Autor Tema: Suma de dos potencias de = exponente. ¿Existe prueba sencilla del UFT?

0 Usuarios y 2 Visitantes están viendo este tema.

17 Junio, 2014, 09:46 am
Respuesta #10

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

En el ejemplo anterior, hemos visto que no todas las ecuaciones lineales de congruencia tienen solución. Pero, necesitamos un “criterio” que nos permita reconocer (por simple inspección) si una determinada ecuación de la forma:

\( a\cdot X\equiv b\pmod {m} \)

tiene o no solución.

Este teorema permite establecer dicho criterio.

2.7.2.1.2. Teorema (condición necesaria y suficiente)

Dados tres números enteros  \(  a, b, m \), con \( m>0 \);  la ecuación lineal de congruencia,

\( a\cdot X\equiv b\pmod {m} \)


tiene al menos una solución, si y solo si,

\( mcd(a,m) \) | \( b \)

(O sea, si el m.c.d. de a y m divide a b.)

DEMOSTRACIÓN

Spoiler
CONDICIÓN DE NECESIDAD

(COMENTARIO: Es necesario que “b” sea divisible por \( mcd(a,m) \),…)

Sea: \(  d=mcd(a,m) \)     (1)

Esto significa que todos los factores comunes de a y de b son iguales a d.

Entonces, existen dos números enteros “\(  a_1 \) y \(  m_1 \) que verifican las siguientes igualdades.

\(  a=d\cdot {}a_1 \)        (2)

\(  m=d\cdot{}m_1 \)           (3)

Por otro lado, por definición de congruencia, existe un número entero M que verifica la igualdad:

\(  a\cdo{}x-b=m\cdot{} M \)       

Despejando “b” resulta:

\(  b=a\cdo{}x-m\cdot{} M \)       (4)

Reemplazando (2) y (3) en (4)

\(  b=( d\cdot {}a_1)\cdo{}x-( d\cdot{}m_1)\cdot{} M \)

De donde se puede factorizar “d”, resultando,

\(  b=d\cdot{}(a_1\cdo{}x-m_1\cdot{} M) \)

Por el teorema fundamental de la aritmética (T.F.A.): “d” debe ser divisor de “b”.

CONDICIÓN DE SUFICIENCIA

(COMENTARIO: Debemos asegurar que exista al menos una solución.)

Sea: \(  d=mcd(a,m) \)     (1)

Además, existen dos números enteros “\(  a_1 \) y \(  m_1 \) que verifican las siguientes igualdades.

\(  a=d\cdot {}a_1 \)        (2)

\(  m=d\cdot{}m_1 \)           (3)

Por definición de “máximo común divisor” existen dos números enteros “u” y “v” que cumplen la siguiente igualdad (identidad de Bezout),

\(  d=a\cdot{}u+m\cdot{}v \)      (4)

Reemplazando (2) y (3) en (4), luego de simplificar resulta,

\(  1=a_1\cdot{}u+m_1\cdot{}v \)        (5)

Multiplicando (5) por \( b_1 \) (que puede ser cualquier número entero)

\(  b_1=a_1\cdot{}b\cdot{}u+m_1\cdot{}b\cdot{}v \)

Reordenando, y haciendo: \(  x= b_1\cdot{}u \)  y \(  M=-b_1\cdot{}v \)

 \( a_1\cdot{} b_1\cdot {u} - b_1=-m_1\cdot {}b_1\cdot {v}=m_1\cdot{}M \)

\( a_1\cdot{} x - b_1=m_1\cdot{}M \)


De donde, por definición de congruencia:

\( a_1\cdot{} x\equiv b_1\pmod{m_1} \)       (6)

Pero, en virtud de (5), (6) tiene al menos una solución. Con lo que se demuestra el teorema.

EXPLICACIÓN: La condición de necesidad nos dice que: siempre y cuando una ecuación lineal de congruencia tenga solución; entonces, es necesario que el m.c.d. de “a” y “m” divida a b.

La condición de suficiencia nos dice que: sin importar que valor tenga “b” la ecuación lineal de congruencia tiene solución si y solo si el m.c.d. de “a” y “m” sea igual a la unidad. Es decir, a y b tienen que ser coprimos entre sí.

De este modo, si se cumple que:

\( mcd(a,m) \) | \( b \)

Entonces la ecuación lineal de congruencia tiene una o más soluciones.
[cerrar]

El teorema anterior nos brinda un criterio importante. De este modo, podemos reconocer “por simple inspección” si una ecuación lineal tiene o no solución.

¿Puede el lector (por simple inspección) decir cuál de las siguientes ecuaciones lineales de congruencia no tiene solución?

1) \( 111X\equiv 75\pmod {321} \)                  2) \( 12X\equiv 352\pmod {153} \)                 3) \( 49X\equiv 287\pmod {91} \)


2.7.2.1.3. Naturaleza de las soluciones de la ecuación lineal de congruencia

Supongamos que la siguiente ecuación
\( a\cdot{}X\equiv b\pmod{m} \)        (1)

verifica el teorema de necesidad y suficiencia anterior.

Vamos investigar qué forma tiene su solución (o soluciones). Supongamos que

\( X=X_0+m\cdot {}k \)         (2)

es una solución de la ecuación anterior. Donde \( 0\leq{X_0}<m \) y “k” es cualquier número entero.

Reemplazando (2) en (1), resulta,
\( a\cdot{}( X_0+m\cdot {}k)\equiv b\pmod{m} \)

\( a\cdot{}X_0+m\cdot {}a\cdot {}k)\equiv b\pmod{m} \)

Por la propiedad periódica,   
   
\( a\cdot{}X_0\equiv b\pmod{m} \)     (3)

Es decir, si una ecuación lineal de congruencia tiene solución; entonces, dicha solución puede obtenerse seleccionando un número entero y positivo de la siguiente sucesión (finita) de números:

0, 1, 2, 3, 4, 5, …., m-1          (4)

Pero, como,

\( X=X_0+m\cdot {}k \) 
 

Podría suponerse que (1) tiene infinitas soluciones porque “k” es un número entero arbitrario.

Sin embargo, tal concepción es errónea y puede conducir a confusiones sin fundamento. El propio Gauss se dio cuenta de esto, por ello, utilizó la siguiente notación (para expresar una solución  de la ecuación lineal de congruencia):

\( X\equiv X_0\pmod {m} \)        (5)

Por ejemplo, la solución de la siguiente ecuación,

\( 3\cdot{}X\equiv 2\pmod{13} \)

es,

\( X\equiv 5\pmod {13} \)          (5 ‘)

Pero alguien podría decir que esta otra,        \( X\equiv -8\pmod {13} \)          (5 ‘’)

Es una solución diferente. Dicha concepción es totalmente equivocada, pues:

\( X\equiv -8+13\pmod {13} \)   \( \Rightarrow{} \)       \( X\equiv 5\pmod {13}  \)        (5 ‘’’) 

Es decir, se trata de la misma congruencia, luego es la misma solución  (5 ‘). 
 
Insistimos, las ecuaciones de congruencias en general (y las ecuaciones lineales, en particular) no tienen infinitas soluciones.

Las soluciones (si es que existen) deben expresarse en forma de congruencias (con el mismo módulo de la ecuación que lo genera).


COMENTARIO: MÁS ANALOGÍAS ENTRE LAS FUNCIONES PERIODICAS Y LAS CONGRUENCIAS


Spoiler
Vamos a realizar una analogía con las funciones periódicas.

Las funciones periódicas son aquellas que verifican la siguiente relación:

\( f(x+T)=f(x) \)      (A)

Por ejemplo, las funciones trigonométricas son funciones periódicas. En el caso de la función seno, tenemos:

\( sin(x+2\pi\cdot {}k)=sin x \)         (B)

Observamos que:        \( T=2\pi\cdot {}k \)   
 
donde   \( T \)    se llama periodo (de la función periodica).

Pero, las funciones periódicas se repiten en su rango (véase, por ejemplo, el gráfico de la entrega anterior).

Por lo tanto, no hace falta analizar todos los puntos en que se extiende su gráfico (de la función periódica). Basta estudiar un solo intervalo.

A ese intervalo se conoce como “intervalo fundamental”. Por ejemplo, el intervalo fundamental de la función seno es: \( 0\leq{}x<2\pi \).

Podemos representar la longitud de dicho intervalo mediante      \( T_0 \); O sea, el periodo mínimo para la que se cumplirá la relación:

\( f(x+T)=f(x) \)
   
Análogamente, cuando tratamos con congruencias, no es necesario estudiar todos los números enteros. Basta analizar una sucesión finita en la que se exhibirá todas las propiedades de las congruencias.

Por ejemplo, en la congruencia

\( 3X\equiv u\pmod {7} \)     

Analicemos los restos (u) que se producen cuando dividimos 3X por 7. Podemos confeccionar la siguiente tabla: 


Obsérvese que los restos de la división de 3x por 7, se repiten (en valores enteros) entre 0 y 6.

Así pues, el intrvalo fundamental es:

\( 0\leq{u}<7 \)   

En la aritmética modular este intervalo está definido por la sucesión de los siguientes números:

0, 1, 2, 3, 4, 5, 6

A esta sucesión de números enteros se conoce como "sistema completo de restos". En la teoría de números, el sistema completo de restos (y también, el sistema reducido de restos) cumplen un papel fundamental (que más adelante analizaremos en detalle cuando abordemos el acápite referido al "pequeño teorema de Fermat").

Así, por analogía la longitud de este intervalo fundamental es igual al valor del módulo. En este caso, m=7.

Continuando con la analogía, así como las funciones periodicas se pueden representar en un gráfico cartesiano; las congruencias también se pueden representar de manera semejante. En la figura inferior, los valoores de la tabla (arriba) se pueden representar en un gráfico cuyo eje de abscisas es "x" y cuyo eje de ordenadas es "u" (el correspondiente al de los restos que se obtienen por división de 3x por 7).


Un análisis exhaustivo de la anterior representación nos permite conjeturar que los números enteros expresados como congruencias y las funciones periodicas se relacionan de manera intrínseca.

Por ejemplo, si somos capaces de expresar los puntos enteros mediante una curva \( F(x) \), podremos utilizar las técnicas de análisis de Fourier. De ese modo, habremos conciliado la aritmética con otros campos de la matemática. En este caso con el análisis basado en la expansión en series trigonométricas.
[cerrar]

(formulas en revisión, contenido sujeto a cambios...)

(continuará)

19 Junio, 2014, 01:33 am
Respuesta #11

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

Se tiene el siguiente teorema,

2.7.2.1.4. Teorema (Número de soluciones de una ecuación lineal de congruencia)

Dados tres números enteros \( [a, b, m (m>0) \), la ecuación lineal de congruencia,

\( a\cdot{}X\equiv b\pmod{m} \)
     
O no tiene soluciones, o tiene exactamente “d” soluciones. Donde: \(  mcd(a,m) = d \)

DEMOSTRACIÓN

Spoiler
I) Si no se verifica la condición de necesidad y suficiencia del teorema (2.7.2.1.2), entonces, la ecuación lineal de congruencia
 
\( a\cdot{}X\equiv b\pmod{m} \)          (1)
tampoco tiene soluciones.

II) Demostremos el caso \(  mcd(a,m) = 1 \), para luego generalizar para todo \( d=mcd(a,m) \).

Supongamos que \( X\equiv X_0\pmod {m} \) es una solución de la ecuación (1). Según el acápite anterior, \( X_0 \) puede ser un número de la siguiente lista de números:

0, 1, 2, 3, 4, 5, 6, 7, …., m-1       (2)

Pero, como \( a \) es coprimo con  \( m \); entonces, (salvo\( X_0=0 \)),  ni \( a \), ni  \( x_0 \)  son exactamente divisibles por \( m \). Luego, el producto:  \( a\cdot {}X_0 \)  tampoco es divisible por \( m \).

Eso quiere decir que, sólo alguna de las siguientes diferencias  es divisible por \( m \),

\(  a\cdot {}X_0 -0 \) , \(  a\cdot {}X_0 -2 \) , \(  a\cdot {}X_0 -3 \), …, \(  a\cdot {}X_0 –(m-1) \)         (3)

O dicho de otro modo, \(  a\cdot {}X_0 \) es congruente (módulo m) sólo con alguno de los siguientes restos:

0, 1, 2, 3, 4, 5, 6, 7, …, m-1         (4)

Pero, \(  b \) es un número entero y puede expresarse (POR LA PROPIEDAD PERIODICA) en la forma:

\(  b=b_0 + m\cdot {}t \)       (5)

Siendo “t” algún número entero y \(  0<=b<m \)        (véase sucesión (4))

Con lo antedicho, existe un solo \(  b  \)   para cada    \(  X_0 \) . De donde, sólo puede haber una solución para la ecuación lineal de congruencia (1).     
 
III) Sea \( mcd(a,m)=d \). Luego, por la LEY 8 (véase leyes del algebra de congruencias), \( a, b, y m \) deben ser divisibles por “d”.

Sean:

\( a=d\cdot {}a_1 \)     (1 ‘)

\( b=d\cdot {}b_1 \)     (2 ‘)

\( m=d\cdot {}m_1 \)     (3 ‘)

Reemplazando (1 ‘), (2 ‘) y (3 ‘) en (1) , véase inciso (I). Y por la LEY (11), tenemos:

\( a_1\cdot{}X\equiv b_1\pmod{m_1} \)    (4 ‘)

Por el inciso (II), (4 ‘) debe tener solución única; porque \( mcd(a_1, m_1) = 1 \)

Si  \( X\equiv X_1\pmod {m_1} \)  es solución de (4 ‘) significa que también es solución de la ecuación (1); esto puede escribirse también así (por la LEY CANCELATIVA EN LA MULTIPLICACIÓN): \( X\equiv X_1\pmod {m} \).

Entonces,  \( X\equiv X_1\pmod {m} \) es solución de (1), también \( X\equiv X_1 + m_1\pmod {m} \)  es otra solución diferente (porque  \( X_1 + m_1 < m \)) . Así, sucesivamente, existirán tantas soluciones de la forma:

\( X\equiv X_1 + m_1\cdto {t}\pmod {m} \)  (t = 0, 1, 2, 3, … ) mientras se cumpla la desigualdad,

\( X_1 + m_1\cdto {t}< m \)            (5’)

Podemos demostrar a partir de esta desigualdad que no se puede sobrepasar al valor: \( t=d-1 \) (o sea, no puede ser t=d, d+1, d+2, etc.) : (por ejemplo, tomando  \( X_1 < m_1 \) y reemplazando en (5’)). Luego,  la siguiente sucesión de congruencias, son todas las soluciones de la congruencia (1).

\( X\equiv X_1\pmod {m} \)  ;          \( X\equiv X_1 + m_1\pmod {m} \)   ;       \( X\equiv X_1 + 2m_1\pmod {m} \)  ; …. ;     \( X\equiv X_1+ (d-1)m_1\pmod {m} \)

O sea, hay exactamente “d” soluciones diferentes de la ecuación (1).
[cerrar]



19 Junio, 2014, 01:52 am
Respuesta #12

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.7.2.1.5. Problemas

Si bien, los anteriores teoremas resuelven por sí mismos las ecuaciones lineales de congruencia (de forma general), conviene poner en práctica los conocimientos adquiridos (sin recurrir a estos teoremas recién formulados). Veamos algunos ejemplos:

1. Resolver la ecuación:  \( 30\cdot {}X\equiv 18\pmod {78} \) 

MÉTODO TRADICIONAL

Sea:    \( 30\cdot {}X\equiv 18\pmod {78} \)        (1)

PRIMERO: Calculamos el m.c.d.  de “a” y “m”(se puede emplear el algoritmo de Euclides) o también lo siguiente:

30 y 78 son divisibles por 2. Al dividir resultan los números: 15 y 39.

15 y 39 son divisibles por 3. Al dividir resultan los números: 5 y 13

5 y 13 son coprimos entre sí. Luego, \( d=mcd (30, 78) = 2\cdot {}3 = 6 \)

Debemos esperar “6” soluciones diferentes.

SEGUNDO: Por la LEY 11 (ver leyes del algebra de congruencias) se puede dividir 30, 18 y 78 por 6, resultando los números: 5, 3, 13 y por tanto, resulta la congruencia:

\( 5\cdot {}X\equiv 3\pmod {13} \)        (2)

Como m=13 es un número razonablemente pequeño la solución de (2)  coincide con alguno de los siguientes valores:

\(  0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 \) 

Por “tanteo”, se obtiene: \( X_0 = 11 \) . Entonces, otros valores pueden obtenerse sumando múltiplos de 13. O sea,

\(  X_0=11, 11+13, 11+26, 11+ 39, 11+52, 11+65 \) 

TERCERO: En conclusión, las soluciones de (1) son:

\( X\equiv 11\pmod {78} \)   ;     \( X\equiv 24\pmod {78} \)          ;        \( X\equiv 37\pmod {78} \)      ;           \( X\equiv 50\pmod {78} \)        ;           \( X\equiv 63\pmod {78} \)        ;         \( X\equiv 76\pmod {78} \) 
   
COMENTARIO: En el anterior ejemplo, hemos obtenido el valor: \( X_0 = 11 \) por simple “tanteo”. Pero, no todas las ecuaciones lineales de congruencia pueden obtenerse así (sobre todo si el módulo es un número demasiado grande. A continuación daremos un método para salvar dicho obstáculo.

--------------------------------------------------------------------------------------------------------------------------------

2. Resolver la ecuación:  \( 111\cdot {}X\equiv 75\pmod {321} \) 

MÉTODO  BASADO EN LAS“FRACCIONES CONTINUADAS”

NOTA:
Spoiler
El cociente de dos números \( a \)  por  \( b \)  se puede expresar como fracciones continuadas. Por ejemplo: sea \( a=75 \)  y   \( b=19 \) , entonces, puede escribirse:

\( \displaystyle\frac {75}{19}=3+\displaystyle\frac {18}{19}=3+\displaystyle\frac {1}{(\displaystyle\frac{19}{18})}  \)       (A)

Pero, \( \displaystyle\frac {19}{18}=1+\displaystyle\frac {1}{18} \)       (B)

Reemplazando (B) en (A), así sucesivamente, se obtiene una fracción continuada….
[cerrar]

…el método basado en las “fracciones continuadas” consiste en determinar (mediante un algoritmo rápido) los valores de “u” , “v” y “d”, tales que:

\( a\cdot {u}+b\cdot {v} = d \)             (identidad de Bezout)

PRIMERO: Calculamos el m.c.d.  de “a” y “m”(se puede emplear el algoritmo de Euclides). Tenemos:

\( d=mcd (30, 78) = 3 \)        (puede verificarse rápidamente)

Entonces, debemos esperar “3” soluciones diferentes.

SEGUNDO: Por la LEY 11 (ver leyes del algebra de congruencias) se puede dividir 111, 75 y 321 por 3, resultando los números: 37, 25, 107 y por tanto, resulta la congruencia:

\( 37\cdot {}X\equiv 25\pmod {107} \)        (2)

En esta congruencia, calculamos (por definición) el m.c.d. de 107 y 37,


EXPLICACIÓN

Spoiler
a) El esquema del paso 1, es el del algoritmo de Euclides con “a=107” y “b=37” , como se muestra en la anterior figura, arriba, (recordemos que el esquema del algoritmo de Euclides ya lo hemos visto en un problema anterior, en el subtitulado: “máximo común divisor”)
(Observar  en la figura, que el método funciona trabajando con los cocientes: 2, 1 y 8)



b) En el esquema del paso 2 (véase figura, arriba) hay que escribir “0” y “1” como se ve en la fila del centro.  Obsérvese que en esta fila del centro se generarán los números 1 y 9. En total, puede visualizarse los siguientes números: 0, 1, 1 y 9.

c) En el esquema de paso 2 (véase figura, arriba) vamos anotando alternadamente los signos + y - . El valor que obtengamos para la variable “u” tendrá el signo que está debajo de ese valor (en la figura, tiene el signo: u=+9)

d) Como ya conocemos el valor d=1 y u=9, podemos determinar el valor de “v” (como se detalla en la figura).
[cerrar]

Así obtenemos:     

 \( (107)(+9)+(37)(-26)=1 \)            (3)

TERCERO: Utilizando el resultado anterior, es evidente por la LEY CANCELATIVA DEL PRODUCTO (véase “leyes del álgebra de congruencias” que:

\( 37\cdot {}X\equiv 25\pmod {107}   \Rightarrow{}   37\cdot {}X\equiv 25\cdot {((107)(+9)+(37)(-26))}\pmod {107}  \)        (3 ‘)

Que por la LEY PERIODICA simplifica a:

\( 37\cdot {}X\equiv 25\cdot {((37)(-26))}\pmod {107}  \)

Nuevamente, LEY CANCELATIVA DEL PRODUCTO (haciendo desaparecer:37)

\( X\equiv 25\cdot {(-26)}\pmod {107}  \)   entonces   \( X\equiv -650\pmod {107}  \)
 
Esta congruencia es equivalente a: \( X\equiv 99+107\cdot {(-7)}\pmod {107}  \)
   
De nuevo LEY PERIODICA,

\( X\equiv99\pmod {107}  \)           (4), que es solución de (2)

Pero, por la LEY 11 (ver “leyes del algebra de congruencias”, se sigue que esta solución es  también solución de la ecuación (1), pero en el módulo 321:

\( X\equiv99\pmod {321}  \)     

CUARTO: En conclusión las 3 soluciones, en este problema,  de la ecuación (1) , son:

\( X\equiv99\pmod {321}  \)    ;     \( X\equiv99+107\pmod {321}  \)    ;    \( X\equiv99+214\pmod {321}  \)
   
Que también podemos escribir (solo con el fin de simplificar)

 \( X\equiv99; 206 ; 313\pmod {321}  \)

------------------------------------------------------------------------------------------------------------------------------- 
 
3) Resolver la ecuación diofántica lineal: \( 321x+111y=75 \)     

COMENTARIO: El lector ya tiene las herramientas para resolver este problema usando la definición del máximo común divisor y el problema 2 (del mismo subtitulado).

PRIMERO: Simplificamos todo lo posible. La ecuación original toma la forma:

\( 107x+37y=25 \)            (1)

NOTA: Todas las soluciones de (1) también son soluciones de la ecuación original.

PRIMERO: Vamos a aprovechar el resultado (3) del problema anterior.

\( (107)(+9)+(37)(-26)=1 \)            (2)

Multiplicando por “25” obtendremos:

\( (107)(+225)+(37)(-650)=25 \)            (3)

De aquí, una “solución particular” puede expresarse por el binomio la "dupla": \( (x_0,y_0)=(+225,-650) \)

Por otro lado, (como se vio en el problema 2, del subtitulado “máximo común divisor”) es posible obtener la proporcionalidad:

\( (107)\cdot {R}=(37)\cdot {S} \)  , o sea,

\( (107)\cdot {R}+(37)\cdot {(-S)}=0 \)        (4)

Hagamos: \( R=37k  \) y \( S=107k  \)     (k es un número entero cualquiera), (4) queda,

\( (107)\cdot {37k}+(37)\cdot {-107k}=0 \)        (4 ‘)

Sumando miembro a miembro (3) y (4 ‘) resulta:

\( (107)\cdot {+225+37k)}+(37)\cdot {-650-107k}=75 \)      (5)

CONCLUSIÓN: De (5), rápidamente se concluye: La solución general de la ecuación diofántica lineal

\( 321x+111y=75 \)     está dado por el binomio: (x,y)=(+225+37k, -650-107k)

Ésta incluye a todas las soluciones de la ecuación diofántica original.


24 Junio, 2014, 07:31 am
Respuesta #13

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.7.2.1.6. PRIMER PARADIGMA DE LA IRRESOLUBILIDAD DEL UTF POR MÉTODOS SENCILLOS

A partir del  problema anterior (2), ya se pueden obtener las soluciones generales (en forma simbólica) de una ecuación lineal de congruencia. Dejaremos que el lector se entretenga obteniendo tales soluciones generales.

Pero, ahora nos referiremos a la ecuación diofántica lineal,

\( a\cdot {}x+b\cdot {}y = c \)       (2.5)

En el problema anterior (3), hemos dado un método para su resolución. Sin embargo, tal método es demasiado “rebuscado” (o por decirlo en palabras más elegantes, es un método que emplea un par de “artificios matemáticos”). Un solucionador de ecuaciones diofánticas, no se vale de tales artificios (a menos que sean la última opción).

Entonces, ¿por qué están ahí?.  Porque nos ayudaran a comprender nuestro primer paradigma. Un paradigma que nos dará una pauta acerca de la no factibilidad de afrontar el UTF por métodos sencillos (cuando uno se vale de conocimientos de algebra básica).

¿Qué dice ese paradigma?... No nos apresuremos todavía…

… En lugar de eso, vamos a resolver dicha ecuación diofántica lineal (por el método de la deducción elemental):

RESOLUCIÓN

Spoiler
Sea:

 
\( a\cdot {}x+b\cdot {}y = c \)     (L.1)

Antes que nada, conviene simplificar al máximo. Así pues, si \( mcd(a,b,c)=d \), cada término de (L.1) se puede dividir entre “d”. O sea,

\( \displaystyle\frac{a}{d}\cdot {}x+\displaystyle\frac{b}{d}\cdot {}y = \displaystyle\frac{c}{d} \)     (L.2)

Realizamos los cambios de variable (C.V.):

\( x=x_0+u \)                  (L.3)

\( y=y_0+v \)                  (L.4)

Hasta ahora, \( x_0 \)  e \( y_0 \) son todavía cantidades desconocidas (así como \( u \) y \( u \). Reemplazando en (L.2), y asociando convenientemente, resultará,

\(  [\displaystyle\frac{a}{d}\cdot {}u+\displaystyle\frac{b}{d}\cdot {}v]+\displaystyle\frac{a}{d}\cdot {}x_0+\displaystyle\frac{b}{d}\cdot {}y_0 = \displaystyle\frac{c}{d} \)     (L.2)’

Igualemos la cantidad entre “corchetes”: […] a cero (0). Tendremos:
\(  [\displaystyle\frac{a}{d}\cdot {}u+\displaystyle\frac{b}{d}\cdot {}v]=0 \)       (L.2)’’

\( \displaystyle\frac{a}{d}\cdot {}x_0+\displaystyle\frac{b}{d}\cdot {}y_0 = \displaystyle\frac{c}{d} \)        (L.2)’’’

…Vamos a suponer que \( x_0 \)  e \( y_0 \) son números concretos (conocidos). Y por tanto, (L.2)’’’ es una igualdad. Notemos que, (L.2)’’’ nos recuerda a la identidad de Bezout . Así, podemos multiplicar la identidad de Bezout por \( \displaystyle\frac{c}{d} \)...

\( \displaystyle\frac{a}{d}\alpha+\displaystyle\frac{b}{d}\beta=1 \) (identidad de Bezout)  \( \Rightarrow{} \)   \( \displaystyle\frac{a}{d}\displaystyle\frac{\alpha\cdot{c}}{d}+\displaystyle\frac{b}{d}\displaystyle\frac{\beta\cdot{c}}{d}=\displaystyle\frac{c}{d} \)             (L.2)''''

Comparando (L.2)''' y (L.2)'''' se puede obtener los valores buscados para \( x_0 \)  e  \( y_0 \)

Por otro lado, teníamos,

\(  [\displaystyle\frac{a}{d}\cdot {}u+\displaystyle\frac{b}{d}\cdot {}v]=0 \)       (L.2)’’

Aquí, es evidente que si \( (u_0, v_0) \)  es una solución de (L.2)’’, entonces, \( (k\cdot {}u_0,k\cdot {} v_0) \)  es otra solución. Pero, \( k \)  puede adoptar el valor de cualquier número entero. Por tanto, la ecuación (L.2)’’ tendrá un número ilimitado de soluciones. Pero, de (L.2)’’ los valores de la dupla \( (u_0, v_0) \)  pueden determinarse inmediatamente. Estos valores son:

\( u_0=\displaystyle\frac{b}{d}  \)        y        \( v_0=-\displaystyle\frac{a}{d} \)           (L.3)

Así, con los valores obtenidos para \( x_0 \)  e \( y_0 \)  en (L.2)’v, y con los valores obtenidos en (L3) se puede determinar la solución de la ecuación diofántica inicial (L.1). Que tendrá la forma (ver C.V.):
[cerrar]

La solución de la ecuación diofántica tiene la forma:

\( x=x_0+\displaystyle\frac{b}{d} \cdot {}k \)                        (L.4)

\( y=y_0-\displaystyle\frac{a}{d} \cdot {}k \)                        (L.5)

ANÁLISIS DEL MÉTODO DADO

El método empleado, nos ha permitido desdoblar la ecuación original en otras dos, de modo que una de las resultantes se iguala a cero. La ecuación lineal que ha sido igualada a cero se llama ecuación lineal homogénea…

Las soluciones expresadas en la forma: (L.4) y (L.5) se llaman soluciones paramétricas de la ecuación diofántica, y “k” se llama parámetro. Más adelante (parte 3) estudiaremos con mejor detalle el significado de qué es un parámetro y qué es una parametrización.

Por ahora, vamos a adelantar que la ecuación diofántica lineal (L.1) es una “recta” en el plano cartesiano y el parámetro “k” nos permite obtener puntos enteros P(x,y) sobre dicha recta. Por ejemplo, en la figura (véase la figura inferior), se ha graficado la recta: \( 7x-5y=3 \), observése que al incrementarse las coordenadas en progresión aritmética:

\( x=-6+5k \).

\( y=-9+7k \)

...la distancia entre dos puntos consecutivos es constante e igual a \( d=\sqrt[ ]{74} \)



Pero, aquí vamos a tomar nota de algo más importante todavía: Obsérvese, en (L.4) y (L.5), que el parámetro “k” conserva el grado (o exponente) que tienen “x” e “y” en la ecuación (L.1). Conviene tomar en cuenta este detalle, pues más adelante (parte 3) analizaremos este mismo aspecto en la “ecuación de Fermat” que nos abrirá aun más los ojos de nuestra intuición.

Pero, a este momento, el lector debe estar preguntándose, en qué consiste el primer paradigma de la irresolubilidad del UTF (por métodos sencillos)?...

Sin más preámbulos, comencemos preguntándonos ¿cuál es el máximo común divisor de dos potencias cuyos exponentes son iguales?.

Es decir, ¿cuál es el máximo común divisor de  \( a^n  \)        y        \( b^n  \) ?
 
Es claro que el m.c.d. de éstos existe y se puede expresar mediante la identidad de Bezout.  Para esto, consideremos tres potencias de números arbitrariamente elegidos,
   
\( a^n  \)       ,        \( b^n  \)          y        \( c^n  \)

Supongamos además que son coprimos dos a dos. Entonces, por definición de m.c.d. se tiene:

\( a^n\cdot {}X_1+ b^n\cdot {}X_2=1  \)          (P.1)

\(  a^n\cdot {}Y_1+ c^n\cdot {}Y_2=1  \)         (P.2)

\(  b^n\cdot {}Z_1+ c^n\cdot {}Z_2=1  \)          (P.3)

Como hemos estudiado, sabemos que siempre es posible encontrar los valores:

 
\( X_1, X_2, Y_1, Y_2, Z_1, Z_2  \)             (P.4)


Ahora vamos a enunciar formalmente la hipótesis fundamental del UTF (sencillo). Así lo llamaremos,  UTF (sencillo),  cada vez que nos refiramos a los métodos que emplean artificios elementales o sencillos en la demostración del UTF.

Hipótesis:

El UTF es falso, y por tanto, existen tres números enteros, no nulos, \( a<b<c \) ; tales que se verifica la igualdad:

\( a^n+b^n=c^n  \)                                         (H.1) 

para algun número natural \( n\geq{3} \)

         
A partir de esta hipótesis (H.1) y las relaciones (P.1), (P.2), (P.3) vamos a efectuar unas cuantas transformaciones algebraicas...

(NOTA: a lo largo de los siguientes capítulos vamos a considerar otro tipo de transformaciones, Así iran surgiendo nuevos paradigmas)…

(si existiesen errores en la transcripcion, son nuestras...)

(continuará…)

25 Junio, 2014, 06:36 am
Respuesta #14

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

Vamos a suponer en (P.4) que ningún X, Y o Z es nulo...

Ahora, multiplicando (P.2) por \( Z_1 \)  y (P.3) por \( Y_1 \),

\( a^nY_1Z_1+c^nY_2Z_1=Z_1 \)       (P.2) '

\( b^nZ_1Y_1+c^nZ_2Y_1=Y_1 \)       (P.3) '

Sumando las anteriores miembro a miembro y teniendo en consideración la hipótesis (H.1), \( a^n+b^n=c^n \), tenemos,

\( c^nY_1Z_1+c^n(Y_2Z_1+Z_2Y_1)=Z_1+Y_1 \)

De donde rápìdamente se llega a,

\( c^n=\displaystyle\frac{Z_1+Y_1}{Y_1Z_1+Y_2Z_1+Z_2Y_1} \)       (P.5)

Con un razonable criterio de sentido común, sabiendo que UTF es verdadero ("proof by Wiles"), deberíamos pensar que no existe ninguna combinación de las variables Y y Z's tales que en (P.5) se produzca una potencia perfecta. Pero tal supuesto (de nuestro sentido común) es falso. Ver el siguiente contraejemplo:

CONTRAEJEMPLO: Sean \( a=11 \), \( b=2 \). De aquí, el máximo común divisor (por Bezout) es:

\( a^3Y_1+b^3Y_2=1 \)     o  en números concretos:     \( 11^3\cdot {}3+2^3\cdot{(-499)}=1 \)   o sea,  \( Y_1=3 \)  y  \( Y_2=-499 \)

Si ahora reemplazamos en (P.5) esos valores, además de: \( Z_1=2741 \)  y  \( Z_2=453179 \)

Obtendremos:

\( c^n=\displaystyle\frac{Z_1+Y_1}{Y_1Z_1+Y_2Z_1+Z_2Y_1} \)       (P.5)

\( c^n=\displaystyle\frac{2741+3}{(3)(2741)+(-499)(2741)+(453179)(3)}=14^3 \)       (P.5) '

¿Por qué ocurre esto, hicimos mal las transformaciones algebraicas?.¿O se trata mas bien de una paradoja?...

¡...Nada de eso...! La expresión (P.5) es el resultado correcto de un razonamiento algebraico. Lo incorrecto fue tratar de encontrar una contradicción al UTF.

Pero, si se reflexiona un poco mejor, en (P.5) las variables \( Z_1 \) y \( Z_2 \) son "totalmente independientes" de los valores que adopten \( Y_1 \) y \( Y_2 \); pues para cada valor de \( (Y_1, Y_2) \) en numerador siempre es posible encontrar otro valor para \( Z_1 \) de manera independiente a como se lo hace en el denominador para \( Z_2 \).

Este es el PRIMER PARADIGMA:

En las trasformaciones algebraicas, en la ecuación diofántica: \( x^n+y^n=z^n \) (x, y, z, minúsculas, ojo) las variables intervinientes tienden a comportarse como si fueran números enteros.

REFLEXIONES FINALES

Spoiler
En el contraejemplo que pusimos, un lector "despierto" puede decir: Un momentito....("wan moment, plis")

los valores \( Z_1 \)  y  \( Z_2 \)  son ambos positivos...¿no deberían ser de signos contrarios? como lo puede exigir la ecuación (P.3)?

Efectivamente, tienen que ser de signos contrarios. Sin embargo, probar que esa condición se tiene que cumplir para todas las combinaciones posibles que puedan darse con las variables \( Y_1 \), \( Y_2 \),\( Z_1 \),\( Z_2 \) es un procedimiento que ya se escapa de las "consideraciones elementales".

Es decir, tendríamos que trabajar en un nivel un grado más superior a la sencillez de intentar buscar contradicciones haciendo transformaciones algebraicas. Pero, este razonamiento es de corte más intuitivo que analítico (aún así, si el lector quiere convencerse por sí mismo, intente probar que \( Z_1 \) y \( Z_2 \) deben ser de signos opuestos, cuando  \( Y_1 \) y \( Y_2 \) lo son...

¿Eso queda para la reflexión personal de cada uno...!
[cerrar]

(En nuestra próxima entrega, no se pierda el pequeño teorema de Fermat)

(Si se detecta algún error, seran corregidas en nuestra próxima entrega)

Fin.


27 Junio, 2014, 07:40 am
Respuesta #15

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.8. EL PEQUEÑO TEOREMA DE FERMAT (PTF)

Antes que nada, vamos a definir qué se entiende por “sistema completo de restos” y después qué es el “sistema reducido de restos” (pues estas nociones nos ayudaran a comprender mejor la demostración del Pequeño teorema de Fermat)

PRIMERAS CONSIDERACIONES
Spoiler
Si  \( a \) es un número entero cualquiera y lo dividimos por otro número entero \( m \), \(   (m>1)  \) entonces, el resto de la división hade ser “uno y solamente uno” de la siguiente lista:

\( 0, 1, 2, 3, 4, 5,\ldots, m-1 \)      (1)

(Esto el lector lo conoce por experiencia). Por ejemplo, si \( a=50 \) y \( m=17 \),  el resto de la división es \( r=16 \).

Diremos pues que \( a=50 \) pertenece a la CLASE DE NÚMEROS cuyos restos son \( r=16 \), en el módulo “m=17”. Así, otros números compartirán este mismo privilegio de poder generar el resto \( R=16 \). Por ejemplo, \( a=67 \), \( a=101 \) \( a=84 \), etc., pertenecen a la misma CLASE DE NÚMEROS (es decir, todos ellos arrojan un resto \( r=16 \). Arrojan  ese resto porque la fórmula que los genera es:

\( a=16+17\cdot {}M \)    (donde “M” es un número entero cualquiera)

Así pues, habrán tantas “clases de números” como cantidad de restos se puedan obtener al dividir \( a \)  por  \( m \). De acuerdo con (1), habrá  “m” clases de números enteros. O sea, la clase de números que produce resto: 0, la clase de números que produce resto: 1, la clase de números que produce resto: 2, etc.

Y a cada uno de esos restos (o sea, 0, 1, 2, 3, …, m-1) llamaremos RESTOS MÍNIMOS. ¿Por qué mínimos?. Recordemos que, de acuerdo a la definición de congruencia, los restos también pueden ser mayores o iguales que el módulo “m”. Por tanto, si tuviéramos la congruencia:

\( a\equiv 105\pmod {11} \)

El número 105 es resto de “a”. (Nótese que estamos llamando resto a 105, aún cuando 105>11)

En consecuencia, surge la necesidad de definir un RESTO MÍNIMO como aquel que es menor al valor del módulo, (m).

A partir de esas dos ideas (la clasificación de números en clases y el hecho que un resto no necesariamente es un número menor al divisor) surge el concepto de “sistema de restos”. A continuación damos una definición intuitiva:
[cerrar]

Definición intuitiva

Spoiler
Se llama SISTEMA COMPLETO DE RESTOS, MÓDULO \( m \)  a la sucesión de números enteros:

\( b_1, b_2, b_3, b_4, b_5,\ldots, b_m \)

Donde cada  \( b_i \) es un número cualquiera que pertenece a una clase diferente. Por tanto, no puede haber dos \( b_i \) de la misma clase.

Veamos con más claridad con un ejemplo:

Si tomamos el módulo “m=5”, habrán “5 clases (de conjuntos) de números enteros”:

Números Clase 0: …, -10, -5, 0, 5, 10, …

Números Clase 1: …, -9, -4, 1, 6, 11, …

Números Clase 2: …, -8, -3, 2, 7, 12, …

Números Clase 3: …, -7, -2, 3, 8, 13, …

Números Clase 4: …, -6, -1, 4, 9, 14, …

Vemos que estas Clases son una partición de los números enteros (\( \mathbb{Z} \)). Pero, lo más importante es notar que cada Clase representa un “género” diferente de números enteros; es decir, la intersección de dos clases es vacía (\( \emptyset \)). Ahora, escogiendo arbitrariamente un número de cada clase, por ejemplo:

14, 3, 7, 10, -3

Hemos definido así un “sistema completo de restos, módulo 5”.  Así como podemos definir un “sistema completo de restos, módulo 5” con los números: 14, 3, 7, 10, -3; se puede definir otros sistemas completos de infinidad de maneras diferentes. Por tanto, definir un sistema de restos no es único.
[cerrar]

2.8.1. SISTEMA COMPLETO DE RESTOS (Definición formal)

Se llama sistema completo de restos, módulo \( m \) a la sucesión de números enteros:

\( b_1, b_2, b_3, b_4, b_5,\ldots, b_m \)       (2.6)

tales que todo número entero \( A \) es congruente a uno, y solamente uno, de los elementos de la sucesión (anterior).

Por ejemplo,

1) \( 10, 6,12,8,9 \)  es un sistema completo de restos, módulo 5.
(Nótese que 10 es clase:0, 6 es clase:1, 12 es clase: 2, etc.

2) \( 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0 \)  es un sistema completo de restos, módulo 11.

NOTA: A la sucesión: \( 0, 1, 2, 3, 4,\ldots, m-1 \)  llamaremos “sistema completo de restos mínimos, módulo \( m \). El ejemplo 2), es un sistema completo de restos mínimos, módulo 11.

Definición intuitiva

Spoiler
Se llama SISTEMA REDUCIDO DE RESTOS, MÓDULO \( m \)  a la sucesión de números enteros:

\( c_1, c_2, c_3, c_4, c_5,\ldots, c_n \)

Sí y solo si, se verifica que:  mcd(c_i, m) = 1 , (i=1,2, 3, …)
[cerrar]

2.8.2. SISTEMA REDUCIDO DE RESTOS (Definición formal)

Se llama sistema reducido de restos, módulo \( m \)  a la sucesión de números enteros:

\( c_1, c_2, c_3, c_4, c_5,\ldots, c_n \)       (2.7)

tales que todo número entero \( A \) coprimo con \( m \), es congruente a uno, y solamente uno, de los elementos de la sucesión (anterior).

Por ejemplo,

1) \( 1, 5, 7, 11 \)  es un sistema reducido de restos, módulo 12.

(Nótese que este sistema reducido puede determinarse suprimiendo todos aquellos números que “no son coprimos” con: 12, cuando se toma como base el sistema completo de restos (mínimos). Por ejemplo, el sistema completo de restos mínimos, módulo 12 es: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11. De esta lista, los no coprimos con 12 son: 2, 3, 4, 6, 8, 9, 10. Entonces, estos se suprimen y resulta: \( 1, 5, 7, 11 \)  (que es un sistema reducido de restos, módulo 12)

Esta forma de definir un sistema reducido de restos invoca a la definición de la función de Euler.

2.8.3. FUNCIÓN DE EULER

La función "phi" (\( \phi \)) de Euler, llamado a veces “el totiem”, se define para todo número entero positivo \( m \) como la “cantidad” de números de la sucesión:

0, 1, 2, 3, 4, …, m-1

Tales que son primos a \( m \)

Y se simboliza así:                             
\( \boxed{\phi(m)} \)       (2.8)

(Obsérvese la semejanza con la definición de sistema reducido de restos).

De este modo, podemos responder a la pregunta: ¿Cuántos elementos tiene la sucesión que define el sistema reducido de restos, módulo m?. La respuesta es: Tiene \( \phi(m) \) elementos.

Por ejemplo, ya vimos que: \( 1, 5, 7, 11 \)  es un sistema reducido de restos, módulo 12.
Si contamos los elementos vemos que es igual a 4, ¡ese es el totiem de Euler!. O sea, \( \phi(12) = 4 \)

Es una lástima que no nos detengamos a estudiar detenidamente al totiem de Euler, sin embargo, podremos aplicar este concepto para demostrar el “pequeño teorema de Fermat”.

2.8.4. EL PEQUEÑO TEOREMA DE FERMAT

El pequeño teorema de Fermat es uno de los resultados más importantes de la teoría de números. Fue conocido por Fermat alrededor de 1636 y demostrado por primera vez por el gran Leonhard Euler en 1736.

Spoiler
Parece que Fermat escribió a Frénicle de Bessy las siguientes palabras:   


“Todo número primo mide una de las potencias menos uno de cualquier progresión en la que el exponente es un múltiplo del primo dado menos uno. (...) Y esta proposición es generalmente cierta para todas las progresiones y todos los números primos; le enviaría la prueba, si no temiese que es demasiado larga”                (P. de Fermat)         
   (Cita tomada de wikipedia)
[cerrar]

En términos modernos este teorema se enuncia así:
   
2.8.4.1. Teorema

Si \( p  \) es un número primo, entonces, para cada número natural \( a \) coprimo con \( p \) se verifica:

\( \boxed{a^p\equiv 1\pmod {p}} \)        (2.9)
                                                               

Antes de demostrar este  importante resultado, previamente demostraremos dos teoremas:

2.8.4.2.Teorema

Sea  \( mcd(a, m) = 1 \). Sea  \( r_1, r_2, r_3,\ldots, r_{\phi(m)} \), un sistema reducido de restos, módulo m. Entonces, \( ar_1, ar_2, ar_3,\ldots,ar_{\phi(m)} \), es un sistema reducido de restos, módulo m.

DEMOSTRACIÓN

Spoiler
1) Existe la misma cantidad de elementos en \( ar_1, ar_2, ar_3,\ldots,ar_{\phi(m)} \),  que en [/tex]. Sea \( r_1, r_2, r_3,\ldots, r_{\phi(m)} \).

2) Luego, lo único que debemos demostrar es que la sucesión: \( ar_1, ar_2, ar_3,\ldots,ar_{\phi(m)} \) dos de ellos (distintos entre sí) no sean congruentes (con respecto del otro), módulo m.

Sea: x el índice de uno de los elementos elegidos arbitrariamente en la anterior sucesión.
Sea: y el índice de otro elemento, elegido arbitrariamente en la anterior sucesión.

Si no constituye un sistema reducido de restos, entonces, si \( x \ne {}y \) debe verificarse la congruencia: \( ar_x\equiv ar_y\pmod {m} \).

Entonces, por la LEY CANCELATIVA DEL PRODUCTO se tiene:

\( r_x\equiv r_y\pmod {m} \)

Esta congruencia sólo es posible si x=y, porque \( r_x \)  y \( r_y \) son elementos de un sistema reducido de restos, (y tal congruencia no se cumple excepto cuando x=y)
[cerrar]

COMENTARIO: A partir del anterior teorema el lector ya está en la posibilidad de demostrar el “pequeño teorema de Fermat”. Sin embargo, nosotros vamos a demostrar un teorema más general y demostrar el PTF como corolario de este teorema general.

2.8.4.3. TEOREMA (GENERALIZACIÓN DE EULER DEL PTF)

Si \( mcd(a, m) =1 \) , entonces:

\( \boxed{a^{\phi(m)}\equiv 1\pmod {m}} \)        (2.10)

DEMOSTRACIÓN

Spoiler
Como ya fue demostrado, \( r_1, r_2, r_3,\ldots, r_{\phi(m)} \) y \( ar_1, ar_2, ar_3,\ldots,ar_{\phi(m)} \), constituyen (ambos) dos sistemas reducidos de restos, módulo m.

Por constituir dos sistemas reducidos de restos, cada \( r_x \) (del primer sistema) será congruente solamente con uno y solo un \( ar_y \) (del segundo sistema). Por tanto, habrán \( \phi(m) \) congruencias de la forma:
\( r_x\equiv ar_y\pmod {m} \)

Así pues, podemos multiplicar miembro a miembro (todas las \( \phi(m) \) congruencias) en virtud de la LEY DE MULTIPLICATIVIDAD MIEMBRO A MIEMBRO (véase leyes del algebra de congruencias). Asi, obtendremos que: el producto de los elementos del primer es congruente con el producto del segundo sistema, o sea:

\( (r_1)( r_2)( r_3)\ldots(r_{\phi(m)})\equiv (ar_1)(ar_2)( ar_3)\ldots(ar_{\phi(m)})\pmod {m} \),

En el segundo miembro de la congruencia podemos factorizar convenientemente todas las “\( a \)” y resultará

\( (r_1)( r_2)( r_3)\ldots(r_{\phi(m)})\equiv a^{\phi(m)}(r_1)(r_2)( r_3)\ldots(r_{\phi(m)})\pmod {m} \),

Y por ser todas y cada una de las \( r_1,  r_2,  r_3,\ldots,r_{\phi(m)} \), coprimos con \( m \), podemos aplicar LEY CANCELATIVA DEL PRODUCTO, resultando,

\( 1\equiv a^{\phi(m)}\pmod {m} \),

Y aplicando la LEY SIMÉTRICA, se tiene finalmente,

\( a^{\phi(m)}\equiv 1\ pmod {m} \),

Como se buscaba demostrar.
[cerrar]

DEMOSTRACIÓN DEL PEQUEÑO TEOREMA DE FERMAT

COROLARIO (DE LA GENERALIZACIÓN DE EULER): Si \( m=p \), entonces, se verifica el PTF.

DEMOSTRACIÓN

Spoiler
En efecto,

Si \( m=p \), se tiene (por el teorema 2.8.4.3. ya demostrado):

\( a^{\phi(p)}\equiv 1\pmod {p} \),     (1)

Ahora, basta demostrar que \( \phi(p)=p-1 \),

En la sucesión:

0, 1, 2, 3, 4, 5, …., p-1

El único elemento que no es coprimo con “p” es el cero:0. Luego, la sucesión: 1, 2, 3, …, p-1 es un sistema reducido de restos, módulo “p” y como se ve, este sistema tiene exactamente \( \phi(p)=p-1 \), elementos (porque hemos excluido al cero).

Reemplazando este resultado en (1), se demuestra el PTF,

\( a^{p-1}\equiv 1\pmod {p} \)

Esto demuestra el PTF.
[cerrar]



01 Julio, 2014, 08:23 am
Respuesta #16

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

Entre las aplicaciones que se puede dar al pequeño teorema de Fermat (PTF) están las relacionadas con la criptografía y que se vinculan con los famosos “test de primalidad”. Sin embargo, para el PTF,  o de forma más general el teorema de Euler (véase entrega anterior), también puede encontrarse otro tipo de aplicación; específicamente, para resolver algunas congruencias binomiales de la forma:

\( x^a\equiv b\pmod {m} \)       (2.11)

Donde,  \( a \) y \( b \) son números enteros positivos dados y \( x \) se llama incógnita.

Antes de dar el método para resolver esta ecuación de congruencias, previamente demostraremos el siguiente teorema:

TEOREMA: Dada una congruencia en la forma: \( A\equiv B\pmod {m} \), se puede elevar ambos miembros de la congruencia a una potencia positiva  “n>1”.

DEMOSTRACIÓN:
Spoiler
Sean, \( A\equiv B\pmod {m} \)  (1), \( A\equiv B\pmod {m} \)  (2).

Por la LEY DE MULTIPLICACIÓN MIEMBRO A MIEMBRO (véase leyes del algebra de congruencias), multipliquemos ambos miembros de ambas congruencias, para obtener:

\( A\cdot {A}\equiv B\cdot {B}\pmod {m} \)       o también:     \( A^2\equiv B^2\pmod {m} \)      (3)

Repitiendo el proceso con (1) y (3), tenemos,

\( A^3\equiv B^3\pmod {m} \)      (3)

Entonces, por inducción,

Supongamos que se verifica para el exponente “k”:

\( A^k\equiv B^k\pmod {m} \)      (4)

Multiplicando miembro a miembro (por la ley citada) las ecuaciones (1) y (4), tenemos:

\( A^{k+1}\equiv B^{k+1}\pmod {m} \)      (5)

Lo cual demuestra y justifica que se puede elevar una congruencia dada a la n-ésima potencia (n>1)
[cerrar]



Ejemplo:

Resolver la siguiente ecuación binomial de quinto grado,

\( x^5\equiv 94\pmod {103} \)            (1)

NOTA: Aunque este método es excelente (para resolver este tipo de ecuaciones de congruencias), no se puede aplicar a todos los casos posibles. Desafiamos al lector a averiguar a partir del siguiente ejemplo por qué ocurre eso).

SOLUCIÓN

Recordemos que el PTF dice:

\( x^{103-1}\equiv 1\pmod {103} \)     o mejor (pos SIMETRÍA)      \( 1\equiv x^{102}\pmod {103} \)               (2)

1) Relacionemos los exponentes de (1) y de (2), o sea, 102 y 5,  para hallar su m.c.d. Dado que el lector ya sabe cómo hacer eso, a continuación escribimos directamente en forma de combinación lineal (Bézout). O sea:

\( (-2)\cdot {102}+(41)\cdot {5}=1 \)                     (3)   

Despejando convenientemente:

 \(  (41)\cdot {5}=(2)\cdot {102}+ 1 \)                     (3) ’

2) Ahora teniendo en cuenta (3) ‘; por el teorema anterior, elevamos ambos miembros de la congruencia (1) a: \( n=41 \). O sea,

\( (x^5)^{41}\equiv 94^{41}\pmod {103} \)            (1) ’

Dado que:  \( (x^5)^{41}= x^{(2)\cdot {102}+ 1}= x^{(2)\cdot {102}}x  \)  . Entonces,         

\(  x^{(2)\cdot {102}}x \equiv 94^{41}\pmod {103} \)            (1) ’’

Análogamente, elevamos ambos miembros de la congruencia (2) a \( n=2 \). O sea,

\(  1\equiv (x^{102})^2\pmod {103} \)               (2) ’

3) Multiplicando miembro a miembro las ecuaciones  (1) ’’  y    (2) ’, resulta,

\(  x^{(2)\cdot {102}}x \equiv 94^{41}(x^{102})^2\pmod {103} \) 

Por la “ley cancelativa del producto” nos deshacemos de: \(  (x^{102})^2  \) , resultando,   
 
\(  x \equiv 94^{41}\pmod {103} \)        (4)

(4) prácticamente es la solución de la ecuación binomial de quinto grado. Sin embargo, podemos simplificar el segundo miembro para que el resto sea menor que el módulo. O sea,

Spoiler
Tengamos en cuenta que:

\(  41=2^5+2^8+1=32+8+1  \)   
 
Entonces procedemos a elevar al cuadrado, y el resultado volvemos a elevar al cuadrado, y así sucesivamente. Tenemos:

Primera potenciación: \(  94^2\equiv 81\pmod {103} \) 

Segunda potenciación: \(  94^4\equiv 81^2\equiv 72\pmod {103} \) 

Tercera potenciación: \(  94^8\equiv 72^2\equiv 34\pmod {103} \) 

Cuarta potenciación: \(  94^{16}\equiv 34^2\equiv 23\pmod {103} \) 

Quinta potenciación: \(  94^{32}\equiv 23^2\equiv 14\pmod {103} \) 

Los restos que nos interesan son de la quinta y de la tercera potenciación. Entonces, tenemos:

\(  94^{41} \equiv 94^{32}\cdot{}94^8\cdot{94}\pmod {103} \)   
   
\(  94^{41} \equiv (14)\cdot{}(34)\cdot{94}\equiv 42\pmod {103} \)   
 
De donde  finalmente,

[cerrar]
\(  x \equiv 42\pmod {103} \)        (5)

Lo cual se puede verificar reemplazando este resultado en la ecuación original (1). O sea,

\( 42^5\equiv 94\pmod {103} \)               (que es cierto)

ACLARACIÓN: Para resolver este ejercicio, hemos justificado cada paso teniendo en cuenta las leyes del algebra de congruencias. Sin embargo, una vez que ya somos conscientes de la veracidad de dichas leyes, el lector podrá agilizar la resolución de ejercicios similares sin tanta justificación (así como cuando se resuelve una ecuación ordinaria de algebra, no hay que justificar cada vez las leyes que están involucradas. Por eso, en adelante vamos a efectuar la resolución de congruencias con la mayor brevedad posible.

EJERCICIO PARA EL LECTOR

Empleando el método descrito en los anteriores párrafos, resolver:

\(  x^{341} \equiv 127\pmod {893} \)   


Sugerencia: 893 no es primo, entonces, emplee el teorema de Euler, en lugar del PTF.

Spoiler
Ayuda:     \( \phi (893)=\phi(19)\cdot {\phi (47)}=18\cdot {46}=828 \) 
 
Respuesta: \(  x \equiv 630\pmod {893} \)
[cerrar]
 

2.8.5. ORDEN (DE UN NÚMERO) CON RESPECTO DEL MÓDULO

Consideremos la siguiente congruencia:

\(  3^x\equiv u\pmod {11} \)          donde     \( 0\leq{}u<11  \)

A medida que damos valores a “x” de la siguiente sucesión:

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, …

“u” adquiere los siguientes valores

1, 3, 9, 5, 4, 1, 3, 9, 5, 4, 1, 3, 9, 5, 4, 1, 3, 9, 5, 4, 1, 3, 9, 5, 4, 1, 3, 9, 5, 4, 1, …

Esto se puede apreciar mejor en la siguiente gráfica:



Podemos observar que en la segunda sucesión están ausentes los valores: 2, 6, 7, 8, 10. Esto reduce la “amplitud del periodo (fundamental)  de la congruencia”. Su valor ya no es como habíamos visto en ocasiones anteriores igual al módulo (recuérdese la LEY PERIODICA). En este caso particular, la amplitud del periodo (fundamental) es igual a \( T_0=5 \). 

O sea, los valores de la ordenada "u" (en la gráfica) se repiten cada vez que la abscisa “x” se ha recorrido en 5 unidades hacia la derecha. Este valor (o amplitud del periodo fundamental de la congruencia) se llama también “orden de 3 con respecto del módulo 11” (donde 3 es el valor de la base de la función exponencial). Vamos a definir esta idea con mejor precisión.

Definición (orden de “a” con respecto del módulo “m”)

Se llama orden de \( a \) con respecto del módulo \( m \) al entero positivo más pequeño \( d \) tal que se verifique la congruencia:

\( a^d\equiv 1\pmod {m} \)       (2.12)

Obsérvese la similitud con el PTF (o con el teorema de Euler). Entonces, se requiere que,

\( 1\leq{}d\leq{}\phi (m) \).

Este valor lo denotaremos del siguiente modo:

\( d=Ord_m(a) \).


que se lee: "d es igual al orden de a, módulo m"

TEOREMA

Sean \( a \) y \( m \) dos enteros positivos tales que, \( mcd(a,m)=1 \). Sea, \( d=Ord_m(a) \).  Entonces, \( a^k\equiv a^l\pmod {m} \), sí y solo sí, \( k\equiv l\pmod {d} \). En particular, \( a^n\equiv 1\pmod {m} \), si y solo si, \( d \) divide a \( n \); y además, \( d \) divide a \( \phi (m) \).

DEMOSTRACIÓN

Spoiler
PRIMERA PARTE: \( a^k\equiv a^l\pmod {m} \), sí y solo sí, \( k\equiv l\pmod {d} \)

1) Sea \( a \)  de orden  \( d \), módulo  \( m \).  Además, sean  \( a \)    y    \( m \),   coprimos entre sí.  Supongamos además, que tenemos la congruencia: \( k\equiv l\pmod {d} \), luego, por definición:

 \( k=l+d\cdot {M} \) (M  es algún número entero).     (1)

Por otro lado, siempre es posible,  \( a^k\equiv a^k\pmod {m} \)           (reflexividad)      (2)

Podemos reemplazar (1) en (2), para obtener:

\( a^k\equiv a^{ l+d\cdot {M}}\pmod {m} \)   

Expresando esto en forma más conveniente,

 \( \displaystyle{a^k\equiv a^l(a^d)^M\pmod {m}} \)        (3)

Por ser “a” de orden “d”, módulo “m”, tenemos,

 \( a^d\equiv 1\pmod {m} \)

Elevemos a la potencia “M”,

\( \displaystyle{(a^d)^M\equiv 1\pmod {m}} \)                    (4)

Se puede multiplicar (3) y (4) miembro a miembro, para obtener,

\( \displaystyle{(a^k)( a^d)^M\equiv a^l(a^d)^M\pmod {m}} \)   
 
Además, dado que: \( mcd(a, m)=1 \)  en ambos miembros se cancela la expresión: \( \displaystyle{( a^d)^M } \) ,
\( \displaystyle{a^k\equiv a^l\pmod {m}} \)       
   
Lo cual prueba que: \( k\equiv l\pmod {d} \)  implica  \( \displaystyle{a^k\equiv a^l\pmod {m}} \) 
       
2) Recíprocamente, sea

\( \displaystyle{a^k\equiv a^l\pmod {m}} \)          (5)

Sin perder generalidad, podemos suponer que \( k\geq{}l \) , entonces, por el algoritmo de la división (tomando “d” como divisor),

\( k-l=d\cdot {q}+r \)        y donde      \( 0\leq{}r<=d-1 \)          (6)   
   
Podemos reemplazar (6) en (2),

 \( a^k\equiv a^{ l+d\cdot {q}+r}\pmod {m} \) 
 
Que se puede, escribir en esta otra forma:

\( \displaystyle{a^k\equiv a^l(a^d)^qa^r\pmod {m}} \)        (7)

Por ser “a” de orden “d”, módulo “m”, tenemos,

\( a^d\equiv 1\pmod {m} \)

Elevemos a la potencia “q”,

\( \displaystyle{(a^d)^q\equiv 1\pmod {m}} \)                    (8)

Luego de multiplicar (7) y (8), miembro a miembro, podremos cancelar la expresión: \( \displaystyle{( a^d)^q}  \) . Además, por la condición inicial (5), y teniendo en cuenta que “a” y “m” son coprimos entre sí, se podrá cancelar: \( a^k  \) con \( a^l  \), de donde resultará finalmente,

\( 1\equiv a^r\pmod {m} \)     

Pero, habíamos dicho que “a” es de orden “d”, módulo “m”. Luego, por (6), sólo queda una posibilidad. Que sea,

\( r=0 \) 
   
De donde inmediatamente, por definición de congruencia, (6) nos dice que:

       \( k\equiv l\pmod {d} \)     

Lo cual demuestra que:   \( \displaystyle{a^k\equiv a^l\pmod {m}} \)   implica   \( k\equiv l\pmod {d} \)     

De donde, el teorema es cierto (en su primera parte).

SEGUNDA PARTE:       
       
 \( a^n\equiv 1\pmod {m} \), si y solo si, \( d \) divide a \( n \); y además, \( d \) divide a \( \phi (m) \).

3) En efecto, dado que “a” es de orden “d”, módulo “m”; sólo puede darse que n=d o que n>d. Si n=d (no hay nada que probar). Si n>d, entonces por la PRIMERA PARTE, tendríamos: \( \displaystyle\a^n\equiv a^d\equiv 1\pmod {m} \)   si y solo si   \( n\equiv d\pmod {d} \) ; de donde,   \( n\equiv 0\pmod {d} \) que nos dice que “d” es divisor de “n”.

4) Por el teorema de Euler  \( a^{\phi(m)}\equiv a^d\equiv 1\pmod {d} \). Entonces, por el anterior inciso (3), “d” es divisor de  \( \phi (m) \).

Los cuales completan la demostración del teorema dado.
[cerrar]

2.8.6. SOLUCIÓN GENERAL DE UNA ECUACIÓN LINEAL DE CONGRUENCIAS

En base a los conceptos recien enunciados, se puede resolver una ecuación lineal de congruencias conociendo el ORDEN DE UN NUMERO, MÓDULO M. O en general, conociendo la FUNCIÓN PHI DE EULER.

Supongamos que buscamos resolver la ecuación:

\( ax\equiv b\pmod {m} \)

siendo \( mcd(a,m)=1 \). entonces, existe única solución.

Supongamos que "a" es de orden "d", módulo "m". O sea, \( d=Ord_m(a) \), entonces,

\( a^d\equiv 1\pmod{m} \)   o también,  \( 1\equiv a^d\pmod{m} \)

Multiplicando con la ecuación original, resulta,

\( ax\equiv b\cdot {a^d}\pmod {m} \)

Como a y m son coprimos entre sí y como \( d\geq{1} \), se puede dividir miembro a miembro por "a", resultando,


\( x\equiv b\cdot {a^{d-1}}\pmod {m} \)

Con lo que hemos enconcontrado la solución general de la ecuación de congruencias.

NOTA: A veces, no es fácil conocer el valor \( d=Ord_m(a) \), por eso, en su lugar podemos emplear la función totient de Euler..



Con esto concluimos este breve recorrido a la teoria elemental de números. En el futuro, sólo nos queda analizar los simbolos de Legendre y de Jacobi junto con la ley de reciprocidad cuadrática.

En posteriores entregas realizaremos una introducción al algebra lineal, con principal énfasis en el cálculo matricial.


(continuará)

22 Julio, 2014, 05:09 pm
Respuesta #17

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.9. LIBROS CONSULTADOS POR EL AUTOR

Los siguientes libros han sido consultados por el autor. También pueden servir para que el lector pueda complementar sus conocimientos, con información sobre "teoría elemental de números" en forma de conceptos y ejercicios. El resto de los libros tienen información histórica.



[Bell, ?] Bell, Eric T. Los grandes matemáticos. (Texto descargado de: www.librosmaravillosos.com)

Págs. Consultadas:
Spoiler
Capítulo 4 (Pierre de Fermat), Capítulo 14 (Gauss, el príncipe de la matemática)
[cerrar]

[Gauss, 1798?] Gauss, Carl. Disquisitiones Arithmeticae.

Págs. Consultadas:
Spoiler
Sección1 (Congruencias en general), Sección 2 (Congruencias de primer grado), Sección 3 (Residuos de las potencias)
[cerrar]

[Gentile 1, 1985] Gentile, Enzo R. Aritmética elemental. O.E.A. Washington D.C. (1985)

Págs. Consultadas:
Spoiler
Capítulo 4 (máximo común divisor), Capítulo 5 (mínimo común múltiplo), Capítulo 6 (Teorema Fundamental de la Aritmética), Capítulos 11, 12 (sobre congruencias), Capítulo 14 (sobre el pequeño teorema de Fermat, PTF)
[cerrar]

[Iborra 1, ?]Iborra Castillo, Carlos. Algebra. España.(e-book).

Págs. Consultadas
Spoiler
(Capítulo 6): 65-67 (sobre ternas pitagóricas), 80-83 (sobre el último teorema de Fermat)
[cerrar]

[Iborra 2, ?]Iborra Castillo, Carlos. Teoría de números. España (e-book)

Págs. Consultadas:
Spoiler
Capítulo 1 (sobre una introducción a la teoría de números)
[cerrar]

[Kúrosch, 1976] Kúrosch, A.G. Ecuaciones algebraicas de grados arbitrarios. Moscú. Editorial Mir. 1983

Págs. Consultadas:
Spoiler
22-24 (sobre la resolución de ecuaciones bajo radicales y la existencia de raíces de las ecuaciones)
[cerrar]

[Nathanson, 1999] Nathanson, Melvyn. Elementary Methods in Number Theory. USA. Springer-Verlag. 2000.

Págs. Consultadas:
Spoiler
Capítulo 1 (sobre la divisibilidad y los números primos), Capítulo 2 (sobre las congruencias en general)
[cerrar]

[Niven-Zuckerman, 1969] Niven, I. Zuckerman, H. Introducción a la Teoría de los Números. México, Limusa Wiley S.A 1976 (digitalizado)

Págs. Consultadas:
Spoiler
Capítulo 1 (divisibilidad), Capítulo 2 (congruencias)
[cerrar]

[A.V.(Rubiano), 2000] R. Jimenez, E. Gordillo, G. Rubiano. Teoría de Números (para principiantes). Universidad Nacional de Colombia. 2004 (e-book)

Págs. Consultadas:
Spoiler
Capítulo 2 (sobre el m.c.d. y el algoritmo de Euclides), 114-117 (sobre los teoremas de Fermat y Euler)
[cerrar]
[Singh, 1998] Singh, Simon. El enigma de Fermat. Barcelona. Ed. Planeta. (1998)

Pág. Consultadas: 23-55 (sobre el teorema de Pitágoras), 74-80 (sobre la raíz cuadrada de 2 y la arithmética de Diofanto)

[Vinogradov, 1977] Vinogradov, Ivan. Fundamentos de la teoría de los números. Moscú. Ed. Mir. Volumen 1. (1977)

Págs. Consultadas:
Spoiler
Capítulo 1 (sobre la teoría de la divisibilidad), Cap. 2: 37-39 (función de Euler), Capítulo 3 (sobre las propiedades relacionadas con las “leyes del algebra de congruencias”), Capítulo 4 (sobre resolución de congruencias mediante fracciones continuadas)
[cerrar]

2.9.1.WEB-GRAFÍA (Sitios y páginas web consultados)

http://scienceworld.wolfram.com/ (Sitio web sobre temas científicos, en inglés)

Secciones consultadas:
Spoiler
Biografía de Diofanto, Ecuaciones diofánticas, Último teorema de Fermat, Ternas pitagóricas
http://es.wikipedia.org/wiki/Wikipedia (Sitio web sobre temas diversos expuestos de forma enciclopédica, en español)
[cerrar]

www.librosmaravillosos.com (Sitio web que contiene libros interesantes de lectura accesible a todo público, para leer o descargar)

Secciones consultadas:
Spoiler
Biografía de Diofanto, Biografía de Ramanujan, El pequeño teorema de Fermat
[cerrar]

2.9.2. OTRAS CONSULTAS

Tema: Algoritmo extendido de Euclides (por el_manco)

http://rinconmatematico.com/foros/index.php?topic=26742.0

Tema: Ecuación diofántica lineal: ax+by=c (por el_manco)

http://rinconmatematico.com/foros/index.php?topic=26781.0

Tema: Aritmética de módulos y aplicación a criterios de divisibilidad (por argentinator)

http://rinconmatematico.com/foros/index.php?topic=34174.0


LIBROS RECOMENDADOS POR EL AUTOR ACERCA DE LOS TEMAS TRATADOS

Nivel Recreativo: [Bell, ?] (Los grandes matemáticos), [Singh, 1998]

Nivel básico: [Gentile 1, 1985], [Vinogradov, 1977]

Nivel Intermedio: [A.V.(Rubiano), 2000]

Buen Nivel: [Nathanson, 1999]

Nivel Avanzado:

22 Julio, 2014, 05:57 pm
Respuesta #18

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.10. INTRODUCCIÓN A LA TEORIA MATRICIAL

Sea \( \mathbb{K} \) un cuerpo cualquiera. Y si además llamamos ESCALARES a los elementos de \( \mathbb{K} \)  . Entonces, podemos definir la noción de matriz.

2.10.1. Definición (matriz)

Se llama matriz, de orden \( mxn \) (léase: “eme por ene”), definido sobre el cuerpo \( \mathbb{K} \); al conjunto de los “\( mn \)” elementos de \( \mathbb{K} \) dispuestos en “m” filas y “n” columnas.

Usaremos letras mayúsculas y los signos de agrupación (…) ó […], para  simbolizar una matriz; por ejemplo, la matriz genérica A,

\( A=\begin{bmatrix}{a_1_1}&{a_1_2}&{a_1_3}&{\cdots}&{a_1_n}\\{a_2_1}&{a_2_2}&{a_2_3}&{\cdots}&{a_2_n}\\{a_3_1}&{a_3_2}&{a_3_3}&{\cdots}&{a_3_n}\\{\vdots}&{\vdots}&{\vdots}&{\vdots}&{\vdots}\\{a_m_1}&{a_m_2}&{a_m_3}&{\cdots}&{a_m_n}\end{bmatrix} \)       (2.13)
       

EJEMPLOS: Como el sistema de números reales (\( \mathbb{R} \)) es un cuerpo, entonces, las siguientes son matrices:

\( A=\begin{pmatrix} 5 & {\pi} \\ {\sqrt{2}} & {\displaystyle\-\frac {3}{4}} \end{pmatrix} \)           \(  B=\begin{bmatrix}{\sen\displaystyle\frac {\pi}{3}}&{ \cos\displaystyle\frac {\pi}{3}}&{1}\\{1}&{2}&{3}\end{bmatrix} \)   

EJEMPLO: Como el sistema de números complejos (\( \mathbb{C} \)) es un cuerpo, entonces, la siguiente es una matriz:
   
 \( C= \begin{bmatrix}{3+2i}&{5i}&{-3+7i}\\{-5i}&{2}&{i}\\{-3-7i}&{-i}&{3}\end{bmatrix} \)   

2.10.1.1. Filas, columnas y elementos de una matriz

1) Sea \( i \) (“i”) el índice que nos muestra la FILA donde se encuentra un elemento específico, en la matriz.

2) Sea \( j \) (“jota”) el índice que nos muestra la COLUMNA donde se encuentra un elemento específico, en la matriz.

3) Entonces, diremos que: \( a_i_j \) es el ELEMENTO DE LA MATRIZ que se encuentra en la i-ésima fila y la j-ésima columna. Escrito en la forma: \( a_i_j \) se llama un “elemento genérico” de la matriz A.

Teniendo en cuenta el elemento genérico, una matriz A también se puede escribir:

\( A=(a_i_j) \)       (2.14)


2.10.1.2. Tamaño de una matriz


El término “tamaño” de una matriz hace referencia al número de filas (m) y el número de columnas (n) de una matriz. Aunque intuitivamente es correcta esta noción (de tamaño de una matriz), es preferible hablar de “orden de una matriz” en lugar de tamaño.

Así, en adelante se dirá, por ej.: Matriz de orden 2x3 (“dos por tres”) para referirnos a una matriz que tiene 2 filas y 3 columnas, etc.

A veces, usaremos la siguiente notación: \( A_m_x_n \)  que se lee: “matriz de orden mxn.

2.10.1.3. Igualdad de matrices

Dos matrices A y B, se dicen iguales únicamente si ambas tienen el mismo orden y sus correspondientes elementos genéricos son iguales entre sí. O sea, si \( a_i_j=b_i_j \)   

 
PROBLEMA:
Determine los valores de x, y, z para que las matrices A y B sean iguales.

\( A=\begin{bmatrix}{x^2+1}&{2y}\\{3}&{x+y}\\{7}&{z-3}\end{bmatrix} \) \( B=\begin{bmatrix}{-x^2+3}&{6}\\{3}&{2}\\{7}&{x+y}\end{bmatrix} \)

SOLUCIÓN:
Spoiler
En la primera fila, primera columna igualamos: \(  x^2+1=-x^2+3 \)
De donde x=1 ó x=-1.

En la primera fila, segunda columna igualamos: \( 2y=6 \). De donde, y=3.

En la segunda fila, primera columna igualamos: \(  3=3 \) (ya está igualado)

En la segunda fila, segunda columna igualamos: \(  x+y=2 \). Pero y=3, de donde, x=-1.

En la tercera fila, primera columna igualamos: \( 7=7 \) (ya está igualado)

En la tercera fila, segunda columna igualamos: \( z-3=x+y \). Pero, y=3, x=-1, de donde: z=5.

En resumen: x=-1, y=3, z=5. Con estos valores obtenemos las matrices A y B,

\( A=\begin{bmatrix}{2}&{6}\\{3}&{2}\\{7}&{2}\end{bmatrix} \) \( B=\begin{bmatrix}{2}&{6}\\{3}&{2}\\{7}&{2}\end{bmatrix} \)

O sea, A=B (como se buscaba).
[cerrar]

2.9.1.4. Suma de matrices

2.9.1.4.1. Definición

Dadas dos matrices del mismo orden: \( A_m_x_n=(a_i_j) \)  y \( B_m_x_n=(b_i_j) \) . Entonces, la suma de ambas matrices es otra matriz C (del mismo orden). O sea,

\( C_m_x_n=A_m_x_n + B_m_x_n  \)  o más brevemente, \( C=A + B \) 

Tal que:  \( C_m_x_n=( a_i_j + b_i_j) \)

EJEMPLO: 

\( \begin{bmatrix}{a}&{b}\\{c}&{d}\\{e}&{f}\end{bmatrix}+\begin{bmatrix}{u}&{v}\\{w}&{x}\\{y}&{z}\end{bmatrix}=\begin{bmatrix}{a+u}&{b+v}\\{c+w}&{d+x}\\{e+y}&{f+z}\end{bmatrix} \)

PROBLEMA: Halar C=A+B, donde,

\( A_3_x_3=(a_i_j) \)   tal que:  \( a_i_j= \left \{ \begin{matrix} i & \mbox{si }i \le j
\\ j & \mbox{si } i>j\end{matrix}\right  \) 

\( B_3_x_3=(b_i_j) \)   tal que:  \( b_i_j= \left \{ \begin{matrix} i+j & \mbox{si }i \le j
\\ i-j & \mbox{si } i>j\end{matrix}\right  \) 

SOLUCIÓN

Spoiler
Primero, debemos interpretar los terminos genéricos (en ambas matrices),

Matriz A: Primera fila, primera columna (i=1, j=1, son iguales i=j. Luego, el elemento \( a_1_1=1 \)

Primera fila, segunda columna (i=1, j=2, es i<j. Luego, el elemento \( a_1_2=1 \)

Primera fila, tercera columna (i=1, j=3, es i<j. Luego, el elemento \( a_1_3=1 \)

Segunda fila, primera columna (i=2, j=1, es i>j. Luego, el elemento \( a_2_1=1 \)

Segunda fila, segunda columna (i=2, j=2, es i=j. Luego, el elemento \( a_2_2=2 \)

Segunda fila, tercera columna (i=2, j=3, es i<j. Luego, el elemento \( a_2_3=2 \)

Tercera fila, primera columna (i=3, j=1, es i>j. Luego, el elemento \( a_3_1=1 \)

Tercera fila, segunda columna (i=3, j=2, es i>j. Luego, el elemento \( a_2_1=2 \)

Tercera fila, tercera columna (i=3, j=3, es i=j. Luego, el elemento \( a_3_3=3 \)

Luego, la matriz buscada es: \( A=\begin{bmatrix}{1}&{1}&{1}\\{1}&{2}&{2}\\{1}&{2}&{3}\end{bmatrix} \)

Matriz B: Primera fila, primera columna (i=1, j=1, son iguales i=j. Luego, por suma de indices se obtiene el elemento:
\( a_1_1=2 \)

Primera fila, segunda columna (i=1, j=2, es i<j. Luego, suma de indices: \( a_1_2=3 \)

Primera fila, tercera columna (i=1, j=3, es i<j. Luego, suma de indices: \( a_1_3=4 \)

Segunda fila, primera columna (i=2, j=1, es i>j. Luego, resta de índices \( a_2_1=1 \)

Segunda fila, segunda columna (i=2, j=2, es i=j. Luego, suma de indices:  \( a_2_2=4 \)

Segunda fila, tercera columna (i=2, j=3, es i<j. Luego, suma de indices:  \( a_2_3=5 \)

Tercera fila, primera columna (i=3, j=1, es i>j. Luego, resta de indices: \( a_3_1=2 \)

Tercera fila, segunda columna (i=3, j=2, es i>j. Luego, resta de indices: \( a_2_1=1 \)

Tercera fila, tercera columna (i=3, j=3, es i=j. Luego, suma de indices:  \( a_3_3=6 \)

Luego, la matriz buscada es: \( B=\begin{bmatrix}{2}&{3}&{4}\\{1}&{4}&{5}\\{2}&{1}&{6}\end{bmatrix} \)
Finalmente, la suma matricial es:

\( \begin{bmatrix}{1}&{1}&{1}\\{1}&{2}&{2}\\{1}&{2}&{3}\end{bmatrix}+\begin{bmatrix}{2}&{3}&{4}\\{1}&{4}&{5}\\{2}&{1}&{6}\end{bmatrix}=\begin{bmatrix}{3}&{4}&{5}\\{2}&{6}&{7}\\{3}&{3}&{9}\end{bmatrix}  \)

NOTA: Debemos recordar que el índice “i” representa siempre a las filas y el índice “j” representa a las columnas. Es muy importante tener en cuenta esto ya que muchos alumnos suelen confundir estos índices (de donde los resultados son nefastos).
[cerrar]

2.10.1.4. Producto de una matriz por un escalar

2.10.1.4.1. Definición

El producto de una matriz \( A=( a_i_j)  \)  por un escalar “k” es otra matriz cuyos elementos son iguales a: \( k\cdot {}a_i_j \) . Esta nueva matriz se denota por:   \( k\cdot {}A=A\cdot {}k \)   
 
EJEMPLO:

\( k\begin{bmatrix}{a}&{b}\\{c}&{d}\\{e}&{f}\end{bmatrix}=\begin{bmatrix}{ka}&{kb}\\{kc}&{kd}\\{ke}&{kf}\end{bmatrix} \)

Con base en la definición anterior, podemos definir la MATRIZ OPUESTA de A, como: \( -A=-1( a_i_j)=(- a_i_j) \); con lo cuál estamos preparados para hablar de “sustracción de matrices” como un caso especial de la adición (matricial).

Hasta ahora, hemos considerado matrices con elementos “no nulos”. Una matriz donde todos sus elementos son nulos (o sea, iguales a cero) se llama MATRIZ CERO. Por ejemplo, la matriz cero de orden 3x2 tiene la forma:

\(  0_3_x_2=\begin{bmatrix}{0}&{0}\\{0}&{0}\\{0}&{0}\end{bmatrix} \)

NOTA:
Cuando se sobreentiende de qué orden se trata, no es necesario utilizar los subíndices (salvo que pueda generarse alguna ambigüedad).

2.10.1.5. TEOREMA:
 
Sea \(  \mathbb{K}^{mxn} \) el conjunto de todas las matrices de orden mxn, sobre el cuerpo \(  \mathbb{K} \).  Sean \( A,B,C\in{}\mathbb{K}^{mxn} \) tres matrices arbitrarias y sean \(  k_1,k_2\in{}\mathbb{K} \) dos escalares. Entonces,

P.1. Propiedad asociativa

\(  (A+B)+C= A+(B+C) \)

DEMOSTRACIÓN

Spoiler
\(  A+B= (a_i_j)+(b_i_j)=(a_i_j+b_i_j) \), entonces, \(  (A+B)+C= (a_i_j+b_i_j)+(c_i_j)=( a_i_j+b_i_j+c_i_j) \)      (1)

De otro lado,

\(  B+C= (b_i_j)+(c_i_j)=(b_i_j+c_i_j) \), entonces, \(  A+(B+C)= (a_i_j)+(b_i_j+c_i_j)=( a_i_j+b_i_j+c_i_j) \)      (2)

Despues de igualar (1) y (2) se concluye,

\(  (A+B)+C= A+(B+C) \)
[cerrar]

Se deja al lector demostrar las restantes propiedades,

P.2. Elemento neutro aditivo

\(  A+0= A \)

P.3. Opuesto aditivo

\(  A+(-A)= 0 \)

P.4. Propiedad conmutativa

\(  A+B= B+A \)

P.5. Propiedad distributiva (respecto de un escalar)

\(  k_1(A+B) = k_1A+k_1B \)

P.6. Propiedad distributiva (respecto de una matriz)

\(  (k_1+k_2)A = k_1A+k_2A \)

P.7. Asociatividad en el producto por escalares

\(  (k_1k_2)A = k_1(k_2A) \)

P.8 El escalar: 1, y el escalar: 0 en el producto por una matriz

\(  1\cdot {} A= A \)         \(  0\cdot {} A= 0_m_x_n \)
 
2.10.1.6. Transpuesta de una matriz

Dada una matriz \( A\in{\mathbb{K}}^{mxn} \), su transpuesta es otra matriz \( B\in{\mathbb{K}}^{nxm} \), tal que, \( b_i_j=a_j_i \). Y se escribe: \( B=A^t \).

Observesé que la matriz \( A \) y su transpuesta \( A^t \), pertenecen a diferentes conjuntos de matrices. Por ejemplo,

\(  A=\begin{bmatrix}{a}&{b}&{c}\\{x}&{y}&{z}}\end{bmatrix}  \)   entonces, su transpuesta será  \(  \begin{bmatrix}{a}&{x}\\{b}&{y}\\{c}&{z}\end{bmatrix}  \)

Insinuamos al lector que demuestre las siguientes propiedadades:

1) \( (A+B)^t=A^t+B^t \)

2) \( (kA)^t=kA^t \)

2.10.1.7. Producto de dos matrices

Primero definimos el producto de una matriz fila (orden 1xn) por otra matriz columna (orden nx1), que es igual a la suma de los productos de sus elementos correspondientes. O sea,

\( \begin{bmatrix}{a_1}&{a_2}&{a_3}&{\ldots}&{a_n}\end{bmatrix} \begin{bmatrix}{b_1}\\{b_2}\\{b_3}\\{\vdots}\\{b_n}\end{bmatrix}=a_1b_1+a_2b_2+a_3b_3+...+a_nb_n  \)

O abreviando la notación (de la suma de productos),

\( \begin{bmatrix}{a_1}&{a_2}&{a_3}&{\ldots}&{a_n}\end{bmatrix} \begin{bmatrix}{b_1}\\{b_2}\\{b_3}\\{\vdots}\\{b_n}\end{bmatrix}=\displaystyle\sum_{k=1}^n{a_kb_k} \)       (2.15)

OBSERVACIÓN: Con el producto de dos matrices (matriz fila y matriz columna) hemos obtenido un número, es decir, un escalar. Por eso, a veces, el anterior producto se llama también producto escalar.

Ahora, ya podemos generalizar la definición del producto de dos matrices, que como podemos ver se trata de obtener los productos escalares de la i-esima fila (de la primera matriz A) con respecto a la j-ésima columna de la (segunda matriz B) para obtener el elemento \( c_i_j \) de la matriz resultante C.

O sea,

\( C=AB \) tal que  \( C=(c_i_j)=( }\displaystyle\sum_{k=1}^p{a_i_kb_k_j}) \)       (2.16)

Para que esta fórmula tenga total validez es necesario observar que la PRE-MATRIZ: A, hade contener tantas COLUMNAS ("P columnas") como FILAS ("p filas") tenga la POST-MATRIZ: B. Asi, la pre-matriz A es de orden mxp; y la post-matriz B es de orden pxn. De donde, la matriz resultante C será de orden mxn.

PROBLEMA: Construya una matriz C de orden 3x3, obtenida del producto de dos matrices, tales que la post-matriz es la transpuesta de la pre-matriz A (\( A_{3x2}=(i^3-j^3) \))

SOLUCIÓN:
Spoiler
Primero construimos la matriz A

Primera fila, primera columna: \( a_1_1=1^3-1^3=0 \)

Primera fila, segunda columna: \( a_1_2=1^3-2^3=-7 \)

Segunda fila, primera columna: \( a_2_1=2^3-1^3=7 \)

Segunda fila, segunda columna: \( a_2_2=2^3-2^3=0 \)

Tercera fila, primera columna: \( a_3_1=3^3-1^3=26 \)

Tercera fila, segunda columna: \( a_3_2=3^3-2^3=19 \)

Resulta: \(  A=\begin{bmatrix}{0}&{-7}\\{7}&{0}\\{26}&{19}\end{bmatrix} \)

Ahora, obtenemos su transpuesta: \( B=A^t=\begin{bmatrix}{0}&{7}&{26}\\{-7}&{0}&{19}}\end{bmatrix}  \)

Entonces, se pide calcular el producto,

\( C=\begin{bmatrix}{0}&{-7}\\{7}&{0}\\{26}&{19}\end{bmatrix}\begin{bmatrix}{0}&{7}&{26}\\{-7}&{0}&{19}}\end{bmatrix} \)

CALCULOS AUXILIARES:

El producto escalar de la primera fila (pre-matriz A) por la primera columna (post-matriz B) es: \( c_1_1=0\cdot {}0+(-7)\cdot{}(-7)=49 \)

El producto escalar de la primera fila (pre-matriz A) por la segunda columna (post-matriz B) es: \( c_1_2=0\cdot {}7+(-7)\cdot{}0 = 0  \)

El producto escalar de la primera fila (pre-matriz A) por la tercera columna (post-matriz B) es: \( c_1_1=0\cdot {}26+(-7)\cdot{}19=-133  \)

El producto escalar de la segunda fila (pre-matriz A) por la primera columna (post-matriz B) es: \( c_1_1=7\cdot {}0+0\cdot{}(-7)=0 \)

El producto escalar de la segunda fila (pre-matriz A) por la segunda columna (post-matriz B) es: \( c_1_1=7\cdot {}7+0\cdot{}0=49 \)

El producto escalar de la segunda fila (pre-matriz A) por la tercera columna (post-matriz B) es: \( c_1_1=7\cdot {}26+0\cdot{}19=182 \)

El producto escalar de la tercera fila (pre-matriz A) por la primera columna (post-matriz B) es: \( c_1_1=26\cdot {}0+19\cdot{}(-7)=-133 \)

El producto escalar de la tercera fila (pre-matriz A) por la segunda columna (post-matriz B) es: \( c_1_1=26\cdot {}7+19\cdot{}0=182 \)

El producto escalar de la tercera fila (pre-matriz A) por la tercera columna (post-matriz B) es: \( c_1_1=26\cdot {}26+19\cdot{}19=1037  \)

De aquí resulta finalmente,

\( C=\begin{bmatrix}{49}&{0}&{-133}\\{0}&{49}&{182}\\{-133}&{182}&{1037}\end{bmatrix} \)
[cerrar]

(En la próxima entrega: Matrices cuadradas)

(continuará...)

22 Julio, 2014, 06:11 pm
Respuesta #19

nataivel

  • $$\Large \color{red}\pi\,\pi$$
  • Mensajes: 52
  • Karma: +1/-0
  • Sexo: Masculino
  • Un paso a la vez...

2.10.1.8. Teorema

Sea \( k  \) un escalar y sean \( A, B, C  \) tres matrices, de ordenes diferentes, tales que los productos están definidos. Entonces,

P.1. Propiedad asociativa (producto)

\( (AB)C =A(BC) \)

DEMOSTRACIÓN

Spoiler
Para que el producto esté definido, consideremos los siguientes órdenes de las matrices: \( A_m_x_p, B_p_x_q, C_q_x_n  \)

PRIMERA PARTE:

Por definición del producto de dos matrices, tenemos:

\( (AB)_m_x_q=( \displaystyle\sum_{k=1}^p{a_i_kb_k_j}) \)  (Esta matriz resultante tiene “m filas y q columnas”).

Multiplicamos la anterior matriz (AB) por C

Para esto, tengamos en cuenta que la i-ésima fila de (AB) está dada por la sucesión,

 ,\( \displaystyle\sum_{k=1}^p{a_i_kb_k_1}, \displaystyle\sum_{k=1}^p{a_i_kb_k_2} , \displaystyle\sum_{k=1}^p{a_i_kb_k_3}, \displaystyle\sum_{k=1}^p{a_i_kb_k_4}, \ldots, \displaystyle\sum_{k=1}^p{a_i_kb_k_q}  \)     (es decir, hay “q” elementos en dicha fila, porque la matriz tiene “q” columnas)

Asimismo, la j-ésima columna de C consta de los siguientes elementos:

\( c_1_j, c_2_j, c_3_j, \idots, c_q_j  \)  (es decir, hay “q” elementos en dicha columna, porque la matriz C, tiene “q” filas)

Haciendo el producto escalar, tenemos:

\( \begin{bmatrix}{\displaystyle\sum_{k=1}^p{a_i_kb_k_1}}&{\displaystyle\sum_{k=1}^p{a_i_kb_k_2}}&{\displaystyle\sum_{k=1}^p{a_i_kb_k_3}}&{\ldots}&{\displaystyle\sum_{k=1}^p{a_i_kb_k_q}}\end{bmatrix}\begin{bmatrix}{c_1_j}\\{c_2_j}\\{c_3_j}\\{\vdots}\\{c_q_j}\end{bmatrix}=  \)

\(  =\displaystyle\sum_{k=1}^p{a_i_kb_k_1}\cdot { c_1_j }+\displaystyle\sum_{k=1}^p{a_i_kb_k_2}\cdot { c_2_j }+  \displaystyle\sum_{k=1}^p{a_i_kb_k_3}\cdot { c_3_j }+ \ldots + \displaystyle\sum_{k=1}^p{a_i_kb_k_q}\cdot { c_q_j }  \)   

O escribiendo abreviadamente,

 \( =\displaystyle\sum_{h=1}^q (\sum_{k=1}^p{a_i_kb_k_h}\cdot { c_h_j }) \)   
 
O sea,

\( [(AB)C]_m_x_n=(\displaystyle\sum_{h=1}^q (\sum_{k=1}^p{a_i_kb_k_h}\cdot { c_h_j })) \)       (1)

SEGUNDA PARTE:

También por definición de producto matricial.Tener en cuenta que:\( A_m_x_p, B_p_x_q, C_q_x_n  \)

\( (BC)_p_x_n=( \displaystyle\sum_{K=1}^q{b_i_Kc_K_j}) \)  (Esta matriz tiene “p filas y n columnas”).

Multiplicamos la matriz A por (BC), para esto tengamos en cuenta la i-ésima fila de A. O sea:

\( \begin{bmatrix}{a_i_1}&{a_i_2}&{a_i_3}&{\ldots}&{a_i_p}\end{bmatrix}  \)

(Esta fila tiene “p” elementos, porque la matriz A tiene “p columnas”)

Ahora, obtengamos la j-ésima columna de (BC), o sea,

\( \begin{bmatrix}{\displaystyle\sum_{K=1}^q{b_1_Kc_K_j}}\\{\displaystyle\sum_{K=1}^q{b_2_Kc_K_j}}\\{\displaystyle\sum_{K=1}^q{b_3_Kc_K_j}}\\{\vdots}\\{\displaystyle\sum_{K=1}^q{b_p_Kc_K_j}}\end{bmatrix}  \)

(Esta columna tiene “p” elementos, porque la matriz (BC) tiene “p filas”)

Entonces, haciendo el producto escalar, tenemos:

\( \begin{bmatrix}{a_i_1}&{a_i_2}&{a_i_3}&{\ldots}&{a_i_p}\end{bmatrix}\begin{bmatrix}{\displaystyle\sum_{K=1}^q{b_1_Kc_K_j}}\\{\displaystyle\sum_{K=1}^q{b_2_Kc_K_j}}\\{\displaystyle\sum_{K=1}^q{b_3_Kc_K_j}}\\{\vdots}\\{\displaystyle\sum_{K=1}^q{b_p_Kc_K_j}}\end{bmatrix}=  \)

\( = a_i_1\cdot {\displaystyle\sum_{K=1}^q{b_1_Kc_K_j}} + a_i_2\cdot {\displaystyle\sum_{K=1}^q{b_2_Kc_K_j}}+ a_i_3\cdot {\displaystyle\sum_{K=1}^q{b_3_Kc_K_j}} + \ldots+ a_i_p\cdot {\displaystyle\sum_{K=1}^q{b_p_Kc_K_j}} = \displaystyle\sum_{H=1}^p (a_i_H\cdot {}\sum_{K=1}^q{b_H_Kc_K_j})  \)   
 
En resumen,

\(  [A(BC)]_m_x_n=(\displaystyle\sum_{H=1}^p (a_i_H\cdot {}\sum_{K=1}^q{b_H_Kc_K_j}))  \)       (2)

Comparando ambas sumatorias dobles, en (1) y (2), vemos que existe diferencia en los índices. Sin embargo, nos damos cuenta que: K=h , H=k  (3)

Poniendo (3) en (2) tenemos:

\(  [A(BC)]_m_x_n=(\displaystyle\sum_{k=1}^p (a_i_k\cdot {}\sum_{h=1}^q{b_k_hc_h_j}))  \)       (2’)

TERCERA PARTE:

Comparando ambas sumatorias dobles (1) y (2’). O sea,

\( [(AB)C]_m_x_n=(\displaystyle\sum_{h=1}^q (\sum_{k=1}^p{a_i_kb_k_h}\cdot { c_h_j })) \)       (1)

\(  [A(BC)]_m_x_n=(\displaystyle\sum_{k=1}^p (a_i_k\cdot {}\sum_{h=1}^q{b_k_hc_h_j}))  \)       (2’)

En ambas sumatorias dobles, vemos que el elemento (\( a_i_k \)) depende solamente del índice sumatorio “k” que varía de K=1 hasta k=p. Esto sucede en ambas sumatorias dobles.

El elemento: \( b_k_h \) depende solamente de los índices sumatorios “k y h”. Donde “k” varía desde k=1 hasta k=p. Y donde “h” varía desde h=1 hasta h=q. Esto sucede en ambas sumatorias dobles, (1) y (2’).

El elemento: \( c_h_j \), depende del índice sumatorio “h”. Donde “h” varía desde h=1 hasta h=q. esto sucede en ambas sumatorias dobles.

De este análisis de desprende que: “Ambas sumatorias dobles, en (1) y en (2’), son iguales en magnitud”. De donde, se concluye inmediatamente que debe ser:

(AB)C=A(BC)

Que demuestra la propiedad asociativa (P1).
[cerrar]

El lector puede demostrar las propiedades restantes,

P.2. Propiedad distributiva (por la izquierda)

\( A(B+C )=AB+AC) \)

P.3. Propiedad distributiva (por la derecha)

\(  (B+C )A=BA+CA) \)

P.4. Asociatividad respecto de un escalar

\(  k(AB)=(kA)B=A(kB) \)


2.10.2. MATRICES CUADRADAS

A partir de ahora, vamos a enfatizar nuestro estudio en las matrices cuadradas (matrices con la misma cantidad de filas y columnas), debido a que sobre ellas se fundamenta el resto del contenido de este “breve estudio”.

2.10.2.1. Definición

El conjunto de las matrices que tienen la misma cantidad de filas y de columnas se llaman matrices cuadradas. Si la matriz A tiene “n filas” y “n columnas”, se dice que es de orden nxn (que se lee: “matriz ene-cuadradada” o bien, “matriz cuadrada de orden n”).

Una matriz genérica de orden nxn se puede escribir así:

\( A=\begin{bmatrix}{a_1_1}&{a_1_2}&{a_1_3}&{\cdots}&{a_1_n}\\{a_2_1}&{a_2_2}&{a_2_3}&{\cdots}&{a_2_n}\\{a_3_1}&{a_3_2}&{a_3_3}&{\cdots}&{a_3_n}\\{\vdots}&{\vdots}&{\vdots}&{\vdots}&{\vdots}\\{a_n_1}&{a_n_2}&{a_n_3}&{\cdots}&{a_n_n}\end{bmatrix}  \)       (2.17)

2.10.2.2. Diagonal y traza de una matriz cuadrada

2.10.2.2.1. La diagonal principal

La sucesión de los elementos de una matriz cuadrada tales que sus índices son iguales se llama “diagonal principal”. O sea, se llama diagonal principal a la sucesión,

\( a_1_1, a_2_2, a_3_3, a_4_4, \ldots, a_n_n \)       (2.18)

2.10.2.2.2. La diagonal secundaria

Intuitivamente, la diagonal secundaria es la otra diagonal que se puede formar dibujando una línea imaginaria desde el extremo inferior izquierdo hasta la esquina superior derecha (en la matriz dada).

EJEMPLO:  En la matriz,

\( A=\begin{bmatrix}{1}&{2}&{3}\\{4}&{5}&{6}\\{7}&{8}&{9}\end{bmatrix} \)

La diagonal principal es: 1, 5, 9

La diagonal secundaria es: 7, 5, 3

2.10.2.2.3. La traza

Se llama traza de la matriz A, y se simboliza: \( tr(A) \) o simplemente\( tr A \)  , a la suma de todos los elementos de la diagonal principal. O sea:

\( tr(A)=a_1_1+a_2_2+a_3_3+a_4_4+\ldots+a_n_n \)

O en notación abreviada:

\( tr(A)= \displaystyle{\sum_{k=1}^n{a_k_k}}  \)       (2.19)

En el ejemplo anterior, la diagonal principal (en la matriz A) es: 1, 5, 9. Luego, tr A=15

2.10.3. MATRICES CUADRADAS ESPECIALES (PARTE 1)

2.10.3.1. La matriz identidad

Sea (\( \delta_i_j  \)), la función DELTA DE KRONECKER, que se define:

\( \delta_i_j= \left \{ \begin{matrix} 1 & \mbox{si }i=j\\0 & \mbox{si } i\neq j\end{matrix}\right  \) 

Entonces, la matriz identidad (I) es aquella cuyo elemento genérico es la función delta de Kronecker.

\( I= (\delta_i_j) \)

A veces, es necesario explicitar el orden de la matriz. Si es de orden nxn, se puede escribir:

\( I_n= (\delta_i_j) \)

Intuitivamente, la matriz identidad es aquella en que los elementos de la diagonal principal son todas iguales a 1; y el resto de sus elementos es igual a 0 (cero).

Por ejemplo:   

\( I_3=\begin{bmatrix}{1}&{0}&{0}\\{0}&{1}&{0}\\{0}&{0}&{1}\end{bmatrix}  \)

Una de las propiedades fundamentales de la matriz identidad (I) es que se asemeja al escalar: 1 (en los números reales). Así se verifica que para toda matriz cuadrada A,

\( IA=AI=A \)

2.10.3.2. La matriz escalar

Si k es un escalar cualquiera, entonces, se llama matriz escalar (o también matriz constante), a la matriz cuadrada que verifica:

 \( K=(k_i_j) \)   tal que:    \( k_i_j= \left \{ \begin{matrix} k & \mbox{si }i=j\\0 & \mbox{si } i\neq j\end{matrix}\right  \) 

Nótese que la matriz constante (o escalar) se obtiene multiplicando un escalar “k” por la matriz identidad. O sea,
\( K=kI \)

2.10.3.3. Matrices diagonales

Se llama matriz diagonal (D), aquella en que todos sus elementos son nulos excepto (tal vez) los de la diagonal principal.
 
Por ejemplo, \( \begin{bmatrix}{x}&{0}&{0}\\{0}&{y}&{0}\\{0}&{0}&{z}\end{bmatrix}  \)

Es una matriz diagonal.

2.10.3.4. Matrices triangulares

Se dice que una matriz cuadrada es triangular superior, si todas las entradas por debajo de la diagonal principal son cero (0). Se dice que una matriz es triangular inferior, si todas las entradas por encima de la diagonal principal son cero (0).

EJEMPLO: La primera matriz es triangular superior y la segunda es triangular inferior.

\( \begin{bmatrix}{a}&{b}&{c}\\{0}&{e}&{f}\\{0}&{0}&{i}\end{bmatrix}  \)

\(  \begin{bmatrix}{a}&{0}&{0}\\{d}&{e}&{0}\\{g}&{h}&{i}\end{bmatrix}  \)

2.10.4. MATRICES CUADRADAS ESPECIALES (PARTE 2)

2.10.4.1. Potencias de matrices

Se define, para toda matriz A (cuadrada) y “n” natural,

\(  A^0=I \)   ,  \(  A^1=A \)    ,  \(  A^{n+1}=A^nA=AA^n \)       (2.20)

2.10.4.2. Matriz periodica (respecto de su exponente)

Una matriz cuadrada A, es periódica (respecto de su exponente), si existe un número entero “p”, tal que,

\(  A^{p+1}=A \)

Al número “p” llamaremos PERIODO DE LA MATRIZ.

PROBLEMA: Determine el periodo de la siguiente matriz,

\( A=\begin{bmatrix}{1}&{-2}&{-6}\\{-3}&{2}&{9}\\{2}&{0}&{-3}\end{bmatrix}  \)

SOLUCIÓN

Spoiler
Multiplicando sucesivamente la misma matriz, tenemos:

\(  A^2=\begin{bmatrix}{1}&{-2}&{-6}\\{-3}&{2}&{9}\\{2}&{0}&{-3}\end{bmatrix}\begin{bmatrix}{1}&{-2}&{-6}\\{-3}&{2}&{9}\\{2}&{0}&{-3}\end{bmatrix}=\begin{bmatrix}{-5}&{-6}&{-6}\\{9}&{10}&{9}\\{-4}&{-4}&{-3}\end{bmatrix}  \)

\( A^2A=\begin{bmatrix}{-5}&{-6}&{-6}\\{9}&{10}&{9}\\{-4}&{-4}&{-3}\end{bmatrix}\begin{bmatrix}{1}&{-2}&{-6}\\{-3}&{2}&{9}\\{2}&{0}&{-3}\end{bmatrix}=\begin{bmatrix}{1}&{-2}&{-6}\\{-3}&{2}&{9}\\{2}&{0}&{-3}\end{bmatrix}=A  \)

Hemos obtenido: \( A^2A=A  \)

De donde el periodo de la matriz A es, p=2. En conclusión, la matriz A es periodica de periodo p=2.
[cerrar]

2.10.4.2.1. Matriz idempotente

Una matriz cuadrada A y periódica, se llama IDEMPOTENTE si su periodo es P=1. Es decir, si se verifica que:

\( A^2=A \)

2.10.4.2.2. Matriz tripotente

Una matriz cuadrada A y periódica, se llama TRIPOTENTE si su periodo es P=2. Es decir, si se verifica que:

\( A^3=A \)

2.10.4.3. Matriz involutiva

Una matriz cuadrada A, se dice que es INVOLUTIVA, si al multiplicarse consigo misma se obtiene la matriz identidad. Es decir,

\( A^2=I \)

2.10.4.4. Matriz nilpotente

Una matriz cuadrada \( A\neq 0  \), se llama NILPOTENTE (o NULPOTENTE) si existe un número natural \(  h\neq 0 \), tal que se verifica,

\( A^h=0 \)

2.10.5. MATRICES CUADRADAS ESPECIALES (PARTE 3)

2.10.5.1. Matrices simétricas y antisimétricas


Una matriz cuadrada es SIMÉTRICA cuando es igual a su transpuesta. O sea,

\( A =A^t \)

Una matriz cuadrada es ANTISIMÉTRICA cuando es igual al opuesto de su transpuesta. O sea,

\( A =-A^t \)

NOTA: Los elementos de la diagonal principal de una matriz antisimétrica son todos iguales a cero (0).

EJEMPLO: Las siguientes matrices son, respectivamente, simétrica y antisimétrica.

\( \begin{bmatrix}{x}&{a}&{b}\\{a}&{y}&{c}\\{b}&{c}&{z}\end{bmatrix}  \)

\( \begin{bmatrix}{0}&{-a}&{b}\\{a}&{0}&{-c}\\{-b}&{c}&{0}\end{bmatrix}  \)

Spoiler
Para reconocer por simple inspección una matriz simétrica trazamos una línea imaginaria por su diagonal principal y vemos que los elementos están distribuidos de forma equidistante. Por ejemplo “a” con “a”, “b” con “b”, “c” con “c”.

Para reconocer por simple inspección una matriz antisimétrica, vemos que todos los elementos de la diagonal principal son cero (0). Además, sus elementos están distribuidos de froma equidistante pero con signo cambiado. Por ejemplo: “a” con “-a”, “-b” con “b” y “c” con “-c”.
[cerrar]

2.10.5.2. Matrices normales

Una matriz cuadrada A, es NORMAL, si en el producto, conmuta con su transpuesta. O sea:

\( A A^t=A^tA \)

2.10.5.3. Matrices ortogonales

Una matriz cuadrada A, es ORTOGONAL, si el producto por su transpuesta es igual a la matriz identidad (I). O sea:

\( A A^t=A^tA= I \)

NOTA:
Spoiler
A veces se define de la siguiente forma: “Una matriz cuadrada A, es ORTOGONAL, si su inversa es igual a su transpuesta”. Sin embargo, para dicha definición necesitamos conocer el significado de INVERSA DE UNA MATRIZ que se dará más adelante. Por ahora, nos quedamos con la definición 2.10.5.2
[cerrar]

2.10.6. MATRICES CUADRADAS ESPECIALES (PARTE 4)

2.10.6.1. Matrices complejas

Una matriz compleja es aquella cuyos elementos son números complejos. Los números complejos son aquellos que tienen la forma:

\( z=a+bi \)  (donde \( a, b \) son números reales y donde \( i \) es la unidad imaginaria (\( i=\sqrt[ ]{-1} \))

Al número real "a" se llama PARTE REAL del número complejo. El número real "b" se llama PARTE IMAGINARIA del número complejo.

Se llama CONJUGADA de un número complejo a aquel numero complejo cuya PARTE IMAGINARIA es de signo opuesto (al del número complejo dado). O sea,

Si \( z=a+bi \) (es un número complejo) entonces \( \bar{z}=a-bi \)(es su conjugada)

2.10.6.2. Matrices conjugada

Se llama así a una matriz compleja \( B \) tal que todos sus elementos son los conjugados de los elementos de una matriz dada A. se simboliza: \( B=\bar{A} \) (se lee: matriz conjugada de A)

2.10.6.3. Matriz conjugada de la transpuesta o transpuesta de la conjugada

Si obtenemos la transpuesta de la conjugada de una matriz A, representaremos ese hecho mediante el superíndice (\( * \))

Es decir,

\( A^*=(\overline{A})^t=\overline{(A^t)} \)       (2.21)

NOTA: Algunos autores suelen emplear el superíndice \( H \) en lugar de \( * \) (En este trabajo, no estudiaremos matrices complejas, por tanto estas notaciones son solo de caracter informativo).

2.10.6.4. Matrices hermitianas

Una matriz A, se llama HERMITIANA si es igual a la transpuesta de su conjugada. O sea,

\( A=(\overline{A})^t \)  (entonces, A es hermitiana)

También se puede escribir:  \( A=A^* \)   (entonces, A es hermitiana)

OBSERVACIÓN: Para reconocer por simple inspección si una matriz es hermitiana, debe darse que la matriz es simétrica respecto de las partes reales (de sus elementos). Al mismo tiempo, la matriz es antisimétrica respecto de sus partes imaginarias (de sus elementos).

PROBLEMA: La siguiente matriz ¿es hermitiana o no?

\( A=\begin{bmatrix}{1}&{-i}&{2+i}\\{i}&{-2}&{-3-2i}\\{2-i}&{-3+2i}&{3}\end{bmatrix} \)

SOLUCIÓN:

Spoiler
Analicemos,

PRIMERO: Si no existiera partes imaginarias tendríamos:

\( \begin{bmatrix}{1}&{0}&{2}\\{0}&{-2}&{-3}\\{2}&{-3}&{3}\end{bmatrix} \) (una matriz simétrica)

SEGUNDO: Si no existiera partes reales, tendríamos,

\( A=\begin{bmatrix}{0}&{-i}&{i}\\{i}&{0}&{-2i}\\{-i}&{+2i}&{0}\end{bmatrix} \) (una matriz antisimétrica)

Luego, la matriz dada es hermitiana.
[cerrar]

2.10.6.5. Matrices antihermitianas

Una matriz se llama antihermitiana o antihermítica si se verifica,

\( A=-(\overline{A})^t \)   o también  \( A=-A^* \)


2.10.6.6. Matrices complejas normales

Una matriz compleja A se llama normal, si se verifica la conmutatividad de matrices:

\( AA^*=A^*A \)

2.10.6.7. Matriz unitaria

Una matriz compleja A es unitaria si se verifica,

\( AA^*=A^*A=I \)

En otras palabras, \( A^* \) es igual a la matriz inversa de A.

Spoiler
(Nuevamente, estos conceptos son de caracter informativo. Por esa razón no ampliaremos otras posibles propiedades que puedan derivarse de estas definiciones. esos afanes corresponderan a un curso completo de Algebra Lineal, no aquí)
[cerrar]

Hasta aquí, hemos definido una gran parte de las matrices cuadradas especiales que aparecen en muchos problemas. En las próximas entregas estudiaremos la función determinante y posteriormente la inversión de matrices.

(continuará)