Autor Tema: Número 2. (2013) - 1 Motivación p/ definición de longitud de curva en el plano

0 Usuarios y 1 Visitante están viendo este tema.

23 Agosto, 2013, 11:30 pm
Leído 6082 veces

pepito

  • Lathi
  • Mensajes: 1,618
  • Karma: +0/-0
  • Sexo: Masculino
Motivación para la definición de longitud de una curva en el plano

Introducción

Para inventar una definición matemática que modele algo que uno cree ya conocer se empieza asumiendo determinadas propiedades que uno quisiera que cumpla aquello que se está definiendo y se analizan las consecuencias que traerían en caso de ser ciertas. Un ejemplo sería la definición de lo que se entiende por área encerrada bajo la gráfica de una función. Para funciones escalonadas es algo que se puede hacer sin problemas, simplemente se la define como la suma de las áreas de los rectángulos que conforman la región encerrada bajo la gráfica de la función en cuestión. Para generalizar esto a otras funciones (según Riemann) se asume que:

(*) Si una función toma valores mayores o iguales que otra en todo el intervalo en el que ambas están definidas entonces el área encerrada bajo la gráfica de la primera es mayor o igual al de la segunda.

Sea lo que sea que uno entienda por área, en tanto se asuma que cumple (*), resulta que el área encerrada bajo la gráfica de una función es mayor o igual al supremo de las sumas inferiores y menor o igual al ínfimo de las superiores, teniendo en cuenta que toda suma inferior se corresponde con el área encerrada abajo de la gráfica de una función auxiliar que es escalonada y menor o igual a la función original en todo el intervalo de definición, y algo análogo ocurre con toda suma superior. Entonces uno decide restringirse a estudiar las funciones para las cuales el supremo y el ínfimo mencionados coinciden y define el área encerrada bajo su gráfica como el número al que equivalen estas dos cantidades. Por supuesto que una vez hecho esto falta probar, entre otras tantas cosas, que el área entendida de esa manera cumple (*). Si no resultara así se estaría trabajando con una definición que no modela la noción de área de la forma que uno había declarado desde el principio que quería. Todo el estudio previo a la definición no constituye más que una motivación para la misma, pero el estudiante honesto lo hace, y no toma las definiciones cual robot, diciendo "ah, yo no sé lo que es un área, sólo sé lo que es una suma inferior, una suma superior, un ínfimo y un supremo, y trabajo tranquilo con eso". A pesar de que en todos los libros se demuestre que la integral de Riemann cumple (*) a partir de la definición, lo cierto es que no se llegó a esa definición por otro camino más que asumiendo a priori que lo cumplía (por supuesto que esto no es un error de los libros, es sólo algo que se da por sobreentendido).

Ese es un caso sencillo comparado con el que se trata en este artículo. Lo que me propongo es sugerir una lista de propiedades razonables a asumir sobre la longitud de las curvas, análogas a (*), para demostrar que suponiéndolas verdaderas se llega a que la longitud de una curva en el plano es el supremo de las longitudes de las poligonales inscritas en ella. Mi objetivo es partir de propiedades más razonables que "si dos curvas se parecen mucho, sus longitudes también".

Teorema: Sea \( f:[a,b]\to\mathbb{R} \) una función derivable con derivada estrictamente creciente. Dada una partición \( P=\{x_0,\ldots,x_n\} \) de \( [a,b] \), para cada \( 0\le i\le n \) sea \( T_i \) la recta tangente al gráfico de \( f \) en \( (x_i,f(x_i)) \). Para cada \( 1\le i\le n \), \( T_i \) se corta con \( T_{i-1} \) en un único punto \( P_i \). Sean, para cada \( 1\le i\le n \),  \( L_i \) el segmento que une \( (x_{i-1},f(x_{i-1})) \) con \( P_i \), \( R_i \) el segmento que une \( P_i \) con \( (x_i,f(x_i)) \) y \( D_i \) el segmento que une \( (x_{i-1},f(x_{i-1})) \) con \( (x_i,f(x_i)) \). Sean \( l_i \), \( r_i \) y \( d_i \) sus respectivas longitudes. Entonces para todo \( \epsilon>0 \) existe una partición \( P=\{x_0,\ldots,x_n\} \) de \( [a,b] \) para la cual \( \sum_{i=1}^n(l_i+r_i)-\sum_{i=1}^nd_i<\epsilon \).

Demostración:

Como \( f' \) es creciente y no puede tener discontinuidades esenciales (por ser una derivada), entonces es continua.

Primero voy a probar que bajo estas hipótesis el conjunto \( \{\sum_{i=1}^nd_i: P=\{x_0,\ldots,x_n\}\textsf{ partición de [a,b]}\} \) está acotado superiormente (cosa que voy a usar al final). Como \( f' \) es continua y su dominio es compacto, entonces es acotada. Por lo tanto, el ángulo de la recta tangente al gráfico de \( f \) en cada punto no toma valores arbitrariamente cercanos a \( -\frac{\pi}{2} \) ni a \( \frac{\pi}{2} \), y entonces su coseno no toma valores arbitrariamente cercanos al 0. Dada una partición \( P=\{x_0,\ldots,x_n\} \) de \( [a,b] \) cualquiera, por el teorema del valor medio sé que, para cada \( 1\le i\le n \), existe un \( \tau_i\in(x_{i-1},x_i) \) tal que el ángulo que forma la recta tangente al gráfico de \( f \) en el punto \( (\tau_i,f(\tau_i)) \) con la horizontal, al que llamo \( \alpha(\tau_i) \), es igual al ángulo de inclinación del segmento \( D_i \). Se tiene

\( \cos(\alpha(\tau_i))=\dfrac{x_i-x_{i-1}}{d_i} \) o sea que \( d_i=\dfrac{x_i-x_{i-1}}{\cos(\alpha(\tau_i))} \)

y por lo tanto

\( \displaystyle\sum_{i=1}^nd_i=\displaystyle\sum_{i=1}^n\dfrac{x_i-x_{i-1}}{\cos(\alpha(\tau_i))}\le M'\displaystyle\sum_{i=1}^n(x_i-x_{i-1})=M' (b-a)=M \),

donde \( M' \) es una cota superior para \( \frac{1}{\cos(\alpha(x))},\;\;x\in[a,b] \) y \( M=M'(b-a) \).

Ahora sí. Como \( f' \) es continua y su dominio es compacto, entonces es uniformemente continua. Por lo tanto, el ángulo de la recta tangente al gráfico de \( f \) en cada punto es una función uniformemente continua, a la que llamo \( \alpha \). Dado \( \epsilon '>0 \), sea \( \delta>0 \) tal que si \( |x-y|<\delta \) entonces \( |\alpha(x)-\alpha(y)|<\epsilon ' \). Tomo una partición \( P=\{x_0,\ldots,x_n\} \) de \( [a,b] \) para la cual \( \max_{1\le i\le n}\{x_i-x_{i-1}\}<\delta \). Para cada \( 1\le i\le n \) se tiene la siguiente situación, donde \( \alpha_{i-1}=\alpha(x_{i-1}) \) y \( \alpha_i=\alpha(x_i)=\alpha_{i-1}+\epsilon_i \), con \( 0<\epsilon_i<\epsilon ' \).



El ángulo rojo es \( \pi-\alpha-\epsilon_i \), o sea que el azul es \( \epsilon_i \), y por lo tanto, el verde (el ángulo entre los segmentos \( L_i \) y \( R_i \)) es \( \pi-\epsilon_i \).

Por el teorema del coseno, es

\( d_i^2=l_i^2+r_i^2-2l_ir_i\cos(\pi-\epsilon_i))\qquad\iff \)

\( d_i^2=(l_i+r_i)^2-2l_ir_i(1+\cos(\pi-\epsilon_i))\qquad\iff \)

\( (l_i+r_i)^2-d_i^2=2l_ir_i(1+\cos(\pi-\epsilon_i))\qquad\iff \)

\( (l_i+r_i-d_i)(l_i+r_i+d_i)=2l_ir_i(1+\cos(\pi-\epsilon_i))\qquad\iff \)

\( (l_i+r_i-d_i)=\dfrac{2l_ir_i}{l_i+r_i+d_i}(1+\cos(\pi-\epsilon_i)) \)

Ahora bien, por la desigualdad triangular sé que \( d_i<l_i+r_i \), y además, está claro que para \( \epsilon ' \) suficientemente chico tanto \( l_i \) como \( r_i \) son menores que \( d_i \), o sea que

\( (l_i+r_i-d_i)=\dfrac{2l_ir_i}{l_i+r_i+d_i}(1+\cos(\pi-\epsilon_i))<\dfrac{2l_ir_i}{2d_i}(1+\cos(\pi-\epsilon_i))< \)

\( \dfrac{2d_i^2}{2d_i}(1+\cos(\pi-\epsilon_i))=d_i(1+\cos(\pi-\epsilon_i)) \)

Y finalmente,

\( \displaystyle\sum_{i=1}^n(l_i+r_i)-\displaystyle\sum_{i=1}^nd_i=\displaystyle\sum_{i=1}^n(l_i+r_i-d_i)<\displaystyle\sum_{i=1}^nd_i(1+\cos(\pi-\epsilon_i))< \)

\( (1+\cos(\pi-\epsilon '))\displaystyle\sum_{i=1}^nd_i\le(1+\cos(\pi-\epsilon '))M \)

cosa que puede hacerse tan chica como se quiera tomando \( \epsilon ' \) suficientemente chico.

¿Para qué sirve esto?

La longitud de un segmento del plano puede definirse sin problemas mediante el teorema de Pitágoras. Para definir la longitud de una curva se asume que, sea lo que sea que uno entienda por ello, debe cumplirse que

(1) Si se divide una curva en una cantidad finita de curvas disjuntas, la longitud de la curva original es igual a la suma de las longitudes de las curvas en las que se la dividió.

(2) Cualquier curva que una dos puntos debe tener una longitud mayor o igual a la del segmento que los une.

Cualquier definición que contradiga estos hechos estaría midiendo una magnitud que no se condice con lo que uno espera que sea la longitud de (lo que uno espera que sea) una curva. Uno busca, si es que existe, alguna definición de longitud de curva que esté de acuerdo con estos dos hechos.

Asumir (1) y (2) lleva a que el supremo de las longitudes de las poligonales inscritas en una curva tenga que ser menor o igual a la longitud de dicha curva, sea lo que sea que uno entienda por longitud de la curva. A partir de ahí una posibilidad (la que se presenta en todos los libros que consulté) sería decir "no tengo más herramientas para trabajar sobre esto, así que me resigno a aceptar ese supremo como definición de longitud de curva", lo que está asumiendo que

(3) Mediante poligonales inscritas en una curva dada se puede conseguir longitudes arbitrariamente cercanas a lo que entiendo por longitud de la curva en cuestión.

La pregunta sería qué es lo que nos motiva a asumir (3). En vista de todas esas pseudo-paradojas que existen sobre la longitud de curvas, hay que ser bastante cuidadoso y no perder de vista ese principio que dice que en cálculo ninguna cantidad, por más pequeña que sea, puede ser despreciada. Y bueno, lo que pasa es que uno puede asumir

(3') Si \( f:[a,b]\to\mathbb{R} \) es una función convexa cuyo gráfico \( \gamma\subseteq\mathbb{R}^2 \) admite recta tangente no vertical en sus extremos, sean \( L_1 \) y \( L_2 \) las rectas tangentes a \( \gamma \) en los extremos. Estas rectas se cortan porque \( f \) es convexa (en un único punto si \( \gamma \) no es una recta). Sea \( P \) el punto de corte de \( L_1 \) y \( L_2 \) y sean \( S_1 \) el segmento que une \( (a,f(a)) \) con \( P \) y \( S_2 \) el segmento que une \( P \) con \( (b,f(b)) \). Entonces la longitud de \( \gamma \) debe ser menor o igual a la de \( S_1 \) sumada a la de \( S_2 \).

En esta noción se apoyó Arquímedes para acotar superiormente la longitud de una circunferencia (al menos esa es mi interpretación de lo que hizo). Si uno lo piensa lo suficiente, asumir (3') es tan razonable como asumir (2). Esto es decir "así como el segmento que une a \( (a,f(a)) \) con \( (b,f(b)) \) corta camino con respecto a la curva, bajo estas hipótesis la curva corta camino con respecto a \( S_1\cup S_2 \)". Son nociones previas que uno ya sabe que la longitud de una curva debería satisfacer, sea lo que sea que uno entienda por longitud de una curva.

Asumiendo (1), (2) y (3') en vez de (1), (2) y (3), como consecuencia del teorema se tiene (3) para las curvas que cumplen sus hipótesis (y por lo tanto también para, entre otras, las curvas que pueden dividirse en una cantidad finita de curvas que cumplen sus hipótesis). Entonces uno puede definir la longitud de una curva como el supremo de las longitudes de las poligonales inscritas en ella con la tranquilidad de que, para las curvas "razonables" (entre ellas, las que podrían presentarse en el mundo material), lo que se está calculando es efectivamnte lo que uno entiende por longitud de una cuerda física.

En los libros que pude consultar se omite este teorema y todo esto se trata de una forma más "vaga". Por ejemplo Rudin lo expone así:

Cita de: Principios de Análisis Matemático, capítulo 6
[...]Conforme la partición se hace más fina, este polígono se aproxima al rango de \( \gamma \) cada vez más. Esto hace razonable definir la longitud de \( \gamma \) como [el supremo de las longitudes de las poligonales inscritas en ella].

Es sabido por todos que no cualquier sucesión de poligonales que "se parezcan cada vez más" a una curva dada va a tener longitudes que sean siquiera acotadas. Para poder afirmar que las poligonales inscritas en una curva se "aproximan a ella" de la forma que uno necesita, a diferencia de otras poligonales cualesquiera que podrían aproximarse a la curva de otras formas, se está aplicando implícitamente una noción de tangencia que no queda para nada clara.

Y esto no es cosa menor, porque por ejemplo en física el trabajo es una integral curvilinea. Y sin haber probado este teorema, el que los cálculos que hacen los físicos den bien sería una coincidencia.Yo lo hice para estudiar integrales complejas. En ese contexto está claro que uno podría definir lo que quiera y contentarse con que, si la curva es un intervalo de \( \mathbb{R} \), se recupera la integral real. Pero personalmente no le encuentro demasiado sentido a usar una palabra que ya conozco y para la cual ya tengo un significado adjudicado, para referirme a una noción abstracta sin tener un argumento sólido que me garantice que lo que estoy haciendo es verdaderamente integrar los valores complejos que toma la función sobre la curva.

¿Qué faltaría?

Buscar una forma de acotar superiormente la longitud de una curva en 3 dimensiones, por ejemplo para aquellos que quieren calcular el trabajo realizado por una fuerza a lo largo de una trayectoria tridimensional y saber que el resultado que obtuvieron es efectivamente lo que en el mundo material se va a manifestar como la integral sobre esa trayectoria y no una cota inferior para dicha integral que se define como igual a ella sin mayor argumentación.
"...parecido pero nada que ver"