Autor Tema: Número 2. (2013) - 5 Extensiones finitamente aditivas de la medida de Lebesgue

0 Usuarios y 1 Visitante están viendo este tema.

20 Octubre, 2013, 12:03 am
Leído 11343 veces

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Hola. Acabo de publicar en mi página web una nueva versión de mi libro de lógica y teoría de conjuntos (ahora son dos), y hay un material que tenía pensado incluir, pero que al final he descartado porque no encajaba con la estructura y los demás contenidos del libro. Como de momento no tengo dónde incluirlo y creo que es interesante, me ha parecido buena idea exponerlo en la revista del foro.

Como es un poco complicado explicar en pocas palabras lo que voy a contar, los dos mensajes siguientes servirán de introducción.

Como siempre, cualquier pregunta o comentario será bien recibida (resp. recibido), aunque, para no interrumpir la exposición, mejor si se hacen en el hilo de comentarios.

20 Octubre, 2013, 12:12 am
Respuesta #1

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
El contenido de este artículo está relacionado con el problema de definir un concepto de "volumen" de un subconjunto de \( \mathbb R^n \) lo más general posible y evaluar en qué medida una definición dada puede considerarse razonable. En los primeros mensaje voy a resumir a modo de introducción las ideas básicas que conducen hasta la definición del concepto "estándar" de volumen de un subconjunto de \( \mathbb R^n \), que es la medida de Lebesgue. Lo que realmente nos va a ocupar es el problema de hasta qué punto y en qué condiciones se puede ir más allá y "medir" conjuntos más generales que los conjuntos medibles Lebesgue. Aunque luego trabajaremos en un contexto muy general, de momento consideraremos por simplicidad el caso de dos dimensiones, si bien todo lo que vamos a ver se generaliza sin dificultad a dimensiones arbitrarias.

Los griegos no se preocuparon seriamente de definir el área de una figura, sino más bien de calcularla, es decir, aplicaron el planteamiento heurístico consistente en que si podemos argumentar que el área de una figura tiene que ser un número dado, es que la figura tiene área y es ese número.

De todos modos, la idea más o menos imprecisa de qué hay que entender por el área de una figura es que, fijada una longitud como unidad, el área de una figura es el número de cuadrados de lado unitario que pueden meterse dentro de ella. Por supuesto, esto no puede entenderse literalmente cuando la figura en cuestión no puede expresarse como unión de un número finito de cuadrados unitarios. Sin embargo, como esbozo inicial basta para justificar algunos hechos básicos. Identificamos el plano euclídeo con \( \mathbb R^2 \) y representamos por \( m(A)\geq 0 \) el área de un conjunto \( A\subset \mathbb R^2 \). Entonces, un concepto razonable de área debe cumplir:

  • Normalización \( m([0,1]^2)=1 \),
  • Invarianza por isometrías Si \( A \) y \( B \) son dos subconjuntos de \( \mathbb R^2 \) tales que uno se puede transformar en otro mediante una isometría (es decir, mediante una aplicación que conserve las distancias), entonces \( m(A)=m(B) \),
  • Aditividad Si \( A=B\cup C \) y \( B\cap C=\emptyset \), entonces \( m(A)=m(B)+m(C) \).

Observaciones:

La normalización significa simplemente que tomamos el cuadrado unitario como unidad de área. Más en general (por la segunda propiedad) todos los cuadrados unitarios tienen área 1, pues cualquier cuadrado unitario puede convertirse en otro mediante un movimiento.

Isometrías y movimientos
Un famoso teorema afirma que toda isometría en \( \mathbb R^n \) puede expresarse como composición de un número finito de traslaciones, giros y simetrías (salvo cuando \( n=1 \), que sólo hay traslaciones y simetrías).

Los movimientos son las isometrías que conservan la orientación (es decir, que no transforman una figura en su imagen por un espejo). Son las isometrías que se expresan como composición de traslaciones y giros.
[cerrar]

En el planteamiento heurístico que estamos considerando de momento (sin una definición de área previa) la segunda propiedad debe entenderse más concretamente como que si podemos justificar de algún modo que \( A \) tiene área, entonces podemos afirmar que \( B \) también tiene área, y es la misma.

Similarmente, la aditividad puede entenderse como que si sabemos justificar que \( B \) y \( C \) tienen área, es decir, si, de algún modo, sabemos contar cuántos cuadrados caben dentro de \( B \) y \( C \), entonces podemos afirmar que \( A \) tiene área, y será la suma de las otras dos. Recíprocamente, si podemos afirmar que \( A \) y \( B \) tienen área, podemos decir que \( C=A\setminus B \) tiene por área la resta de las áreas.

Veamos ahora qué podemos afirmar con rigor sin más que aceptar que el área que pretendemos definir cumple las tres propiedades anteriores:

  • Si \(  B\subset A \) tienen ambos área, entonces \(   m(B)\leq m(A) \)

    (Por la aditividad.)

  • Si los puntos tienen que tener un área asignada, ésta tiene que ser \(  0 \).

Demostración
En efecto, como todo punto se puede convertir en cualquier otro mediante una traslación, todos los puntos deben tener la misma área. Si ésta fuera \( \epsilon>0 \), podríamos tomar un natural \( n \) tal que \( 1/n<\epsilon \), pero dentro de \( [0,1]^2 \) podemos considerar \( n \) puntos distintos \( p_1,\ldots, p_n \), luego \( n\epsilon =m(\{p_1,\ldots, p_n\})\leq m([0,1]^2)=1 \), luego \( \epsilon\leq 1/n \), contradicción.
[cerrar]

  • Si los segmentos tienen que tener un área asignada, ésta tiene que ser \(  0 \)

Demostración
Si consideramos segmentos de longitud \( \leq 1 \), su medida tiene que ser \( 0 \) por el mismo argumento empleado para los puntos. Pero todo segmento se puede descomponer en unión finita y disjuntas de puntos y segmentos de longitud  \( \leq 1 \), luego por la aditividad, su medida tiene que ser cero.
[cerrar]

  • Si un rectángulo de lados \( p, q \) racionales tiene que tener área, ésta tiene que ser \(  pq \)

Demostración
Consideremos primero el caso de un cuadrado de lado \( 1/n \), donde \( n \) es un natural no nulo. Observemos que, dividiendo \( [0,1] \) en \( n \) intervalos iguales, podemos dividir \( [0,1]^2 \) en \( n^2 \) cuadrados de lado \( 1/n \). Estos cuadrados no serán disjuntos, porque algunos compartirán parte de sus fronteras respectivas, pero las fronteras de todos ellos son la unión de un número finito de puntos y segmentos, que deben tener área nula, luego la figura que resulta de quitarle a \( [0,1]^2 \) todas las fronteras de los cuadraditos sigue teniendo medida 1 y es unión de \( n^2 \) cuadraditos que tienen que tener la misma área, pues cualquiera de ellos se puede convertir en otro mediante una traslación. Por la aditividad, el área de cada cuadradito (abierto o cerrado, que da igual, porque la frontera tiene área cero) debe ser \( 1/n^2 \).

En general, si \( p = a/n \) y \( q=b/n \), entonces el rectángulo \( [0,p]\times [0,q] \) se puede descomponer en \( ab \) cuadraditos de longitud \( 1/n^2 \) (con las mismas salvedades que antes sobre sus fronteras), luego, por la aditividad, su área debe ser \( ab/n^2 = pq \).
[cerrar]

  • Si un rectángulo de lados \(  a, b \) tiene que tener área, ésta tiene que ser \( ab \)

Demostración
Tomemos números racionales \( r_1<a<r_2 \), \( s_1<b<s_2 \). Entonces, como \( [0,r_1]\times [0,s_1]\subset [0,a]\times [0,b]\subset [0,r_2]\times [0,s_2] \), por la aditividad podemos concluir que \( r_1s_1\leq m([0,a]\times [0,b])\leq r_2s_2 \), pero sólo hay un número real mayor o igual que todos los valores posibles para \( r_1s_1 \) y menor o igual que todos los valores posibles para \( r_2s_2 \), y ese valor es \( ab \), luego tiene que ser \( m([0,a]\times [0,b])=ab \).
[cerrar]

La última demostración contiene el ejemplo más elemental de uso del método de exhaución, por el que el área de una figura se determina encerrándola entre una sucesión de figuras menores y otra sucesión de figuras mayores cuyas áreas convergen a un mismo valor, que tiene que ser, por lo tanto, el área de la figura considerada.

Las demostraciones anteriores explican en qué sentido se puede decir que el área de una figura es el número de cuadrados unitarios que caben en ella: en realidad no trabajamos con cuadrados unitarios, sino con cuadrados de lados racionales tan pequeños como sea necesario (cuya área se puede calcular viendo cuántos de ellos caben en el cuadrado unitario), los cuales nos proporcionan aproximaciones del área, y luego realizamos un paso al límite cuando el lado de los cuadraditos tiende a cero. (Notemos que para que una sucesión de números racionales \( r_n \) converja a un número irracional \( a \) es necesario que sus denominadores tiendan a infinito.)

A partir de aquí todos conocemos los argumentos que, a partir del área de un rectángulo, nos dan el área de un paralelogramo (le cortamos un triángulo y lo trasladamos para formar un rectángulo, con lo que usamos la aditividad y la invarianza por traslaciones) y a partir de ahí el área de un triángulo (con dos triángulos simétricos podemos formar un paralelogramo que tendrá el doble de área) y a partir de ahí la de cualquier polígono, y a partir de las áreas de los polígonos podemos determinar por exahución la de los círculos, etc.

Lo que queremos destacar aquí es que todas las fórmulas de la geometría elemental para el cálculo de áreas de figuras sencillas se pueden deducir de las tres propiedades que hemos enunciado.

Para tener un concepto de área rigurosamente fundamentado que englobe como casos particulares a todas las fórmulas del área de rectángulos, triángulos, trapecios, etc., sólo nos falta tener una definición de área y no unas meras reglas para calcular áreas.

Las ideas y técnicas que hemos esbozado conducen a la definición más elemental de área que puede darse: la medida de Jordan. La presentamos en \( \mathbb R^n \):

Definición Si \( A\subset \mathbb R^n \) es un conjunto acotado, definimos su medida interior de Jordan \( m_*(A) \) como el supremo de las sumas \( \sum\limits_{i=1}^km(C_i) \), donde \( \{C_i\}_{i=1}^k \) es una familia de cubos \( C_i=[a_i,b_i]^n\subset A \) tales que la intersección de dos de ellos es vacía o está contenida en la intersección de sus fronteras (y donde \( m(C_i)=(b_i-a_i)^n \)).

Similarmente, la medida exterior de Jordan \( m^*(A) \) se define como el ínfimo de las sumas del mismo tipo, salvo que ahora exigimos que \( A\subset \bigcup\limits_{i=1}^kC_i \).

En general se demuestra que \( m_*(A)\leq m^*(A) \).

Un conjunto acotado \( A \) es medible Jordan si \( m_*(A)=m^*(A) \), y a dicho valor común se le llama medida de Jordan \( m(A) \). Representaremos por \( \mathcal J_n \) al conjunto de todos los subconjuntos de \( \mathbb R^n \) medibles Jordan.

Los conjuntos medibles Jordan son los conjuntos a los que se les puede asignar unívocamente una medida basándonos en (la generalización a \( \mathbb R^n \) de) los tres principios que hemos considerado más arriba. En lo sucesivo no necesitaremos para nada el concepto de medida de Jordan, pero de momento nos sirve como motivación para introducir algunos conceptos que sí que vamos a manejar constantemente:



Definición Un anillo de conjuntos en un conjunto \( X \) es una familia \( \mathcal A\subset \mathcal PX \) con las propiedades siguientes:
  • \( \emptyset\in \mathcal A \)
  • Si \( A \), \( B\in \mathcal A \), entonces \( A\cup B \) y \( A\setminus B\in \mathcal A \)

Notemos que esto implica que también \( A\cap B = A\setminus (A\setminus B)\in \mathcal A \).

Una medida en un anillo de conjuntos \( \mathcal A \) es una aplicación \( \mu:\mathcal A\longrightarrow [0,+\infty] \) que cumpla:
  • \( \mu(\emptyset)=0 \)
  • Si \( A \), \( B\in \mathcal A \) son disjuntos, entonces \( \mu(A\cup B)=\mu(A)+\mu(B) \).

Llamamos \( \Sigma_X \) al grupo de todas las aplicaciones biyectivas del conjunto \( X \) en sí mismo. Si \( G \) es un subgrupo de \( \Sigma_X \), diremos que un anillo \( \mathcal A \) de subconjuntos de \( X \) es \( G \)-invariante si cuando \( A\in \mathcal A \) y \( g\in G \) entonces \( g[A]\in \mathcal A \).

Diremos que una medida \( \mu \) en \( \mathcal A \) es \( G \)-invariante si además, \( \mu(g[A])=\mu(A) \).

Con estos conceptos podemos enunciar las propiedades principales de la medida de Jordan:

Teorema La familia \( \mathcal J_n \) de los subconjuntos de \( \mathbb R^n \) medibles Jordan es un anillo de subconjuntos de \( \mathbb R^n \) y la medida de Jordan \( m:\mathcal J_n\longrightarrow \left[0,+\infty\right[ \) es una medida en \( \mathcal A \) invariante por isometrías y tal que \( m([0,1]^n)=1 \).

Más aún, si \( \mu: \mathcal J_n\longrightarrow [0,+\infty] \) es cualquier medida en \( \mathcal J_n \) invariante por traslaciones respecto a la cual el cubo unitario tiene medida \( 1 \), entonces \( \mu=m \).


Naturalmente, "invariante por isometrías" o "invariante por traslaciones" significa \( G \)-invariante, donde \( G \) es, respectivamente, el grupo de las isometrías o las traslaciones en \( \mathbb R^n \).

En otras palabras, tal y como habíamos anunciado, los conjuntos medibles Jordan tienen la propiedad de se les puede asignar una medida (un volumen) y que la asignación es la única posible para que se respete la aditividad y la invarianza por traslaciones y de modo que el cubo unitario tenga medida \( 1 \).

No vamos a demostrar este teorema porque, como ya hemos indicado, no vamos a necesitarlo en ningún momento. Pero observemos que de él se desprende que asignar una medida a un conjunto no es algo tan simple como tomar un conjunto cualquiera y ver cómo le asociamos un "tamaño". Unos criterios para definir una medida (como son la aditividad y la invarianza por isometrías) nos permiten definir una familia de conjuntos \( \mathcal J_n \) a los que podemos asignarles una medida mediante la aplicación oportuna de dichos criterios, pero no está claro si con ellos es posible asignar unívocamente una medida a más conjuntos. En principio, a falta de "más ideas" nos encontramos con que hay muchos subconjuntos de \( \mathbb R^n \) que no tienen ninguna medida asignada y que, salvo que se nos ocurra algo más, no podemos decir si tienen un volumen pero no sabemos calcularlo (ni definirlo), o si no hay ningún sentido preciso en que pueda decirse que tienen un volumen.

Dedicaremos el mensaje siguiente a indicar (también sin demostraciones) cómo se extiende la medida de Jordan, pero antes resulta natural preguntarse si los conjuntos medibles Jordan son muchos o pocos. Para ver que, en cierto sentido, hay bastantes, es útil el teorema siguiente:

Teorema Un conjunto acotado \( A\subset \mathbb R^n \) es medible Jordan si y sólo si su frontera \( \partial A \) es medible Jordan y \( m(\partial A)=0 \).

Es decir, que un conjunto es medible Jordan si su frontera es "fina". De aquí se desprende, por ejemplo, que todo conjunto "normal", limitado por una curva "normal", como un polígono, un círculo, una elipse, etc., es medible Jordan, al igual que toda región limitada por curvas diferenciables. E igualmente en tres dimensiones son medibles Jordan los poliedros, las esferas, los elipsoides, etc. En suma, todos los conjuntos geométricos "normales" que pueden dibujarse son medibles Jordan. (Obviamente lo de "normal" es una forma de escurrir el bulto, pero es que, como ya he dicho varias veces, el objetivo de este hilo no es hablar de la medida de Jordan.)

En vista de lo que acabamos de decir, podría pensarse que la medida de Jordan proporciona un concepto de área o de volumen que formaliza perfectamente el concepto intuitivo correspondiente. En cierto sentido así es, pero para los cálculos que hacen habitualmente los matemáticos resulta ser demasiado pobre.

Pensemos por ejemplo en el conjunto \( A=\mathbb Q\cap [0,1] \). Como tiene interior vacío, no contiene ningún cubo, luego \( m_*(A)=0 \), Si fuera medible Jordan, tendría medida 0, pero  \( [0,1]\setminus A \) tendría entonces medida 1, y no es así: le sucede lo mismo que a \( A \). Como tiene interior vacío, es \( m_*([0,1]\setminus A)=0 \). Así pues, \( A \) no es medible Jordan. (Hemos usado la definición. Si recurrimos al teorema anterior, tenemos que \( \partial A = [0,1] \), que no tiene medida nula, por lo que \( A \) no es medible Jordan.)

El ejemplo se puede mejorar. En realidad hemos probado que si un conjunto \( A\subset [0,1] \) tiene interior vacío y lo mismo vale para \( [0,1]\setminus A \), entonces ninguno de los dos puede ser medible Jordan, pero esto le sucede al conjunto de Cantor y a su complementario. El primero es cerrado, luego su complementario en \( \left]0, 1\right[ \) es abierto. Vemos, pues, que existen abiertos y cerrados acotados en \( \mathbb R \) que no son medibles Jordan. En \( \mathbb R^n \) se pueden poner ejemplos similares.

No poder contar siquiera con que los abiertos y cerrados acotados son medibles es una restricción que las matemáticas modernas no pueden aceptar.

En el mensaje siguiente hablamos de cómo la medida de Lebesgue resuelve estos inconvenientes, y a partir de ahí ya estaremos en condiciones de plantear el objeto de este artículo propiamente dicho. Terminamos enunciando una caracterización importante de la medida de Jordan:

Teorema Un conjunto acotado \( A\subset \mathbb R^n \) es medible Jordan si y sólo si su función característica \( \chi_A \) es integrable Riemann (y entonces \( m(A)=\int\chi_A dx_1\cdots dx_n \)).

A partir de aquí puede probarse que todo conjunto cuya área o volumen sea calculable mediante la integral de Riemann es medible Jordan.

20 Octubre, 2013, 03:12 am
Respuesta #2

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Ya hemos visto que los conjuntos medibles Jordan incluyen todos aquellos a los que se les puede asignar un área calculable con las técnicas usuales para calcular áreas (las geométricas clásicas, y las que requieren únicamente la integral de Riemann).

El problema de si es posible asignar una medida a más subconjuntos de \( \mathbb R^n \) aparte de los medibles Jordan sin más criterio que la invarianza por isometrías y la aditividad es muy complicado, pero los matemáticos lo esquivan simplemente imponiendo una condición adicional que es razonable exigir al concepto de área:

Definición: Un \( \sigma \)-anillo en un conjunto \( X \) es un anillo \( \mathcal A \) de subconjuntos de \( X \) que es un anillo y además cumple que toda unión numerable de elementos del anillo está en el anillo.

Una medida \( \mu:\mathcal A\longrightarrow [0,+\infty] \) en un \( \sigma \)-anillo es \( \sigma \)-aditiva si cuando \( \{A_k\}_{k=0}^\infty \) es una familia de elementos de \( \mathcal A \) disjuntos dos a dos, entonces \( \mu(\bigcup\limits_{k=0}^\infty A_k)=\sum\limits_{k=0}^\infty\mu(A_k) \).

Si uno reflexiona, es una condición razonable: si tenemos una familia numerable de conjuntos disjuntos dos a dos, ¿qué tendríamos que considerar como su volumen sino la suma de sus volúmenes (que puede ser infinita)? No obstante, observemos que la numerabilidad es importante, todo conjunto puede expresarse como \( A=\bigcup\limits_{p\in A}\{p\} \), y los puntos "deben" tener medida nula, lo cual no significa que \( A \) deba tenerla. Si aceptamos la \( \sigma \)-aditividad este argumento nos lleva, no obstante, a que todos los conjuntos numerables deben tener medida nula.

La medida de Jordan no es \( \sigma \)-aditiva. Por ejemplo, todo abierto en \( \mathbb R \) puede expresarse como unión numerable de intervalos abiertos disjuntos dos a dos, y todos los intervalos acotados son medibles Jordan. Si la medida de Jordan fuera \( \sigma \)-aditiva, todos los abiertos acotados serían medibles, y ya hemos visto que no es así.

Al trabajar con medidas \( \sigma \)-aditivas ya no tenemos necesidad de restringirnos a conjuntos acotados, por lo que, en lugar de con anillos, podemos trabajar con álgebras:

Definición Un álgebra de conjuntos en un conjunto \( X \) es una familia \( \mathcal B\subset \mathcal PX \) que cumple las propiedades siguientes:
  • \( \emptyset, X\in \mathcal B \)
  • Si \( A, B\in \mathcal B \), entonces \( \bar A=X\setminus A, A\cup B\in \mathcal B \).

Notemos que esto implica que \( A\cap B =\overline{\bar A\cup \bar B}\in \mathcal B \) y también que \( A\setminus B = A\cap \bar B\in \mathcal B \).

Una \( \sigma \)-álgebra es un álgebra con la propiedad adicional de que toda unión numerable de elementos de \( \mathcal B \) está en \( \mathcal B \) (y eso hace, tomando complementarios, que lo mismo valta para las intersecciones numerables de elementos de \( \mathcal B \).

Es inmediato comprobar que un anillo (resp.\ \( \sigma \)-anillo) \( \mathcal A \) es un álgebra (resp.\ \( \sigma \)-álgebra) si y sólo si \( X\in \mathcal A \).

NOTA: Lo habitual es llamar medidas a lo que aquí estoy llamado medidas \( \sigma \)-aditivas, y llamar medidas finitamente aditivas a lo que aquí estoy llamando medidas, pero como vamos a trabajar principalmente con medidas finitamente aditivas, por ello aquí me referiré a ellas simplemente como "medidas", y diré medida \( \sigma \)-aditiva cuando quiera referirme a una medida en el sentido usual.

La \( \sigma \)-aditividad determina automáticamente una medida para una familia de conjuntos mucho más amplia que la de los conjuntos medibles Jordan. Dicha familia se conoce como la \( \sigma \)-álgebra \( \mathcal M_n \) de los conjuntos medibles Lebesgue en \( \mathbb R^n \), sobre la cual está definida la medida de Lebesgue: \( m: \mathcal M_n\longrightarrow [0,+\infty] \), de modo que se cumple:

Teorema La medida de Lebesgue en \( \mathbb R^n \) es una medida \( m:\mathcal M_n\longrightarrow [0,+\infty] \) \( \sigma \)-aditiva, invariante por isometrías tal que \( \mu([0,1]^n)=1 \), y toda medida \( \mu:\mathcal M_n\longrightarrow [0,+\infty] \) \( \sigma \)-aditiva invariante por traslaciones y respecto a la que el cubo unitario tiene medida \( 1 \) cumple \( \mu = m \).

Así pues, tenemos una familia \( \mathcal M_n \) de subconjuntos de \( \mathbb R^n \) sobre la cual sólo es posible asignar una medida a cada uno de sus elementos, si exigimos que dicha asignación tiene que ser invariante por traslaciones y \( \sigma \)-aditiva (y respecto a la cual el cubo unitario tenga medida 1).

No vamos a exponer aquí la construcción de la medida de Lebesgue, puesto que en realidad no vamos a necesitarla sino como motivación de lo que vamos a exponer a partir del próximo mensaje (a partir del cual prometo demostrar todo lo que diga).

La familia de los conjuntos medibles Lebesgue contiene a todos los conjuntos medibles Jordan, y la restricción de la medida de Lebesgue a \( \mathcal J_n \) es una medida finitamente aditiva invariante por traslaciones, luego, por la unicidad de la medida de Jordan, es la medida de Jordan. En otras palabras, la medida de Lebesgue extiende a la medida de Jordan.

Para hacernos una idea de la amplitud de la \( \sigma \)-álgebra de los conjuntos medibles Lebesgue necesitamos un concepto que vamos a usar a menudo en lo sucesivo. Se apoya en un teorema elemental:

Teorema Sea \( X \) un conjunto y \( A\subset \mathcal PX \). Entonces, la intersección \( \left<A\right> \) (resp.  \( \left<A\right>_\sigma \)) de todas las álgebras (resp. \( \sigma \)-álgebras) de subconjuntos de \( X \) que contienen a \( A \) es un álgebra (resp.  \( \sigma \)-álgebra) de subconjuntos de \( X \) que contiene a \( A \).

Demostración
Sea \( \mathcal F \) el conjunto de todas las álgebras (resp. \( \sigma \)-álgebras) de subconjuntos de \( X \) que contienen a \( A \). Notemos que es no vacío, porque \( \mathcal PX\in \mathcal F \). Tenemos entonces que \( \left<A\right>_*=\bigcap \mathcal F \) (donde el asterisco indica que vale con \( \sigma \) y sin \( \sigma \), según el caso).

Como \( A \) está contenido en cada elemento de \( \mathcal F \), tenemos obviamente que \( A\subset \left<A\right>_* \).

Como \( \emptyset \) y \( X \) pertenecen a todo elemento de \( \mathcal F \) (por definición de álgebra), resulta que \( \emptyset, X\in \left<A\right>_* \)

Si tomamos \( U, V\in \left<A\right>_* \), entonces, para cada \( \mathcal C\in \mathcal F \) se cumple que \( X\setminus U, U\cup V\in \mathcal C \), luego  \( X\setminus U, U\cup V\in \left<A\right>_* \). Esto prueba que \( \left<A\right>_* \) es un álgebra de subconjuntos de \( X \).

En el caso \( \sigma \) tomamos una familia \( \{U_k\}_{k=0}^\infty \) de elementos de \( \left<A\right>_\sigma \) y tomamos \( \mathcal C\in \mathcal F \). Entonces todos los \( U_k \) están en la \( \sigma \)-álgebra \( \mathcal C \), luego \( \bigcup\limits_{k=0}^\infty U_k\in \mathcal C \), luego por definición de intersección \( \bigcup\limits_{k=0}^\infty U_k\in \left<A\right>_\sigma \). Esto prueba que  \( \left<A\right>_\sigma \) es una \( \sigma \)-álgebra de subconjuntos de \( X \).
[cerrar]

Definición El álgebra (resp. \( \sigma \)-álgebra) dada por el teorema anterior se llama álgebra (resp. \( \sigma \)-álgebra) generada por \( A \), y es la menor álgebra (resp. \( \sigma \)-álgebra) de subconjuntos de \( X \) que contiene a \( A \).

Si \( X \) es un espacio topológico, la \( \sigma \)-álgebra generada por la familia de los subconjuntos abiertos de \( X \) se llama \( \sigma \)-álgebra de Borel de \( X \).

Sucede que la \( \sigma \)-álgebra \( \mathcal M_n \) de los subconjuntos medibles Lebesgue de \( \mathbb R^n \) contiene a todos los abiertos de \( \mathbb R^n \), luego automáticamente contiene a la \( \sigma \)-álgebra \( \mathcal B_n \) de los conjuntos de Borel de \( \mathbb R^n \).

Sin embargo, sucede que \( \mathcal M_n \) es estrictamente mayor que \( \mathcal B_n \). De hecho tiene una propiedad que no cumple el álgebra de Borel:

Si \( A \) es un conjunto medible Lebesgue con medida \( 0 \) y \( B\subset A \), entonces \( B \) es medible Lebesgue (obviamente de medida \( 0 \)).

La relación exacta entre los conjuntos medibles Lebesgue y los conjuntos de Borel es que un conjunto \( A \) es medible Lebesgue si y sólo si \( A=B\cup N \), donde \( B \) es un conjunto de Borel y \( N\subset C \), para otro conjunto de Borel \( C \) de medida nula.

El álgebra de los conjuntos medibles Lebesgue es suficientemente amplia como para que los analistas trabajen en ella "cómodamente", pero no contiene a todos los subconjuntos de \( \mathbb R \).

Sin embargo, así como hemos encontrado fácilmente conjuntos no medibles Jordan, no es posible mostrar explícitamente un subconjunto de \( \mathbb R^n \) no medible Lebesgue, en el sentido de que todas las pruebas de que existen tales conjuntos son necesariamente no constructivas e involucran el axioma de elección.

Toda la construcción de la medida de Lebesgue puede realizarse sin apelar más que a una forma débil del axioma de elección (lo justo para asegurar cosas como que una unión numerable de conjuntos numerables es numerable y poco más). Sin embargo, la construcción de conjuntos no medibles Lebesgue requiere el axioma de elección en (casi) toda su potencia.

El ejemplo clásico de subconjunto no medible Lebesgue se debe a Vitali y admite una generalización:

Teorema No existe ninguna medida \( \sigma \)-aditiva \( \mu:\mathcal P\mathbb R^n\longrightarrow [0,+\infty] \) respecto a la cual el cubo unitario tenga medida finita no nula y sea invariante por traslaciones.

Demostración
Por simplicidad con la notación lo probamos para \( n=2 \), pero el argumento vale para cualquier \( n \). Es claro que el cuadrado \( [-1,2]^2] \) puede cubrirse con nueve trasladados del cuadrado unitario, luego su medida tiene que ser finita.

Consideremos en \( [0,1]^2 \) la relación de equivalencia dada por \( p\,R\, q \) si y sólo si existe \( t\in \mathbb Q^2 \) tal que \( p = t+q \). Por el axioma de elección existe un conjunto \( N \) que contiene exactamente un punto de cada clase de equivalencia del cociente \( [0,1]^2/R \). Como \( N\subset [0,1]^2 \), tiene que ser \( \mu(N)<+\infty \). Ahora bien, dado cualquier \( p\in [0,1]^2 \), existe un \( a\in N\cap [p] \), luego \( p = t+a \), donde \( t\in \mathbb Q^2\cap[-1,1]^2 \).

(Notemos que \( t = p-a\in [-1,1]^2 \), porque al restar dos números entre \( 0 \) y \( 1 \) obtenemos un número entre \( -1 \) y \( 1 \)).

Esto prueba que \( [0,1]^2\subset \bigcup\limits_{t\in \mathbb Q^2\cap [-1,1]}(t+N)\subset [-1,2] \), pues al sumar un número en \( [0,1] \) más un número en \( [-1,1] \) obtenemos un número en \( [-1, 2] \).

Por otra parte, los conjuntos \( t+N \) son disjuntos dos a dos, ya que si \( t_1+a = t_2+b \), con \( t_1, t_2\in \mathbb Q^2 \) y \( a, b\in N \), resulta entonces que \( b= a+t_1-t_2 \), luego \( b\,R\,a \), en contradicción con que \( N \) sólo contiene un elemento de cada clase de equivalencia según \( R \).

Por lo tanto podemos aplicar la \( \sigma \)-aditividad de \( \mu \) para concluir que

\( 0<\mu([0,1]^2\leq \sum\limits_{q}\mu(t+N))\leq \mu([-1,2]^2)<+\infty \)

Ahora bien, como \( \mu \) es invariante por traslaciones, \( \mu(t+N)=\mu(N) \), y resulta que

\( 0<\mu([0,1]^2\leq \sum\limits_{q}\mu(N)\leq \mu([-1,2]^2)<+\infty \).

Pero esto es imposible: si \( \mu(N)=0 \), entonces la suma sería 0 y no se cumpliría la primera desigualdad, pero si \( \mu(N)>0 \) entonces una suma con una cantidad infinita numerable de sumandos iguales a \( \mu(N) \) tiene que ser infinita, y no se cumpliría la última desigualdad. Esta contradicción prueba que no puede existir tal \( \mu \).
[cerrar]

Hay un resultado mucho más espectacular que este:

Teorema (Paradoja de Banach-Tarski) Si \( B \) es la bola unidad cerrada en \( \mathbb R^3 \), es posible descomponer \( B = A_1\cup A_2 \cup A_3\cup A_4\cup A_5 \) en una unión de cinco subconjuntos disjuntos dos a dos tales que, aplicando a cada \( A_i \) un movimiento adecuado, se convierte en otro conjunto \( A'_i \) de modo que \( B = A'_1\cup A'_2=A'_3\cup A'_4\cup A'_5 \) , donde las uniones también son disjuntas dos a dos.

Es decir: podemos partir una bola en cinco trozos, moverlos adecuadamente (sin deformarlos) y recombinarlos de modo que los dos primeros trozos den lugar a una bola igual que la primera, y los otros tres trozos también.

El resultado es generalizable a todo \( n\geq  3 \), por lo que podemos concluir:

Teorema Si \( n\geq 3 \) no existe ninguna medida (finitamente aditiva) \( \mu:\mathcal P\mathbb R^n\longrightarrow [0,+\infty] \) invariante por movimientos respecto a la que el cubo unitario tenga medida finita

Demostración
Razonamos en el caso \( n=3 \) a partir del enunciado que hemos dado de la paradoja de Banach-Tarski.

Como el cubo \( [-1,1]^3 \) puede cubrirse con un número finito de trasladados del cubo unitario, tiene medida finita, luego \( B \) también. Expresando el cubo unitario como unión de cubos menores se concluye que hay cubos arbitrariamente pequeños con medida no nula. Como \( B \) contiene cubos, concluimos que  \( 0<\mu(B)<+\infty \). Por la aditividad, \( \mu(B)=\mu(A_1)+\mu(A_2)+\mu(A_3)+\mu(A_4)+\mu(A_5) =  \)\( \mu(A'_1)+\mu(A'_2)+\mu(A'_3)+\mu(A'_4)+\mu(A'_5)=\mu(B)+\mu(B) \), es decir, \( \mu(B)=2\mu(B) \), contradicción.

Este argumento prueba en particular que alguno de los conjuntos \( A_i \) no es medible Lebesgue.
[cerrar]

Ahora ya podemos concretar el objetivo de este artículo: vamos a probar que si \( n=1, 2 \) sí que existe una extensión finitamente aditiva de la medida de Lebesgue a \( \mathcal P\mathbb R \) invariante por isometrías, e incluso que para cualquier \( n \) existe una extensión finitamente aditiva de la medida de Lebesgue invariante por traslaciones (pero no por movimientos cualesquiera, según acabamos de indicar).

Como consecuencia, no existe un análogo en dos dimensiones de la paradoja de Banach-Tarski: no es posible partir en un número finito de trozos un disco, mover los trozos y obtener con ellos dos discos.

Sin embargo, al ir más allá de la medida de Lebesgue, ya no podemos definir las medidas que vamos a obtener. Éstas son necesariamente no constructivas: frutos del axioma de elección, curiosamente, del mismo axioma de elección que implica que no existen en dimensiones mayores que \( 2 \).

20 Octubre, 2013, 08:55 pm
Respuesta #3

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
En este mensaje demostraré un par de propiedades sobre álgebras de conjuntos que necesitaremos más adelante. Necesitamos algunos conceptos:

Definición Un homomorfismo de álgebras de conjuntos \( \mathcal B\subset \mathcal PX \) en \( \mathcal C\subset \mathcal PY \) es una aplicación \( h: \mathcal B\longrightarrow \mathcal C \) tal que, para todo \( A, B\in \mathcal B \), se cumple:

\( h(A\cup B)= h(A)\cup H(B) \), \( h(X\setminus A)= Y\setminus h(A) \), de donde se sigue a su vez que \( h(A\cap B)=h(A)\cap h(B) \).

Un isomorfismo de álgebras de conjuntos es un homomorfismo biyectivo. Dos álgebras de conjuntos son isomorfas cuando existe un isomorfismo entre ellas.

Un átomo en un álgebra de conjuntos \( \mathcal B \) es un \( A\in \mathcal B \) no vacío tal que no existe ningún \( B\in \mathcal B \) tal que \( \emptyset\subsetneq B\subsetneq A \).

Por ejemplo, los átomos en un álgebra \( \mathcal PX \) son los conjuntos de la forma \( \{x\} \), pero no toda álgebra de conjuntos tiene átomos. Por ejemplo, el conjunto de los subconjuntos de \( \mathbb Q \) que son a la vez abiertos y cerrados es un álgebra de conjuntos sin átomos.

Por otra parte, un álgebra de conjuntos es atómica si todos sus elementos no vacíos contienen al menos un átomo.

Obviamente, toda álgebra de tipo \( \mathcal PX \) es atómica, y también lo es toda álgebra de conjuntos finita, pues si \( A_0\in \mathcal B \) no es vacío y no contiene un átomo, en particular \( A_0 \) no es un átomo, luego existe un \( A_1\in \mathcal B \) tal que \( \emptyset \neq A_1\subsetneq A_0 \), pero \( A_1 \) no puede ser un átomo (porque \( A_0 \) no contiene átomos), luego existe un \( A_2\in \mathcal B \) tal que \( \emptyset \subsetneq A_2\subsetneq A_1\subsetneq A_0 \), y de este modo podemos construir una sucesión infinita de elementos de \( \mathcal B \).

Vamos a probar algo más fuerte:

Teorema: Toda álgebra de conjuntos finita \( \mathcal B \) es isomorfa al álgebra \( \mathcal PA \), donde \( A \) es el conjunto de sus átomos.

Demostración
Sea \( h: \mathcal B\longrightarrow \mathcal PA \) la aplicación que a cada \( U\in \mathcal B \) le asigna el conjunto \( h(U)\subset A \) formado por todos los átomos de \( \mathcal B \) contenidos en \( U \). Veamos que se trata de un isomorfismo de álgebras.

Tenemos que \( h \) es inyectiva, pues si \( U\neq V \), entonces \( U\setminus V\neq \emptyset \) (o al revés, pero los dos casos se tratan igualmente). Como \( U\setminus V\in \mathcal B \) y ya hemos razonado que las álgebras finitas son atómicas, existe un átomo \( P\subset U\setminus V \), con lo que \( P\in h(U)\setminus h(V) \), luego \( h(U)\neq h(V) \).

También es suprayectiva, pues si \( V\in \mathcal PA \), se trata de una familia finita de elementos de \( \mathcal B \), luego \( U=\bigcup V\in \mathcal B \). Veamos que \( h(U)=V \). Ciertamente, todo \( P\in V \) es un átomo de \( \mathcal B \) contenido en \( U \), luego \( P\in h(U) \), luego \( V\subset h(U) \).

Recíprocamente, si \( P\in h(U) \), entonces es un átomo de \( \mathcal B \) contenido en \( U=\bigcup V \). Necesariamente, existe un \( Q\in V \) tal que \( P\cap Q\neq \emptyset \), pero como \( P \) y \( Q \) son átomos y \( P\cap Q\in \mathcal B \), tiene que ser \( P=P\cap Q=Q \), por definición de átomo (ninguno de los dos puede contener estrictamente un conjunto no vacío en \( \mathcal B \)). Por lo tanto \( P=Q\in V \) y tenemos la igualdad.

Con esto tenemos que \( h \) es biyectiva. Falta probar que es un homomorfismo de álgebras. En primer lugar, veamos que \( h(U\cup V)=h(U)\cup h(V) \). Si \( P\in h(U\cup V) \), entonces \( P \) es un átomo contenido en \( U\cup V \), luego \( P = P\cap (U\cup V)=(P\cap U)\cup (P\cap V) \), y ambas partes están en \( \mathcal B \). Como \( P \) es un átomo, o bien \( P\cap U=\emptyset \), en cuyo caso \( P\subset V \) y \( P\in h(V) \), o bien \( P\cap U=P \), en cuyo caso \( P\subset U \) y \( P\in h(U) \). Esto prueba que \( h(U\cup V)\subset h(U)\cup h(V) \).

Recíprocamente, si \( P\in h(U)\cup h(V) \), digamos que \( P\in h(U) \), con lo que es un átomo contenido en \( U \), luego en \( U\cup V \), luego \( P\in h(U\cup V) \) y tenemos la igualdad.

Similarmente, \( h(X\setminus U)=A\setminus h(U) \). En efecto, si \( P\in h(X\setminus U) \), entonces \( P \) es un átomo que no está contenido en \( U \), luego \( P\in A\setminus h(U) \). Recíprocamente, si \( P\in A\setminus h(U) \), tenemos que \( P \) es un átomo no contenido en \( U \). Por lo tanto \( P\cap U\neq P \), luego \( P\cap U=\emptyset \) (porque \( P \) es un átomo) luego \( P\subset X\setminus U \), luego \( P\in h(X\setminus U) \).

Esto prueba que \( h \) es un homomorfismo y, por consiguiente, un isomorfismo.
[cerrar]

El último resultado que vamos a necesitar es el siguiente:

Teorema: Toda álgebra de conjuntos finitamente generada es finita.

Demostración
Sea \( \mathcal B = \left<C_0,\ldots, C_{n-1}\right>\subset \mathcal PX \) el álgebra generada por unos conjuntos \( C_i \). Vamos a probar que \( \mathcal B \) es finita.

Para cada \( B\in \mathcal B \) usaremos la notación \( B^1 = B \) y \( B^0 = X\setminus B \). Para cada aplicación \( f:\{0,\ldots, n-1\}\longrightarrow \{0,1\} \) definimos \( C_f = \bigcap\limits_{i<n}C_i^{f(i)}\in \mathcal B \).

Así pues, \( C_f \) es el conjunto formado por una intersección finita, donde cada conjunto de la intersección es un generador o bien su complementario, y es la función \( f \) la que determina si tomamos uno u otro.

Sea \( Y \) el conjunto (finito) de todas las funciones \( f: \{0,\ldots, n-1\}\longrightarrow \{0,1\} \) tales que \( C_f\neq \emptyset \). Para cada \( U\subset Y \) sea \( h(U)=\bigcup\limits_{f\in U}C_f\in \mathcal B \). Llamamos \( \mathcal C=\{h(U)\mid U\in \mathcal PY\}\subset \mathcal B \), que claramente es un subconjunto finito de \( \mathcal B \), y tenemos una aplicación suprayectiva \( h:\mathcal PY\longrightarrow \mathcal C \).

Vamos a probar que \( \mathcal C \) es un álgebra de conjuntos y que \( h \) es un homomorfismo de álgebras.

Observemos en primer lugar que si \( f\neq g \) entonces \( C_f\cap C_g=\emptyset \), pues existe un \( i<n \) tal que \( f(i)\neq g(i) \). Pongamos que, por ejemplo, \( f(i)=0 \) y \( g(i)=1 \). Entonces \( C_f\subset X\setminus C_i \) y \( C_g\subset C_i \), luego \( C_f\cap C_g=\emptyset \).

Veamos ahora que \( h(Y)=X \). En efecto:

\( X=\bigcap\limits_{i<n}(C_i\cup(X\setminus C_i)) \).

Aplicando la propiedad distibutiva de la intersección respecto de la unión esta expresión equivale a una unión de \( 2^n \) conjuntos, cada uno de los cuales es la intersección de \( n \) conjuntos, cada uno de los cuales es o bien \( C_i=C_i^1 \) o bien \( X\setminus C_i=C_i^0 \). Es decir:

\( X= \bigcup\limits_{f}\bigcap\limits_{i<n}C_i^{f(i)}=\bigcup\limits_f C_f=\bigcup\limits_{f\in Y}C_f=h(Y) \).

Por otra parte, es trivial que \( h(\emptyset)=\emptyset \) (convenimos en que \( \bigcup \emptyset=\emptyset \)), así como que \( h(U)\cup h(V)=h(U\cup V) \). Veamos ahora que \( h(U\cap V)=h(U)\cap h(V) \). En efecto:

\( h(U)\cap h(V)=\bigcup\limits_{f\in U}C_f\cap \bigcup\limits_{f\in V}c_f = \bigcup\limits_{(f,g)\in U\times V}(C_f\cap C_g) \),

pero hemos visto que \( C_f\cap C_g=\emptyset \) salvo si \( f=g \), luego

\( h(U)\cap h(V)= \bigcup\limits_{f\in U\cap V}C_f=h(U\cap V) \).

Por último, si llamamos \( \bar U=X\setminus U \), tenemos que \( \overline{h(U)}=h(\bar U) \). En efecto,

\( h(\bar U)\cap h(U)=h(\bar U\cap U)=h(\emptyset) =\emptyset \),     \( h(\bar U)\cup h(U) = h(\bar U\cup U)=h(Y)=X \),

y esto implica que \( h(\bar U)=X\setminus h(U) = \overline{h(U)} \).

Veamos ahora que \( h \) es inyectiva, con lo que será un isomorfismo de álgebras. Si \( h(U)=h(V) \) entonces \( h(U\cap \bar V)= h(U)\cap \overline{h(V)}=h(U)\cap \overline{h(U)}=\emptyset \), luego \( U\cap \bar V=\emptyset \), ya que si \( f\in U\cap \bar V \) entonces \( \emptyset\neq C_f\subset h(U\cap \bar V) \). Esto prueba que \( U\subset V \), e igualmente se prueba la inclusión opuesta.

Por lo tanto \( h \) es un isomorfismo y \( \mathcal C\cong \mathcal PY \).

Ahora basta probar que cada \( C_i\in \mathcal C \), pues entonces, como \( \mathcal B \) es la menor álgebra de conjuntos que contiene a todos los \( C_i \), será \( \mathcal B=\mathcal C\cong \mathcal PY \), y así \( \mathcal B \) será un álgebra de conjuntos finita.

En efecto, llamemos \( U_i=\{f\in Y\mid f(i)=1\} \). Basta probar que \( C_i=h(U_i) \), pero si \( f\in U_i \) entonces \( C_f\subset C_i \), luego \( h(U_i)\subset C_i \). Por otra parte, si \( f\in \bar U_i \), entonces \( C_f\cap C_i=\emptyset \), luego \( \overline{h(U_i)}=h(\bar U_i)\cap C_i=\emptyset \), luego \( C_i\subset h(U_i) \) y tenemos la igualdad.
[cerrar]

Notemos que en la prueba del teorema anterior hemos partido de un álgebra de conjuntos finitamente generada \( \mathcal B \) y hemos acabado demostrando que \( \mathcal B\cong \mathcal PY \), para un cierto conjunto finito \( Y \). Esto nos da una demostración alternativa del teorema precedente (sólo que mucho más compleja).

Para terminar voy a dar una demostración mucho más sencilla del teorema anterior para quienes estén familiarizados con las álgebras de Boole y sus espacios de Stone (pero ojo, la demostración que hemos dado no requiere el axioma de elección, y la que vamos a ver ahora sí):

Demostración alternativa
Sea \( \mathcal B \) un álgebra de conjuntos finitamente generada, y sea \( \mathcal C=\{\emptyset, X\} \) el álgebra trivial con dos elementos. El espacio de Stone \( S(\mathcal C) \) tiene un único punto, luego los puntos del espacio \( S(\mathcal B) \) se corresponden biunívocamente con las aplicaciones continuas \( f: S(\mathcal C)\longrightarrow S(\mathcal B) \), las cuales se corresponden biunívocamente con los homomorfismos de álgebras \( h: \mathcal B\longrightarrow \mahtcal C \), pero si \( \mathcal B \) es finitamente generada cada \( h \) está determinado por su imagen sobre un generador finito, luego sólo hay una cantidad finita de homomorfismos posibles, luego \( S(\mathcal B) \) es finito, luego su álgebra de abiertos cerrados es finita, y es isomorfa a \( \mathcal B \).
[cerrar]

No vamos a necesitar ningún resultado más sobre álgebras de conjuntos. Naturalmente, todo lo que hemos probado vale igualmente para álgebras de Boole arbitrarias (entre otras cosas porque toda álgebra de Boole es isomorfa a un álgebra de conjuntos).

21 Octubre, 2013, 12:31 am
Respuesta #4

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Vamos a demostrar aquí el resultado básico de extensiones de medidas (recordemos que por "medida" nos referimos a una medida finitamente aditiva):

Teorema Sea \( \mathcal B \) un álgebra de subconjuntos de \( X \) y sea \( \mathcal A\subset \mathcal B \) un anillo de subconjuntos de \( X \). Entonces, toda medida en \( \mathcal A \) tiene una extensión a \( \mathcal B \).

Demostraremos en primer lugar el teorema en el caso en que \( \mathcal B \) es un álgebra finita. En tal caso hemos visto que es isomorfa a un álgebra de la forma \( \mathcal PA \), luego en particular es atómica y tiene un número finito de átomos. Razonaremos por inducción sobre el número de átomos de \( \mathcal B \).

Si \( \mathcal B \) sólo tiene un átomo, tiene que ser \( \mathcal B =\{\emptyset, X\} \) (y el átomo es \( X \)), porque si \( X \) no fuera un átomo, habría un átomo \( P\subsetneq X \), pero entonces \( X\setminus P\neq\emptyset \) debería contener otro átomo. Pero si B =\{\emptyset, X\}[/tex], o bien \( \mathcal A=\{\emptyset\} \) o bien \( \mathcal A=\mathcal B \) y en ambos casos el teorema es trivial.

Supongamos que el teorema es cierto para álgebras con menos de \( n \)-átomos y supongamos que \( \mathcal B \) tiene \( n \) átomos. Fijamos una medida \( \mu: \mathcal A\longrightarrow [0,+\infty] \).

Si \( \mathcal A=\{\emptyset\} \) basta extender \( \mu \) como la medida idénticamente nula en \( \mathcal B \). En caso contrario, podemos tomar \( A\in \mathcal A\setminus\{\emptyset\} \) minimal para la inclusión (porque \( \mathcal A \) es finito, luego si un \( A\in \mathcal A\setminus \{\emptyset\} \) no es minimal, podemos tomar un conjunto estrictamente menor, y tras un número finito de pasos debemos llegar a un minimal).

Sea \( C=X\setminus A \) y sea \( \mathcal C=\{B\in \mathcal B\mid B\subset C\} \). Es claro que \( \mathcal C \) es un álgebra (finita) de subconjuntos de \( C \) y todo átomo de \( \mathcal C \) es un átomo de \( \mathcal B \), pero en \( \mathcal B \) tiene que haber un átomo contenido en \( A \) que no estará en \( \mathcal C \), luego \( \mathcal C \) tiene menos átomos que \( \mathcal B \), y podemos aplicarle la hipótesis de inducción.

Para ello consideramos el anillo \( \mathcal A_C=\{U\in \mathcal A\mid U\subset C\}\subset \mathcal C \) y la restricción a \( \mathcal A_C \) de la medida \( \mu \). Por hipótesis de inducción existe una medida \( \mu_C: \mathcal C\longrightarrow [0,+\infty] \) que extiende a \( \mu|_{\mathcal A_C} \).

Sea \( P\subset A \) un átomo de \( \mathcal B \). Sea \( A(\mathcal B) \) el conjunto de los átomos de \( \mathcal B \). Definimos \( \bar \mu: A(\mathcal B)\longrightarrow [0,+\infty] \) mediante

\( \bar \mu(Q)=\begin{Bmatrix} \mu_C(Q) & \mbox{ si }& Q\subset C\\ \mu(A) & \mbox{si}& Q=P\\
0&\mbox{si}&Q\subset A, Q\neq P\end{Bmatrix} \)

Notemos que están contempladas todas las posibilidades, pues si \( Q \) es un átomo, o bien \( Q\subset C=X\setminus A \), o bien \( Q\subset A \). En caso contrario tendríamos que \( \emptyset \subsetneq Q\cap A\subsetneq Q \), en contra de la definición de átomo.

Para cada \( B\in \mathcal B \), definimos \( \bar\mu(B)=\sum\limits_{Q\subset B}\bar\mu(Q) \), donde \( Q \) recorre los átomos contenidos en \( B \).

Notemos que si \( Q \)  es un átomo, entonces no contiene más átomo que a sí mismo, luego esta definición extiende a la dada previamente, y ahora tenemos definida \( \bar\mu: \mathcal B\longrightarrow [0,+\infty] \).

Se trata de una medida, pues \( \bar\mu(\emptyset)=0 \) (el conjunto vacío no contiene átomos, y se entiende que una suma vacía vale cero) y, si \( U\cap V=\emptyset \), entonces los átomos contenidos en \( U\cup V \) son los contenidos en \( U \) o los contenidos en \( V \), de donde se sigue inmediatamente que \( \bar mu(U\cup V)=\bar\mu(U)+\bar\mu(V) \).

Esta medida \( \bar \mu \) extiende a \( \mu_C \), pues si \( B\subset C \), entonces \( B \) es la unión disjunta de los átomos que contiene (dos átomos \( Q_1 \) y \( Q_2 \) son necesariamente disjuntos, porque \( Q_1\cap Q_2\subsetneq Q_1 \), luego la intersección es vacía, y si la unión de los átomos no fuera todo \( B \), el complemento contendría otro átomo y tendríamos una contradicción). Por lo tanto

\( \bar \mu(B)=\sum\limits_{Q\subset B}\bar\mu(Q)=\sum\limits_{Q\subset B}\mu_C(Q)=\mu_C(B) \).

Veamos ahora que \( \bar \mu \) extiende a \( \mu \). Para ello tomamos \( U\in \mathcal A \). Como \( \emptyset \subset A\cap U\subset A \), la minimalidad de \( A \) hace que \( A\cap U=\emptyset \) o bien \( A\subset U \).

En el primer caso \( U\subset C \), luego \( U\in \mathcal C \), luego \( \bar\mu(U)=\mu_C(U)=\mu(U) \), porque por hipótesis de inducción \( \bar \mu_C \) extiende a \( \mu \).

En el segundo caso

\( \bar\mu(U)=\bar\mu(A)+\bar\mu(U\setminus A)=\mu(A)+\mu_C(U\setminus A)=\mu(A)+\mu(U\setminus A)=\mu(U) \)

Hemos usado que \( \bar mu(A) \) es la suma de las medidas \( \bar \mu \) de los átomos contenidos en \( A \), pero dichas medidas son todas cero por definición excepto \( \bar \mu(P)=\mu(A) \).

Esto termina la prueba de que el resultado es cierto para álgebras finitas.



Para el caso general consideramos el espacio \( K=[0,+\infty]^{\mathcal B} \), es decir, el producto de espacios topológicos, todos iguales al espacio \( [0,+\infty] \) y con tantos factores como elementos tiene \( \mathcal B \). Como \( [0,+\infty] \) es un espacio topológico compacto, sabemos que \( K \) es compacto con la topología producto (aquí estamos usando el axioma de elección).

Notemos que cada elemento de \( K \) es una aplicación \( f:\mathcal B\longrightarrow [0,+\infty] \).

Para cada álgebra de conjuntos finita \( \mathcal C\subset \mathcal B \), consideramos el conjunto

\( C(\mathcal C)=\{\nu\in K\mid \nu|_{\mathcal C}:\mathcal C\longrightarrow [0,+\infty]\mbox{ es una medida que extiende a }\mu|_{\mathcal A\cap \mathcal C}\} \).

Observemos que \( C(\mathcal C)\neq \emptyset \). En efecto, por la parte ya probada, la medida \( \mu|_{\mathcal A\cap \mathcal C} \) se extiende a una medida en \( \mathcal C \), que a su vez puede extenderse a una aplicación \( \nu\in K \), por ejemplo, que tome el valor cero en \( \mathcal B\setminus \mathcal C \). Dicha extensión \( \nu \) no es una medida, pero \( \nu|_{\mathcal C} \) sí que es una medida que extiende a \( \mu|_{\mathcal A\cap \mathcal C} \), que es lo necesario para que \( \nu\in C(\mathcal C) \).

Observemos ahora que si \( \mathcal C_1,\ldots, \mathcal C_n \) son álgebras finitas contenidas en \( \mathcal B \), entonces \( \mathcal C=\left<\mathcal C_1\cup \cdots \cup \mathcal C_n\right> \) es un álgebra finitamente generada, luego finita, según hemos probado en el mensaje anterior, y es claro que

\( \emptyset \neq C(\mathcal C)\subset C(\mathcal C_1)\cap \cdots \cap C(\mathcal C_n) \),

pues si \( \nu\in C(\mathcal C) \), entonces \( \nu|_{\mathcal C} \) es una medida que extiende a \( \mu|_{\mathcal A\cap \mathcal C} \), luego, restringiendo aún más, \( \nu|_{\mathcal C_i} \) es una medida que extiende a \( \mu|_{\mathcal A\cap \mathcal C_i} \).

Esto significa que la familia de todos los conjuntos \( C(\mathcal C) \), donde \( \mathcal C \) recorre las álgebras finitas contenidas en \( \mathcal B \), tiene la propiedad de la intersección finita.

Si probamos que todos los conjuntos \( C(\mathcal C) \) son cerrados, la compacidad de \( K \) nos permite asegurar que \( \bigcap\limits_{\mathcal C}C(\mathcal C)\neq \emptyset \), y entonces, cualquier \( \nu \) en dicha intersección es una medida \( \nu: \mathcal B\longrightarrow [0,+\infty] \) que extiende a \( \mu \). Veamos primero esto y luego probamos que los \( C(\mathcal C) \) son cerrados.

Si \( U, V\in \mathcal B \) son disjuntos, entonces \( \mathcal C=\left<U,V\right> \) es un álgebra finitamente generada, luego finita, y \( \nu\in C(\mathcal C) \), luego \( \nu|_{\mathcal C} \) es una medida en \( \mathcal C \), luego \( \nu(\emptyset)=0 \) y \( \nu(U\cup V)=\nu(U)+\nu(V) \).

Por otra parte, si \( U\in \mathcal A \), entonces, tomando \( \mathcal C=\left<U\right> \), tenemos que \( \nu|_{\mathcal C} \) es una medida en \( C(\mathcal C) \) que extiende a \( \mathcal C\cap \mathcal A \) y, como \( U\in \mathcal C\cap \mathcal A \), resulta que \( \nu(U)=\mu(U) \).

Así pues, sólo falta probar que \( C(\mathcal C) \) es cerrado. Para ello tomamos \( \nu\in K\setminus C(\mathcal C) \) y vamos a probar que hay un abierto \( \nu\in A\subset K\setminus C(\mathcal C) \). Esto prueba que el complementario es abierto en \( K \).

Si \( \nu\in K\setminus C(\mathcal C) \), esto significa que \( \nu|_{\mathcal C} \) no es una medida, o bien que no extiende a \( \mu|_{\mathcal A\cap \mathcal C} \).

Consideremos primero el segundo caso, es decir, que existe un \( U\in \mathcal A\cap \mathcal C \) tal que \( \nu(U)\neq \mu(U) \).

Sea \( p_U: K\longrightarrow [0,+\infty] \) la proyección en el \( U \)-ésimo factor de \( K \) y consideremos el abierto \( V=[0,+\infty]\setminus \{\mu(U)\} \). Entonces \( A=p_U^{-1}[V] \) es abierto en \( K \) y toda \( \nu'\in A \) cumple que \( p_U(\nu')=\nu'(U)\neq \mu(U) \), luego \( \nu' \) no extiende a \( \mu \), luego \( \nu\in A\subset K\setminus C(\mathcal C) \), como queríamos probar.

Pasemos ahora al caso en que \( \nu|_{\mathcal C} \) no es una medida. Si esto sucede porque \( \nu(\emptyset)\neq 0 \), entonces en particular \( \nu \) no extiende a \( \mu \) y ya hemos tratado este caso.

La otra posibilidad es que existan \( U_1, U_2\in \mathcal C \) disjuntos tales que \( \nu(U_1\cup U_2)\neq \nu(U_1)+\nu(U_2) \).

En tal caso, por la propiedad de Hausdorff en \( [0,+\infty] \), existen abiertos disjuntos \( V_1, V_2 \) tales que \( \nu(U_1\cup U_2)\in V_1 \), \( \nu(U_1)+\nu(U_2)\in V_2 \).

Por la continuidad de la suma \( f: [0,+\infty]\times [0,+\infty]\longrightarrow [0,+\infty] \) existe un abierto \( W_1\times W_2 \) tal que \( (\nu(U_1),\nu(U_2))\in W_1\times W_2\subset f^{-1}[V_2] \).

El conjunto \( A =p_{U_1}(W_1)\cap p_{U_2}(W_2)\cap P_{U_1\cup U_2}(V_1) \) es abierto en \( K \), porque es intersección de tres abiertos. Se cumple que \( \nu\in A \), pues \( \nu(U_1)\in W_1 \), \( \nu(U_2)\in W_2 \) y \( \nu(U_1\cup U_2)\in V_1 \), y si \( \nu'\in A \), entonces \( \nu'(U_1)\in W_1 \), \( \nu'(U_2)\in W_2 \), luego \( \nu'(U_1)+\nu'(U_2)\in V_2 \), pero \( \nu'(U_1\cup U_2)\in V_1 \), luego \( \nu'(U_1)+\nu'(U_2)\neq \nu'(U_1\cup U_2) \), luego \( \nu'|_{\mathcal C} \) no es una medida, luego \( \nu'\in K\setminus C(\mathcal C) \).

En definitiva, tenemos también que \( \nu\in A\subset K\setminus C(\mathcal C) \) y el teorema queda probado.



En particular, si aplicamos esto con \( \mathcal B=\mathcal P\mathbb R^n \) y \( \mathcal A \) el álgebra \( \mathcal M_n \) de los conjuntos medibles Lebesgue, concluimos:

Teorema La medida de Lebesgue en \( \mathbb R^n \) puede extenderse a una medida finitamente aditiva en \( \mathcal P\mathbb R^n \).

A partir de aquí, el problema es estudiar si podemos tomar una extensión invariante por isometrías. La paradoja de Banach-Tarski nos dice que, para \( n\geq 3 \), es imposible, pero veremos que sí que es posible para \( n=1,2 \) y, en general, al menos podemos tomarla invariante por traslaciones.

Terminamos con una observación sobre el uso del axioma de elección en el teorema que hemos probado:

El teorema de extensión de medidas usa el axioma de elección sólo una vez, al aplicar el teorema de Tychonoff para concluir que el producto \( K \) es compacto. No obstante, si el álgebra \( \mathcal B \) es numerable, entonces no hace falta el axioma de elección, porque éste no es necesario para probar que el producto de una cantidad numerable de copias de \( [0,+\infty] \) es compacto. Este hecho tendrá su interés más adelante.

21 Octubre, 2013, 05:47 pm
Respuesta #5

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Consideremos una extensión \( \mu \) a \( \mathcal P\mathbb R^n \) de la medida de Lebesgue \( m \) y supongamos que queremos garantizar que cumple \( \mu(A)=\mu(-A) \) (donde \( -A=\{-a\mid a\in A\} \) es el resultado de aplicar a \( A \) la simetría respecto del origen). Para conseguirlo basta cambiar \( \mu \) por \( \mu^*(A)=\dfrac{\mu(A)+\mu(-A)}2 \).

Si queremos que la medida sea invariante por traslaciones, la idea de fondo para conseguirlo es promediar todos los valores \( \mu(t+A) \), para todo \( t\in \mathbb R^n \), y la forma de hacerlo es mediante una integral.

Por ello, ahora vamos a demostrar que a partir de cada medida finitamente aditiva en un álgebra \( \mathcal PX \) se puede construir una integral. La construcción es idéntica a la de la integral de Lebesgue, sólo que se simplifica sustancialmente debido a que, como partimos de una medida en \( \mathcal PX \), todos los conjuntos son medibles, y esto hace que todas las funciones sean medibles, por lo que ni siquiera necesitamos el concepto de función medible. Además, vamos a definir únicamente la integral de funciones acotadas en el caso en que la medida de todo el espacio es \( 1 \), lo cual simplifica aún más el asunto.

Definición Sea \( X \) un conjunto y sea \( B(X) \) el conjunto de todas las funciones \( f:X\longrightarrow \mathbb R \) acotadas. El conjunto \( B(X) \) tiene estructura de anillo con la suma y el producto definidos punto a punto, es decir:
\( (f+g)(x)=f(x)+g(x) \),   \( (fg)(x)=f(x)g(x) \)

Además podemos considerar en \( B(X) \) el orden parcial dado por
\( f\leq g\leftrightarrow \forall x\in X\ f(x)\leq g(x) \)

Identificaremos los números reales con las funciones constantes, de modo que \( 0 \) representará a la función constantemente igual a \( 0 \), etc.

Diremos que \( s\in B(X) \) es una función simple si toma un número finito de valores. Es inmediato que la suma y el producto de funciones simples es simple, por lo que el conjunto \( S(X) \) de las funciones simples es un subanillo de \( B(X) \) que contiene a las constantes.

Si \( s \) es simple y \( \alpha_1,\ldots, \alpha_n \) son los valores no nulos que toma, entonces llamamos \( X_i=s^{-1}[i] \) y tenemos una familia de subconjuntos de \( X \) disjuntos dos a dos tal que \( s \) se expresa en la forma \( s=\sum\limits_{i=1}^n\alpha_i\chi_{X_i} \), donde \( \chi_{X_i} \) es la función característica de \( X_i \), es decir, la función dada por
\( \chi_A(x)=\begin{cases} 1 & \mbox{ si }& x\in A,\\ 0 & \mbox{si}& x\notin A.\end{cases} \)
Recíprocamente, toda función de esta forma es simple.

Definición Sea \( X \) un conjunto y \( \mu \) una medida unitaria (es decir, tal que \( \mu(X)=1 \)) en \( \mathcal PX \). Para cada función simple \( s\in S(X) \) que tome los valores no nulos \( \alpha_1,\ldots, \alpha_n \), llamando \( X_i=s^{-1}[\alpha_i] \), definimos
\( \displaystyle \int_Xs\,d\mu=\sum_{i=1}^n\alpha_i\mu(X_i) \).

En este contexto conviene pensar en la integral como una media ponderada: multiplicamos cada uno de los valores que toma \( s \) por el tamaño del conjunto donde toma ese valor.

Teorema En las condiciones de la definición anterior, si \( s, t\in S(X) \) y \( \alpha,\beta\in \mathbb R \),entonces
\( \displaystyle \int_X(\alpha f+\beta g)\,d\mu=\alpha\int_Xf\,d\mu+\beta\int_Xg\,d\mu \).

Demostración
Sea \( s=\sum\limits_{i=1}^n\alpha_i \chi_{X_i} \) y \( t=\sum\limits_{j=1}^m\beta_i\chi_{Y_j} \). Llamamos \( X_{ij}=X_i\cap Y_j \) y completamos estos conjuntos con
\( X_{i0}=X_i\setminus \bigcup\limits_{j=1}^mY_j \)     \( X_{0i}=Y_j\setminus \bigcup\limits_{i=1}^nX_i \)   \(  X_{00}=\emptyset \).

Convenimos además en que \( \alpha_0=\beta_0=0 \). Entonces

\( X_i \) es la unión disjunta de los conjuntos \( X_i\cap Y_j \) más el conjunto \( X_{i0} \) que contiene todo lo que no queda contenido en éstos, e igualmente con \( Y_j \). Por lo tanto

\( \alpha s+\beta t =\alpha\sum\limits_{i=1}^n\alpha_i\sum\limits_{j=0}^m\chi_{X_{ij}}+\beta\sum\limits_{j=1}^m\beta_j\sum\limits_{i=0}^n\chi_{X_{ij}}= \sum\limits_{i=0}^n\sum\limits_{j=0}^m\alpha\alpha_i\chi_{X_{ij}}+\sum\limits_{j=0}^m\sum\limits_{i=0}^n\beta\beta_j\chi_{X_{ij}} \)\( =\sum\limits_{ij}(\alpha\alpha_i+\beta\beta_j)\chi_{X_{ij}} \)

Por lo tanto:

\( \displaystyle \int_X(\alpha s+\beta t)\,d\mu = \sum_{ij}(\alpha\alpha_i+\beta\beta_j)\mu(X_{ij})=\alpha\sum_{ij}\alpha_i\mu(X_{ij})+\beta\sum_{ij}\beta_j\mu(X_{ij}) \)\( \displaystyle=\alpha\sum_{i=1}^n\alpha_i\mu(X_i)+\beta\sum_{j=1}^m\beta_j\mu(Y_j)=\alpha\int_Xs\,d\mu+\beta\int_Xt\,d\mu. \)
[cerrar]

Observemos que si una función simple cumple \( s\geq 0 \), de la propia definición de integral se sigue que \( \int_Xd\,d\mu\geq 0 \). Por lo tanto, si \( s\leq t \), entonces \( t-s\geq 0 \) y, por el teorema anterior, \( \int_X t\,d\mu-\int_X s\,d\mu\geq 0 \), luego \( \int_Xs\,d\mu\leq \int_Xt\,d\mu \), de modo que la integral es un operador monótono.

Definición Sea \( X \) un conjunto y \( \mu \) una medida unitaria en \( \mathcal PX \). Para cada \( f\in B(X) \) definimos

\( \displaystyle \int_Xf\,d\mu=\sup\{\int_Xs\,d\mu\mid s\in S(X)\land s\leq f\} \).

Observemos que, como \( f \) está acotada, existe un \( M\in \mathbb R \) tal que \( -M\leq f\leq M \) y \( M\chi_X \) es una función simple menor o igual que \( f \), luego el conjunto cuyo supremo estamos considerando no es vacío. Además, si \( f \) es simple dicho conjunto contiene a la integral de \( f \) como función simple, y por la monotonía es mayor o igual que la integral de cualquier otra función simple \( s\leq f \). Esto significa que la integral definida de este modo para una función simple coincide con la que ya teníamos definida.

Ahora necesitamos que toda función se puede aproximar por una función simple:

Teorema Si \( X \) es un conjunto y \( f\in B(X) \), dado \( \epsilon>0 \) existe \( s\in S(X) \) tal que \( s\leq f \) y \( f-s\leq \epsilon \).

Demostración
Pongamos que \( f[X]\subset \left[a,b\right[ \). Fijemos un número natural \( N \) tal que \( (b-a)/N<\epsilon \) y consideremos la partición de \( \left[a,b\right[ \) dada por los conjuntos

\( Y_i=\left[a+\dfrac{i(b-a)}N,a+\dfrac{(i+1)(b-a)}N\right[ \)

Entonces los conjuntos \( X_i=f^{-1}[Y_i] \) forman una partición de \( X \) y podemos considerar la función simple

\( \displaystyle s=\sum\limits_{i=0}^{n-1}\left(a+\dfrac{i(b-a)}N\right)\chi_{X_i} \).

Es claro que cumple lo pedido, pues si \( x\in X \) y, concretamente, \( x\in X_i \), tenemos que \( s(x)=a+\dfrac{i(b-a)}N\leq f(x)\leq a+\dfrac{(i+1)(b-a)}{N} \), luego \( f(x)-s(x)\leq \dfrac{b-a}N\leq \epsilon \).
[cerrar]

Observemos que, en las condiciones de la definición y el teorema anterior, si \( f-s\leq \epsilon \), también \( \int_Xf\,d\mu-\int_Xs\,d\mu\leq \epsilon \).

Demostración
Si \( u\leq f \) es una función simple, tenemos que \( u-s\leq f-s\leq \epsilon \), luego \( \int_Xu\,d\mu-\int_Xs\,d\mu\leq \int_X\epsilon = \epsilon\mu(X)=\epsilon \), luego \( \int_Xu\,d\mu\leq \int_Xs\,d\mu+\epsilon \) y, tomando el supremo en \( u \), resulta que \( \int_Xf\,d\mu\leq \int_Xs\,d\mu+\epsilon \).
[cerrar]

Observemos que si, por ejemplo, \( X=\mathbb R \), el hecho de que \( f-s\leq \epsilon \) para un \( \epsilon \) tan pequeño que supere nuestra capacidad de discernimiento, resulta que la gráfica de \( s \) está formada por un número finito de segmentos horizontales, pero son tan pequeños y están tan próximos a \( f \) que es imposible distinguirla de la verdadera gráfica de \( f \), y lo que estamos diciendo es que si una función simple es casi idéntica a una función \( f \), entonces la integral de la función simple es casi la integral de la función \( f \).

Con esto podemos probar:

Teorema Sea \( X \) un conjunto y \( \mu \) una medida unitaria en \( \mathcal PX \). Si \( f,g\in B(X) \), entonces
\( \displaystyle\int_X(f+g)\,d\mu=\int_Xf\,d\mu+\int_Xg\,d\mu \)

Demostración
Fijado \( \epsilon>0 \), tomemos funciones simples \( s\leq f \) y \( t\leq g \) tales que \( f-s\leq \epsilon/4 \) y\( g-t\leq \epsilon/4 \), con lo que \( s+t\leq f+g \) y \( f+g-s-t\leq \epsilon/2 \).

Por la observación precedente resulta que

\( \displaystyle \left|\int_X(f+g)\,d\mu-\int_Xf\,d\mu-\int_Xg\,d\mu\right|=\left|\int_X(f+g)\,d\mu-\int_X(s+t)\,d\mu+\int_Xs\,d\mu-\int_Xf\,d\mu+\int_Xt\,d\mu-\int_Xg\,d\mu\right| \)

\( \displaystyle \leq \left|\int_X(f+g)\,d\mu-\int_X(s+t)\,d\mu\right|+\left|\int_Xf\,d\mu-\int_Xs\,d\mu\right|+\left|\int_Xg\,d\mu-\int_Xt\,d\mu\right| \)\( \leq \dfrac\epsilon2+\dfrac\epsilon4+\dfrac\epsilon4=\epsilon \).

Como esto vale para todo \( \epsilon>0 \), tiene que darse la igualdad del enunciado.
[cerrar]

Las únicas propiedades de la integral que vamos a necesitar son las siguientes:


Teorema Sea \( X \) un conjunto  y \( \mu \) una medida unitaria en \( \mathcal PX \), sean \( f,g\in B(X) \) y \( \alpha,\beta\in \mathbb R \). Entonces:
  • \( \displaystyle \int_X(\alpha f+\beta g)\,d\mu=\alpha\int_Xf\,d\mu+\beta\int_Xg\,d\mu \),
  • Si \( f\geq 0 \), entonces \( \displaystyle \int_Xf\,d\mu\geq 0 \),
  • \( \displaystyle\int_X\chi_X\,d\mu=1 \).

Demostración
Observemos en primer lugar que la monotonía que hemos probado para la integral de funciones simples vale para funciones acotadas cualesquiera: si \( f\leq g \), entonces toda función simple \( s\leq f \) cumple también \( s\leq g \), luego, por definición de integral \( \int_Xs\,d\mu\leq \int_Xg\,d\mu \), y de nuevo por la definición de integral \( \int_Xf\,d\mu\leq \int_Xg\,d\mu \).

Para probar la linealidad sólo falta ver que la integral es lineal para el producto, es decir, que

\( \displaystyle \int_X\alpha\,f\,d\mu=\alpha\int_Xf\,d\mu \)

Vamos a suponer que \( \alpha<0 \), pues el caso contrario es más sencillo. Si \( s\leq f \) es una función simple, entonces \( \alpha s\geq \alpha f \), luego por la monotonía que acabamos de probar, \( \alpha\int_Xs\,d\mu\geq \int_X\alpha f\,\dmu \), luego

\( \displaystyle \int_Xs\,d\mu\leq \frac1\alpha\int_X\alpha f\,d\mu \),

y esto vale para toda \( s\leq f \), luego tomando el supremo resulta que

\( \displaystyle\int_Xf\,d\mu\leq \frac1\alpha\int_X\alpha f\,d\mu \),
luego

\( \displaystyle \alpha\int_Xf\,d\mu\geq\int_X\alpha f\,d\mu \).

Por otra parte, si tomamos una función simple \( s\leq \alpha f \), entonces \( \alpha^{-1}s\geq f \), luego

\( \displaystyle\frac1\alpha\int_Xs\,d\mu\geq \int_X f\,d\mu \),  luego   \( \displaystyle \int_Xs\,d\mu\leq \alpha\int_X f\,d\mu \)

y esto vale para toda \( s\leq \alpha f \), luego por definición de integral \( \displaystyle \int_X \alpha f\,d\mu\leq \alpha\int_X\,d\mu \), y tenemos la igualdad.

Las otras dos propiedades son inmediatas: si \( f\geq 0 \), entonces \( \int_Xf\,d\mu\geq \int_X0\,d\mu=0 \) y \( \int_X\car X\,d\mu = \int_X1\,\mu=1\mu(X)=1 \).
[cerrar]

Ahora podríamos definir la integral sobre un conjunto \( A\subset X \) como \( \displaystyle\int_Af\,d\mu=\int_Xf\chi_A\,d\mu \) y demostrar las propiedades obvias, como que si \( A\cap B=\emptyset \) entonces

\( \displaystyle \int_{A\cup B}f\,d\mu=\int_Af\,d\mu+\int_Bf\,d\mu \),

pero no vamos a necesitar estos hechos.

24 Octubre, 2013, 01:08 am
Respuesta #6

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
El teorema principal que hemos demostrado hasta ahora afirma que si \( \mathcal B \) es un álgebra de conjuntos y \( \mu \) es una medida (finitamente aditiva) definida en un subanillo \( \mathcal A\subset\mathcal B \), entonces \( \mu \) admite una extensión a \( \mathcal B \).

Ahora supondremos quei la medida dada \( \mu \) es \( G \)-invariante, para un cierto subgrupo \( G \) del grupo \( \Sigma_X \) de las permutaciones de \( X \), y veremos en qué condiciones podemos exigir que la extensión sea también \( G \)-invariante.

Concretamente, veremos que la condición necesaria y suficiente para que toda medida \( G \)-invariante pueda extenderse a una medida \( G \)-invariante es que exista una medida \( G \)-invariante sobre el álgebra \( \mathcal PG \). Esto nos lleva a la definición siguiente:

Definición Un grupo \( G \) es medible si existe una medida (finitamente aditiva) unitaria \( \mu:\mathcal PG\longrightarrow [0,1] \) que sea \( G \)-invariante por la izquierda, es decir, tal que, para todo \( A\in \mathcal PG \), se cumpla que \( \mu(gA)=\mu(A) \).

Naturalmente, aquí hay que entender que \( gA=\{ga\mid a\in A\} \).

Nota
Según la Wikipedia, fue von Neumann en 1929 quien definió estos grupos con el término messbar (medibles), pero un tal Mahlon M. Day, al parecer bromeando, tradujo el término al inglés como amenable, y su ocurrencia creó escuela y estos grupos se conocen como lo que en castellano sería "grupos dóciles". He optado por traducir el término original de von Neumann, que es más serio.
[cerrar]

En la definición de grupo medible hemos optado por exigir que la medida sea invariante por la izquierda. Enseguida veremos que la existencia de una medida invariante por la derecha implica la existencia de una invariante a la vez por la izquierda y la derecha. Antes necesitamos un último resultado técnico sobre integrales.

Teorema Sea \( G \) un grupo medible y sea \( \mu \) una medida unitaria en \( \mathcal PG \) que sea \( G \)-invariante por la izquierda. Para cada \( g\in G \) y cada \( f\in B(G) \) llamamos \( f_g\in B(G) \) a la función dada por \( f_g(h)=f(g^{-1}h) \). Entonces

\( \displaystyle \int_Gf_g\,d\mu=\int_G\,d\mu \).

Por ejemplo, si fuera \( G=(\mathbb R,+) \), entonces \( f_g(x)=f(x-g) \), por lo que \( f_g \) es la función cuya gráfica resulta de trasladar \( g \) unidades la gráfica de \( \mathbb R \). Si integramos ambas funciones respecto a una medida invariante por traslaciones, es de esperar que las integrales sean idénticas, y eso es lo que prueba este teorema. Notemos que es la última prueba en la que necesitamos recurrir a la definición de integral.

Demostración
Lo probamos primero para funciones de la forma \( \chi_A \), con \( A\in \mathcal PG \). Observamos que

\( (\chi_A)_g(h)=\chi_A(g^{-1}h)=\chi_{gA}(h) \), luego \( (\chi_A)_g=\chi_{gA} \), luego

\( \displaystyle \int_G(\chi_A)_g\,d\mu = \mu(gA)=\mu(A)=\int_G\chi_A\,d\mu \).

Si \( s= \sum\limits_{i=1}^n\alpha_1 \chi_{A_i} \) es una función simple, entonces es fácil ver que \( s_g=\sum\limits_{i=1}^n\alpha_1 (\chi_{A_i})_g \) y el caso anterior implica que el teorema vale tambien para funciones simples.

Por último, si \( s\leq f \), entonces \( s_g\leq f_g \), luego \( \int_Gs\,\dmu=\int_Gs_g\,d\mu\leq \int_Gf\,d\mu \), luego, por la definición de integral como supremo de integrales de funciones simples,

\( \displaystyle \int_Gf\,d\mu\leq \int_Gf_g\,d\mu \).

Recíprocamente, si \( s\leq f_g \), entonces \( s_{g^{-1}}\leq (f_g)_{g^{-1}}=f \), luego

\( \displaystyle \int_Gs\,d\mu\leq \int_Gs_{g^{-1}}\,d\mu\leq\int_Gf\,d\mu \),

de donde, tomando el supremo, \( \int_Gf_g\,d\mu\leq \int_Gf\,d\mu \) y tenemos la igualdad.
[cerrar]

Con esto podemos probar lo que habíamos anunciado:

Teorema Todo grupo medible admite una medida unitaria en \( \mathcal PG \) que sea a la vez \( G \)-invariante por la izquierda y por la derecha.

Demostración
Sea \( \mu \) una medida \( G \)-invariante por la izquierda en \( \mathcal PG \). Para cada \( A\in \mathcal PG \) definimos \( f_A\in B(G) \) mediante \( f_A(g)=\mu(A^{-1}g) \), donde \( A^{-1}=\{a^{-1}\mid a\in A\} \), y llamamos \( \nu(A)= \int_Gf_A\,d\mu \).

Vamos a probar que \( \nu \) es la medida buscada. Trivialmente \( f_{\emptyset}=0 \), luego \( \nu(\emptyset)=0 \). Además \( f_G(g)=\mu(G^{-1}g)=\mu(G)=1 \), donde hemos usado que \( G^{-1}g=G \). Por consiguiente \( f_G=1 \) y \( \nu(G)=1 \).

Por otra parte, si \( A\cap B=\emptyset \) son subconjuntos de \( G \), entonces

\( f_{A\cup B}(g)=\mu(A^{-1}g\cup B^{-1}g)=\mu(A^{-1}g)+\mu(B^{-1}g)=f_A(g)+f_B(g) \),

luego al integrar \( f_{A\cup B}=f_A+f_B \) queda que \( \nu(A\cup B)=\nu(A)\cup \nu(B) \).

Con esto tenemos probado que \( \nu \) es una medida. Finalmente, \( f_{Ag}(h)=\mu(g^{-1}A^{-1}h)=\mu(A^{-1}h)=f_A(h) \), luego \( f_{Ag}=f_A \), mientras que \( f_{gA}(h)=\mu(A^{-1}g^{-1}h)=f_A(g^{-1}h)=(f_A)_g(h) \), luego \( f_{gA}= (f_A)_g \). Integrando estas dos igualdades (y aplicando a la segunda el teorema anterior) resulta que \( \nu(gA)=\nu(A) \) y \( \nu{}(Ag)=\nu{}(A) \).
[cerrar]

Finalmente demostramos el resultado principal:

Teorema Sea \( G \) un subgrupo del grupo de las permutaciones de un conjunto \( X \), sea \( \mathcal B \) un álgebra \( G \)-invariante de subconjuntos de \( X \)  y sea \( \mu \) una medida \( G \)-invariante en un subanillo \( \mathcal A \) de \( \mathcal B \). Si \( G \) es medible, entonces existe una extensión \( G \)-invariante de \( \mu \) a \( \mathcal B \).

Demostración
Sea \( \nu \) una medida unitaria \( G \)-invariante en \( \mathcal PG \). Ya hemos probado que \( \mu \) admite una extensión \( \bar \mu \) a \( \mathcal B \). Para cada \( A\in \mathcal B \), sea \( f_A:G\longrightarrow [0,+\infty] \) la función dada por \( f_A(g)=\bar\mu(g^{-1}[A]) \). Definimos \( \mu^*:\mathcal B\longrightarrow [0,+\infty] \) mediante

\( \mu^*(A)=\begin{Bmatrix} \int_Gf_A\,d\nu & \mbox{ si }& f_A\in B(G),\\ +\infty & \mbox{si}& f_A\notin B(G).\end{matrix} \)

Veamos que se trata de una medida \( G \)-invariante que extiende a \( \mu \).

En primer lugar, \( f_\emptyset(g)=\bar\mu[g^{-1}[\emptyset]]=\bar\mu[\emptyset]=0 \), luego \( \mu^*(\emptyset)=0 \).

Si \( A\cap B=\emptyset \), entonces

\( f_{A\cup B}(g)=\bar\mu(g^{-1}[A\cup B])=\bar\mu(g^{-1}[A]\cup g^{-1}[B])=\bar\mu(g^{-1}[A])+\bar\mu(g^{-1}[B]) \)\( =f_A(g)+f_B(g) \), luego \( f_{A\cup B}=f_A+f_B \). Si \( f_A, f_B\in B(G) \), integrando obtenemos que  \( \mu^*(A\cup B)=\mu^*(A)+\mu^*(B) \). Si algún sumando no está acotado es claro que la suma tampoco lo está y la igualdad se cumple trivialmente con ambos miembros infinitos.

Si \( A\in \mathcal A \), entonces \( f_A(g)=\mu(g^{-1}[A])=\mu(A) \), porque \( \mu \) es \( G \)-invariante, luego \( \mu^*(A)=\int_G\mu(A)\,d\nu =\mu(A) \).

Por lo tanto \( \mu^* \) es una medida que extiende a \( \mu \). Falta probar que es \( G \)-invariante. En efecto:

\( f_{h[A]}(g)=\bar\mu[g^{-1}[h[A]]] = f_A(h^{-1}g)=(f_A)_h(g) \), luego \( f_{h[A]}=(f_A)_h \). Si \( f_A\in B(G) \), también \( f_{h[A]}\in B(G) \) y entonces

\( \displaystyle \mu^*(h[A])=\int_Gf_{h[A]}\,d\nu=\intG(f_A)_h\,d\nu = \int_Gf_A\,d\nu=\mu^*(A). \)

Si \( f_A\notin B(G) \) lo mismo vale para \( f_{h[A]} \), luego \( \mu^*(h[A])=+\infty=\mu^*(A) \).
[cerrar]

Observemos que para que se cumpla el teorema anterior la condición de que \( G \) sea medible es necesaria, pues si un grupo \( G \) cumple el teorema, podemos tomar \( X=G \) e identificar a \( G \) con un subgrupo de \( \Sigma_G \) identificando cada \( g\in G \) con la permutación \( h\mapsto gh \). Tomamos \( \mathcal B=\mathcal PG \), obviamente \( G \)-invariante y \( \mathcal A=\{\emptyset, G\} \). La medida en \( \mathcal A \) dada por \( \mu(\emptyset)=0 \) y \( \mu(G)=1 \) se extiende a una medida unitaria \( G \)-invariante en \( \mathcal PG \) y esto prueba que \( G \) es medible.

Así pues, el problema que nos queda ahora planteado para extender medidas \( G \)-invariantes es el de determinar qué grupos son medibles.

27 Octubre, 2013, 12:29 am
Respuesta #7

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Una observación trivial es que todo grupo finito es medible. En efecto, si \( G \) es finito podemos considerar en \( \mathcal PG \) la medida unitaria dada por \( \mu(A)=|A|/|G| \), y es claramente invariante por permutaciones arbitrarias, luego en particular por la multiplicación por elementos de \( G \).

Sin embargo, la medibilidad de los grupos infinitos es no trivial incluso en el caso más simple de un grupo cíclico como \( \mathbb Z \). Probar la existencia de una medida unitaria \( \mathbb Z \)-invariante en \( \mathbb Z \) requiere el axioma de elección.

Vamos a probar que, en general, todo grupo abeliano es medible. Para ello demostramos un resultado previo:

Teorema Sea \( G \) un grupo y \( \mathcal F \) una familia de subgrupos tal que \( G=\bigcup\mathcal F \) y, para cada \( H_1,H_2\in\mathcal F \), existe un \( H\in\mathcal F \) tal que \( H_1\cup H_2\subset H \). Si todos los grupos de \( \mathcal F \) son medibles, también lo es \( G \).

Demostración
Sea \( X=[0,1]^{\mathcal PG} \), que es un espacio topológico compacto con la topología producto. Para cada \( \mathcal H\in\mathcal F \) sea

\( C(H)=\{\mu\in X\mid \mu\text{ es una medida unitaria y }\forall A\in \mathcal PG\forall h\in H\ \mu(hA)=\mu(A)\} \).

Se cumple que \( C(H)\neq \emptyset \), pues, como \( H \) es medible, existe una medida unitaria \( H \)-invariante \( \nu:\mathcal PH\longrightarrow [0,1] \), y entonces \( \mu\in X \) dada por \( \mu(A)=\nu(A\cap H) \) cumple claramente que \( \mu\in C(H) \).

La familia de los conjuntos \( C(H) \) tiene la propiedad de la intersección finita, pues si \( H_1,\ldots, H_n\in \mathcal F \), por hipótesis existe un \( H\in \mathcal F \) tal que \( H_1\cup \cdots \cup H_n\subset H  \), de donde

\( \emptyset\neq C(H)\subset C(H_1)\cap \cdots \cap C(H_n) \).

Un argumento similar al empleado en la demostración del teorema de extensión prueba que todos los conjuntos \( C(H) \) son cerrados, luego por compacidad existe \( \mu\in \bigcap\limits_{H\in\mathcal F}C(H) \), y es inmediato que \( \mu \) es una medida unitaria \( G \)-invariante, que prueba que  \( G \) es medible.
[cerrar]

Con esto ya podemos demostrar:

Teorema Todo grupo abeliano es medible.

Demostración
Sea \( G \) un grupo abeliano. La familia \( \mathcal F \) de los subgrupos finitamente generados de \( G \) cumple las hipótesis del teorema anterior, luego si probamos que todos los grupos abelianos finitamente generados son medibles, tendremos que todos los subgrupos de \( \mathcal F \) son medibles y, por el teorema anterior, \( G \) también lo será.

Equivalentemente, podemos suponer que \( G \) es un grupo abeliano finitamente generado. Sea \( X=\{g_1,\ldots, g_n\}  \) un sistema generador de \( G \).

Veamos que basta probar que para todo \( \epsilon>0 \) existe una medida unitaria \( \mu_\epsilon:\mathcal PG\longrightarrow [0,1] \) que es casi invariante por los generadores, en el sentido de que, para todo \( A\in \mathcal PG \) y cada \( i=1,\ldots, n \), se cumple que \( |\mu_\epsilon(A)-\mu_\epsilon(g_iA)|<\epsilon \).

Admitamos de momento que existen estas medidas. Entonces llamamos \( C_\epsilon\subset [0,1]^{\mathcal PG} \) al conjunto de todas las medidas \( \mu_\epsilon \) que cumplen las condiciones indicadas. Se comprueba fácilmente que es cerrado en el producto cartesiano, y la familia de todos los conjuntos \( C_\epsilon \) tiene la propiedad de la intersección finita, pues \( \epsilon<\epsilon'\rightarrow C_\epsilon\subset C_{\epsilon'} \). Por compacidad podemos tomar \( \mu\in \bigcap\limits_{\epsilon>0}C_\epsilon \), que es una medida unitaria \( G \)-invariante en \( \mathcal PG \).

Para construir una medida \( \mu_\epsilon \) tomamos un natural \( N \) tal que \( 2/N<\epsilon \) y, para cada \( A\in \mathcal PG \), definimos

\( \mu_\epsilon(A)=\dfrac{|\{(k_1,\ldots, k_n)\in \{1,\ldots, N\}^n\mid g_1^{k_1}\cdots g_n^{k_n}\in A\}|}{N^n} \).

Es inmediato que \( \mu_\epsilon \) es una medida unitaria y

\( g_1^{k_1}\cdots g_n^{k_n}\in g_iA\leftrightarrow g_1^{k_1}\cdots g_i^{k_i-1}\cdots g_n^{k_n}\in A \),

luego \( \mu_\epsilon(g_iA) \) y \( \mu_\epsilon(A) \) se diferencian a lo sumo en

\( \dfrac{|\{(k_1,\ldots, k_n)\in \{1,\ldots, N\}^n\mid k_i=1\lor k_i=N\}|}{N^n}=\dfrac{2N^{n-1}}{N^n}=\dfrac2N<\epsilon \).
[cerrar]

Así, como la medida de Lebesgue en \( \mathbb R^n \) es invariante por traslaciones y el grupo de las traslaciones de \( \mathbb R^n \) es abeliano (es isomorfo al grupo aditivo de \( \mathbb R^n \), el último teorema de mensaje precedente nos permite afirmar lo siguiente:

Teorema: La medida de Lebesgue en \( \mathbb R^n \) se extiende a una medida finitamente aditiva invariante por traslaciones en \( \mathcal P\mathbb R^n \).

01 Noviembre, 2013, 11:18 pm
Respuesta #8

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Recordemos que un grupo \( G \) es resoluble si existe una serie de subgrupos

\( 1=G_0\trianglelefteq G_1\trianglelefteq\cdots \trianglelefteq G_n=G \)

tal que cada grupo cociente \( G_i/G_{i-1} \) es abeliano.

Puesto que sabemos que los grupos abelianos son medibles, para probar que todo grupo resoluble es medible basta demostrar el teorema siguiente:

Teorema Si \( G \) es un grupo y \( N\trianglelefteq G \) es un subgrupo normal tal que tanto \( N \) como \( G/N \) son medibles, entonces \( G \) es medible.

Aceptando esto, si \( G \) es resoluble y consideramos una serie según la definición, un razonamiento inductivo prueba que cada grupo \( G_i \) es medible, pues \( G_0 \) lo es trivialmente y, si lo es \( G_{i-1} \), como \( G_i/G_{i-1} \) también lo es (por ser abeliano), resulta que \( G_i \) también lo es, luego llegamos a que \( G=G_n \) es medible.

Demostración
Sean \( \nu_s: \mathcal PN\longrightarrow [0,1] \) y \( \nu_c: \mathcal P(G/N)\longrightarrow [0,1] \) medidas según la definición de grupo medible (la s es por "subgrupo" y la c por "cociente").

Para cada \( A\subset G \), definimos \( f_A: G\longrightarrow [0,1] \) mediante \( f_A(g)=\nu_s(N\cap g^{-1}A) \).

Notemos que si \( g_1N = g_2N \), entonces \( g_2^{-1}g_1N=N \), luego

\( f_A(g_1)=\nu_s(N\cap g_1^{-1}A)=\nu_s(g_2^{-1}g_1N\cap g_2^{-1}A)=\nu_s(N\cap g_2^{-1}A)=f_A(g_2) \),

donde hemos usado que \( \nu_s \) es invariante por la multiplicación por \( g_2^{-1}g_1 \). Por consiguiente, \( f_A \) induce una función \( \bar f_A:\mathcal P(G/N)\longrightarrow [0,1] \) dada por \( \bar f_A(gN)=f_A(g) \). Claramente \( \bar f_A\in B(G/N) \), luego podemos definir

\( \displaystyle\mu(A)=\int_{G/N}f_A\,d\nu_c \).

Como \( f_G = 1 \), también \( \bar f_G=1 \), luego \( \mu(G)=1 \). Igualmente, \( f_\emptyset=0 \), luego \( \mu(\emptyset)=0 \).

Si \( A,B \) son subconjuntos disjuntos de \( G \), entonces, para todo \( g\in G \) tenemos que

\( (N\cap g^{-1}A)\cap (N\cap g^{-1}B)=\emptyset \), luego \( f_{A\cup B}(g)=\nu_s(N\cap g^{-1}(A\cup B))=\nu_s((N\cap g^{-1}A)\cup (N\cap g^{-1}B)) \)\( =\nu_s(N\cap g^{-1}A)+\nu_s(N\cap g^{-1}B)=f_A(g)+f_B(g) \)

de modo que \( f_{A\cup B}=f_A+f_B \), luego también \( \bar f_{A\cup B}=\bar f_A+\bar f_B \), luego

\( \displaystyle \mu(A\cup B)=\int_{G/N}f_{A\cup B}\,d\nu_c = \int_{G/N}f_A\,d\nu_c+\int_{G/N}f_B\,d\nu_c=\mu(A)+\mu(B) \)

Así pues, \( \mu \) es una medida en \( G \), y sólo falta probar que es \( G \)-invariante. Ahora bien,

\( f_{hA}(g)=\nu_s(N\cap g^{-1}hA)= f_A(h^{-1}g)= (f_A)_h(g) \),

luego \( f_{hA}=(f_A)_h \), de donde a su vez

\( \bar f_{hA}(gN)=f_{hA}(g) = f_A(h^{-1}g) = \bar f_A((hN)^{-1}gN)=(\bar f_A)_{hN}(gN) \),

luego \( \bar f_{hA}=(\bar f_A)_{hN} \), luego

\( \mu(hA)=\displaystyle\int_{G/N}(\bar f_{hA})\,d\nu_c = \int_{G/N}(\bar f_A)_{hN}\,d\nu_c = \int_{G/N}f_A\,d\nu_c=\mu(A)  \).

Esto prueba que \( G \) es medible.
[cerrar]

03 Noviembre, 2013, 11:05 pm
Respuesta #9

Carlos Ivorra

  • Administrador
  • Mensajes: 9,060
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Ya casi sólo nos falta atar cabos.

Sea \( G_n \) el grupo de las isometrías de \( \mathbb R^n \). Es claro que la aplicación \( H: G_n\longrightarrow \mathbb R^n \) dada por \( H(f)=f(0) \) es un epimorfismo de grupos (siempre existe una isometría que transforma el \( 0 \) en cualquier punto de \( \mathbb R^n \), por ejemplo, una traslación). El núcleo de \( H \) es el subgrupo formado por las isometrías que dejan invariante al origen de coordenadas, pero tales isometrías son aplicaciones lineales, y el grupo de todas ellas puede identificarse con el grupo de sus matrices asociadas en una base prefijada. Una matriz \( A \) es la matriz de una isometría lineal si y sólo si es ortogonal, es decir, si y sólo si \( AA^t=I_n \), por lo que \( H \) puede identificarse con el grupo \( O(n) \) de las matrices ortogonales \( n\times n \).

En definitiva, tenemos que \( O(n)\trianglelefteq G_n \) y \( G_n/O(n)\cong \mathbb R^n \).

Ahora, la aplicación \( O(n)\longrightarrow \{\pm 1\} \) que a cada matriz ortogonal le hace corresponder su determinante es un epimorfismo de grupos cuyo núcleo es el grupo \( O^+(n) \) de las matrices ortogonales de determinante positivo. Así pues,

\( O^+(n)\trianglelefteq O(n)\trianglelefteq G_n \),           con \( O(n)/O^+(n)\cong \{\pm 1\} \),           \( G_n/O(n)\cong \mathbb R^n \).

En el caso \( n=1 \), la única matriz \( 1\times 1 \) con determinante \( 1 \) es \( (1) \), luego \( O^+(1)=1 \), y en el caso \( n=2 \) el grupo \( O^+(2) \) está formado por los giros, de modo que sus elementos son de la forma

\( M(\theta)=\left(\begin{array}{cc}
\cos\theta&\sen \theta\\ -\sen\theta&\cos \theta
\end{array}\right) \)
y la aplicación \( \mathbb R\longrightarrow O^+(2) \) dada por \( \theta\mapsto M(\theta) \) es un epimorfismo de grupos. En particular \( O^+(2) \) es abeliano, luego la serie

\( 1\trianglelefteq O^+(2)\trianglelefteq O(2)\trianglelefteq G_2 \)

prueba que el grupo \( G_2 \) es resoluble, al igual que lo es \( G_1 \) y, según hemos visto, ambos grupos son entonces medibles.

Por consiguiente:

Teorema Si \( n=1,2 \) existe una medida finitamente aditiva \( \mu: \mathcal P\mathbb R^n\longrightarrow \left[0,+\infty\right[ \) que extiende a la medida de Lebesgue.

En efecto, la medida de Lebesgue es \( G_n \)-invariante, y el grupo \( G_n \) es medible, luego hemos probado que admite una extensión finitamente aditiva al álgebra \( \mathcal P\mathbb R^n \).

En particular, queda demostrado que no existen análogos a la paradoja de Banach-Tarski en dimensiones 1 o 2. La propia paradoja de Banach-Tarski implica que \( G_3 \) no puede ser medible y, en particular, no puede ser resoluble, ni tampoco pueden serlo los grupos \( G_n \) con \( n\geq 3 \), pues contienen subgrupos isomorfos a \( G_3 \).