Autor Tema: Comentarios al hilo de modelos de la teoría de conjuntos

0 Usuarios y 2 Visitantes están viendo este tema.

17 Septiembre, 2012, 05:21 pm
Leído 109683 veces

argentinator

  • Consultar la FIRMAPEDIA
  • Administrador
  • Mensajes: 7,739
  • País: ar
  • Karma: +0/-0
  • Sexo: Masculino
  • Vean mis posts activos en mi página personal
    • Mis posts activos (click aquí)
He separado en este hilo todos los comentarios al hilo Modelos de la Teoría de Conjuntos para facilitar la lectura tanto del hilo en sí como de los comentarios.

Carlos Ivorra



Para terminar quiero resaltar que, aunque aquí hemos destacado la relación de la teoría matemática sobre lenguajes formales en general (y el lenguaje \( \ulcorner\mathcal L_{\rm tc}\urcorner \) en particular) con la metateoría que fundamenta a ZF, esto no quita para que hayamos definido un concepto matemático (el concepto de lenguaje formal, y los conceptos derivados de término, fórmula, etc.) que es ni más ni menos un concepto matemático como lo es el concepto de espacio topológico (con sus conceptos derivados de interior, clausura, etc.). Un lenguaje formal es un objeto matemático, un conjunto, que da pie a definir otros conceptos matemáticos, otros conjuntos (de términos, fórmulas, etc.) mediante las técnicas usuales en matemáticas (definiciones recurrentes, uniones, etc.) y todo ello es independiente de cualquier conexión con la metamatemática.

Este último párrafo me resulta algo enredado de entender.
Si decís, como en el primer post, que "estamos en ZF y allí definimos un lenguaje formal \( \mathcal L \)", entonces estamos en el caso de una estructura matemática formal cualquiera, como por ejemplo, un grupo, una topología, etc.
Luego, todos los objetos tratados son conjuntos.
No entiendo qué quisiste decir respecto esto y la metamatemática.
(A veces hay párrafos que es mejor ni tan siquiera poner, jeje).

17 Septiembre, 2012, 05:59 pm
Respuesta #1

Carlos Ivorra

  • Administrador
  • Mensajes: 11,114
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Este último párrafo me resulta algo enredado de entender.
Si decís, como en el primer post, que "estamos en ZF y allí definimos un lenguaje formal \( \mathcal L \)", entonces estamos en el caso de una estructura matemática formal cualquiera, como por ejemplo, un grupo, una topología, etc.
Luego, todos los objetos tratados son conjuntos.
No entiendo qué quisiste decir respecto esto y la metamatemática.
(A veces hay párrafos que es mejor ni tan siquiera poner, jeje).

Pues lo has entendido perfectamente. Lo único que pretendía era evitar que el haber hablado de metalenguajes llevara a la impresión de que lo que estoy exponiendo no son "matemáticas normales", sino "mátemáticas extrañas de esas que hacen los lógicos". Quería señalar que, si eliminamos toda alusión al metalenguaje del cual el lenguaje que hemos definido es un "reflejo", nos queda todavía una teoría matemática "normal y corriente". Pero voy a ver si rectifico o elimino el párrafo.

03 Octubre, 2012, 07:59 am
Respuesta #2

Cristian C

  • $$\Large \color{#5e8d56}\pi\,\pi\,\pi$$
  • Mensajes: 474
  • Karma: +0/-0
  • Sexo: Masculino
Para no contaminar el hilo con planteos de fundamentos, lo coloco en un
Spoiler
Dice Carlos al inicio:

Citar
Es bastante frecuente que en muchos hilos sobre temas conjuntistas se termine hablando de modelos de la teoría de conjuntos, pero no hay en este foro ningún hilo que recoja las definiciones básicas al que el lector no familiarizado pueda remitirse, y eso hace que todo lo relacionado con modelos acabe sonando como algo más o menos "misterioso".

Encuentro una diferencia entre “modelos de la teoría de conjuntos” tal como lo describes, y “teoría conjuntista de modelos”. Lo primero es un modelo del lenguaje de la teoría de conjuntos y lo segundo es describir la teoría de modelos dentro de la teoría de conjuntos tomada como metateoría. Resulta claro que estas haciendo lo segundo, pero la parte más "misteriosa" se me aparece respecto a lo primero.

En tu "Lógica y Teoría de Conjuntos" inicias el tema fuera del escenario conjuntista formal.
En esa presentación yo debo presuponer las nociones de “colección de objetos”, “relación” y “función” sin más soporte que la intuición. No hay problemas en hacerlo siempre que ese conjunto esté claramente definido. Tu aclaras este punto en tu libro justamente para evitar el círculo vicioso de utilizar nociones conjuntistas fuera de la teoría de conjuntos.

Allí planteas el problema así:

Citar
Para definir con rigor las noción de interpretación de una fórmula de un lenguaje formal necesitamos hablar de colecciones de objetos y de relaciones y funciones abstractas entre ellos. Esto nos pone al borde de un círculo vicioso. En efecto, las nociones generales de “conjunto”, “relación” y “función” están en la base misma de la matemática abstracta, y son la causa de que no podamos fundamentar rigurosamente la matemática sin la ayuda de una teoría axiomática formal. Por otra parte, ahora afirmamos que vamos a usar estas nociones para estudiar la noción de teoría axiomática con la que queremos fundamentar estas nociones.

Y aclaras:

Citar
Así pues, cuando hablemos de una colección de elementos U entenderemos que hablamos de una de esas colecciones de objetos que conocemos con precisión, de modo que cualquier afirmación del tipo a es un elemento de U, o b no es un elemento de U y, más aún, cualquier afirmación sobre la totalidad de los elementos de U tenga un significado preciso.

A partir de aquí inicias la descripción de modelo de un lenguaje.

Supongo entonces que lo que sigue es aplicable cuando todas las afirmaciones referidas a la totalidad de los elementos de U tiene un significado preciso. Pero en el caso del lenguaje de la teoría de conjuntos, no encuentro ningún universo de objetos donde todas las afirmaciones referidas a la totalidad de ellos tengan un significado preciso; al menos un significado intuible preciso, como es el caso de las afirmaciones referidas a conjuntos no numerables, por ejemplo ¿Qué clase de cosas puede tener esa propiedad?

¿Significa esto que la teoría de conjuntos no tiene un modelo? ¿Que no existen modelos de la teoría de conjuntos?

En esta etapa (muy) incipiente de mi estudio del tema, pienso que un modelo es lo que resulta de asignar significado a ciertos signos de un lenguaje. Pero cuando el escenario se formaliza dentro de la teoría de conjuntos, creo que lo que realmente hacemos es asignar conjuntos a conjuntos. ¿No corremos el riesgo de perder la escencia de esta herramienta?

Tal vez cuando avance más en el tema se me clarifiquen estos aspectos.

Saludos.
[cerrar]
Mi primer gran deslumbramiento matemático consistió en comprender que puede demostrarse que existen infinitos de diferente tamaño.
El segundo fue comprender que lo anterior, aun pese a ser correcto, carece de todo significado.

03 Octubre, 2012, 08:18 am
Respuesta #3

Cristian C

  • $$\Large \color{#5e8d56}\pi\,\pi\,\pi$$
  • Mensajes: 474
  • Karma: +0/-0
  • Sexo: Masculino
Para Carlos: leer y eliminar.

Spoiler
Donde titulas Objetos denotados por términos (Respuesta#2), donde dice:

Recordemos que un término \( \ulcorner t\urcorner\in \mbox{Term}_{k+1}(\mathcal L) \) puede estar en dos circunstancias: o bien \( \ulcorner t\urcorner\in \mbox{Term}_k(\mathcal L) \), en cuyo caso definimos \( f_{k+1}(\ulcorner t\urcorner) = f_k(\ulcorner t\urcorner) \) o, si no se da este caso, necesariamente \( \ulcorner t\urcorner = \ulcorner ft_1\ldots t_m\urcorner \), donde los \( \ulcorner t_i\urcorner \) son términos de orden \( k \) (sobre los que está definida \( f_k \)) y \( \ulcorner f\urcorner \) es un funtor \( m \)-ádico, que tiene asocidada la función \( I(f) \). Definimos entonces

\( f_{k+1}(\ulcorner t\urcorner) = I(\ulcorner t\urcorner)(f_k(\ulcorner t_1\urcorner), \ldots, f_k(\ulcorner t_m\urcorner)) \).

Creo que al final debería decir:

Citar
que tiene asocidada la función \( I(\ulcorner f\urcorner) \). Definimos entonces

\( f_{k+1}(\ulcorner t\urcorner) = I(\ulcorner f\urcorner)(f_k(\ulcorner t_1\urcorner), \ldots, f_k(\ulcorner t_m\urcorner)) \).

Donde he practicado dos modificaciones, una en la oración y otra en la fórmula.
[cerrar]
Mi primer gran deslumbramiento matemático consistió en comprender que puede demostrarse que existen infinitos de diferente tamaño.
El segundo fue comprender que lo anterior, aun pese a ser correcto, carece de todo significado.

03 Octubre, 2012, 09:00 am
Respuesta #4

Carlos Ivorra

  • Administrador
  • Mensajes: 11,114
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Hola, Cristian. Ya he corregido las erratas que me indicas. Gracias. De momento no elimino nada del hilo. Si al final conviene depurarlo ya eliminaría mensajes como éste.

Ahora mismo no tengo tiempo de responder a tu mensaje anterior, pero lo haré esta tarde. No tengas reparos en introducir cualquier pregunta en el hilo, al contrario, todo "feed back" es bienvenido.

03 Octubre, 2012, 03:01 pm
Respuesta #5

Carlos Ivorra

  • Administrador
  • Mensajes: 11,114
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Encuentro una diferencia entre “modelos de la teoría de conjuntos” tal como lo describes, y “teoría conjuntista de modelos”. Lo primero es un modelo del lenguaje de la teoría de conjuntos y lo segundo es describir la teoría de modelos dentro de la teoría de conjuntos tomada como metateoría. Resulta claro que estas haciendo lo segundo,...

Cierto. Aunque no estoy tratando la teoría conjuntista de modelos en toda su generalidad, sino únicamente su aplicación al estudio de los modelos de la teoría de conjuntos, que son muchos menos que los modelos que se pueden estudiar en la teoría de modelos. Es verdad que en los primeros mensajes he probado algunos hechos generales, porque sería tonto particularizarlos al caso de la teoría de conjuntos cuando la prueba particular sería idéntica a la prueba general.

...pero la parte más "misteriosa" se me aparece respecto a lo primero.

Je, je. Precisamente lo que pretendo con este hilo es dar la oportunidad a quien quiera intentarlo de desvanecer el misterio que muchos ven en estas cosas. Es cierto que estoy "atacando" la parte que consideras menos misteriosa, pero desde esta parte se puede iluminar bastante "la otra parte".

En tu "Lógica y Teoría de Conjuntos" inicias el tema fuera del escenario conjuntista formal.
En esa presentación yo debo presuponer las nociones de “colección de objetos”, “relación” y “función” sin más soporte que la intuición. No hay problemas en hacerlo siempre que ese conjunto esté claramente definido. Tu aclaras este punto en tu libro justamente para evitar el círculo vicioso de utilizar nociones conjuntistas fuera de la teoría de conjuntos.

Exacto, es un planteamiento que conceptualmente no tiene nada que ver con el que estoy siguiendo aquí, aunque formalmente ambos puedan resultar indistinguibles.

Supongo entonces que lo que sigue es aplicable cuando todas las afirmaciones referidas a la totalidad de los elementos de U tiene un significado preciso. Pero en el caso del lenguaje de la teoría de conjuntos, no encuentro ningún universo de objetos donde todas las afirmaciones referidas a la totalidad de ellos tengan un significado preciso; al menos un significado intuible preciso, como es el caso de las afirmaciones referidas a conjuntos no numerables, por ejemplo ¿Qué clase de cosas puede tener esa propiedad?

Aquí estas cayendo en una ingenuidad en la que cae el 99.9% de los matemáticos: pensar que por el hecho de que en ZFC puede probarse que existen conjuntos no numerables, el universo U de un modelo de ZFC debe tener una cantidad no numerable de objetos. En este hilo he demostrado que si ZFC tiene modelos, entonces tiene modelos cuyo universo es numerable. Eso se conoce como "paradoja de Skolem", aunque sólo es paradójico en apariencia. Tengo que tratar en asunto en los próximos mensajes, tal vez en el próximo.

La idea es que, en contra de lo que la mayoría de los matemáticos cree, cuando se demuestra que un conjunto es no numerable, no se está demostrando la existencia de muchos elementos, sino únicamente la no existencia de un conjunto que biyecte sus elementos con los números naturales, y "no existir" sólo significa "no existir en cualquier cosa que aspire a ser un modelo de ZFC". Perfectamente puedes tener un modelo de ZFC cuyo universo sea el conjunto U de los números naturales. Entonces, un cierto número natural será "el conjunto de los números reales" del modelo, y ciertos números naturales serán "los números reales" del modelo, pero la no numerabilidad de \( \mathbb{R} \) en el modelo sólo significa que si vas revisando los números naturales uno a uno, ninguno de ellos tendrá la propiedad de ser en dicho modelo una biyección entre \( \mathbb{N} \) y \( \mathbb{R} \).

La demostración vista aquí se basa en el teorema de Löwenheim-Skolem, que no creo que tenga ninguna "sustancia" metamatemática, es decir, que no creo que de su demostración se pueda extraer ningún argumento metamatemáticamente aceptable. Pero sucede que es posible construir modelos numerables de cualquier teoría formal consistente por un procedimiento completamente distinto, que en esencia es la demostración de Henkin del teorema de completitud de Gödel, y que está descrito en el capítulo IV de mi libro de lógica.

¿Significa esto que la teoría de conjuntos no tiene un modelo? ¿Que no existen modelos de la teoría de conjuntos?

Personalmente, no creo que nuestra intuición pueda servir de soporte para justificar la existencia de un conjunto no numerable. Sin embargo, como ya digo, si la teoría de conjuntos es consistente es posible dar una construcción intuitivamente aceptable de un modelo numerable de la teoría de conjuntos. Su universo lo puedes elegir sin problemas, el conjunto de los números naturales, por ejemplo. Lo delicado es cómo definir la relación que debe interpretar a la relación de pertenencia. Te esbozo lo que es el meollo de la cuestión (aunque para que funcione realmente hay que hacer unas correcciones técnicas, pero que no afectan a lo que quiero destacar aquí):

Partimos de una enumeración de todas las sentencias del lenguaje formal de la teoría para la cual buscamos el modelo, y a partir de ella definimos una cierta colección de sentencias, quedándonos con algunas y descartando otras. El proceso consiste en tomar la primera sentencia y quedárnosla si es consistente con los axiomas de la teoría y descartarla si es contradictoria con ellos. En el paso n-simo, nos quedamos con la sentencia n-sima si es consistente con los axiomas de la teoría y las sentencias previas que hemos aceptado, y rechazarla en caso contrario.

De este modo obtenemos una colección de sentencias que está casi en el borde de lo que la intuición nos permite soportar. Está bien definida, pues el criterio deja bien claro qué sentencias están en la colección y cuáles no (una vez fijada una enumeración de todas ellas, lo cual es efectivamente realizable), pero no podemos saber si una sentencia dada está entre las elegidas o no, porque ello supone resolver una cantidad finita de problemas de decisión, es decir, de determinar si ciertas colecciones de fórmulas son consistentes o no, y, aunque podemos afirmar que, o lo son o no lo son, no tenemos ningún medio en general de saber cuál es el caso. Si la teoría axiomática de partida es contradictoria, la colección de sentencias que hemos construido es vacía, pero si es consistente, ya es una pura manipulación mecánica el obtener a partir de ella un conjunto numerable U y unas relaciones y funciones bien definidos para que U se convierta en un modelo (numerable) de la teoría en cuestión.

En esta etapa (muy) incipiente de mi estudio del tema, pienso que un modelo es lo que resulta de asignar significado a ciertos signos de un lenguaje. Pero cuando el escenario se formaliza dentro de la teoría de conjuntos, creo que lo que realmente hacemos es asignar conjuntos a conjuntos.

Desde el momento en que los signos (formalizados) pasan a ser conjuntos, así es, pero quizá una forma más positiva de verlo es considerar que estamos restringiendo el significado de la palabra "conjunto". Cuando demostramos que un conjunto (o, en cierto sentido, una clase) M es un modelo de la teoría de conjuntos y estudiamos M, lo que estamos haciendo es ver qué sucede si, en lugar de entender por "conjunto" cualquiera de los objetos de los que se supone que estamos hablando, nos restringimos a considerar como "conjuntos" únicamente los elementos de M.

Así por ejemplo, en ZF se puede probar que si nos restringimos a considerar como conjuntos una parte de ellos, los llamados "conjuntos constructibles", el axioma de elección se cumple necesariamente, aunque sobre la totalidad de los conjuntos no pueda demostrarse que se cumple.

¿No corremos el riesgo de perder la escencia de esta herramienta?

Si te refieres a que podríamos caer en contradicciones, obviamente no. Estudiar la teoría de modelos dentro de ZFC es como estudiar anillos o espacios topológicos, es simplemente una de las muchas cosas que puede estudiar un matemático.

Si te refieres a que estamos trivializando la idea y que de ella no puede salir realmente nada interesante, la respuesta es negativa. Es cierto que a priori estamos debilitando la teoría, en el sentido de que si, por ejemplo, en ZFC demostramos que existe un modelo de la teoría de Zermelo, con ello no podemos asegurar que dicha teoría es consistente. Sólo hemos demostrado en ZFC que lo es, pero la prueba carecería de valor si ZFC fuera contradictorio, luego "no nos dice nada" metamatemáticamente valioso.

No obstante, las técnicas que estoy tratando en este hilo aportan (aparte de teoremas de interés en sí mismo, como al topólogo le puedan interesar sus teoremas sobre espacios raros) demostraciones constructivas metamatemáticamente relevantes. Por ejemplo, es posible programar a un ordenador para que si le damos una prueba de \( 0\neq 0 \) en ZFC (es decir, con el axioma de elección), el ordenador nos devuelva una demostración de \( 0\neq 0 \) en ZF (sin el axioma de elección), con lo cual sabemos (en un sentido con contenido intuitivo) que añadir el axioma de elección a ZF no puede volver contradictoria a la teoría (que si es contradictoria después, es porque ya lo era antes). Y el meollo de la prueba está en probar en ZF que la clase L de los conjuntos constructibles es un modelo de ZFC, que es parte de lo que llamas "asignar conjuntos a conjuntos".

Por último, si hay que entender lo que dices como un argumento "ético-estético", en el sentido de "no se debería hacer eso", "va contra natura", etc. lo único que puedo decir (aunque estoy convencido de que las observaciones precedentes te convencerán de que no es el caso, pero por si un lector hipotético insistiera en ver las cosas así) es que los argumentos ético-estéticos son una lacra incluso en la ética, conque no veas en matemáticas, y que si el diablo le ofrece a un matemático comprarle su alma a cambio de darle una demostración totalmente rigurosa de algo que merezca la pena, el deber del matemático es vender su alma, porque al fin y al cabo el cielo debe de ser un sitio bastante aburrido. Vamos, que la única razón para hacer ascos a una técnica que proporciona unos resultados rigurosos es que haya otra que llegue a lo mismo de forma más elegante o práctica.

06 Octubre, 2012, 09:26 am
Respuesta #6

Cristian C

  • $$\Large \color{#5e8d56}\pi\,\pi\,\pi$$
  • Mensajes: 474
  • Karma: +0/-0
  • Sexo: Masculino
Hola Carlos

Disculpa si no te contesto, no quiero molestarte si no puedo precisar mis dudas. Voy despacio, mirando el planisferio con un microscopio y con tiempo robado al sueño.
Estoy siguiendo en paralelo la presentación metamatemática de tu libro y la presentación de este hilo. Por el momento, la primera no me ofrece problemas. Veré si puedo precisar una duda respecto a la segunda.


Satisfacción de fórmulas Ahora vamos a definir lo que significa que una fórmula sea verdadera o falsa en un modelo. Para ello vamos a definir una función \( f: \mbox{Form}(\mathcal L)\times \mbox{Val}(\mathcal L,M)\longrightarrow \{0,1\} \) de modo que \( f(\ulcorner \alpha\urcorner, v)=1 \) si y sólo si la fórmula \( \ulcorner \alpha\urcorner \) es verdadera en \( M \) cuando sus variables se interpretan mediante \( v \) .

Allí, no acabo de comprender el significado de la condición:
"la fórmula \( \ulcorner \alpha\urcorner \) es verdadera en \( M \) cuando sus variables se interpretan mediante \( v \)"

Si \( \ulcorner x_1\urcorner,\ldots ,\ulcorner x_n\urcorner \) son las variables libres de \( \ulcorner \alpha\urcorner \), entonces el resultado de interpretar las variables de \( \ulcorner \alpha\urcorner \) mediante la valoración \( v \) es \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \), donde los \( v(\ulcorner x_i\urcorner) \) son elementos de \( M \), y por lo tanto, conjuntos.

Así pues, el resultado de interpretar las variables de \( \ulcorner \alpha\urcorner \) mediante la valoración \( v \) es una sentencia de la teoría de conjuntos que estamos utilizando como metateoría; concretamente, la sentencia \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \). La pregunta es ¿Qué significa que esa sentencia sea "verdadera"?
Por ejemplo, supongamos que \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \) es una sentencia indecidible en la metateoría ¿Cómo se elucida su valor de verdad?

Saludos.
Mi primer gran deslumbramiento matemático consistió en comprender que puede demostrarse que existen infinitos de diferente tamaño.
El segundo fue comprender que lo anterior, aun pese a ser correcto, carece de todo significado.

06 Octubre, 2012, 01:01 pm
Respuesta #7

Carlos Ivorra

  • Administrador
  • Mensajes: 11,114
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Disculpa si no te contesto, no quiero molestarte si no puedo precisar mis dudas. Voy despacio, mirando el planisferio con un microscopio y con tiempo robado al sueño.

Tú ve a tu ritmo. Soy consciente de que estás haciendo un gran esfuerzo. Está bien así.

Allí, no acabo de comprender el significado de la condición:
"la fórmula \( \ulcorner \alpha\urcorner \) es verdadera en \( M \) cuando sus variables se interpretan mediante \( v \)"

En lo que dices a continuación estás mezclando varios niveles de interpretación y no sé si eres consciente de ello. No es lo mismo preguntar qué significa que \( \ulcorner \alpha\urcorner \) sea verdadera (lo primero que preguntas) que preguntar qué significa la afirmación que expresa que \( \ulcorner \alpha\urcorner \) es verdadera (lo que acabas preguntando luego).

La definición por la que preguntas es una definición en ZFC como cualquier otra definición en ZFC. La definición en ZFC de "\( \ulcorner \alpha\urcorner \) es verdadera en \( M \) cuando sus variables se interpretan mediante \( v \)" es que, por definición, esto significa que \( f(\ulcorner \alpha\urcorner,v)=1 \), donde \( f \) es una función definida de acuerdo con las exigencias de rigor de ZFC. Y esto zanja "oficialmente" la cuestión, es decir, si trabajar en ZFC sirve para algo es precisamente para evitar preguntas "molestas" del tipo "¿pero qué quieres decir en realidad con esto?". Un matemático sabe que mientras sus definiciones sean formalmente correctas no necesita especificar nada más sobre ellas. Otra cosa es que después queramos "filosofar", lo cual está bien, siempre y cuando seamos conscientes de que la filosofía no daña los cimientos de ZFC.

Pero antes de ponernos a filosofar, aquí tienes una confusión técnica:

Si \( \ulcorner x_1\urcorner,\ldots ,\ulcorner x_n\urcorner \) son las variables libres de \( \ulcorner \alpha\urcorner \), entonces el resultado de interpretar las variables de \( \ulcorner \alpha\urcorner \) mediante la valoración \( v \) es \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \), donde los \( v(\ulcorner x_i\urcorner) \) son elementos de \( M \), y por lo tanto, conjuntos.

Esto no tiene sentido. En ningún momento se ha definido \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \). Veamos un ejemplo concreto, cuando \( \ulcorner \alpha\urcorner = \ulcorner x\in y\urcorner \).

Fijado un modelo \( M \) del lenguaje \( \ulcorner \mathcal L_{\rm tc}\urcorner \) en el que, por simplicidad, el relator \( \ulcorner \in\urcorner \) se interpreta como la relación de pertenencia, y dada una valoración \( v \), que \( \ulcorner \alpha\urcorner \) sea verdadera en \( M \) cuando sus variables se interpretan mediante \( v \) es lo que hemos definido formalmente como \( M\vDash \ulcorner \alpha\urcorner[v] \), que es una fórmula metamatemática que, según la definición que hemos dado, equivale a que \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \). Si quieres un paso intermedio, hemos definido \( M\vDash \ulcorner \alpha\urcorner[v] \) como que \( f(\ulcorner \alpha\urcorner,v)=1 \), lo cual, por definición de \( f \), sucede si y sólo si \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \).

De este modo, en este caso particular, la sentencia \( \ulcorner x\in y\urcorner \) es verdadera en \( M \) cuando sus variables se interpretan mediante \( v \) significa que el conjunto \( v(\ulcorner x\urcorner) \) pertenece al conjunto \( v(\ulcorner y\urcorner) \).

Pero tú dices:

Así pues, el resultado de interpretar las variables de \( \ulcorner \alpha\urcorner \) mediante la valoración \( v \) es una sentencia de la teoría de conjuntos que estamos utilizando como metateoría; concretamente, la sentencia \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \).

Como te decía, no hay ninguna definición dada de \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \), pero si con esto te refieres a lo que en el ejemplo anterior es \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \), pues eso es lo que hay. La fórmula \( M\vDash  \ulcorner x\in y\urcorner[v] \) (que no es una sentencia, pues, aun aceptando que \( x \) e \( y \) representan dos variables concretas del lenguaje, que no concretamos explícitamente por no complicar la notación, tiene libre la variable \( v \)) es equivalente en ZFC a la fórmula \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \) (que sigue teniendo libre la variable \( v \)).

La pregunta es ¿Qué significa que esa sentencia sea "verdadera"?

Si entiendo bien que "esa sentencia" no es más que (en el ejemplo) la fórmula \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \), estás preguntando qué significa que \( v(\ulcorner x\urcorner)\in v(\ulcorner y\urcorner) \) sea verdadera. Es una pregunta que está totalmente fuera de lugar en ZFC. De hecho, la \( v \) es secundaria en tu pregunta. En realidad estás preguntando qué significa que \( x\in y \) sea verdadera. Esa pregunta no tiene sentido en el seno de ZFC, porque ZFC ha sido diseñado precismente para que los matemáticos puedan hablar de conjuntos y pertenencia sin necesidad de responder a las preguntas de "qué es un conjunto" y "qué significa que un conjunto pertenezca a otro".

Pero para tratar de seguirte hay un asunto técnico que complica el análisis, y es que la fórmula del ejemplo que te he puesto tiene variables libres, y el carácter de verdadero o falso de una fórmulas con variables libres depende de la interpretación de esas variables. Más aún, en el ejemplo que te he puesto el significado de \( \ulcorner \alpha\urcorner \) resultaba ser independiente de \( M \), mientras que en general \( M\vDash \ulcorner \alpha\urcorner[v] \) es una fórmula que tiene a \( M \) como variable libre (aunque a veces pueda desaparecer al pasar a una fórmula equivalente). Pongamos un ejemplo donde no quede ninguna variable libre.

Toma \( M=\{\emptyset,\{\emptyset\}\} \), considerado como modelo del lenguaje \( \ulcorner \mathcal L_{\rm tc}\urcorner \) interpretando el relator \( \ulcorner \in\urcorner \) como la relación de pertenencia, y sea \( \ulcorner \alpha\urcorner=\ulcorner \exists xy\ x\in y\urcorner \). Ahora \( M \) no es una variable, sino un término sin variables libres.

Entonces, \( M\vDash \ulcorner \alpha\urcorner[v] \) es independiente de \( v \), y equivale a la sentencia \( \exists xy\in M(x\in y) \). Consideremos aquí (ahora ya sin variables libres molestas) tu pregunta sobre ¿qué significa que \( \exists xy\in M(x\in y) \) sea verdadera?

Lo que decía antes sigue siendo válido aquí: ZFC está "blindado" contra esa pregunta. Un matemático puede escudarse en ZFC y decirte que él ha dado una definición rigurosa de  \( M\vDash \ulcorner \alpha\urcorner[v] \) y ha demostrado que para este ejemplo concreto equivale a la sentencia \( \exists xy\in M(x\in y) \), y eso es todo. Bueno, hay más: es fácil demostrar esta última sentencia (a partir de la definición de \( M \)), luego el matemático te ha demostrado en ZFC que se cumple \( M\vDash \ulcorner \alpha\urcorner[v] \) y ahí acaba su trabajo: el demuestra teoremas razonando rigurosamente en ZFC y sin ninguna obligación de explicar qué significa que sus teoremas sean ciertos.

Si quieres ir más allá, desde un punto de vista metamatemático, lo que puedes decir es que si ZFC es consistente tendrá modelos (metamatemáticos), y como hemos demostrado \( M\vDash \ulcorner \alpha\urcorner[v] \), entonces podemos asegurar que dicha sentencia será verdadera en todos los modelos de ZFC, en el sentido metamatemático de verdad de una fórmula en un modelo.

Por ejemplo, supongamos que \( M(\ulcorner \alpha\urcorner)(v(\ulcorner x_1\urcorner),\ldots ,v(\ulcorner x_n\urcorner)) \) es una sentencia indecidible en la metateoría ¿Cómo se elucida su valor de verdad?

Corrigiendo tu notación, si \( M\vDash \ulcorner \alpha\urcorner[v] \) es una sentencia indecidible en la metateoría, eso significa que habrá modelos de ZFC en los que sea verdadera y modelos en los que sea falsa. Pero eso no afecta en nada a que tenemos una definición que a cada fórmula (que no es más que un conjunto) \( \ulcorner \alpha\urcorner \), a cada modelo \( M \) y a cada valoración \( v \) le hemos asignado un valor de verdad \( f( \ulcorner \alpha\urcorner,v) \) (que depende de \( M \) aunque no conste explícitamente en la notación) y que puede ser \( 0 \) o \( 1 \), de modo que \( M\vDash \ulcorner \alpha\urcorner[v] \) significa por definición que dicho valor de verdad es \( 1 \), y que eso no excluye la posibiidad de que, para una determinada fórmula en un determinado modelo, no se pueda demostrar en ZFC si el valor de verdad correspondiente es \( 0 \) o \( 1 \). Si eso pasa, tendremos que habrá modelos de ZFC donde \( M\vDash \ulcorner \alpha\urcorner[v] \) será una fórmula verdadera y modelos donde será falsa.

12 Octubre, 2012, 08:17 am
Respuesta #8

Cristian C

  • $$\Large \color{#5e8d56}\pi\,\pi\,\pi$$
  • Mensajes: 474
  • Karma: +0/-0
  • Sexo: Masculino
Hola Carlos:
En el spolier de la respuesta#2, al final de “Satisfacción de fórmulas”, dices:

Citar
Notemos que, en la definición recurrente de \( f_{k+1} \), para definir \( f_{k+1}(\ulcorner \forall x\alpha\urcorner[v]) \) hemos usado que teníamos definida \( f_k \), no sólo para \( (\ulcorner \alpha\urcorner, v) \), sino para todos los pares \( (\ulcorner \alpha\urcorner, w) \), donde \( w \) es cualquier otra valoración, no necesariamente \( v \), ya que necesitamos saber si \( \ulcorner \alpha\urcorner \) es satisfecha o no por cualquiera de las valoraciones \( v_x^a \). Por eso, para definir recurrentemente \( M\vDash \ulcorner \alpha\urcorner[v] \) no podíamos fijar una valoración \( v \) y definir funciones \( f_k: \mbox{Form}_k(\mathcal L)\longrightarrow \{0,1\} \), sino que teníamos que incluir el conjunto de todas las valoraciones en el dominio de las \( f_k \).

Este detalle técnico es crucial, porque es la razón por la cual en ZFC, o en NBG no es posible definir \( M\vDash \alpha[v] \) cuando \( M \) es una clase propia, sino que tenemos que exigir que \( M \) sea un conjunto, como hemos hecho en la definición de modelo.

En efecto, si generalizamos la noción de modelo para permitir que el universo \( M \) sea una clase propia, cuando esto sucede la clase \( \mbox{Val(\mathcal L), M)} \) de todas las valoraciones en \( M \) es también una clase propia, y las \( f_k \) también serían clases propias por serlo su dominio. Esto hace que no pueda definirse la sucesión \( \{f_k\}_k \), ya que ello exigiría que las \( f_k \) fueran conjuntos.

Es claro que cada \( f_{k} \) debe definirse con dominio en \( Form_{k}(\mathcal{L})\times Val(\mathcal{L},M) \) y no para cada valoración fija, por la razón que citas; pero no entiendo por qué razón es inevitable formar \( f \) a partir de las \( f_{k} \). En concreto, se me ocurre una forma de construir \( f \) directamente, sin pasar por las \( f_{k} \). Lo que hago tiene que estar mal, pero no me doy cuenta donde tengo el error. La construcción es la siguiente:

Sea \( f\::\: Form(\mathcal{L})\times Val(\mathcal{L},M)\longrightarrow\{0,1\} \).
Definimos \( f(\theta,v) \) por recursión sobre el orden de \( \theta \).

1. Si \( \theta \) es una fórmula de orden 0 se tiene que \( \theta=\ulcorner Rt_{1}\ldots t_{m}\urcorner \) para un relator \( \ulcorner R\urcorner \) de \( \mathcal{L} \) y términos \( \ulcorner t_{1}\urcorner\ldots \ulcorner t_{m}\urcorner \). Entonces definimos para cada valoración \( v \):
\( f(\ulcorner Rt_{1}\ldots t_{m}\urcorner,v)=1\;\longleftrightarrow I(R)(M(\ulcorner t_{1}\urcorner)[v],\ldots,M(\ulcorner t_{1}\urcorner)[v]) \)
y \( f(\ulcorner Rt_{1}\ldots t_{m}\urcorner,v)=0 \) en otro caso

2. Supuesta definida \( f \) para fórmulas de orden \( k \) para toda valoración \( v \), la definimos para fórmulas de orden \( k+1 \) así:
Sea \( \theta \) una fórmula de orden \( k+1 \), entonces para cada valoración \( v \):
a) si \( \theta \) es también de órden \( k \) entonces \( f(\theta,v) \) está definida por hipótesis.
b) si \( \theta=\ulcorner\neg\alpha\urcorner \) con \( \ulcorner\alpha\urcorner \) de orden \( k \), entonces \( f(\ulcorner\neg\alpha\urcorner,v)=1-f(\ulcorner\alpha\urcorner,v) \) donde \( f(\ulcorner\alpha\urcorner,v) \) está definida por hipótesis.
c) si \( \theta=\ulcorner\alpha\rightarrow\beta\urcorner \) con \( \ulcorner\alpha\urcorner \) y \( \ulcorner\beta\urcorner \) de orden \( k \), entonces \( f(\ulcorner\alpha\rightarrow\beta\urcorner,v)=1\longleftrightarrow f(\ulcorner\alpha\urcorner,v)=0\quad\vee\quad f(\ulcorner\beta\urcorner,v)=1 \), donde \( f(\ulcorner\alpha\urcorner,v) \) y \( f(\ulcorner\beta\urcorner,v) \) están definidas por hipótesis.
d) si \( \theta=\ulcorner\forall x\alpha\urcorner \) con \( \ulcorner\alpha\urcorner \) de orden \( k \), entonces \( f(\ulcorner\forall x\alpha\urcorner,v)=1\longleftrightarrow\forall a\in M\quad f(\ulcorner\alpha\urcorner,v_{x}^{a})=1 \) donde las \( f(\ulcorner\alpha\urcorner,v_{x}^{a}) \) están definidas por hipotesis.

Si esto estuviera bien, no hay ninguna sucesión \( \{f_{k}\}_{k\in\mathbb{N}} \) y el problema que mencionas desaparece. Si estuviera mal, al menos habré entrenado la notación :D

Comento que se me ha ocurrido otra forma de evitar el problema, directamente quitando las valoraciones del dominio de \( f \), fijando una valoración, como en la denotación de términos; pero es más engorrosa y no la tengo del todo asegurada. Además, no tiene sentido que insista en lo más complejo si no entiendo primero porqué no funciona esto, que es más simple.

Una primera impresión hasta aquí: Esta teoría es muuuuy interesante. Toda estructura matemática es equivalente a un modelo de sus axiomas (en el lenguaje apropiado). Esto le confiere una generalidad abrumadora.

Y una cosa que me ha llamado la atención: cuando interpretamos una fórmula en un modelo, tenemos un 1 o un 0; un verdadero o un falso (o ninguna de las dos cosas). En cambio, cuando interpretamos una fórmula del modo natural, mediante la idea de la cual la fórmula se abstrajo originalmente, lo que tenemos es un objeto con significado, una afirmación, que luego podrá ser verdadera o falsa.

Erratas:
Spoiler
1.En respuesta#2, “objetos denotados por términos”
Donde dice:

Citar

De la construcción se deduce inmediatamente:

  • Si \( \ulcorner x\urcorner \) es una variable, entonces \( M(\ulcorner x\urcorner)[v] = v(\ulcorner x\urcorner). \)
  • Si \( \ulcorner c\urcorner \) es una constante, entonces \( M(\ulcorner c\urcorner)[v] = I(\ulcorner c\urcorner) \).
  • Si \( f \) es un funtor \( m \)-ádico, entonces \( M(\ulcorner ft_1\ldots t_m\urcorner)[v] = M(\ulcorner f\urcorner)(M(\ulcorner t_1\urcorner)[v], \ldots, M(\ulcorner t_m\urcorner)[v]) \).

En el último punto, sospecho de debe decir:

Citar
  • Si \( f \) es un funtor \( m \)-ádico, entonces \( M(\ulcorner ft_1\ldots t_m\urcorner)[v] = I(\ulcorner f\urcorner)(M(\ulcorner t_1\urcorner)[v], \ldots, M(\ulcorner t_m\urcorner)[v]) \).

2. Mismo post, después de las propiedades de satisfacción de fórmulas, donde dice

Citar
Por ejemplo, recordando que, por definición (por abuso de lenguaje) \( \ulcorner \alpha\lor\beta\urcorner = \ulcorner \lnot\alpha\lor \beta\urcorner \), tenemos que

Debe decir:

Citar
Por ejemplo, recordando que, por definición (por abuso de lenguaje) \( \ulcorner \alpha\lor\beta\urcorner = \ulcorner \lnot\alpha\rightarrow \beta\urcorner \), tenemos que
[cerrar]
Mi primer gran deslumbramiento matemático consistió en comprender que puede demostrarse que existen infinitos de diferente tamaño.
El segundo fue comprender que lo anterior, aun pese a ser correcto, carece de todo significado.

12 Octubre, 2012, 03:41 pm
Respuesta #9

Carlos Ivorra

  • Administrador
  • Mensajes: 11,114
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
    • Página web personal
Hola, Cristian. Ya he corregido las erratas. Gracias por señalarlas. En cuanto a tu argumento, el problema está aquí:

Sea \( f\::\: Form(\mathcal{L})\times Val(\mathcal{L},M)\longrightarrow\{0,1\} \).
Definimos \( f(\theta,v) \) por recursión sobre el orden de \( \theta \).

Definir por recursión significa asociar algo a cada número natural, es decir, definir una función \( f:\mathbb N\longrightarrow V \), determinando \( f(k) \) en función de los valores tomados por \( f \) sobre números menores que \( k \), es decir, en función de \( f|_k \) (si convenimos en que un número natural \( k \) es el conjunto de los números menores que \( k \)). ¿Qué sería \( f(k) \) o \( f|_k \) en este caso? o, en otras palabras, ¿que defines para un \( k \) y qué supones definido para los naturales menores que \( k \)?

La respuesta es que estás definiendo para cada \( k \) la función que a cada fórmula \( \theta \) de orden \( k \) y a cada valoración \( v \) les asigna el valor \( f(\theta, v) \), pero esto no es sino la función \( f_k \) y lo que supones definido no son sino las funciones \( f_m \) con \( m<k \). No importa cómo lo presentes: para que una definición por recursión sea correcta en ZFC tienes que poder precisar qué supones definido y qué defines, y es imprescindible que lo que supones definido pueda expresarse como una función \( f|_k \) (en particular un conjunto, porque toda función cuyo dominio es un número natural es un conjunto) y lo que defines tiene que ser un conjunto \( x=f(k) \) (porque el par \( (k,x) \) tiene que pertenecer a la función \( f \) que estás definiendo).

La razón por la que no encuentras ningún error en tu planteamiento es porque no lo hay. El problema surge si revisas la demostración del teorema que justifica la existencia y unicidad de las funciones definidas por recurrencia. Si lo haces verás que es imprescindible que sean realmente funciones, es decir, conjuntos (o clases, si quieres) que asignen a cada número natural \( k \) un cierto conjunto \( f(k) \) (y aquí sí que no vale que \( f(k) \) no sea un conjunto).

Es frecuente encontrar demostraciones donde se habla de construcciones por recurrencia sobre \( k \) en términos similares a los que tú planteas, pero son correctos (son formalizables en ZFC) porque se pueden reducir al esquema abstracto de definir \( f(k) = G(f|_k) \), de acuerdo con el teorema de recursión. Pero el caso que tú propones no puede reducirse a este esquema porque tanto lo que quieres definir en el paso k como lo que supones definido son clases propias, luego no pueden expresarse como \( f(k) \) y \( f|_k \), respectivamente, que necesariamente son conjuntos.

Añado:

Y una cosa que me ha llamado la atención: cuando interpretamos una fórmula en un modelo, tenemos un 1 o un 0; un verdadero o un falso (o ninguna de las dos cosas). En cambio, cuando interpretamos una fórmula del modo natural, mediante la idea de la cual la fórmula se abstrajo originalmente, lo que tenemos es un objeto con significado, una afirmación, que luego podrá ser verdadera o falsa.

Sí. Pero también puedes pensar que una fórmula \( \alpha \) no es más que una cosa, una sucesión de números naturales, y que \( M\Vdash\alpha[v] \) es una fórmula "de verdad", a la que puedes identificar con "el significado" de \( \alpha \), que luego podrá ser verdadero o falso.