Hola
Sigo sin entender como ha hecho la demostración el compañero, ya que en la proposición 2, se pide probar que
\[ A \not \perp Y \ \Longrightarrow \ A \perp C \ o \ A \perp Y \mid C \]
Según lo que tú has dicho eso equivaldría a probar que:
\[ A \not \perp Y \ y \ A \not \perp Y \mid C \ \Longrightarrow \ \ A \perp C \]
cosa que no veo que haya probado el compañero en el comentario anterior (o al menos no lo entiendo).
Está mezclando las cosas o no nos estamos entendiendo. Por "el compañero" supongo que te refieres a
geométracat. Lo que él prueba no es lo que dices ahí arriba sino:
\( A \not\perp Y \) y \( A \perp Y \mid C \) \( \Longrightarrow{} \) \( A \not \perp C \)
Lo prueba suponiendo que es falsa la conclusión \( A \not \perp C \), es decir, suponiendo que \( A \perp C \) y llegando a una contradicción con las hipótesis, ya que si supone además que \( A \perp Y \mid C \) deduce que \( A\perp Y \), lo cuál contradice la hipótesis \( A \not\perp Y \).
Eso es lo que hace aquí:
Te ayudo con el primero. Tienes que ver que si \[ A \not\perp Y \] y \[ A \perp Y \mid C \], entonces \[ A \not \perp C \]. Por reducción al absurdo, supón que tuvieras \[ A \perp C \], y vamos a llegar a una contradicción, concretamente a que \[ A \perp Y \].
En efecto:
\[
\begin{align*}
P(A=a, Y=y) &= \sum_{c \in C} P(C=c)P(A=a,Y=y \mid C=c) = \sum_{c\in C} P(C=c) P(A=a \mid C=c) P(Y=y \mid C=c) = \\
&= \sum_{c \in C} P(C=c)P(A=a)P(Y=y) = P(A=a) \sum_{c \in C} P(C=c)P(Y=y) = P(A=a)P(Y=y)
\end{align*}
\]
donde la primera igualdad es el teorema de la probabilidad total, la segunda viene de la hipótesis \[ A\perp Y \mid C \], la tercera de \[ A \perp C \] y la última de nuevo es el teorema de la probabilidad total.
Si sigues sin entender esa prueba detalla tu duda de la manera más precisa posible; pero cuidado con no confundir esa propiedad con otras de las que quieres probar.
Ahora en la proposición 2 de este enlace:
https://fairmlbook.org/classification.html lo que se pide probar es que si \( A\not\perp Y \) entonces no puede ser que al mismo tiempo se de \( A\perp C \) y \( A\perp Y|C \). Eso equivale a probar que si se da al mismo tiempo \( A\perp C \) y \( A\perp Y|C \) entonces no puede darse \( A\not\perp Y \). Es decir lo que tienes que probar es que:
\( A\perp C \) y \( A\perp Y|C \) \( \Longrightarrow{} \) \( A\perp Y \)
Pero \( A\perp Y|C \) significa que:
\( \dfrac{P(A\cap Y\cap C=c)}{P(C=c)}=P(A\cap Y|C=c)=P(A|C=c)P(Y|C=c)=\dfrac{P(A\cap C=c)}{P(C=c)}\dfrac{P(Y\cap C=c)}{P(C=c)} \) (*)
Si además \( A\perp C \) entonces \( P(A\cap C=c)=P(A)P(C=c) \). Sustiyuendo en (*)
\( \dfrac{P(A\cap Y\cap C=c)}{P(C=c)}=\dfrac{P(A)P(C=c)}{P(C=c)}\dfrac{P(Y\cap C=c)}{P(C=c)} \)
Simplifcando:
\( P(A\cap Y\cap C=c)=P(A)P(Y\cap C=c) \)
Ahora:
\( P(A\cap Y)=\displaystyle\sum_{c\in C}P(A\cap Y\cap C=c)=\displaystyle\sum_{c\in C}P(A)P(Y\cap C=c)=P(A)\displaystyle\sum_{c\in C}P(Y\cap C=c)=P(A)P(Y) \)
y por tanto \( A\perp Y \).
Saludos.