Autor Tema: Chebyschev

0 Usuarios y 1 Visitante están viendo este tema.

22 Abril, 2017, 12:35 am
Respuesta #40

Quema

  • $$\Large \color{#5b61b3}\pi\,\pi\,\pi\,\pi\,\pi$$
  • Mensajes: 1,975
  • País: uy
  • Karma: +0/-0
  • Sexo: Masculino
Hola

En el caso de la cota que es óptima, no se exigió el conocimiento de la varianza. Yo comparé numéricamente las cotas

\( \dfrac{\sigma^2_X}{(\mu_X+\mu_Y)^2+\sigma^2_X} \)

con

\( \dfrac{\sigma^2_X+\sigma^2_Y}{(\mu_X+\mu_Y)^2+\sigma^2_X+\sigma^2_Y} \)

tirando algunos datos y la primera me da, al menos para los valores que puse, siempre menor que la otra, respetando la condición de la media y agregando el conocimiento de la varianza. No veo entonces cómo se puede mejorar aún más la cota óptima con la información adicional de la varianza de \( Y \), salvo que esto demuestre que la segunda cota no es óptima.

Saludos

22 Abril, 2017, 01:04 am
Respuesta #41

Luis Fuentes

  • el_manco
  • Administrador
  • Mensajes: 56,049
  • País: es
  • Karma: +0/-0
Hola

Hola

En el caso de la cota que es óptima, no se exigió el conocimiento de la varianza. Yo comparé numéricamente las cotas

\( \dfrac{\sigma^2_X}{(\mu_X+\mu_Y)^2+\sigma^2_X} \)

con

\( \dfrac{\sigma^2_X+\sigma^2_Y}{(\mu_X+\mu_Y)^2+\sigma^2_X+\sigma^2_Y} \)

tirando algunos datos y la primera me da, al menos para los valores que puse, siempre menor que la otra, respetando la condición de la media y agregando el conocimiento de la varianza. No veo entonces cómo se puede mejorar aún más la cota óptima con la información adicional de la varianza de \( Y \), salvo que esto demuestre que la segunda cota no es óptima.

Las cotas pueden escribirse respectivamente como:

\( \dfrac{\sigma^2_X}{(\mu_X+\mu_Y)^2+\sigma^2_X}=\dfrac{1}{\dfrac{(\mu_x+\mu_y)^2}{\sigma^2_X}+1} \)

y


\( \dfrac{\sigma^2_X+\sigma^2_Y}{(\mu_X+\mu_Y)^2+\sigma^2_X+\sigma^2_Y}=\dfrac{1}{\dfrac{(\mu_x+\mu_y)^2}{\sigma^2_X+\sigma^2_Y}+1} \)

Dado que la función \( f(x)=\dfrac{1}{x^2+1} \) es decreciente para \( x>0 \) efectivamente la primera cota siempre es más pequeña que la segunda.

Pero tienes que tener en cuenta una cosa, en la primera usamos un dato adicional, el soporte de \( Y \) y no es válida para cualquier soporte; sólo cuando cumple la cota indicada. En ese caso lo que digo es que si además de conocer ese dato sobre el soporte, conociésemos la varianza de \( Y \) previsiblemente podría mejorarse. Eso no contradice la comparación con las cotas que indicas, porque como te digo la segunda no usa el supuesto del soporte.

Por otra parte tampoco nos sirve para asegurar 100% que la segunda cota no es óptima; pudiera existir una distribución \( Y \) con el soporte fuera del que exigimos para la primera cota, que alcanzase el valor de la segunda cota.

Saludos.

22 Abril, 2017, 01:17 am
Respuesta #42

Quema

  • $$\Large \color{#5b61b3}\pi\,\pi\,\pi\,\pi\,\pi$$
  • Mensajes: 1,975
  • País: uy
  • Karma: +0/-0
  • Sexo: Masculino
Hola

Estoy viendo que la cota que llegamos sabiendo la media de \( Y \) en si no ayuda mucho, pues es igual a la cota de mi primer mensaje tomando \( Y=\mu_Y \).

Saludos

22 Abril, 2017, 08:54 am
Respuesta #43

Luis Fuentes

  • el_manco
  • Administrador
  • Mensajes: 56,049
  • País: es
  • Karma: +0/-0
Hola

Estoy viendo que la cota que llegamos sabiendo la media de \( Y \) en si no ayuda mucho, pues es igual a la cota de mi primer mensaje tomando \( Y=\mu_Y \).

No sé muy bien que quieres decir con que "no ayuda mucho". Fíjate que de hecho la cota general para dos variables \( X,Y \) (frente una variable \( X \) y una constante \( Y=a \)) TIENE que ser igual... o peor. Me explico:

La cota de tu primer mensaje es la cota de Cantelli que sabemos que es óptima; es un caso particular de cota conocidas varianza y media de \( X \) y media de \( Y \), cuando la variable \( Y \) es constante igual a esa media.

Pero no es obvio ni trivial que esa misma cota siga funcionando cuando \( Y \) no es constante igual a su media; de hecho nosotros solo hemos probado que sigue funcionando cuando el soporte de \( Y \) está acotado de la forma indicada. En general, sin esa restricción del soporte, quizá esa cota no funcione.

Saludos.

22 Abril, 2017, 10:19 am
Respuesta #44

Luis Fuentes

  • el_manco
  • Administrador
  • Mensajes: 56,049
  • País: es
  • Karma: +0/-0
Hola

 Usando las técnicas del artículo de Scarf he hallado otra cota para el caso en el que tenemos datos sobre el soporte de \( Y \) (soporte acotado) pero usando también su varianza. No es óptima.

 Esencialmente la idea es acotar superiormente \( g(y)=\dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+y)^2} \) por una parábola \( h(y)=1-a(\mu_x+y)^2 \).

 Llego a lo siguiente (convendría revisarlo):

 Si \( X \) es una variable aleatoria de media \( \mu_X \) y varianza \( \sigma_X^2 \), e \( Y \) es una variable aleatoria independiente de \( X \) con media \( \mu_Y \), varianza \( \sigma_X^2 \) y soporte en \( [-\mu_X,-\mu_X+b] \) y \( \color{red}\cancel{b^2+\sigma_X^2\geq 1}\color{black} \), entonces:

\( \bf{\color{green}P(X+Y\leq 0)\leq 1-\dfrac{\sigma_Y^2+(\mu_X+\mu_Y)^2}{\sigma_X^2+b^2}\color{black}} \) (COTA 3)  (válida si \( sop(Y)\subset [-\mu_X,-\mu_X+b] \) y \( \color{red}\cancel{b^2+\sigma_X^2\geq 1}\color{black} \))

 Nótese que para que sea compatible con el soporte, la varianza de \( Y \) como máximo vale \( b^2/4 \).

 Las otras cotas que tenemos son:

\( \bf{P(X+Y\leq 0)\leq \dfrac{\sigma_X^2+\sigma_Y^2}{\sigma_X^2+\sigma_Y^2+(\mu_X+\mu_Y)^2}} \) (COTA 1) (válida si \( \mu_X+\mu_Y\geq 0 \))

\( \bf{\color{blue}P(X+Y\leq 0)\leq \dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+\mu_Y)^2}\color{black}} \) (COTA 2) (válida si \( sop(Y)\subset [-\mu_X,-\mu_X+\sqrt{\sigma_X^2/3}] \)

 Puede verse la comparación entre ellas en este gráfico, donde el eje de las \( X \) corresponde al valor de la media de \( Y \). En rojo está dibujado también el valor de la COTA 3-COTA 2, para que se vea mejor cual es más pequeña.


Saludos.

P.D. En cuanto a la posiblidad de encontrar cotas óptimas conocida la varianza de \( Y \), habría que cambiar de estrategia. En todo lo que hemos hecho usamos de manera indpendiente la desigualdad de Cantelli para la variable \( X \). Está desigualdad es óptima pero la dsitribuciónd e \( X \) que alcanza el óptimo para \( P(X+a\leq 0) \) depende de \( a \). Si la usamos para \( P(X+Y\leq 0) \) solo podemos aspirar a cota óptima cuando \( Y \) puede tomar un sólo valor; si exigimos varianza de \( Y \) no nula esto ya no se da.

CORREGIDO

22 Abril, 2017, 02:26 pm
Respuesta #45

Quema

  • $$\Large \color{#5b61b3}\pi\,\pi\,\pi\,\pi\,\pi$$
  • Mensajes: 1,975
  • País: uy
  • Karma: +0/-0
  • Sexo: Masculino
Hola

Lo revisaré todo. La condición \( V(Y)\leq{}b^2/4 \) se cumple por la desigualdad de Gruss de covarianzas. En resumen, tendríamos tres cotas. En la segunda cota, también se cumple \( \mu_X+\mu_Y>0 \), pues la media de \( Y \) necesariamente es un valor de su soporte. La cota 3 es muy parecida a la cota 2, pero se le agrega una nueva restricción. Hay algo raro en el gráfico, si se mueve \( b \) la varianza de \( Y \) debería incrementarse y de hecho baja.

En muchas de las desigualdades existentes (ver archivos adjuntos de otros mensajes Bennett.pdf y Bounds.pdf) se llegan a cotas del estilo

\( P(X+Y>t\sigma_{X+Y})<e^{f(t)} \) con \( f(0)=0. \) aunque el signo dentro de la probabilidad es distinto al nuestro.

Saludos



22 Abril, 2017, 06:23 pm
Respuesta #46

Luis Fuentes

  • el_manco
  • Administrador
  • Mensajes: 56,049
  • País: es
  • Karma: +0/-0
Hola

Lo revisaré todo. La condición \( V(Y)\leq{}b^2/4 \) se cumple por la desigualdad de Gruss de covarianzas.

Si, eso es lo que quise decir. Lo puntualizaba no como condición a exigir en el teorema, sino simplemente para tener cuidado a la hora de tomar ejemplos; no tiene sentido tomar uno donde no se cumpla esa cota porque no existirían distribuciones en esas condiciones. Eso lo he tenido en cuenta en el gráfico y el propio Geogebra controla que no se supere esa cota. Por esto en algún caso al modificar el valor de \( b \) o el de la varianza se ve a su vez cambiado el otro, para respetar la condición.

De hecho olvidé que debido a que también es un dato la media de \( Y \), la condición es todavía más restrictiva (y  por eso para ciertos ejemplos me salía una cota 3 negativa, lo cuál no es posible). Se tiene que cumplir que:

\( \sigma_2^Y\leq (-\mu_X+b-\mu_Y)(\mu_Y+\mu_X) \)

Eso no lo tiene en cuenta el gráfico, y por eso pudiera haber algún resultado extraño. Una vez más esa condición no es que sea un hipótesis de la cota, sino que no existen distribuciones \( Y \) que NO la cumplan.

Citar
En resumen, tendríamos tres cotas. En la segunda cota, también se cumple \( \mu_X+\mu_Y>0 \), pues la media de \( Y \) necesariamente es un valor de su soporte.


Si, por supuesto. En las tres cotas se cumple eso.

Citar
La cota 3 es muy parecida a la cota 2, pero se le agrega una nueva restricción. Hay algo raro en el gráfico, si se mueve \( b \) la varianza de \( Y \) debería incrementarse y de hecho baja.

Las posibles interacciones entre \( b \) y la varianza son debidas al "esfuerzo" de geogebra por respetar la desigualdad de Gruss. Sea como sea , fuera del control cota, en realidad son dos parámetros independientes que podemos elegir al gusto; no hay ningún motivo para que uno baje o suba al subir o bajar el otro.

Citar
La cota 3 es muy parecida a la cota 2, pero se le agrega una nueva restricción

OJO. La cota 3 es más rica que la cota 2; vale para cualquier soporte finito de \( Y \) a la derecha de \( -\mu_X \) y en ella interviene la varianza de \( Y \). Es significativamente mejor que la 2, cuando la varianza de \( Y \) es alta.

Saludos.

22 Abril, 2017, 11:21 pm
Respuesta #47

Quema

  • $$\Large \color{#5b61b3}\pi\,\pi\,\pi\,\pi\,\pi$$
  • Mensajes: 1,975
  • País: uy
  • Karma: +0/-0
  • Sexo: Masculino
Hola

No me queda muy claro las pruebas de las cotas. La desigualdad de Cantelli dice que \( P(X-\mu\geq{}\lambda)\leq{\displaystyle\frac{\sigma^2}{\sigma^2+\lambda^2}} \). Decimos que \( \bf{P(X+Y\leq 0)\leq \dfrac{\sigma_X^2+\sigma_Y^2}{\sigma_X^2+\sigma_Y^2+(\mu_X+\mu_Y)^2}} \), no veo muy claro que es \( \lambda \).

Ahora en la segunda cota creo

\( \bf{\color{blue}P(X+Y\leq 0)\leq \dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+\mu_Y)^2}\color{black}} \) utilizamos
\(
\displaystyle\mathbb{P}[X+Y<0]\leq\mathbb{P}[X+Y{\bf 1}_{\{Y\geq m\}}<0]\leq\sigma^{2}_{X}\mathbb{E}\Big[\frac{1}{\sigma^{2}_{X}+(Y{\bf1}_{\{Y>m\}}+\mu_{X})^{2}}\Big] \) y la desigualdad de Jensen? Primero como \( \mu_X>0 \) el \( m=0 \), pero como definimos el soporte entonces \( Y\left\{{1Y>0}\right\} \) es cero, salvo que \( -mu_X+\sqrt{\sigma_X^2/3}>0 \), pero en principio no tiene por qué cumplirse. Y no entiendo cómo se llega a la media de \( Y \) en el denominador.

Saludos

23 Abril, 2017, 01:14 pm
Respuesta #48

Luis Fuentes

  • el_manco
  • Administrador
  • Mensajes: 56,049
  • País: es
  • Karma: +0/-0
Hola

No me queda muy claro las pruebas de las cotas. La desigualdad de Cantelli dice que \( P(X-\mu\geq{}\lambda)\leq{\displaystyle\frac{\sigma^2}{\sigma^2+\lambda^2}} \).

Si, dice eso para \( \lambda>0 \). Podemos usar esa desigualdad para probar que:

 \( P(Z+a\leq 0)\leq{\displaystyle\frac{\sigma^2}{\sigma^2+(\mu_Z+a)^2}} \).

si \( \mu_Z+a\geq 0 \).

 Para ello basta considerar la variable aleatoria \( X=-Z \) y \( \lambda=\mu_Z+a=a-\mu_X \). Entonces:

\( P(Z+a\leq 0)=P(-X+a\leq 0)=P(X-a\geq 0)=P(X-\mu_X\geq a-\mu_X)=P(X-\mu_X\geq \mu_Z+a) \)

y usar que \( \sigma_X^2=\sigma_Z^2 \).

Citar
Decimos que \( \bf{P(X+Y\leq 0)\leq \dfrac{\sigma_X^2+\sigma_Y^2}{\sigma_X^2+\sigma_Y^2+(\mu_X+\mu_Y)^2}} \), no veo muy claro que es \( \lambda \).

Ahora basta usar la desigualdad que indiqué antes para \( Z=X+Y \) y \( a=0 \). Para aplicarla necesitamos que \( \mu_X+\mu_y>0 \).

Citar
Ahora en la segunda cota creo

\( \bf{\color{blue}P(X+Y\leq 0)\leq \dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+\mu_Y)^2}\color{black}} \) utilizamos
\(
\displaystyle\mathbb{P}[X+Y<0]\leq\mathbb{P}[X+Y{\bf 1}_{\{Y\geq m\}}<0]\leq\sigma^{2}_{X}\mathbb{E}\Big[\frac{1}{\sigma^{2}_{X}+(Y{\bf1}_{\{Y>m\}}+\mu_{X})^{2}}\Big] \) y la desigualdad de Jensen? Primero como \( \mu_X>0 \) el \( m=0 \), pero como definimos el soporte entonces \( Y\left\{{1Y>0}\right\} \) es cero, salvo que \( -mu_X+\sqrt{\sigma_X^2/3}>0 \), pero en principio no tiene por qué cumplirse. Y no entiendo cómo se llega a la media de \( Y \) en el denominador.

No. Usamos lo siguiente:

\( P(X+Y<0)=E[1_{X+Y<0}]=E[E[1_{X+y<0}|Y=y]] \)

Bajo el supueso de que \( sop(Y)\subset [-\mu_X,+\infty) \) se tiene que \( \mu_X+y>0 \) y podemos aplicar la desigualdad de Cantelli (en la versión que demostré arriba). Además por la independencia de \( X \) e \( Y \) el condicionamiento de \( X \) a \( Y=y \) no varía su media y varianza. Por tanto:

\( P(X+Y<0)=E[1_{X+Y<0}]=E[E[1_{X+y<0}|Y=y]]\leq E\left[\dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+Y)^2}\right] \)

Tengo que irme ahora.. lo último es aplicar Jensen para la función cóncava:

\( g(y)=\dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+y)^2} \)

Saludos.

23 Abril, 2017, 03:34 pm
Respuesta #49

Quema

  • $$\Large \color{#5b61b3}\pi\,\pi\,\pi\,\pi\,\pi$$
  • Mensajes: 1,975
  • País: uy
  • Karma: +0/-0
  • Sexo: Masculino
Hola
La primera cota cómo es este paso

\( E[E[1_{X+y<0}|Y=y]]\leq E\left[\dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+Y)^2}\right] \). Puede ser

\( P(X+y<0|Y=y)\leq{}\dfrac{\sigma_X^2}{\sigma_X^2+(\mu_X+y)^2} \)?

Pero no tiene que ir dividido por la \( P(Y=y) \)?

En la prueba de la segunda, no es que el soporte de \( Y \) estaba acotado superiormente, de forma que \( g(y) \) fuera cóncava, debe haber una errata ahí. Y si puedes ser un poco más específico en la prueba de la cota 3.

Saludos