1
Estadística / Intervalo de confianza para diferencia de medias
« en: 09 Abril, 2024, 05:14 am »
Estimados foristas acá, con un problema, para ver si es correcta la solución. Lo enuncio :
\( X_1,X_2,...,X_{n_1} \) es una muestra aleatoria de una variable normal X, con media \( \mu_X \) y varianza \( \sigma^2 \), \( Y_1,Y_2,...,Y_{n_2} \) es una muestra aleatoria independiente de una variable normal Y, con media \( \mu_Y \) y varianza \( \sigma^2 \). Las varianzas son iguales Obtener un intervalo de confianza de \( 100(1-\beta) \ \ \% \) para la diferencia \( \mu_X-\mu_Y \)
SOLUCION
Considero un teorema que dice que \( \displaystyle\frac{\bar{X}-\mu_X}{S_X/\sqrt[ ]{n_1}} \) es una variable aleatoria que tiene una distribución t de student con \( n_1-1 \) grados de libertad, donde \( S_X \) es la desviación stándar muestral.
De la misma manera \( \displaystyle\frac{\bar{Y}-\mu_Y}{S_Y/\sqrt[ ]{n_2}} \) es una variable aleatoria que tiene una distribución t de student con \( n_2-1 \) grados de libertad, donde \( S_Y \) es la desviación stándar muestral.
Esto lleva a considerar los siguientes intervalos de confianza con una probabilidad \( (1-\alpha)100 \% \) para cada una de las medias respectivamente :
\( P(-t_{1-\alpha/2}\leq{\displaystyle\frac{\bar{X}-\mu_X}{S_X/\sqrt[ ]{n_1}}}\leq{t_{1-\alpha/2}})=1-\alpha\Rightarrow{P(-t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}\leq{\bar{X}-\mu_X}\leq{t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}})=1-\alpha} \)
\( P(-t'_{1-\alpha/2}\leq{\displaystyle\frac{\bar{Y}-\mu_Y}{S_Y/\sqrt[ ]{n_2}}}\leq{t'_{1-\alpha/2}})=1-\alpha\Rightarrow{P(-t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}\leq{\bar{Y}-\mu_Y}\leq{t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}})=1-\alpha} \)
\( t_{1-\alpha/2} \) se refiere a una distribución T/b] de student de \( n_1-1 \) grados de libertad y \( t'_{1-\alpha/2} \) se refiere a una distribución T de estudente de \( n_2-1 \) grados de libertad.
Finalmente se llega a :
\( P(\bar{X}-t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}\leq{\mu_X}\leq{\bar{X}+t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}})=1-\alpha \)
\( P(\bar{Y}-t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}\leq{\mu_Y}\leq{\bar{Y}+t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}})=1-\alpha \)
En este punto se entiende que la probabilidad, que se den ambas situaciones en forma concreta (para valores observados de las muestras) ha de ser \( (1-\alpha)^2 \) en consecuencia \( (1-\alpha)^2=1-\beta\Rightarrow{\alpha=1-\sqrt[ ]{1-\beta}} \), considerando ese \( \alpha \) se dan las dos inecuaciones y operando se llega a :
\( P(\bar{X}-\bar{Y}-t_{1-\alpha/2}(\displaystyle\frac{S_X}{\sqrt[ ]{n_1}})-t'_{1-\alpha/2}(\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}})\leq{\mu_X-\mu_Y}\leq{\bar{X}-\bar{Y}+t_{1-\alpha/2}(\displaystyle\frac{S_X}{\sqrt[ ]{n_1}})+t'_{1-\alpha/2}(\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}})})=1-\beta \)
Donde \( \alpha=1-\sqrt[ ]{1-\beta} \) y t y t' se refieren a distribuciones T student con \( n_1-1\wedge n_2-1 \) grados de libertad respectivamente.
Y eso es un intervalo, lo que me hizo dudar es, el no uso de la igualdad de las varianzas de X e Y. Luego me hicieron conocer una sugerencia y con esa sugerencia llegan a otro intervalo, a otra respuesta. Entiendo que los intervalos no son únicos, por eso mi interrogante si el proceso es correcto. Esperando sus luces, comentarios y consejos. Gracias de antemano.
Saludos
\( X_1,X_2,...,X_{n_1} \) es una muestra aleatoria de una variable normal X, con media \( \mu_X \) y varianza \( \sigma^2 \), \( Y_1,Y_2,...,Y_{n_2} \) es una muestra aleatoria independiente de una variable normal Y, con media \( \mu_Y \) y varianza \( \sigma^2 \). Las varianzas son iguales Obtener un intervalo de confianza de \( 100(1-\beta) \ \ \% \) para la diferencia \( \mu_X-\mu_Y \)
SOLUCION
Considero un teorema que dice que \( \displaystyle\frac{\bar{X}-\mu_X}{S_X/\sqrt[ ]{n_1}} \) es una variable aleatoria que tiene una distribución t de student con \( n_1-1 \) grados de libertad, donde \( S_X \) es la desviación stándar muestral.
De la misma manera \( \displaystyle\frac{\bar{Y}-\mu_Y}{S_Y/\sqrt[ ]{n_2}} \) es una variable aleatoria que tiene una distribución t de student con \( n_2-1 \) grados de libertad, donde \( S_Y \) es la desviación stándar muestral.
Esto lleva a considerar los siguientes intervalos de confianza con una probabilidad \( (1-\alpha)100 \% \) para cada una de las medias respectivamente :
\( P(-t_{1-\alpha/2}\leq{\displaystyle\frac{\bar{X}-\mu_X}{S_X/\sqrt[ ]{n_1}}}\leq{t_{1-\alpha/2}})=1-\alpha\Rightarrow{P(-t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}\leq{\bar{X}-\mu_X}\leq{t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}})=1-\alpha} \)
\( P(-t'_{1-\alpha/2}\leq{\displaystyle\frac{\bar{Y}-\mu_Y}{S_Y/\sqrt[ ]{n_2}}}\leq{t'_{1-\alpha/2}})=1-\alpha\Rightarrow{P(-t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}\leq{\bar{Y}-\mu_Y}\leq{t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}})=1-\alpha} \)
\( t_{1-\alpha/2} \) se refiere a una distribución T/b] de student de \( n_1-1 \) grados de libertad y \( t'_{1-\alpha/2} \) se refiere a una distribución T de estudente de \( n_2-1 \) grados de libertad.
Finalmente se llega a :
\( P(\bar{X}-t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}\leq{\mu_X}\leq{\bar{X}+t_{1-\alpha/2}\displaystyle\frac{S_X}{\sqrt[ ]{n_1}}})=1-\alpha \)
\( P(\bar{Y}-t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}\leq{\mu_Y}\leq{\bar{Y}+t'_{1-\alpha/2}\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}}})=1-\alpha \)
En este punto se entiende que la probabilidad, que se den ambas situaciones en forma concreta (para valores observados de las muestras) ha de ser \( (1-\alpha)^2 \) en consecuencia \( (1-\alpha)^2=1-\beta\Rightarrow{\alpha=1-\sqrt[ ]{1-\beta}} \), considerando ese \( \alpha \) se dan las dos inecuaciones y operando se llega a :
\( P(\bar{X}-\bar{Y}-t_{1-\alpha/2}(\displaystyle\frac{S_X}{\sqrt[ ]{n_1}})-t'_{1-\alpha/2}(\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}})\leq{\mu_X-\mu_Y}\leq{\bar{X}-\bar{Y}+t_{1-\alpha/2}(\displaystyle\frac{S_X}{\sqrt[ ]{n_1}})+t'_{1-\alpha/2}(\displaystyle\frac{S_Y}{\sqrt[ ]{n_2}})})=1-\beta \)
Donde \( \alpha=1-\sqrt[ ]{1-\beta} \) y t y t' se refieren a distribuciones T student con \( n_1-1\wedge n_2-1 \) grados de libertad respectivamente.
Y eso es un intervalo, lo que me hizo dudar es, el no uso de la igualdad de las varianzas de X e Y. Luego me hicieron conocer una sugerencia y con esa sugerencia llegan a otro intervalo, a otra respuesta. Entiendo que los intervalos no son únicos, por eso mi interrogante si el proceso es correcto. Esperando sus luces, comentarios y consejos. Gracias de antemano.
Saludos