jueves, 26 de agosto de 2010

DISTRIBUCIÓN T-STUDENT

/meta>
En probabilidad y estadística, la distribución t-Student es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Se utiliza entonces para hacer inferencia con respecto a una o dos medias poblacionales.

La distribución t-Student se construye como un cociente entre una normal y la raíz de una $\chi ^2$ independientes. De modo preciso, llamamos distribución t-Student con n grados de libertad, ${ {{\bf t} } }_{n}$ a la de una v.a. T,
 \begin{displaymath}{
\mbox{\fbox{$\displaystyle
T=\frac{Z}{\sqrt{ \frac{1}{n}\chi_n^2}} {\leadsto}{ {{\bf t} } }_n
$ } }
}
\end{displaymath}

donde $Z{\leadsto}{ {{\bf N} \left( 0,1 \right)} }$, $\chi_n^2{\leadsto}{ \mbox{\boldmath$\chi$ } }_n^2$. Este tipo de distribuciones aparece cuando tenemos n+1 v.a. independientes

\begin{displaymath}X{\leadsto}{ {{\bf N} \left( \mu,\sigma^2 \right)} }
\end{displaymath}


\begin{displaymath}X_i{\leadsto}{ {{\bf N} \left( \mu_i,\sigma_i^2 \right)} }\qquad i=1,\dots,n
\end{displaymath}

y nos interesa la distribución de

\begin{displaymath}T=\frac{ \displaystyle \frac{X-\mu}{\sigma}}{
\sqrt{\displays...
...c{X_i-\mu_i}{\sigma_i}
\right)^2
}}
{\leadsto}{ {{\bf t} } }_n
\end{displaymath}

Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad, donde n es un entero positivo, si su función de densidad es la siguiente: $t_n{\leadsto}{ {{\bf t} } }_n$ es

\begin{displaymath}f_T(x)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\Gamma\left(
\...
...ac{x^2}{n}\right)^{-\frac{n+1}{2}}
\qquad \forall\,t\in I\!\!R
\end{displaymath}



  
Figura: Función de densidad de una t de Student
\includegraphics[angle=-90, width=0.8\textwidth]{fig06-16.epsi}

La distribución ${ {{\bf t} } }$ de Student tiene propiedades parecidas a ${ {{\bf N} \left ( 0,1 \right )} }$:

  • Es de media cero, y simétrica con respecto a la misma;
  • Es algo más dispersa que la normal, pero la varianza decrece hasta 1 cuando el número de grados de libertad aumenta;








      
    Figura: Comparación entre las funciones de densidad de ${ {{\bf t} } }_1$ y ${ {{\bf N} \left ( 0,1 \right )} }$.
    \includegraphics[angle=-90, width=0.8\textwidth]{fig06-17.epsi}

  • Para un número alto de grados de libertad se puede aproximar la distribución de Student por la normal, es decir,







    \begin{displaymath}{ {{\bf t} } }_n \stackrel{n\rightarrow \infty}{\longrightarrow} { {{\bf N} \left( 0,1 \right)} }
\end{displaymath}










      
    Figura: Cuando aumentan los grados de libertad, la distribución de Student se aproxima a la distribución normal tipificada.
    \includegraphics[angle=-90, width=0.8\textwidth]{fig06-18.epsi}

  • Para calcular







    \begin{displaymath}{{\cal P}}[T\leq t] = F_T(t) = \int_{-\infty}^t f_T(x)\,dx
= ...
...qrt{n\pi}}
\left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}\, dx}
\end{displaymath}

    en lugar de considerar una primitiva de esa función y determinar la integral definida, buscaremos el resultado aproximado en una tabla de la distribución ${ {{\bf t} } }_{n}$. Véase la tabla 4, al final del libro.
Referencia: www.bioestadistica.uma.es/libro/node81.htm

No hay comentarios:

Análisis de Regresión simple y múltiple con fórmulas

I. Introducción al análisis de regresión El análisis de regresión es una técnica estadística fundamental en la ciencia de datos y la investi...