jueves, 26 de agosto de 2010

DISTRIBUCIÓN T-STUDENT

/meta>
En probabilidad y estadística, la distribución t-Student es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Se utiliza entonces para hacer inferencia con respecto a una o dos medias poblacionales.

La distribución t-Student se construye como un cociente entre una normal y la raíz de una $\chi ^2$ independientes. De modo preciso, llamamos distribución t-Student con n grados de libertad, ${ {{\bf t} } }_{n}$ a la de una v.a. T,
 \begin{displaymath}{
\mbox{\fbox{$\displaystyle
T=\frac{Z}{\sqrt{ \frac{1}{n}\chi_n^2}} {\leadsto}{ {{\bf t} } }_n
$ } }
}
\end{displaymath}

donde $Z{\leadsto}{ {{\bf N} \left( 0,1 \right)} }$, $\chi_n^2{\leadsto}{ \mbox{\boldmath$\chi$ } }_n^2$. Este tipo de distribuciones aparece cuando tenemos n+1 v.a. independientes

\begin{displaymath}X{\leadsto}{ {{\bf N} \left( \mu,\sigma^2 \right)} }
\end{displaymath}


\begin{displaymath}X_i{\leadsto}{ {{\bf N} \left( \mu_i,\sigma_i^2 \right)} }\qquad i=1,\dots,n
\end{displaymath}

y nos interesa la distribución de

\begin{displaymath}T=\frac{ \displaystyle \frac{X-\mu}{\sigma}}{
\sqrt{\displays...
...c{X_i-\mu_i}{\sigma_i}
\right)^2
}}
{\leadsto}{ {{\bf t} } }_n
\end{displaymath}

Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad, donde n es un entero positivo, si su función de densidad es la siguiente: $t_n{\leadsto}{ {{\bf t} } }_n$ es

\begin{displaymath}f_T(x)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\Gamma\left(
\...
...ac{x^2}{n}\right)^{-\frac{n+1}{2}}
\qquad \forall\,t\in I\!\!R
\end{displaymath}



  
Figura: Función de densidad de una t de Student
\includegraphics[angle=-90, width=0.8\textwidth]{fig06-16.epsi}

La distribución ${ {{\bf t} } }$ de Student tiene propiedades parecidas a ${ {{\bf N} \left ( 0,1 \right )} }$:

  • Es de media cero, y simétrica con respecto a la misma;
  • Es algo más dispersa que la normal, pero la varianza decrece hasta 1 cuando el número de grados de libertad aumenta;








      
    Figura: Comparación entre las funciones de densidad de ${ {{\bf t} } }_1$ y ${ {{\bf N} \left ( 0,1 \right )} }$.
    \includegraphics[angle=-90, width=0.8\textwidth]{fig06-17.epsi}

  • Para un número alto de grados de libertad se puede aproximar la distribución de Student por la normal, es decir,







    \begin{displaymath}{ {{\bf t} } }_n \stackrel{n\rightarrow \infty}{\longrightarrow} { {{\bf N} \left( 0,1 \right)} }
\end{displaymath}










      
    Figura: Cuando aumentan los grados de libertad, la distribución de Student se aproxima a la distribución normal tipificada.
    \includegraphics[angle=-90, width=0.8\textwidth]{fig06-18.epsi}

  • Para calcular







    \begin{displaymath}{{\cal P}}[T\leq t] = F_T(t) = \int_{-\infty}^t f_T(x)\,dx
= ...
...qrt{n\pi}}
\left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}\, dx}
\end{displaymath}

    en lugar de considerar una primitiva de esa función y determinar la integral definida, buscaremos el resultado aproximado en una tabla de la distribución ${ {{\bf t} } }_{n}$. Véase la tabla 4, al final del libro.
Referencia: www.bioestadistica.uma.es/libro/node81.htm

MODELOS DE PROBABILIDAD CONTINUOS: NORMAL Y T-STUDENT

En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, incluso si la distribución de la población de la cual se extrae la muestra no es normal.[1] Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad".
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas.
Las características que descacan a este distribución son: que el dominio de la variable va desde -oo hasta +oo; su curva es simétrica respecto de la media; la distribución es Unimodal por lo que la media, mediana y moda son iguales; por cada cambio en la media la curva se desplaza hacia la derecha o izquierda; y por cambios en la varianza y/o desviación estándar la curva cambia de forma, es decir se puede achatar si la varianza es grande y ser mas puntiaguda si la varianza es pequeña (ver gráfico siguiente).
REFERENCIA: http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal.

MODELOS DE PROBABILIDAD NORMAL

http://upload.wikimedia.org/wikipedia/commons/1/1b/Normal_distribution_pdf.png

MODELOS DE PROBABILIDAD DISCRETOS

Los modelos o distribuciones de probabilidad más usados o más conocidos son:
- Uniforme
- Binomial
- Hipergeométrico
- Poisson
El modelo Binomial: se utiliza en experimentos aleatoros donde la variable en estudio es discreta, existen sólo dos posibles resultados: Éxito y Fracaso. La probabilidad de éxito se conoce como p y la probabilidad de fracaso como (1-p). Cuando se realiza el experimento y el muestreo es Con Reposición se puede aplicar este modelo binomial por lo que los eventos que se generan son independientes. La calificación de éxito o frecaso a un determinado hecho depende del interés del investigador. La curva de la distribución es Asimétrica positiva. Ejemplos de experimentos binomiales:
* Presentar un examen (éxito=aprobar, fracaso =reprobar)
* Conseguir empleo
* Viajar al exterior
* Conseguir la información que se busca

El modelo Hipergeométrico: cuando el muestreo se realiza Sin Reposición se puede aplicar este modelo por lo que los puntos muestrales que se originan y que forman los eventos son dependientes, la variable en estudio es discreta, se caracteriza principalmente porque existen un número determinado de elementos que presentan cierta característica.

El modelo de Poisson: se usa para análisis de variables aleatorias discretas medidas en el tiempo o en el espacio (tiempo: días, horas, minutos, segunddos, semanas, meses; espacio: km. cm. cc. mts..); los puntos muestrales o eventos que se generan en una unidad de tiempo o espacio son independientes de los que ocurren en otra unidad de tiempo o espacio; el promedio o tasa de eventos que ocurren en una unidad de tiempo o espacio es proporcional al cambio de la unidad de tiempo o espacio. cuando el tamaño de la muestra es grande (n>30) y la probabilidad de éxito es muy pequeña, se puede usar el modelo de Piosson en lugar del Modelo Binomial usando el promedio del modelo binomila como parámetro de Poisson. para mayor información visitar: http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Poisson

Análisis de Regresión simple y múltiple con fórmulas

I. Introducción al análisis de regresión El análisis de regresión es una técnica estadística fundamental en la ciencia de datos y la investi...