Download III.3. Concepto y tipos de variables aleatorias.
Document related concepts
no text concepts found
Transcript
III.3. Concepto y tipos de variables aleatorias. Variable aleatoria A la función que traduce al resultado de experimento aleatorio en un número se le llama variable aleatoria. Por ejemplo cuando escogemos a una persona al azar en un población y se observa su peso en kg., no podemos saber de antemano el resultado del experimento pero podemos tener una idea sobre la frecuencia con la que los diferentes valores que pueden observarse. Personas de 200 kg. son raras aunque posibles, personas de 65 kg. son frecuentes., es decir nos gustaría saber que valores son más probables. a) Distribuciones discretas de variables b) Distribuciones de variables continuas a. 1 Distribución binomial b. 1 Distribución normal a. 2 Distribución binomial negativa a. 3 Distribución Poisson b. 2 Distribución t de Student b. 3 Distribución F de Fisher b. 4 Distribución ji o chi cuadrado a) Distribuciones de variables discretas a. 1 Distribución binomial En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos independientes con una probabilidad fija p de ocurrencia del éxito entre los ensayos. En un experimento dicotómico sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe: 𝑋~𝐵(𝑛, 𝑝) Distribución Binomial (DISTR.BINOM) Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribución binomial. Utilice DISTR.BINOM en problemas con un número fijo de pruebas o ensayos, cuando los resultados de un ensayo son sólo éxito o fracaso, cuando los ensayos son independientes y cuando la probabilidad de éxito es constante durante todo el experimento. Por ejemplo, DISTR.BINOM puede calcular la probabilidad de que dos de los próximos tres bebés que nazcan sean hombres. Sintaxis DISTR.BINOM (núm_éxito;ensayos;prob_éxito;acumulado) Núm_éxito Ensayos es el número de éxitos en los ensayos. es el número de ensayos independientes. Prob_éxito es la probabilidad de éxito en cada ensayo. Acumulado es un valor lógico que determina la forma de la función. Si el argumento acumulado es VERDADERO, DISTR.BINOM devuelve la función de distribución acumulada, que es la probabilidad de que exista el máximo número de éxitos; si es FALSO, devuelve la función de masa de probabilidad, que es la probabilidad de que un evento se reproduzca un número de veces igual al argumento núm_éxito. Observaciones Los argumentos núm_éxito y ensayos se truncan a enteros. Si el argumento núm_éxito, ensayos o prob_éxito no es numérico, DISTR.BINOM devuelve el valor de error #¡VALOR! Si el argumento núm_éxito < 0 o si núm_éxito > ensayos, DISTR.BINOM devuelve el valor de error #¡NUM! Si el argumento prob_éxito < 0 o si prob_éxito > 1, DISTR.BINOM devuelve el valor de error #¡NUM! A B Datos Descripción 6 Número de éxitos de los ensayos 10 Número de ensayos independientes 0.5 Probabilidad de éxito de cada ensayo Fórmula =DISTR.BINOM (A2;A3;A4;FALSO) Descripción (Resultado) Probabilidad de que exactamente 6 de 10 ensayos tengan éxito (0,205078) a. 2 Distribución de Poisson En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta. Así tiempo fijo si estos eventos ocurren con una frecuencia media conocida y son independientes del tiempo discurrido desde el último evento. Poisson (POISSON) Devuelve la distribución de Poisson. Una de las aplicaciones comunes de la distribución de Poisson es la predicción del número de sucesos en un determinado período de tiempo, como por ejemplo, el número de automóviles que se presenta a una zona de peaje en el intervalo de un minuto. Sintaxis POISSON (x;media;acumulado) X es el número de sucesos. Media es el valor numérico esperado. Acumulado es un valor lógico que determina la forma de la distribución de probabilidad devuelta. Si el argumento acumulado es VERDADERO, POISSON devuelve la probabilidad de Poisson de que un suceso aleatorio ocurra un número de veces comprendido entre 0 y x inclusive; si el argumento acumulado es FALSO, la función devuelve la probabilidad de Poisson de que un suceso ocurra exactamente x veces. Observaciones Si el argumento x no es un entero, se trunca. Si los argumentos x o media no son numéricos, POISSON devuelve el valor de error #¡VALOR! Si x ≤ 0, POISSON devuelve el valor de error #¡NUM! Si media ≤ 0, POISSON devuelve el valor de error #¡NUM! POISSON se calcula como: A B Datos Descripción 2 Número de sucesos 5 Media esperada Fórmula Descripción (Resultado) =POISSON(A2;A3;VERDADERO) Probabilidad de Poisson acumulada con los términos anteriores (0,124652) =POISSON(A2;A3;FALSO) Función de probabilidad de Poisson con los términos anteriores (0,084224) b) Distribuciones de variables continuas b. 1 Distribución Normal En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes. La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos. DISTR.NORM Devuelve la distribución normal para la media y desviación estándar especificadas. Esta función tiene un gran número de aplicaciones en estadística, incluidas las pruebas de hipótesis. Sintaxis DISTR.NORM(x;media;desv_estándar;acum) X es el valor cuya distribución desea obtener. Media es la media aritmética de la distribución. Desv_estándar es la desviación estándar de la distribución. Acum es un valor lógico que determina la forma de la función. Si el argumento acum es VERDADERO, la función DISTR.NORM devuelve la función de distribución acumulada; si es FALSO, devuelve la función de masa de probabilidad. Observaciones Si los argumentos media o desv_estándar no son numéricos, DISTR.NORM devuelve el valor de error #¡VALOR! Si el argumento desv_estándar ≤ 0, la función DISTR.NORM devuelve el valor de error #¡NUM! Si el argumento media = 0, desv_estándar = 1 y acumulado = VERDADERO, la función DISTR.NORM devuelve la distribución normal estándar, DISTR.NORM.ESTAND. La ecuación para la función de densidad normal (acumulado = FALSO) es: Cuando acumulado = VERDADERO, la fórmula es el entero desde el infinito negativo a x de la fórmula dada. A B Datos Descripción 42 Valor cuya distribución desea obtener 40 Media aritmética de la distribución 1,5 Fórmula =DISTR.NORM(A2;A3;A4;VERDADERO) Desviación estándar de la distribución Descripción (Resultado) Función de distribución acumulativa para los términos anteriores (0,908789) Función de masa de probabilidad para los términos anteriores (0,10934005) =DISTR.NORM(A2;A3;A4;FALSO) b. 2 "t" de Student En probabilidad y estadística, la distribución t (de t-Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. PRUEBA.T Devuelve la probabilidad asociada con la prueba t de Student. Utilice PRUEBA.T para determinar la probabilidad de que dos muestras puedan proceder de dos poblaciones subyacentes con igual media. Sintaxis PRUEBA.T (matriz1;matriz2;colas;tipo) Matriz1 es el primer conjunto de datos. Matriz2 es el segundo conjunto de datos. Colas especifica el número de colas de la distribución. Si el argumento colas = 1, PRUEBA.T utiliza la distribución de una cola. Si colas = 2, PRUEBA.T utiliza la distribución de dos colas. Tipo es el tipo de prueba t que se realiza. SI TIPO ES IGUAL A LA PRUEBA SE REALIZA 1 En observaciones por pares 2 En dos muestras con varianzas iguales (homoscedástica) 3 En dos muestras con varianzas diferentes (heteroscedástica) Observaciones Si los argumentos matriz1 y matriz2 contienen un número de puntos de datos diferente y el argumento tipo = 1 (observaciones pareadas), PRUEBA.T devuelve el valor de error #N/A. Los argumentos colas y tipo se truncan a enteros. Si el argumento colas o si el argumento tipo no es numérico, PRUEBA.T devuelve el valor de error #¡VALOR! Si el argumento colas es distinto de 1 ó 2, PRUEBA.T devuelve el valor de error #¡NUM! PRUEBA.T utiliza los datos de matriz1 y matriz2 para calcular una estadística t no negativa. Si colas=1, PRUEBA.T devuelve la probabilidad de un valor más elevado de la estadística t en el supuesto de que matriz1 y matriz2 sean muestras de población con la misma media. El valor devuelto por PRUEBA.T cuando colas=2 es el doble que el que se devuelve cuando colas=1 y corresponde a la probabilidad de un valor absoluto más elevado de la estadística t en el supuesto de "medias de población iguales". A B Datos 1 Datos 2 3 6 4 19 5 3 8 2 9 14 1 4 2 5 4 17 5 1 Fórmula =PRUEBA.T(A2:A10;B2:B10;2;1) Descripción (Resultado) Probabilidad asociada con la prueba t de Student pareada con distribución de dos colas (0,196016) b. 3 "f" de Fisher Usada en teoría de probabilidad y estadística, la distribución F es una distribución de probabilidad continua. También se la conoce como distribución F de Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor. Una variable aleatoria de distribución F se construye como el siguiente cociente: Donde U1 y U2 siguen una distribución chi-cuadrado con d1 y d2 grados de libertad respectivamente, y U1 y U2 son estadísticamente independientes. FISHER(x) Devuelve la transformación Fisher en x. Esta transformación produce una función que se distribuye normalmente en lugar de ser asimétrica. Use esta función para realizar pruebas hipotéticas sobre el coeficiente de correlación. Sintaxis FISHER(x) X es un valor numérico para el cual desea calcular la transformación. Observaciones Si el argumento x no es numérico, FISHER devuelve el valor de error #¡VALOR! Si probabilidad ≤ -1 o si x ≥ 1, FISHER devuelve el valor de error #¡NUM! La ecuación para la transformación de Fisher es: Ejemplo El ejemplo puede resultar más fácil de entender si lo copia en una hoja de cálculo en blanco. A B Fórmula Descripción (Resultado) =FISHER(0,75) Transformación Fisher a 0,75 (0,972955) b. 4 Ji o Chi cuadrada. En estadística, la distribución χ² (de Pearson) es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria: Donde Zi son variables de distribución normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribución se representa habitualmente así: . Es conveniente tener en cuenta que la letra griega χ se transcribe al latín como chi1 y se pronuncia en castellano comoji.2 3 La distribución χ² tiene muchas aplicaciones en inferencia estadística, por ejemplo en la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución χ². DISTR.CHI(x;grados_de_libertad) Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de una sola cola. La distribución χ2 está asociada a una prueba χ2. Utilice la prueba χ2 para comparar los valores observados con los esperados. Por ejemplo, un experimento genético podría estar basado en la hipótesis de que la próxima generación de plantas presentará un conjunto determinado de colores. Al comparar los resultados observados con los resultados esperados, puede decidir si su hipótesis original es válida. Sintaxis DISTR.CHI(x;grados_de_libertad) X es el valor al que desea evaluar la distribución. Grados_de_libertad es el número de grados de libertad. Observaciones Si uno de los argumentos no es numérico, DISTR.CHI devuelve el valor de error #¡VALOR! Si el argumento x es negativo, DISTR.CHI devuelve el valor de error #¡NUM! Si el argumento grados_de_libertad no es un entero, se trunca. Si el argumento grados_de_libertad < 1 o si grados_de_libertad > 10^10, DISTR.CHI devuelve el valor de error #¡NUM! DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una variable aleatoria de χ 2. A Datos 18,307 10 Fórmula =DISTR.CHI(A2;A3) B Descripción Valor al que desea evaluar la distribución Grados de libertad Descripción (Resultado) Probabilidad de una sola cola de una distribución chi cuadrado para los términos anteriores (0,050001) Ejemplo El ejemplo puede resultar más fácil de entender si lo copia en una hoja de cálculo en blanco.