Download III.3. Concepto y tipos de variables aleatorias.

Document related concepts
no text concepts found
Transcript
III.3. Concepto y tipos de variables aleatorias.
 Variable aleatoria
A la función que traduce al resultado de experimento aleatorio en un número se le llama
variable aleatoria.
Por ejemplo cuando escogemos a una persona al azar en un población y se observa su peso
en kg., no podemos saber de antemano el resultado del experimento pero podemos tener
una idea sobre la frecuencia con la que los diferentes valores que pueden observarse.
Personas de 200 kg. son raras aunque posibles, personas de 65 kg. son frecuentes., es decir
nos gustaría saber que valores son más probables.
a) Distribuciones
discretas
de
variables
b) Distribuciones
de
variables
continuas
a. 1 Distribución binomial
b. 1 Distribución normal
a. 2 Distribución binomial negativa
a. 3 Distribución Poisson
b. 2 Distribución t de Student
b. 3 Distribución F de Fisher
b. 4 Distribución ji o chi cuadrado
a) Distribuciones de variables discretas
a. 1 Distribución binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta que mide
el número de éxitos en una secuencia de n ensayos independientes con una probabilidad
fija p de ocurrencia del éxito entre los ensayos.
En un experimento dicotómico sólo son posibles dos resultados. A uno de estos se
denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces,
de forma independiente, y se trata de calcular la probabilidad de un determinado número
de éxitos.
Para representar que una variable aleatoria X sigue una distribución binomial de
parámetros n y p, se escribe:
𝑋~𝐵(𝑛, 𝑝)
Distribución Binomial (DISTR.BINOM)
Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribución
binomial. Utilice DISTR.BINOM en problemas con un número fijo de pruebas o ensayos,
cuando los resultados de un ensayo son sólo éxito o fracaso, cuando los ensayos son
independientes y cuando la probabilidad de éxito es constante durante todo el
experimento. Por ejemplo, DISTR.BINOM puede calcular la probabilidad de que dos de los
próximos tres bebés que nazcan sean hombres.
Sintaxis
DISTR.BINOM (núm_éxito;ensayos;prob_éxito;acumulado)
Núm_éxito
Ensayos
es el número de éxitos en los ensayos.
es el número de ensayos independientes.
Prob_éxito
es la probabilidad de éxito en cada ensayo.
Acumulado es un valor lógico que determina la forma de la función. Si el argumento
acumulado es VERDADERO, DISTR.BINOM devuelve la función de distribución acumulada,
que es la probabilidad de que exista el máximo número de éxitos; si es FALSO, devuelve la
función de masa de probabilidad, que es la probabilidad de que un evento se reproduzca un
número de veces igual al argumento núm_éxito.
Observaciones




Los argumentos núm_éxito y ensayos se truncan a enteros.
Si el argumento núm_éxito, ensayos o prob_éxito no es numérico, DISTR.BINOM devuelve el
valor de error #¡VALOR!
Si el argumento núm_éxito < 0 o si núm_éxito > ensayos, DISTR.BINOM devuelve el valor de
error #¡NUM!
Si el argumento prob_éxito < 0 o si prob_éxito > 1, DISTR.BINOM devuelve el valor de error
#¡NUM!
A
B
Datos
Descripción
6
Número de éxitos de los ensayos
10
Número de ensayos independientes
0.5
Probabilidad de éxito de cada ensayo
Fórmula
=DISTR.BINOM
(A2;A3;A4;FALSO)
Descripción (Resultado)
Probabilidad de que exactamente 6 de 10 ensayos tengan éxito
(0,205078)
a. 2 Distribución de Poisson
En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de
probabilidad discreta. Así tiempo fijo si estos eventos ocurren con una frecuencia media
conocida y son independientes del tiempo discurrido desde el último evento.
Poisson (POISSON)
Devuelve la distribución de Poisson. Una de las aplicaciones comunes de la distribución de
Poisson es la predicción del número de sucesos en un determinado período de tiempo,
como por ejemplo, el número de automóviles que se presenta a una zona de peaje en el
intervalo de un minuto.
Sintaxis
POISSON (x;media;acumulado)
X
es el número de sucesos.
Media
es el valor numérico esperado.
Acumulado es un valor lógico que determina la forma de la distribución de probabilidad
devuelta. Si el argumento acumulado es VERDADERO, POISSON devuelve la probabilidad de
Poisson de que un suceso aleatorio ocurra un número de veces comprendido entre 0 y x
inclusive; si el argumento acumulado es FALSO, la función devuelve la probabilidad de
Poisson de que un suceso ocurra exactamente x veces.
Observaciones





Si el argumento x no es un entero, se trunca.
Si los argumentos x o media no son numéricos, POISSON devuelve el valor de error
#¡VALOR!
Si x ≤ 0, POISSON devuelve el valor de error #¡NUM!
Si media ≤ 0, POISSON devuelve el valor de error #¡NUM!
POISSON se calcula como:
A
B
Datos
Descripción
2
Número de sucesos
5
Media esperada
Fórmula
Descripción (Resultado)
=POISSON(A2;A3;VERDADERO) Probabilidad de Poisson acumulada con los términos anteriores
(0,124652)
=POISSON(A2;A3;FALSO)
Función de probabilidad de Poisson con los términos anteriores
(0,084224)
b) Distribuciones de variables continuas
b. 1
Distribución Normal
En estadística y probabilidad se
llama distribución
normal, distribución
de
Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto
de un determinado parámetro. Esta curva se conoce como campana de Gauss.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte
de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observación se obtiene como la suma de unas pocas causas
independientes.
La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
DISTR.NORM
Devuelve la distribución normal para la media y desviación estándar especificadas. Esta
función tiene un gran número de aplicaciones en estadística, incluidas las pruebas de
hipótesis.
Sintaxis
DISTR.NORM(x;media;desv_estándar;acum)
X
es el valor cuya distribución desea obtener.
Media
es la media aritmética de la distribución.
Desv_estándar
es la desviación estándar de la distribución.
Acum es un valor lógico que determina la forma de la función. Si el argumento acum es
VERDADERO, la función DISTR.NORM devuelve la función de distribución acumulada; si es
FALSO, devuelve la función de masa de probabilidad.
Observaciones




Si los argumentos media o desv_estándar no son numéricos, DISTR.NORM devuelve el valor
de error #¡VALOR!
Si el argumento desv_estándar ≤ 0, la función DISTR.NORM devuelve el valor de error
#¡NUM!
Si el argumento media = 0, desv_estándar = 1 y acumulado = VERDADERO, la función
DISTR.NORM devuelve la distribución normal estándar, DISTR.NORM.ESTAND.
La ecuación para la función de densidad normal (acumulado = FALSO) es:

Cuando acumulado = VERDADERO, la fórmula es el entero desde el infinito negativo a x de la
fórmula dada.
A
B
Datos
Descripción
42
Valor cuya distribución desea obtener
40
Media aritmética de la distribución
1,5
Fórmula
=DISTR.NORM(A2;A3;A4;VERDADERO)
Desviación estándar de la distribución
Descripción (Resultado)
Función de distribución acumulativa para los términos anteriores
(0,908789)
Función de masa de probabilidad para los términos anteriores
(0,10934005)
=DISTR.NORM(A2;A3;A4;FALSO)
b. 2
"t" de Student
En probabilidad y estadística, la distribución t (de t-Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce
la desviación típica de una población y ésta debe ser estimada a partir de los datos de una
muestra.
PRUEBA.T
Devuelve la probabilidad asociada con la prueba t de Student. Utilice PRUEBA.T para
determinar la probabilidad de que dos muestras puedan proceder de dos poblaciones
subyacentes con igual media.
Sintaxis
PRUEBA.T (matriz1;matriz2;colas;tipo)
Matriz1
es el primer conjunto de datos.
Matriz2
es el segundo conjunto de datos.
Colas especifica el número de colas de la distribución. Si el argumento colas = 1, PRUEBA.T
utiliza la distribución de una cola. Si colas = 2, PRUEBA.T utiliza la distribución de dos colas.
Tipo
es el tipo de prueba t que se realiza.
SI TIPO ES IGUAL A
LA PRUEBA SE REALIZA
1
En observaciones por pares
2
En dos muestras con varianzas iguales (homoscedástica)
3
En dos muestras con varianzas diferentes (heteroscedástica)
Observaciones





Si los argumentos matriz1 y matriz2 contienen un número de puntos de datos diferente y el
argumento tipo = 1 (observaciones pareadas), PRUEBA.T devuelve el valor de error #N/A.
Los argumentos colas y tipo se truncan a enteros.
Si el argumento colas o si el argumento tipo no es numérico, PRUEBA.T devuelve el valor de
error #¡VALOR!
Si el argumento colas es distinto de 1 ó 2, PRUEBA.T devuelve el valor de error #¡NUM!
PRUEBA.T utiliza los datos de matriz1 y matriz2 para calcular una estadística t no negativa. Si
colas=1, PRUEBA.T devuelve la probabilidad de un valor más elevado de la estadística t en el
supuesto de que matriz1 y matriz2 sean muestras de población con la misma media. El valor
devuelto por PRUEBA.T cuando colas=2 es el doble que el que se devuelve cuando colas=1 y
corresponde a la probabilidad de un valor absoluto más elevado de la estadística t en el
supuesto de "medias de población iguales".
A
B
Datos 1
Datos 2
3
6
4
19
5
3
8
2
9
14
1
4
2
5
4
17
5
1
Fórmula
=PRUEBA.T(A2:A10;B2:B10;2;1)
Descripción (Resultado)
Probabilidad asociada con la prueba t de Student pareada con
distribución de dos colas (0,196016)
b. 3
"f" de Fisher
Usada en teoría de probabilidad y estadística, la distribución F es una distribución de
probabilidad continua. También se la conoce como distribución F de Snedecor (por George
Snedecor) o como distribución F de Fisher-Snedecor.
Una variable aleatoria de distribución F se construye como el siguiente cociente:
Donde

U1 y U2 siguen una distribución chi-cuadrado con d1 y d2 grados de libertad
respectivamente, y

U1 y U2 son estadísticamente independientes.
FISHER(x)
Devuelve la transformación Fisher en x. Esta transformación produce una función que se
distribuye normalmente en lugar de ser asimétrica. Use esta función para realizar pruebas
hipotéticas sobre el coeficiente de correlación.
Sintaxis
FISHER(x)
X
es un valor numérico para el cual desea calcular la transformación.
Observaciones



Si el argumento x no es numérico, FISHER devuelve el valor de error #¡VALOR!
Si probabilidad ≤ -1 o si x ≥ 1, FISHER devuelve el valor de error #¡NUM!
La ecuación para la transformación de Fisher es:
Ejemplo
El ejemplo puede resultar más fácil de entender si lo copia en una hoja de cálculo en blanco.
A
B
Fórmula
Descripción (Resultado)
=FISHER(0,75) Transformación Fisher a 0,75 (0,972955)
b. 4
Ji o Chi cuadrada.
En estadística, la distribución χ² (de Pearson) es una distribución de probabilidad continua
con un parámetro k que representa los grados de libertad de la variable aleatoria:
Donde Zi son variables de distribución normal, de media cero y varianza uno. El que la
variable aleatoria X tenga esta distribución se representa habitualmente así:
.
Es conveniente tener en cuenta que la letra griega χ se transcribe al latín como chi1 y se
pronuncia en castellano comoji.2 3
La distribución χ² tiene muchas aplicaciones en inferencia estadística, por ejemplo en la
denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad
de ajuste y en la estimación de varianzas. También está involucrada en el problema de
estimar la media de una población normalmente distribuida y en el problema de estimar la
pendiente de una recta de regresión lineal, a través de su papel en la distribución t de
Student, y participa en todos los problemas de análisis de varianza, por su papel en
la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias
independientes con distribución χ².
DISTR.CHI(x;grados_de_libertad)
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi
cuadrado de una sola cola. La distribución χ2 está asociada a una prueba χ2. Utilice la prueba
χ2 para comparar los valores observados con los esperados. Por ejemplo, un experimento
genético podría estar basado en la hipótesis de que la próxima generación de plantas
presentará un conjunto determinado de colores. Al comparar los resultados observados con
los resultados esperados, puede decidir si su hipótesis original es válida.
Sintaxis
DISTR.CHI(x;grados_de_libertad)
X
es el valor al que desea evaluar la distribución.
Grados_de_libertad
es el número de grados de libertad.
Observaciones




Si uno de los argumentos no es numérico, DISTR.CHI devuelve el valor de error #¡VALOR!
Si el argumento x es negativo, DISTR.CHI devuelve el valor de error #¡NUM!
Si el argumento grados_de_libertad no es un entero, se trunca.
Si el argumento grados_de_libertad < 1 o si grados_de_libertad > 10^10, DISTR.CHI
devuelve el valor de error #¡NUM!
DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una variable aleatoria de χ 2.
A
Datos
18,307
10
Fórmula
=DISTR.CHI(A2;A3)
B
Descripción
Valor al que desea evaluar la distribución
Grados de libertad
Descripción (Resultado)
Probabilidad de una sola cola de una distribución chi cuadrado para los
términos anteriores (0,050001)
Ejemplo
El ejemplo puede resultar más fácil de entender si lo copia en una hoja de cálculo en blanco.