Download Presentación de PowerPoint

Document related concepts
no text concepts found
Transcript
UNIVERSIDAD NACIONAL EXPERIMENTAL
DEL LOS LLANOS OCCIDENTALES
“EZEQUIEL ZAMORA”
UNELLEZ – NÚCLEO TINAQUILLO
ANÁLISIS DE DATOS
ESTADÍSTICOS DE LA
ACTIVIDAD FÍSICA
Coordinador de unidad de apoyo
de estadística:
MSc Alexis Durán
[email protected]
Desarrollado en 1.993 por Ross
Ihaka y Robert Glenteman (University
of Auckland, Nueva Zelanda).
A partir de 1.995 comenzó a
distribuirse gratuitamente (GNU, Free
Software Foundation).
CARACTERÍSTICAS:
Es un conjunto integrado de programas.
Efectiva manipulación y almacenamiento
de datos.
Una amplia, coherente e integrada
colección de herramientas para el
análisis de datos.
Posibilidades gráficas para el análisis de
datos.
R – Commander (Rcmdr)
 Es una interfaz gráfica del programa R.
 Existe una dirección que descarga el R y el RCommader juntos para windows es la siguiente:
http://knuth.uca.es/R/R-UCA
Se ejecuta normal como cualquier programa.
Para abrir el programa se le da doble clic a la R
azul.
Nota
• Algunas veces cuando el R-Commander se
abre, el programa puede preguntar que si se
quieren instalar otros paquetes, si disponen
de tiempo e internet coloquen si, de lo
contrario coloquen no.
Ventana de Instrucciones
Ventana de Resultados
CARGAR
DATOS
Importar datos desde Excel
Colocar el nombre
de la matriz ó
conjunto de datos y
luego aceptan
Se busca el archivo y luego le
da clic en abrir.
Aparece algo como esto:
Selecciona la hoja
donde estén los datos
dentro del archivo y le
das ok
ANÁLISIS INFERENCIAL
• Es el estudio que parte de una muestra
pequeña y representativa de miembros de
gran una colectivo, donde se extraen
conclusiones que afectan a todos los
elementos del mismo.
PRUEBAS DE HIPÓTESIS
Objetivo: Tratar de determinar
cuándo es razonable concluir, que
la
población
entera
posee
determinada propiedad y cuando
esto no es razonable, a partir del
análisis de una muestra.
Una hipótesis se define como una
afirmación ó suposición que está sujeta a
verificación o comprobación
La prueba de hipótesis es el procedimiento
estadístico que parte de una suposición del
comportamiento de la población (hipótesis)
y en función del análisis de la(s) muestra(s)
se comprobará su veracidad
TIPOS DE HIPOTESIS
El procedimiento de toma de decisiones en la
prueba de hipótesis, se basa en la elección de
una opción entre dos conjuntos posibles de
valores del parámetro, es decir, en dos
hipótesis estadísticas, que son:
Hipótesis nula H0
Hipótesis alternativa H1
HIPOTESIS NULA y ALTERNATIVA
• Hipótesis nula corresponde a la ausencia de
una modificación en la variable investigada, y
por lo tanto se especifica de una forma exacta:
H0 :  =  0
• Hipótesis alternativa se especifica de manera
más general :
H1:   0
H1:  > 0
H1:  < 0.
CUADRO DE DECISIONES Y
ERRORES
Rechazar
Ho
No Rechazar
Ho
Ho CIERTA
Incorrecto
error I
Correcto
Ho FALSA
Correcto
Incorrecto
error II
MEDICIÓN DE LOS ERRORES
 es la Probabilidad de cometer un Error
tipo I. Se llama Nivel de significación (1-10 %)
 es la probabilidad de cometer un Error
tipo II (5-20 %)
Es deseable que estas dos probabilidades de
error sean pequeñas.
P - VALOR
•Es la Probabilidad de obtener una discrepancia
mayor o igual que la observada en la muestra n
cuando Ho es cierta.
•Es la probabilidad de observar un valor de
prueba más extremo que el valor observado,
dado que la hipótesis nula es verdadera.
•Si el valor p es más chico que el nivel de
significación la hipótesis nula es rechazada. Por
el contrario, si es más grande que el nivel de
significación la hipótesis nula no es rechazada.
Pasos de una Prueba de
Hipótesis
Paso 1
Paso 2
• Establecer las hipótesis (Nula y Alternativa)
• Seleccionar el nivel de significación (α)
• Selección del estadístico de prueba ó prueba
estadística
Paso 3
Paso 4
• Procesar la información y tomar la decisión.
PRUEBAS PARA
PROMEDIOS
• En primer lugar se debe hacer una análisis
de normalidad a las variables para poder
seleccionar el test adecuado.
• Siempre se quiere realizar test paramétricos
por ser más objetivos que los no
paramétricos.
Análisis de la Normalidad de
los datos
ANÁLISIS GRÁFICO
• Se debe escribir lo siguiente en el programa en la
ventana de instrucciones:
attach(Nombre del conjunto de datos)
qqnorm(variable, xlab="Cuantiles Teóricos“,
ylab="Cuantiles de la Muestra" ,main="Gráfico
Q-Q de Probabilidad Normal")
qqline(variable)
se sombrea y luego se da ejecutar y se obtiene:
30
35
Normal Q-Q Plot
25
20
15
10
Cuantiles de la Muestra
• La recta indica la distribución teórica de una
normal
• Las interpretaciones se hacen en función de
los puntos con su cercanía en la línea recta.
• Entre los puntos estén mas cerca a la recta,
mejor será su aproximación a una
distribución normal.
-2
-1
0
Cuantiles Teóricos
1
2
25
20
15
10
Cuantiles de la Muestra
30
35
Normal Q-Q Plot
-2
-1
0
Cuantiles Teóricos
1
2
Pruebas de Normalidad
• Establece:
Ho: existe normalidad en los datos
H1: no existe normalidad en los datos
• Test de normalidad de Shapiro Wilk: se
utiliza cuando la muestra es menor o igual a
50. En el programa:
• Para muestras mayores a 50, se utiliza el test de
komogorov – Smirnov, en el programa se escribe en
la ventana de instrucciones lo siguiente:
attach(Nombre del conjunto de datos)
ks.test(variable, pnorm, mean(variable), sd(variable))
Medias para una población
Para poblaciones normales
Hipótesis
Ho
µ = Valor
H1
µ ≠ Valor
µ < Valor
µ > Valor
Se selecciona la opción
De la hipótesis alternativa
plateada
Se selecciona la variable
Se coloca el valor del
promedio establecido
en la Hipótesis nula
Hipótesis
H0
Xme=Valor
H1
Xme≠Valor ("two.sided")
Xme<Valor ("less")
Xme>Valor ("greater")
• Se coloca en la ventana de instrucciones:
attach(nombre del conjunto de datos)
wilcox.test(variable, mu=valor, alternative =
c("ver H1") )
Luego se sombrea y se ejecuta
NOTA: En caso de muestras grandes (Mayores
de 30), de debe añadir correct=FALSE y
quedaría:
attach(nombre del conjunto de datos)
wilcox.test(variable, mu=valor, alternative =
c("ver H1"), correct=F)
Prueba de hipótesis entre dos
poblaciones
• Muestras independientes y normales
HIPÓTESIS:
H0
µ1=µ2
H1
µ1≠µ2
µ1<µ2
µ1>µ2
Antes de realizar esta prueba se debe realizar
una prueba para comparar las varianzas
poblacionales que se necesitará más adelante
PRUEBA F DE FISHER
Hipótesis:
H0
σ1=σ2
H1
σ1≠σ2
La matriz que se debe introducir en R:
Grupo ó Tratamiento
A
B
En el programa:
Variable
DATOS
DATOS
Se selecciona la
Variable
Se selecciona el
grupo (debe ser
cualitativo)
Prueba de T-Student (poblaciones)
Hipótesis:
H0
µ1=µ2
H1
µ1≠µ2
µ1<µ2
µ1>µ2
En el programa:
Se marca Sí, para el caso
que se acepte H0 en la
prueba F de Fisher, caso
contrario si marca No
Se selecciona la Se selecciona el
grupo (debe ser
Variable
cualitativo)
Se selecciona la opción
planteada en la
Se observa la
hipótesis alternativa
Diferencia
Muestras dependientes y normales
Hipótesis:
H0
µi=µf
H1
µi≠µf
µi<µf
µi>µf
Nota: recordar que se debe calcular la diferencia
entre las condiciones iniciales y finales para
hacer el análisis de la normalidad
La matriz que se debe introducir en R:
Variable
(Condición Inicial)
Variable
(Condición Final)
DATOS
DATOS
En el programa:
Se le da doble clic
primero a la variable
inicial, se coloca el
signo – y luego se le
da doble clic a la
variable final
Se coloca un nombre
distinto para identificarla
La matriz que se debe introducir en R:
Variable
(Condición Inicial)
Variable
(Condición Final)
DATOS
DATOS
En el programa:
Se selecciona la opción
planteada en la
hipótesis alternativa
Se selecciona la
condición final
Se selecciona la
condición inicial
Muestras independientes y
al menos una no normal
Prueba de Suma de Rangos de Wilcoxon
Hipótesis:
H0
Xme1=Xme2
H1
Xme1≠Xme2
Xme1<Xme2
Xme1>Xme2
En el programa:
Se
observa
la
Para muestras menores a 30, se
diferencia
marca la opción Por defecto, para
muestras mayores a 30 se marca
Aproximación normal
Se Selecciona
el grupo
Se Selecciona
la variable
Se selecciona la
opción de la hipótesis
alternativa planteada
Muestras dependientes y
al menos una no normal
Prueba de Rangos con signos de Wilcoxon:
Hipótesis:
H0
Xmei=Xmef
H1
Xmei≠Xmef
Xmei<Xmef
Xmei>Xmef
Se
selecciona
la
Para muestras menores a 30, se
opción
de la Por
hipótesis
marca
la opción
defecto, para
alternativa
planteada
muestras
mayores
a 30 se marca
Aproximación normal
Se selecciona la
condición inicial
Se selecciona la
condición final