Download Diapositiva 1 - EducacionTEM

Document related concepts

Parámetro estadístico wikipedia , lookup

Curtosis wikipedia , lookup

Desviación típica wikipedia , lookup

Asimetría estadística wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Transcript
Programa Académico de Maestría en Educación
para Docentes de la Región Callao
ESTADISTICA
PARA LA INVESTIGACIÓN
PSICOPEDAGÓGICA II
José Luis Morón
Octubre - 2011
Sesión 1
1-2
Introducción
Análisis descriptivo e inferencial y en
el cual se proporciona una serie de
procedimientos
para
evaluar
estadísticamente la conformidad de la
información empírica
Diapositiva 2
1-2
Competencia
Conoce y usa procedimientos estadísticos para la
realización de pruebas estadísticas paramétricas y no
paramétricas y análisis multivariados.
Gestiona con SPSS información, contrastada y
establece conclusiones en base al análisis de los
datos
Diapositiva 3
1-2
Definición de Estadística
• Estadística
es
la
ciencia
de
recolectar,
organizar, presentar,
analizar e interpretar datos con el
propósito de ayudar a una toma de
decisiones más efectiva.
Diapositiva 4
Estadística Descriptiva
•
•
Diapositiva 5
Estadística Descriptiva: Conjunto de
métodos y procedimientos gráficos y
numéricos que organizan, resumen y
presentan datos
Es usada para transformar datos en
información.
Estadística Descriptiva
• Recolectar Datos
– Instrumentos,
Encuestas
• Presentar Datos
– Tablas y Gráficos
• Resumir Datos
– Media muestral
Diapositiva 6
X
n
i
Estadística Inferencial
•
•
Diapositiva 7
Estadística Inferencial: Conjunto de
métodos utilizados para saber “algo”
acerca de una población basándose en
una muestra.
Es usada para transformar información
en conocimiento.
Estadística Inferencial
• Estimación
– Estimar el peso promedio de
la población usando el peso
promedio de la muestra.
• Prueba de Hipótesis
– Probar que el peso promedio
de la población es 65 kg.
Extraer conclusiones y/o tomar decisiones
concernientes a una población basándose en
los resultados de una muestra.
Diapositiva 8
Población y Muestra
Población
• TODOS los posibles
•Individuos, objetos,
mediciones y conteos
• Un PARÁMETRO describe
a una Población.
Diapositiva 9
Muestra
• PARTE “representativa”
de la Población.
• Un ESTADÍSTICO describe
a una Muestra.
1-7
Variable
X=edad
Se pueden definir muchas variables
Números
1-11
Resumen de
Tipos de Variables
DATOS
Cualitativos o de atributos
Cuantitativos o numéricos
Discretos
(Conteo)
Diapositiva 11
Continuos
(Medición)
1-11
Tipos de variables
Cualitativas
Si se expresan con las
escalas nominal u ordinal
Tipo de
variable
Cuantitativas
Si se expresan con las
escalas intervalar y de razón
1-14
Distribución en Categorías
• Mutuamente excluyente: un individuo,
objeto o artículo, al ser incluido en una
categoría, debe excluirse de las demás.
• Completamente incluyente: cada
individuo, objeto o artículo debe
clasificarse en al menos una categoría.
Diapositiva 13
Ordenamiento de Datos
Datos Numéricos
Arreglo
de Datos
Distribución de Frecuencias
Distribución Acumulada
Histograma
Tablas
Diapositiva 14
Ojiva
Polígono
•
•
•
Distribución de Frecuencias
Ordenamiento de los datos en clases.
Indica el número de observaciones (datos)
que caen en cada clase.
Clase
– Grupo de valores que describe una característica de
los datos.
•
Tipos de Clases
– Cualitativas
– Cuantitativas
• Discretas
• Continuas
Diapositiva 15
Pasos para construir una
Distribución de Frecuencias
•
1. Calcule el alcance o rango
– (Dato mayor - Dato menor).
•
2. Determine el número de clases.
– Usualmente entre 6 y 15. (Ley Sturges)
•
3. Calcule el intervalo de clase.
– Divida el alcance entre el número de clases
•
4. Determine los límites de cada clase.
– Límite Superior y Límite Inferior
•
6. Asigne las observaciones a cada clase y
efectúe el conteo.
Diapositiva 16
Distribución de Frecuencias
Distribución
de
Frecuencias
Relativas
Acumuladas
Diapositiva 17
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
Frec. Relativa
2
5
11
6
3
3
0.07
0.16
0.37
0.20
0.10
0.10
30
1.00
Frec. Relativa
Acumulada
0.07
0.23
0.60
0.80
0.90
1.00
Organización de los datos
Tablas de
frecuencias
Cualitativa
Barras
Gráficos
Variable
Sectores Circulares
Tablas de
frecuencias
Discreta
Gráfico de
barras
Cuantitativa
Continua
Tabla de frecuencias por
intervalos de clase
Histogramas
Ordenamiento de Datos
Datos Numéricos
Arreglo
de Datos
Distribución de Frecuencias
Distribución Acumulada
Histograma
Tablas
Diapositiva 19
Ojiva
Polígono
Histograma
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
12
Frecuencia
10
8
6
4
2
0
Diapositiva 20
48.8
49.2
49.3
49.7
49.8
50.2
50.3
50.7
50.8
51.2
51.3
51.7
Frecuencia
2
5
11
6
3
3
Polígono de Frecuencias
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
12
10
Frecuencia
Marca Frecuencia
8
6
4
2
0
48.5
Diapositiva 21
49.0
49.5
50.0
50.5
51.0
51.5
52.0
49.0
49.5
50.0
50.5
51.0
51.5
2
5
11
6
3
3
Ojiva
30
27
Frecuencia Acumulada
Relativa
24
Clase
18
Frec.
Abs.
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
7
2
0
48.8
51.8
Diapositiva 22
49.3
49.8
50.3
50.8
51.3
2
5
11
6
3
3
Menor
que
48.8
49.3
49.8
50.3
50.8
51.3
51.8
Frec.
Acum.
0
2
7
18
24
27
30
Diagrama de Tallo y Hoja
1
2
3
4
5
6
Diapositiva 23
68
1255578899
1145566677778999
000122345678999
11667
12
1-2
Características de los Datos
Diapositiva 24
Moda
Medidas de
Tendencia
central
Media
Mediana
Resúmenes
numéricos
Medidas de
dispersión
Medidas de
Simetría y apuntamiento
Rango
Varianza, desv.
Estándar,
Rango intercuartil
Indice de
simetría
Características
de los Datos
Tendencia Central
(Posición)
Dispersión
(Variación)
Sesgo
Diapositiva 26
Tendencia
Central
Media
Aritmética
Diapositiva 27
Media
Ponderada
Media
Geométrica
Mediana
Moda
3-4
Media de una Muestra
• Para datos no agrupados, la media de
una muestra es la suma de todos los
valores divididos entre el número total
de los mismos:
x  x / n
x
– donde denota la media muestral
– n es el número total de valores en la
muestra.
Diapositiva 28
3-6
Propiedades de la
Media Aritmética
• Todo conjunto de datos tiene un valor medio.
• Al evaluar la media se incluyen todos los
valores.
• Un conjunto de valores sólo tiene una media.
• Desventaja
– Es afectada por los valores extremos.
Diapositiva 29
Media Aritmética
• Es la medida más común de tendencia
central.
• Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12
14
Media = 5
Diapositiva 30
Media = 6
3-10
Mediana
• Mediana: es el punto medio de los valores
después de ordenarlos de menor a
mayor, o de mayor a menor. La misma
cantidad de valores se encuentra por arriba
de la mediana que por debajo de ella.
• Nota: para un conjunto con un número par
de números, la mediana será el promedio
aritmético de los dos números medios.
Diapositiva 31
Mediana
• No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10
Mediana = 5
0 1 2 3 4 5 6 7 8 9 10 12
14
Mediana = 5
n 1
Mediana 
2
Diapositiva 32
3-12
Propiedades de la mediana
• La mediana es única para cada conjunto
de datos.
• No se ve afectada por valores muy
grandes o muy pequeños.
Diapositiva 33
Moda
• Valor que ocurre más a menudo.
• No es afectada por valores
extremos.
• Puede no existir una moda.
• Pueden haber varias modas.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
Diapositiva 34
0 1 2 3 4 5 6
Sin Moda
1-2
Medidas de Dispersión
Diapositiva 35
Dispersión
Varianza
Alcance
Varianza de
la Población
Varianza de
la Muestra
Alcance Intercuartil
Diapositiva 36
Desviación Estándar
Desviación
Estándar de
la Población
Desviación
Estándar de
la Muestra
Coeficiente de
Variación
Alcance o Rango
Diapositiva 37
Alcance
• Diferencia entre la mayor y la menor de
las observaciones
Alcance = xmayor – xmenor
• No toma en cuenta la forma en que están
distribuidos los datos.
Alcance: 12 - 7 = 5
Alcance: 12 - 7 = 5
7
12
Diapositiva 38
8
9
10
11
7
12
8
9
10
11
Cuartiles
• Los datos se ordenan de menor a mayor.
25%
25%
 Q1 
Observación
Menor
25%
 Q2 
25%
Q3 
Observación
Mayor
• El alcance intercuartil es la distancia entre el tercer
cuartil Q3 y el primer cuartil Q1.
Diapositiva 39
Desviación de la Media
Diapositiva 40
Promedio de
desviación de cada dato
2
-2
1
-1
0
1
2
3
4
( x   )  0
Diapositiva 41
5
Varianza de la Población
• Desviación cuadrática promedio con
relación a la media de la Población

2

Diapositiva 42
( x   )

N
x
2


N
2
2
2
Desviación Estándar
de la Población
• Raíz Cuadrada de la Varianza de la
Población
 
 
Diapositiva 43


2
2

( x   )
N

x
2

N
2
2
Varianza de la Muestra
• Desviación cuadrática promedio (n-1) con
relación a la media de la Muestra
( x  x )
s 
n 1
2
2
x
nx
s 

n 1 n 1
2
2
Diapositiva 44
2
Desviación Estándar
de la Muestra
• Raíz Cuadrada de la Varianza de la
Muestra
s
s
Diapositiva 45
s
s
2
2


( x  x )
n 1
2
x
nx

n 1 n 1
2
2
Varianza de la Población
Datos Agrupados

2

f ( x   )

N
fx
2


N
2
2
x  marca de clase
Diapositiva 46
2
Desviación Estándar
de la Población
Datos Agrupados
 
 


2

2

f ( x   )
N
fx
2

N
x  marca de clase
Diapositiva 47
2
2
Varianza de la Muestra
Datos agrupados
f ( x  x)
s 
n 1
2
2
fx
nx
s 

n 1 n 1
2
2
x  marca de clase
Diapositiva 48
2
Desviación Estándar
de la Muestra
Datos Agrupados
s
s
s
s
2
2

f ( x  x)
n 1

fx
nx

n 1 n 1
2
x  marca de clase
Diapositiva 49
2
2
Comparación de Desviaciones
Estándar
Datos A
Media = 15.5
s = 3.338
11
21
12
13
14
15
16
17
18
19
20
Datos B
Media = 15.5
11 12
20 21
13
14
15
16
17
18
s = .9258
19
Datos C
Media = 15.5
11
21
Diapositiva 50
12
13
14
15
16
17
18
19
20
s = 4.57
4-14
Interpretación y usos de la
Desviación Estándar
• Teorema de Chebyshev: para
cualquier conjunto de
observaciones, la proporción
mínima de valores que está dentro
de k desviaciones estándar desde
la media es al menos 1 - 1/k2 ,
donde k es una constante mayor
que 1.
Diapositiva 51
4-15
Interpretación y usos de la
Desviación Estándar
• Regla empírica: para una distribución de
frecuencias simétrica de campana:
– Cerca de 68% de las observaciones estará dentro
de ±1σ de la media (μ);
– Cerca de 95% de las observaciones estará dentro
de ±2σ de la media (μ);
– Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).
Diapositiva 52
Curva de Distribución
Normal
-3σ
Diapositiva 53
-2σ
-1σ
μ
+1σ
+2σ
+3σ
34.13%
34.13%
13.60%
13.60%
2.135%
2.135%
0.135%
0.135%
-3σ
-2 σ
-1σ
μ
68.26%
95.46%
99.73%
Diapositiva 54
+1σ
+2σ
+3σ
Resultado Estándar
-3σ
-2σ
-1σ
Re 
Diapositiva 55
μ
+1σ
x

+2σ
+3σ
  100
  20
  100
  20
x  80
x  160
¿ Re?
¿ Re?
-3σ
-2σ
80  100
Re 
 1
20
Diapositiva 56
-1σ
μ
80
100
+1σ
+2σ
+3σ
160
160  100
Re 
3
20
4-17
Dispersión Relativa
• El coeficiente de variación es la razón de
la desviación estándar a la media
aritmética, expresada como porcentaje:
s
CV  (100%)
x
Diapositiva 57
Medida de Curtosis
Como medida de curtosis se usa el
coeficiente de curtosis, que indica la forma
de la distribución de los datos con
respecto a una distribución normal. Un valor
cero indica que la curva es mesocúrtica
(curva normal), si es positivo indica que la
curva es leptocúrtica (apuntada) y si es
negativo platocúrtica (achatada).
Medida de Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración medio
alrededor de los valores centrales de la variable (el mismo que presenta
una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración
alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración
alrededor de los valores centrales de la variable.
Sesión 4
Medidas de forma:
Curtosis
Leptocúrtica
Mesocúrtica
Platicúrtica
Medida de Curtosis
El Coeficiente de Curtosis arroja los siguientes resultados:
o g2 = 0 (distribución mesocúrtica).
o g2 > 0 (distribución leptocúrtica).
o g2 < 0 (distribución platicúrtica).
Sesión 4
Ejemplo de Dispersión Relativa
Distribuci ón A
Distribuci ón B
x  10
x  100
s2
s5
¿Cuál de las dos tiene menor dispersión?
Ejemplo de Dispersión Relativa
Distribuci ón A
Distribuci ón B
2
CV  100  20%
10
5
CV 
100  5%
100
La distribución B tiene menor dispersión
Medidas de Asimetría
El concepto de asimetría se refiere a si la curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha de un valor central (media aritmética)
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de
Fisher.
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y
a la izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la
derecha de la media que a su izquierda)
g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la
izquierda de la media que a su derecha)
Sesgo de una distribución
Negativamente
Sesgada
Simétrica
Media < Mediana < Moda Media = Mediana = Moda
Positivamente
Sesgada
Moda < Mediana < Media