Download Diapositiva 1 - EducacionTEM
Document related concepts
Transcript
Programa Académico de Maestría en Educación para Docentes de la Región Callao ESTADISTICA PARA LA INVESTIGACIÓN PSICOPEDAGÓGICA II José Luis Morón Octubre - 2011 Sesión 1 1-2 Introducción Análisis descriptivo e inferencial y en el cual se proporciona una serie de procedimientos para evaluar estadísticamente la conformidad de la información empírica Diapositiva 2 1-2 Competencia Conoce y usa procedimientos estadísticos para la realización de pruebas estadísticas paramétricas y no paramétricas y análisis multivariados. Gestiona con SPSS información, contrastada y establece conclusiones en base al análisis de los datos Diapositiva 3 1-2 Definición de Estadística • Estadística es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva. Diapositiva 4 Estadística Descriptiva • • Diapositiva 5 Estadística Descriptiva: Conjunto de métodos y procedimientos gráficos y numéricos que organizan, resumen y presentan datos Es usada para transformar datos en información. Estadística Descriptiva • Recolectar Datos – Instrumentos, Encuestas • Presentar Datos – Tablas y Gráficos • Resumir Datos – Media muestral Diapositiva 6 X n i Estadística Inferencial • • Diapositiva 7 Estadística Inferencial: Conjunto de métodos utilizados para saber “algo” acerca de una población basándose en una muestra. Es usada para transformar información en conocimiento. Estadística Inferencial • Estimación – Estimar el peso promedio de la población usando el peso promedio de la muestra. • Prueba de Hipótesis – Probar que el peso promedio de la población es 65 kg. Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en los resultados de una muestra. Diapositiva 8 Población y Muestra Población • TODOS los posibles •Individuos, objetos, mediciones y conteos • Un PARÁMETRO describe a una Población. Diapositiva 9 Muestra • PARTE “representativa” de la Población. • Un ESTADÍSTICO describe a una Muestra. 1-7 Variable X=edad Se pueden definir muchas variables Números 1-11 Resumen de Tipos de Variables DATOS Cualitativos o de atributos Cuantitativos o numéricos Discretos (Conteo) Diapositiva 11 Continuos (Medición) 1-11 Tipos de variables Cualitativas Si se expresan con las escalas nominal u ordinal Tipo de variable Cuantitativas Si se expresan con las escalas intervalar y de razón 1-14 Distribución en Categorías • Mutuamente excluyente: un individuo, objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás. • Completamente incluyente: cada individuo, objeto o artículo debe clasificarse en al menos una categoría. Diapositiva 13 Ordenamiento de Datos Datos Numéricos Arreglo de Datos Distribución de Frecuencias Distribución Acumulada Histograma Tablas Diapositiva 14 Ojiva Polígono • • • Distribución de Frecuencias Ordenamiento de los datos en clases. Indica el número de observaciones (datos) que caen en cada clase. Clase – Grupo de valores que describe una característica de los datos. • Tipos de Clases – Cualitativas – Cuantitativas • Discretas • Continuas Diapositiva 15 Pasos para construir una Distribución de Frecuencias • 1. Calcule el alcance o rango – (Dato mayor - Dato menor). • 2. Determine el número de clases. – Usualmente entre 6 y 15. (Ley Sturges) • 3. Calcule el intervalo de clase. – Divida el alcance entre el número de clases • 4. Determine los límites de cada clase. – Límite Superior y Límite Inferior • 6. Asigne las observaciones a cada clase y efectúe el conteo. Diapositiva 16 Distribución de Frecuencias Distribución de Frecuencias Relativas Acumuladas Diapositiva 17 Clase 48.8-49.2 49.3-49.7 49.8-50.2 50.3-50.7 50.8-51.2 51.3-51.7 Frecuencia Frec. Relativa 2 5 11 6 3 3 0.07 0.16 0.37 0.20 0.10 0.10 30 1.00 Frec. Relativa Acumulada 0.07 0.23 0.60 0.80 0.90 1.00 Organización de los datos Tablas de frecuencias Cualitativa Barras Gráficos Variable Sectores Circulares Tablas de frecuencias Discreta Gráfico de barras Cuantitativa Continua Tabla de frecuencias por intervalos de clase Histogramas Ordenamiento de Datos Datos Numéricos Arreglo de Datos Distribución de Frecuencias Distribución Acumulada Histograma Tablas Diapositiva 19 Ojiva Polígono Histograma Clase 48.8-49.2 49.3-49.7 49.8-50.2 50.3-50.7 50.8-51.2 51.3-51.7 12 Frecuencia 10 8 6 4 2 0 Diapositiva 20 48.8 49.2 49.3 49.7 49.8 50.2 50.3 50.7 50.8 51.2 51.3 51.7 Frecuencia 2 5 11 6 3 3 Polígono de Frecuencias Clase 48.8-49.2 49.3-49.7 49.8-50.2 50.3-50.7 50.8-51.2 51.3-51.7 12 10 Frecuencia Marca Frecuencia 8 6 4 2 0 48.5 Diapositiva 21 49.0 49.5 50.0 50.5 51.0 51.5 52.0 49.0 49.5 50.0 50.5 51.0 51.5 2 5 11 6 3 3 Ojiva 30 27 Frecuencia Acumulada Relativa 24 Clase 18 Frec. Abs. 48.8-49.2 49.3-49.7 49.8-50.2 50.3-50.7 50.8-51.2 51.3-51.7 7 2 0 48.8 51.8 Diapositiva 22 49.3 49.8 50.3 50.8 51.3 2 5 11 6 3 3 Menor que 48.8 49.3 49.8 50.3 50.8 51.3 51.8 Frec. Acum. 0 2 7 18 24 27 30 Diagrama de Tallo y Hoja 1 2 3 4 5 6 Diapositiva 23 68 1255578899 1145566677778999 000122345678999 11667 12 1-2 Características de los Datos Diapositiva 24 Moda Medidas de Tendencia central Media Mediana Resúmenes numéricos Medidas de dispersión Medidas de Simetría y apuntamiento Rango Varianza, desv. Estándar, Rango intercuartil Indice de simetría Características de los Datos Tendencia Central (Posición) Dispersión (Variación) Sesgo Diapositiva 26 Tendencia Central Media Aritmética Diapositiva 27 Media Ponderada Media Geométrica Mediana Moda 3-4 Media de una Muestra • Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el número total de los mismos: x x / n x – donde denota la media muestral – n es el número total de valores en la muestra. Diapositiva 28 3-6 Propiedades de la Media Aritmética • Todo conjunto de datos tiene un valor medio. • Al evaluar la media se incluyen todos los valores. • Un conjunto de valores sólo tiene una media. • Desventaja – Es afectada por los valores extremos. Diapositiva 29 Media Aritmética • Es la medida más común de tendencia central. • Es afectada por valores extremos. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Media = 5 Diapositiva 30 Media = 6 3-10 Mediana • Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella. • Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios. Diapositiva 31 Mediana • No es afectada por los valores extremos. 0 1 2 3 4 5 6 7 8 9 10 Mediana = 5 0 1 2 3 4 5 6 7 8 9 10 12 14 Mediana = 5 n 1 Mediana 2 Diapositiva 32 3-12 Propiedades de la mediana • La mediana es única para cada conjunto de datos. • No se ve afectada por valores muy grandes o muy pequeños. Diapositiva 33 Moda • Valor que ocurre más a menudo. • No es afectada por valores extremos. • Puede no existir una moda. • Pueden haber varias modas. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Moda = 9 Diapositiva 34 0 1 2 3 4 5 6 Sin Moda 1-2 Medidas de Dispersión Diapositiva 35 Dispersión Varianza Alcance Varianza de la Población Varianza de la Muestra Alcance Intercuartil Diapositiva 36 Desviación Estándar Desviación Estándar de la Población Desviación Estándar de la Muestra Coeficiente de Variación Alcance o Rango Diapositiva 37 Alcance • Diferencia entre la mayor y la menor de las observaciones Alcance = xmayor – xmenor • No toma en cuenta la forma en que están distribuidos los datos. Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5 7 12 Diapositiva 38 8 9 10 11 7 12 8 9 10 11 Cuartiles • Los datos se ordenan de menor a mayor. 25% 25% Q1 Observación Menor 25% Q2 25% Q3 Observación Mayor • El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1. Diapositiva 39 Desviación de la Media Diapositiva 40 Promedio de desviación de cada dato 2 -2 1 -1 0 1 2 3 4 ( x ) 0 Diapositiva 41 5 Varianza de la Población • Desviación cuadrática promedio con relación a la media de la Población 2 Diapositiva 42 ( x ) N x 2 N 2 2 2 Desviación Estándar de la Población • Raíz Cuadrada de la Varianza de la Población Diapositiva 43 2 2 ( x ) N x 2 N 2 2 Varianza de la Muestra • Desviación cuadrática promedio (n-1) con relación a la media de la Muestra ( x x ) s n 1 2 2 x nx s n 1 n 1 2 2 Diapositiva 44 2 Desviación Estándar de la Muestra • Raíz Cuadrada de la Varianza de la Muestra s s Diapositiva 45 s s 2 2 ( x x ) n 1 2 x nx n 1 n 1 2 2 Varianza de la Población Datos Agrupados 2 f ( x ) N fx 2 N 2 2 x marca de clase Diapositiva 46 2 Desviación Estándar de la Población Datos Agrupados 2 2 f ( x ) N fx 2 N x marca de clase Diapositiva 47 2 2 Varianza de la Muestra Datos agrupados f ( x x) s n 1 2 2 fx nx s n 1 n 1 2 2 x marca de clase Diapositiva 48 2 Desviación Estándar de la Muestra Datos Agrupados s s s s 2 2 f ( x x) n 1 fx nx n 1 n 1 2 x marca de clase Diapositiva 49 2 2 Comparación de Desviaciones Estándar Datos A Media = 15.5 s = 3.338 11 21 12 13 14 15 16 17 18 19 20 Datos B Media = 15.5 11 12 20 21 13 14 15 16 17 18 s = .9258 19 Datos C Media = 15.5 11 21 Diapositiva 50 12 13 14 15 16 17 18 19 20 s = 4.57 4-14 Interpretación y usos de la Desviación Estándar • Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k2 , donde k es una constante mayor que 1. Diapositiva 51 4-15 Interpretación y usos de la Desviación Estándar • Regla empírica: para una distribución de frecuencias simétrica de campana: – Cerca de 68% de las observaciones estará dentro de ±1σ de la media (μ); – Cerca de 95% de las observaciones estará dentro de ±2σ de la media (μ); – Casi todas (alrededor de 99.7%) las observaciones estarán dentro de ±3σ de la media (μ). Diapositiva 52 Curva de Distribución Normal -3σ Diapositiva 53 -2σ -1σ μ +1σ +2σ +3σ 34.13% 34.13% 13.60% 13.60% 2.135% 2.135% 0.135% 0.135% -3σ -2 σ -1σ μ 68.26% 95.46% 99.73% Diapositiva 54 +1σ +2σ +3σ Resultado Estándar -3σ -2σ -1σ Re Diapositiva 55 μ +1σ x +2σ +3σ 100 20 100 20 x 80 x 160 ¿ Re? ¿ Re? -3σ -2σ 80 100 Re 1 20 Diapositiva 56 -1σ μ 80 100 +1σ +2σ +3σ 160 160 100 Re 3 20 4-17 Dispersión Relativa • El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje: s CV (100%) x Diapositiva 57 Medida de Curtosis Como medida de curtosis se usa el coeficiente de curtosis, que indica la forma de la distribución de los datos con respecto a una distribución normal. Un valor cero indica que la curva es mesocúrtica (curva normal), si es positivo indica que la curva es leptocúrtica (apuntada) y si es negativo platocúrtica (achatada). Medida de Curtosis El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable. Sesión 4 Medidas de forma: Curtosis Leptocúrtica Mesocúrtica Platicúrtica Medida de Curtosis El Coeficiente de Curtosis arroja los siguientes resultados: o g2 = 0 (distribución mesocúrtica). o g2 > 0 (distribución leptocúrtica). o g2 < 0 (distribución platicúrtica). Sesión 4 Ejemplo de Dispersión Relativa Distribuci ón A Distribuci ón B x 10 x 100 s2 s5 ¿Cuál de las dos tiene menor dispersión? Ejemplo de Dispersión Relativa Distribuci ón A Distribuci ón B 2 CV 100 20% 10 5 CV 100 5% 100 La distribución B tiene menor dispersión Medidas de Asimetría El concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética) Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher. Los resultados pueden ser los siguientes: g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda) g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha) Sesgo de una distribución Negativamente Sesgada Simétrica Media < Mediana < Moda Media = Mediana = Moda Positivamente Sesgada Moda < Mediana < Media