Download Inferencia estadística

Document related concepts

Prueba t de Student wikipedia , lookup

Error estándar wikipedia , lookup

Estadístico muestral wikipedia , lookup

Análisis de la varianza wikipedia , lookup

Poder estadístico wikipedia , lookup

Transcript
MATERIA:
CÓDIGO:
REQUISITO:
PROGRAMAS:
Inferencia Estadística
08171
Teoría de Probabilidades (08131)
Ingenierías, Economía, Contaduría y Finanzas, Administración de Empresas,
Mercadeo y Publicidad.
PERIODO ACADÉMICO: 162 (Segundo semestre de 2016)
INTENSIDAD SEMANAL: 4 horas
CRÉDITOS:
3
OBJETIVO GENERAL
Al finalizar este curso, el alumno estará en capacidad de:
Describir, utilizar e interpretar los resultados de los métodos que hacen posible la estimación de una o varias
características de una población de interés, o la toma de una decisión con respecto a una población, basada
sólo en los resultados de una muestra.
OBJETIVOS TERMINALES DE APRENDIZAJE
Como resultado de este curso el estudiante estará en capacidad de:
1.1 Tomar decisiones con base en el análisis de información cuantificando los riesgos asumidos.
1.2 Comprender las distribuciones de muestreo y su incidencia sobre la toma de decisiones basadas en el
muestreo.
1.3 Plantear, resolver y analizar pruebas de hipótesis respecto a los parámetros poblacionales más utilizados.
1.4 Utilizar y valorar el uso de Microsoft Excel en el procesamiento de información y la solución de problemas
de inferencia estadística.
1.5 Identificar, aplicar y analizar el método de regresión lineal simple y el análisis de correlación.
OBJETIVOS ESPECÍFICOS DE CADA MÓDULO
Módulo 1

Diferenciar entre población y muestra y describir los métodos para seleccionar una muestra.

Explicar la razón por la cual una muestra, es con frecuencia, la única forma viable para identificar una
característica sobre una población.

Repasar la Distribución normal e identificarla como una distribución clave en los resultados de la
Inferencia Estadística.
Módulo 2

Definir y construir la distribución muestral para la media, la proporción y la varianza

Explicar las aplicaciones de las distribuciones muestrales.

Explicar y aplicar el teorema central del límite en las distribuciones muestrales de la media y la
proporción.
Módulo 3

Identificar y calcular los principales estimadores puntuales y diferenciar entre estimador puntual y
estimación.

Definir y explicar las principales propiedades de los estimadores puntuales.

Identificar el método de la máxima verosimilitud para encontrar buenos estimadores.

Definir nivel de confianza

Definir y construir un intervalo de confianza

Identificar la distribución t de Student

Identificar la distribución chi cuadrado.

Construir intervalos de confianza para la estimación de la media, la proporción y la varianza
poblacionales.

Determinar y calcular el tamaño de muestra adecuado para estimar la media o la proporción
poblacionales.
Módulo 4

Definir una hipótesis e identificar los componentes o partes de una hipótesis.

Describir el procedimiento general para probar una hipótesis.

Definir los errores tipo I y tipo II y calcular la probabilidad de cometer error tipo I (nivel de significancia) y
error tipo II en las pruebas de hipótesis.

Distinguir entre pruebas de hipótesis de una cola y de dos colas.

Describir y aplicar los procedimientos para probar hipótesis sobre la media y la proporción poblacionales.

Definir y calcular el valor-p en las pruebas de hipótesis.

Distinguir entre pruebas de hipótesis con una sola muestra y con dos muestras.

Listar las características de la distribución F.

Realizar pruebas de hipótesis con dos muestras, para dos varianzas.

Realizar pruebas de hipótesis con dos muestras para la diferencia entre medias poblacionales
independientes, para la diferencia entre dos proporciones poblacionales, para la media de dos muestras
dependientes.

Distinguir entre muestras dependientes e independientes.

Explicar la idea general del análisis de varianza.

Organizar datos en una tabla de ANOVA de una y dos vías.

Realizar una prueba de hipótesis entre tres o más medias de tratamiento.

Desarrollar intervalos de confianza para la diferencia en medias de tratamiento.

Realizar una prueba de hipótesis entre medias de tratamiento con una variable de bloque.
Módulo 5

Identificar cómo y cuándo emplear la prueba chi cuadrado para variables categóricas en tablas de
contingencia

Utilizar la prueba chi cuadrado para comparar un grupo de datos observado de frecuencias con una
distribución esperada

Realizar una prueba de hipótesis para determinar si hay alguna relación entre dos criterios de
clasificación.
Módulo 6

Calcular, interpretar y hacer inferencias sobre el coeficiente de correlación entre dos variables.

Interpretar los términos variable dependiente e independiente.

Usar el análisis de regresión lineal simple para predecir el valor de una variable dependiente con base en
una variable independiente.

Interpretar el significado de los coeficientes de regresión.

Estimar la recta de regresión por el método de mínimos cuadrados.

Estimar e interpretar los intervalos de confianza y de predicción para la variable dependiente.

Evaluar las suposiciones de la regresión mediante pruebas de hipótesis y saber qué hacer si estas
suposiciones son infringidas.
METODOLOGIA
El enfoque: En concordancia con los propósitos de la universidad, en el desarrollo de este curso se considera
que el aprendizaje es el resultado de un proceso de construcción del conocimiento, que tiene como centro al
estudiante y como guía al profesor. Este enfoque se concretará en la práctica con el aprovechamiento de los
resultados del estudio previo hecho por los estudiantes, como elemento generador de preguntas, discusiones
y conclusiones.
La discusión en clase: La discusión, orientada por el profesor es el elemento central en la metodología del
curso.
Se fundamenta en el estudio preliminar de las secciones asignadas, en las preguntas de los
estudiantes y en sus respuestas a sus preguntas y a las del profesor, que alimenten el proceso de aprendizaje
activo. El profesor interviene esencialmente como guía y moderador de las discusiones, y se encarga de
hacer la síntesis final para socializar el conocimiento consolidado en clase y de indicar al estudiante la labor
que debe realizar como preparación para la clase siguiente y los objetivos que debe alcanzar como parte de
tal preparación.
Las actividades del estudiante: Para el logro de los objetivos de aprendizaje el estudiante debe desarrollar
con total responsabilidad un conjunto de actividades antes, durante y después de la clase, así:

Antes de la clase: Realizar todas las actividades indicadas por el profesor para la preparación del tema de
clase, hacer explícitas las dudas e inquietudes que le surjan como resultado de este proceso y preparar
las preguntas que formulará durante la clase de presentación del tema, con el fin de resolver las dudas e
inquietudes.

Durante la clase: Participar activamente en las discusiones que se generen a partir de las preguntas
formuladas por los estudiantes y por el profesor, y de las respuestas a las mismas. Igualmente, presentar
las dudas e inquietudes que le surgieron al prepararse para esta clase, y discutir alternativas propias de
solución de problemas, cuando las tenga.

Después de la clase: Asegurarse de consolidar el nuevo conocimiento resolviendo ejercicios y problemas
que en la fase de preparación no haya podido resolver, o que revisten mayor complejidad, y
relacionándolo con conocimientos previamente adquiridos.
Prácticas en la sala de Cómputo: Se complementará el conocimiento adquirido en el aula de clase con
prácticas de realizadas en la sala de cómputo. Estas prácticas serán dirigidas por el profesor; se utilizarán el
software Microsoft Excel y su complemento MEGASTAT o cualquiera de los software licenciados que tiene la
universidad para estadística, además del texto guía para el desarrollo de los talleres correspondientes.
CONTENIDO
Módulo 1:
El Muestreo y la Inferencia Estadística (1 semana)
1.1
Introducción: Estadística Descriptiva versus Inferencia Estadística
Población, muestra, parámetro, estadístico.
1.2
Tipos de Métodos de Muestreo.
1.3
Razones para obtener una muestra.
1.4
Muestreo Aleatorio Simple, Muestreo Estratificado, Muestreo sistemático, Muestreo por
conglomerados.
1.5
Error de Muestreo
1.6
Repaso de la Distribución Normal.
Módulo 2:
Distribuciones Muestrales y Estimación puntual(2 semanas)
2.1
Distribuciones Muestrales, Distribución Muestral de la Media.
2.2
Teorema del Límite Central. Error Estándar de la Media Muestral
2.3
Uso de la distribución muestral de la media.
2.4
Distribución muestral de la proporción
2.5
Distribución muestral de la varianza
2.6
Estimador puntual y estimación
2.7
Propiedades de un buen estimador:Sesgo, eficiencia, consistencia.
2.8
Módulo 3:
Estimación por intervalos (2 semanas)
3.1
Intervalos de confianza. Introducción, construcción y conceptualización básica.
3.2
Estimación del Intervalo de confianza para la media (σ conocida).
3.3
Estimación del Intervalo de confianza para la media (σ desconocida).
3.4
Distribución muestral t de STUDENT. Propiedades. Concepto de Grados de Libertad.
3.5
Estimación del Intervalo de Confianza para la Proporción
3.6
Estimación del Intervalo de confianza para la Varianza.
3.7
Determinación del tamaño de muestra para la media y para la proporción.
Módulo 4:
Prueba de Hipótesis (6 semanas)
4.1
¿Qué es una hipótesis?¿Qué es la Prueba de Hipótesis? Procedimiento de 5 pasos para probar una
Hipótesis. Hipótesis nula e hipótesis alternativa. Nivel de Significancia. Estadístico de Prueba y su
valor crítico. Regla de decisión, regiones de rechazo y no rechazo.
4.2
Riesgos en la toma de decisiones al usar la metodología de pruebas de hipótesis. Errores tipo I y II.
4.3
Pruebas de significancia de una y dos colas.
4.4
Pruebas para la media de una población (σ conocida) Prueba de dos colas y de una cola. Valor p en
las pruebas de hipótesis.
4.5
Prueba de la media poblacional (σ desconocida).
4.6
Pruebas relacionadas con proporciones.
4.7
Error tipo II – Cálculo del error tipo II
4.8
Prueba de hipótesis con dos muestras: Muestras Independientes.
4.9
Prueba de proporciones con dos muestras
4.10
Comparación de medias con desviaciones estándares de la población desconocidas (la prueba t
conjunta)
4.11
Comparación de medias poblacionales con desviaciones estándares desiguales.
4.12
Prueba de hipótesis con dos muestras: Muestras Dependientes.
4.13
Comparación de muestras dependientes e independientes.
4.14
Distribución F.
4.15
Comparación de dos varianzas poblacionales.
4.16
Suposiciones en el análisis de la varianza (ANOVA)
4.17
La prueba ANOVA
4.18
Inferencias sobre pares de medias de tratamiento. Pruebas post-ANOVA, comparaciones múltiples.
Prueba de Levene.
4.19
Análisis de Varianza de dos vías
Módulo 5:
Pruebas de bondad de ajuste y tablas de contingencia (2 semanas)
5.1
Prueba de bondad de Ajuste: frecuencias esperadas iguales
5.2
Prueba de bondad de ajuste: frecuencias esperadas desiguales
5.3
Bondad de ajuste para distribuciones binomial y poisson.
5.4
Limitaciones de la X²chi cuadrado
5.5
Análisis de tablas de contingencia.
5.6
Prueba X² de Independencia.
5.7
Prueba de bondad de ajusteKOLMOGOROV-SMIRNOV.Conceptos básicos.
Módulo 6:
Correlación y Regresión Lineal (3 semanas)
6.1
¿Qué es el análisis de correlación?
6.2
Coeficiente de correlación.
6.3
Prueba de la importancia del coeficiente de correlación
6.4
Análisis de Regresión.Principio de los mínimos cuadrados
6.5
Error estándar de la estimación
6.6
Suposiciones de la regresión lineal.
6.7
Intervalos de confianza e intervalos de predicción
6.8
Coeficiente de Determinación
6.9
Más sobre el coeficiente de determinación.
6.10
Relaciones entre el coeficiente de correlación, el coeficiente de determinación y el error estándar de
estimación.
6.11
Evaluación de las Suposiciones de la regresión lineal
6.12
Medición de la Autocorrelación: Estadístico DURBIN-WATSON
6.13
Un contraste de Homogeneidad de varianza de los residuales.
EVALUACION
Primer parcial: (sesión10) Tema: Lo visto hasta la sesión anterior al examen.
20%
Segundo parcial: (sesión 22) Tema: Lo visto hasta la sesión anterior al examen.
20%
Examen final: Toda la materia (60% lo visto después del segundo parcial)
30%
Nov. 22 de 2016- 9:30 a 12:00 salón publicado oportunamente en la cartelera del departamento.
Pruebas cortas
Tres pruebas cortas
20%
Control de Estudio Previo
10%
Las pruebas cortas se efectuarán en las sesiones 6, 16 y 28 (Se elimina la de menor nota, no hay supletorios
de pruebas cortas)
Se efectuarán tres controles de estudio (no se elimina ninguna nota de controles de estudio previo)
Supletorios:
De parciales: Oct. 29 de 2016 de 9:30 a 12:00
De examen final: Dic. 05 de 2016 de 9:30 a 12:00
De conformidad con lo determinado en el Departamento de Matemáticas y Estadística para los cursos con
examen final acumulativo, si la nota definitiva obtenida en el curso es mayor o igual que 2.8 pero menor que
3.0 y la calificación del examen final es 3.3 o mayor, la nota definitiva del curso será 3.0
ASISTENCIA A CLASE.
El profesor es autónomo en la decisión de llevar control de asistencia a cada clase. Si por los alumnos es
conocido que se lleva control de asistencia, el alumno que no haya asistido al menos al 80% del total de horas
del curso obtendrá una calificación de “No Aprobado” (Ver artículo 74, literal c “Libro de derechos, deberes y
normas de los estudiantes de pregrado de la Universidad Icesi”).
En los casos en los que el profesor no lleve el registro de asistencia o éste no sea conocido por los
estudiantes, no se podrán aplicar las normas sobre calificación de las materias con “No Aprobado” por faltas
de asistencia (ver parágrafo 2° del artículo 74 “Libro de derechos, deberes y normas de los estudiantes de
pregrado de la Universidad Icesi”)
Nota: Esta asignatura tiene 32 sesiones de 2 horas cada unaen el semestre. Si usted falta a siete (7) o más
sesiones en el semestre, obtendrá una calificación de “No Aprobado”, siempre que el profesor lleve el registro
de asistencia.
BIBLIOGRAFIA
Texto Guía:(Tg)
“Estadística aplicada a los negocios y la economía”. Lind, Marchal, Wathen. Editorial Mc Graw Hill.
Décimo sexta edición 2015.
Libros de Consulta:
Ref 1“Estadística para Administración”, BERENSON, LEVINE, KREHBIEL. Editorial PRENTICE HALL.
Cuarta edición 2006
Ref 2“Estadística para los negocios y la economía”, PAUL NEWBOLD. Editorial PRENTICE HALL.
Octava edición2013.
Ref 3“Estadística para administración y economía”, Levin, Rubin, Balderas, del Valle, Gómez. Editorial
PRENTICE HALL. Séptima edición 2004.
Ref 4“Probabilidad y Estadística”. WALPOLE, MYERS.Editorial MCGRAW HILL. Cuarta edición 1992
Ref 5“Estadística para Administración”, BERENSON, LEVINE, KREHBIEL. Editorial PRENTICE HALL.
Segunda edición 2001
Ref 6“Estadística Matemática con Aplicaciones”, Mendenhall, Scheaffer, Wackerly. 6ª edición 2002. Editorial
Thomson.
Ref 7 “Probabilidad y Estadística Aplicaciones y métodos”. Canavos, George C. Editorial Mc Graw Hill.
Primera edición 1987
TRABAJO DE CLASE EN LA SALA DE CÓMPUTO:
En las sesiones programadas para ser llevadas a cabo en las salas de cómputo, los alumnos se abstendrán
de navegar en Internet, enviarse mensajes a través de correo electrónico o de los software diseñados para tal
fin o de tener abierto cualquier software diferente al que se debe usar en la clase.
A discreción del profesor, el alumno que sea sorprendido infringiendo esta norma, será retirado de la sala, se
le colocará falta de asistencia y si se tiene previsto que se debe presentar algún trabajo en clase, el alumno
tendrá una calificación de 0 (cero) en dicho trabajo(Ver artículo 76 “Libro de derechos, deberes y normas de
los estudiantes de pregrado de la Universidad Icesi”).
.
Programación Curso de Inferencia Estadística
S#: Sesión número
SAE: Sección del texto guía o texto de consulta asignado al estudiante para la clase siguiente
RC: Ejercicios para resolver en casa
S#
Tema
SAE
RC*
1
2
3
Presentación del Programa. Texto guía.
Tgpag 221-228,
Forma de evaluación, Metodología del curso.
Ref 1 pag220-224
Conceptos:
Población,
Muestra,
Parámetro,
Estadístico.Objetivos de la inferencia Estadística.
Tipos de Métodos de Muestreo. Razones para
Tg pag 229-240,
obtener una muestra. Error de muestreo
Repaso distribución normal
Distribuciones Muestrales. Distribución muestral de la
media. Teorema del límite central. Error estándar de
la media muestral. Uso de la distribución muestral de
la media
Distribución muestral de la proporción
Distribución muestral de la varianza.
Estimador puntual y estimación. Propiedades de un
buen estimador: Sesgo, Eficiencia y Consistencia.
Introducción a la estimación de intervalos de
confianza. Estimación de Intervalos de confianza para
la media(σ conocida).
Distribución muestral t STUDENT. Grados de
libertad. Estimación de Intervalos de confianza para la
media (σ desconocida). Estimación de intervalo de
confianza para la proporción.
Quiz 1
Estimación de intervalo de confianza para la varianza
Determinación del tamaño de muestra para la media y
para la proporción. Factor de corrección para
poblaciones finitas
Elementos básicos de las pruebas de hipótesis.
Hipótesis Estadísticas.
Hipótesis nula e Hipótesis alternativa.
Estadístico de Prueba y su valor crítico.
Reglas de Decisión:regiones de rechazo y no
rechazo. Nivel de Significancia. Riesgos en la toma
de decisión al utilizar pruebas de hipótesis: Error tipo
I y Error tipo II
Pruebas de significancia de una y dos colas
Prueba de Hipótesis para la media (σ conocida) de
una y dos colas.
Primer examen parcial
Ref 1 pag 217218
Ref 2 pag 277284.
Tgpag 250-257
11
Valor p en las pruebas de hipótesis.
Prueba de la media poblacional (σ desconocida)
12
Pruebas relacionadas con proporciones
Error tipo II. Cálculo del error tipo II
Prueba de Hipótesis para la varianza
Tgpag 301 – 304
Ref 2 pag384387
Tgpag 311-316,
478-481
13
Pruebas de hipótesis de dos muestras. Muestras Tgpag 316-323
independientes. Pruebas de proporciones de dos
muestras
14
Comparación
de
medias
poblacionales
con Tgpag 324-329
desviaciones estándares desconocidas.
Medias
poblacionales
con
desviaciones
estándares
desiguales
4
5
6
7
8
9
10
Tgpag 258-263
Tgpag 264-266
Tg ejerc 5 a 10 pag 232,
ejerc 11 a 14 pag 239, ejerc
15 a 18 pag 242, ejerc 31 a
45 pág 245
Ref 1 ejerc 7.14 al 7.22 pag
219.
Ref 2 ejerc 7.47 al 7.62 pag
284
Tg ejerc 1 a 8 pag 257,
Ref 2 pag 340343
Tgpag 267-272
Tg ejerc 9 a 14 pag 263
Tg ejerc 15 a 18 pag 266.
Tg pag 282-287
Ref 2 ejerc 9.23 al 9.31 pag
343
Tg ejerc 19 a 26 pag 270.
Tg ejerc 27 a 30 pag 272.
Ref 1 ejerc 9.1 a 9.19 pag
277.
Tg ejerc 1 a 8 pag 293
Tg pag 287 - 292
Tg ejerc 9 a 14 pag 298
Tg ag 292 – 298
Tg ejerc 15 a 20 pag 301,
Tg ejerc 21 a 22 pag 304, 23
a 49 pag 305, 1 a 6 pag 478,
Ref2 pag 387 ejerc 9.47 a
9.52
Tg ejerc 1 a 6 pag 315, ejerc
7 a 12 pag 481
Ref 2 ejerc 10.14 al 10.21
pag 415
Tg ejerc 7 a 12 pag 320, 13 a
16 pag 324
15
Prueba de hipótesis de dos muestras: muestras Tg pag 339-342
dependientes.
Comparación
de
muestras
dependientes e independientes
Tg ejerc 17 a 20 pag 329
16
Distribución F.
Comparación de 2 varianzas poblacionales.
Quiz 2
Suposiciones en el análisis de varianza
La prueba ANOVA
Tg pag 343-350
Tg ejerc 1 a 6 pag 343
Tg pag 351-353
Ref 1 pag 353357
Tg pag 355-358
Tg ejerc 7 a 10 pag 350
17
18
20
Inferencias sobre pares de medias de tratamiento.
Pruebas post-ANOVA: comparaciones múltiples:
Prueba de Levene
Ejercicios de la Anova y Análisis de Varianza de dos
vías
Ejercicios de ANOVA de dos vías
21
Práctica en Excel con Anova y Anova de dos vías
22
Segundo examen parcial
19
23
24
25
26
27
28
29
30
31
32
Tg ejerc 28 a 32 pag 367
Tg ejerc 39 a 45 pag 372
Tgpag 482-490,
Ref 2 pag 661663
Prueba de bondad de ajuste, frecuencias esperadas Tg pag 491-493
iguales.
Prueba de bondad de ajuste, frecuencias esperadas
desiguales.
Bondad de ajuste para distribuciones binomial y
Poisson. Limitaciones de la  ²
.
Prueba de hipótesis de que la distribución de datos
Tg pag 494-498
proviene de una población normal.
Ref 1 pag 386391,393-397
Ref 7 pag 368Análisis de tablas de contingencia
370
Prueba  ² de independencia
Bondad de Ajuste Kolmogorov-Smirnov. Conceptos
básicos para distribución normal.
¿Qué es el análisis de correlación?
Coeficiente de correlación.
Coeficiente de Determinación.
Prueba de la importancia del coeficiente de
correlación
Análisis de regresión. Principio de los mínimos
cuadrados. Error estándar de la estimación.
Suposiciones de la regresión lineal.
Intervalos de confianza e intervalos de predicción
Quiz 3
Más sobre el coeficiente de determinación.
Relaciones entre el coeficiente de correlación, el
coeficiente de determinación y el error estándar de la
estimación. Transformación de datos
Evaluación de las suposiciones de la regresión lineal.
Medición de la autocorrelación: estadístico DurbinWatson.Un contraste de homogeneidad de varianza
para los residuales
Uso de Herramientas Estadísticas utilizando Microsoft
Excel.
Repaso y revisión del cumplimiento de los objetivos
del curso
Tg ejerc 11 a 14 pag 353
Ref 1 ejerc 10.55 al 10.68
pag 358
Tg ejerc 15 a 18 pag 359
Tg pag 381-391
Tg ejerc 13 a 20 pag 486
21 a 24 pag 490.
Ref 2 ejerc 14.1 al 14.10 pag
647, 14.11 y 14.12 pag 653
Tg ejerc 25 a 26 pag 494
Ref 1 ejerc 11.11 a 11.23 pag
391, 11.24 a 11.31 pag 398.
Tg ejerc 27 a 30 pag 497 y
47 a 60 pag 500
Ref 7 ejerc 10.12 pag 376
Tgpag 392-397
Tg ejerc 1 a 6 pag 388, 7 a
12 pag 391
Tgpag 399-411
Tg ejerc 13 a 20 pag 397, 21
a 24 pag 401, 25 a 28 pag
403
Ref 1 pag 433436
Ref 2 pag 602607
Tg ejerc 29 y 30 pag 405, 31
a 34 pag 409, 35 y 36 pag
412, 37 a 61 pag 414
Ref 1 ejerc 12.34 al 12.37
pag 436
Ref 2 ejerc 14.26 y 14.27 pag
607
*Del texto guía, usted debe revisar los ejercicios que se encuentran al final de
cada capítulo.