Download ESTADÍSTICA DESCRIPTIVA CON STATA

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA DESCRIPTIVA CON
STATA
JUAN FRANCISCO ISLAS AGUIRRE
FORTINO VELA PEÓN
UAM-X
Abril, 2012
J. F. ISLAS / F. VELA
CECAD-UAMX
Objetivos
• Que el participante maneje el paquete estadístico Stata a
nivel básico a fin de estar en posibilidad de realizar
análisis de datos para la realización de trabajos
profesionales, fortaleciendo el uso de la herramienta
computacional que ofrece dicho paquete en la aplicación
de técnicas de estadística descriptiva y manejo de
información.
J. F. ISLAS / F. VELA
CECAD-UAMX
Bibliografía
• Sánchez, Octavio (2004). Probabilidad y Estadística,
McGraw Hill, México.
• Macchi, Ricardo L. (2003). Introducción a la Estadística en
Ciencias de la Salud, 1ª. Reimpresión, Editorial Médica
Panamericana
• Apuntes y notas de clase.
Aplicaciones
• Encuesta Nacional de Ingreso Gasto de los Hogares
(ENIGH).
• Encuesta Nacional de Salud (ENSA).
J. F. ISLAS / F. VELA
CECAD-UAMX
• Stata es una herramienta computacional diseñada para
realizar análisis estadístico la cual fue creada en 1985 por
StataCorp.
• El denominativo de Stata es una abreviación de las
palabras “Statistics" y "data ".
• Actualmente es utilizado tanto en
instituciones
académicas como en empresas donde sus usuarios se
ubican en las áreas de la economía, sociología, ciencia
política, ciencias de la salud y epidemiología.
J. F. ISLAS / F. VELA
• Sus capacidades incluyen :
.- Manejo y organización de datos
- Graficación.
- Análisis estadístico .
- Simulación.
- Programación de tareas.
CECAD-UAMX
J. F. ISLAS / F. VELA
CECAD-UAMX
• Actualmente, en el mercado se
encuentra la versión 11.
• Su lenguaje computacional es C.
• Existen
versiones
para
plataformas en Windows, Mac,
UNIX y LINUX.
Elementos teórico-conceptuales
J. F. ISLAS / F. VELA
CECAD-UAMX
¿Qué es la estadística?
• Es una disciplina asociada con las matemáticas que es
utilizada como herramienta en distintas áreas del
conocimiento para contar con procedimientos de
recolección, organización, síntesis, presentación, análisis
e interpretación de datos.
• Sirve también como medio en la contrastación de
hipótesis y/o teorías con la realidad, a través de
modelos.
J. F. ISLAS / F. VELA
CECAD-UAMX
• Aunque en todo estudio estadístico el primer paso es la
recolección de datos, es usual en un curso básico de
estadística asumir que los datos ya han sido recolectados
y que están disponibles.
• Por consiguiente, el trabajo comienza con el esfuerzo por
organizar y presentar estos datos de manera significativa
y descriptiva.
• Los datos deben colocarse en un orden lógico que revele
rápida y fácilmente el mensaje que contienen.
• Este procedimiento constituye la tarea de la estadística
descriptiva.
J. F. ISLAS / F. VELA
CECAD-UAMX
J. F. ISLAS / F. VELA
CECAD-UAMX
Clasificación de las variables
Discretas
Nivel de medición
Continuas
Escala de medición
Nominales
Ordinales
Intervalo
Continuas
Dependiente(s)
Función en la investigación
Grado de abstracción
Independiente(s)
Conceptuales o abstractas
Intermedias
Empíricas u observables
J. F. ISLAS / F. VELA
CECAD-UAMX
Escalas de medición de las variables
Nominales: nombres o clasificaciones que se utilizan
para datos en categorías distintas y separadas.
Ordinales: son las que clasifican las observaciones en
categorías con un orden significativo.
Intervalo: medidas numéricas en la cual el valor cero es
arbitrario pero la diferencia entre valores es importante.
Razón: medidas numéricas en las cuales el valor cero es
un valor fijo y la diferencia entre valores es importante.
J. F. ISLAS / F. VELA
CECAD-UAMX
J. F. ISLAS / F. VELA
CECAD-UAMX
Tablas de contingencia
• Son distribuciones de frecuencia de dos o mas variables
categóricas. También puede conceptualizarse como una
clasificación cruzada de los valores (o categorías) de dos
o mas variables mostrándose el número de
observaciones en cada celda reportada.
• Cuando se tienen dos variables, la tabla se denomina de
doble entrada (two way). Cuando son tres (three way).
• Se suelen llamar tablas cruzadas o crosstabs.
J. F. ISLAS / F. VELA
CECAD-UAMX
J. F. ISLAS / F. VELA
Tipos de tablas de contingencia
Goodman (1981) considera tres tipos de tablas:
1.
Las de distribución conjunta de dos
variables (i.e. peso y edad).
2.
Las de relación causal entre una
variable de respuesta que depende de
una variable explicativa (i. e. fumar y
cáncer).
3.
Las de asociación entre dos variables
de respuesta (i. e. actitud hacia el
aborto y actitud hacia el sexo
premarital).
CECAD-UAMX
J. F. ISLAS / F. VELA
tabulate p3_2a p3_6a
CECAD-UAMX
J. F. ISLAS / F. VELA
CECAD-UAMX