Download Diapositivas de Estadística

Document related concepts
no text concepts found
Transcript
Docente: MSc. Tania Díaz Iglesias
Email: [email protected]
[email protected]
1
Objetivos: Introducir los fundamentos y
principales aplicaciones de los métodos
estadísticos - probabilísticos.

Identificar las condiciones de aplicabilidad de cada una de
las herramientas estadísticas previstas en el curso.

Aplicar, a partir del software correspondiente, dichas
herramientas estadísticas que faciliten el proceso de toma de
decisiones.

Interpretar los resultados que se deriven de la aplicación de
estas herramientas.
Sistema de Conocimientos:
 Espacios muestrales y eventos. Cálculo de
probabilidades. Independencia. Variables
aleatorias. Distribuciones de probabilidad.
Medidas de tendencia central y dispersión.
Distribuciones más utilizadas. La
investigación estadística. Estadística
descriptiva. Algunas técnicas de muestreo
probabilístico. Tamaño de muestra. Pruebas
de hipótesis estadísticas




Caracterizar procesos a partir de la representación gráfica y
numérica de las distribuciones de las variables asociadas a
estos.
Calcular y seleccionar muestras para la aplicación de
encuestas.
Identificar y aplicar las herramientas estadísticas en el
procesamiento de encuestas.
Utilizar software especializado para el procesamiento de
información y análisis estadístico.
Tema I: Generalidades sobre estadística y probabilidades.
Introducción al SPSS.
Tema II: La estadística en la aplicación y procesamiento
de encuestas.
Tema III: Pruebas de Hipotesis



Levin, R.I. & Rubin, D.S.“Estadística para
Administradores”.6ª. Edición PRENTICE-HALL
HISPANOAMERICANA S.A., 1996.
Berenson, M. L.; Levine, D. M.; Krehbiel, T. C.
“Estadística para Administración”.Pearson Educación.
4ta edición. México, 2006.
Materiales complementarios elaboradas en soporte
digital.
Elementos importantes sobre
Probabilidades
Probabilidad. Un concepto sencillo
Medida matemática de la posibilidad de que
algo pase
Rango de variación: 0 – 1 ò 0 – 100%
Tres tipos de probabilidad
 Probabilidad clásica.
 Probabilidad frecuencial o estadística.
 Probabilidad subjetiva.
¿Distribuciones de probabilidad?
 Son como distribuciones de frecuencia teóricas.
 Describe la forma en que se espera que varíen los
resultados.
Teoría de las Probabilidades
Ofrece un modelo matemático para el
estudio de los fenómenos aleatorios
Algunos ejemplos:
•
•
•
•
•
lanzamiento de una moneda
el arribo de aviones a un aeropuerto
el % de artículos defectuosos
el tiempo hasta el fallo de un equipo
la llegada de clientes a una cola
Conceptos y definiciones de
Probabilidades
Punto muestral: Cada uno de los posibles
resultados de un fenómeno aleatorio.
Espacio muestral: Es el conjunto de todos los
puntos muestrales de un experimento aleatorio. Se
denotará por S.
Ejemplo:
Lanzamiento de una moneda (S: cara, escudo)
Lanzamiento de un dado (S: 1,2,3,4,5,6)
Conceptos y definiciones de
Probabilidades
Evento: Conjunto de puntos muestrales. Se
denotará con letra mayúscula: A, B,…
Ejemplo: A: que el dado muestre un # par.
Ocurrencia de un evento: Sea A un evento de
cierto experimento E. Diremos que el evento A
ocurre cuando al realizar el experimento E, el
resultado que obtenemos es un punto muestral de
A.
Álgebra de eventos
Operaciones que pueden realizarse entre
eventos tales como: suma ( +), el
producto ( .) ó el complemento de un
evento (').
Siendo A y B dos eventos cualesquiera de un
espacio muestral S:
A  B ó A+B: Subconjunto de S que contiene
todos los elementos que están en A, en B ó
en ambos.
A  B ó A*B: Subconjunto de S que contiene los
elementos que están a la vez en A y en B.
A': Subconjunto de S que contiene todos los
elementos de S que no están en A
(complemento de A).
Diagrama de Venn
A
B
A
B
S
S
AB
AB
A
S
A'
Álgebra de eventos
Eventos mutuamente excluyentes:
Cuando la ocurrencia simultánea de dos
eventos A y B sea imposible, se dice que
estos eventos son mutuamente excluyentes.
A.B=
Álgebra de eventos
Eventos exhaustivos:
Cuando la suma de dos eventos A y B da
como resultado el espacio muestral S, se
dice que estos eventos son exhaustivos
A + B =S
m
P(A) 
n
Donde:
m: casos favorables a la ocurrencia de A
n: todos los casos que puedan ocurrir
N ( A)
P( A) 
N (S )
Donde:
N(A): puntos muestrales de A
N(S): puntos muestrales de S
Suponga el experimento aleatorio
correspondiente al lanzamiento de un dado
perfectamente balanceado de 6 caras:
a) Describa el Espacio Muestral
correspondiente.
b) Describa y calcule las probabilidades de los
eventos siguientes:
◦
◦
◦
A: Que salga par
B: Que salga impar
C: Que salga un número mayor que dos.
P(A) = fr (A) = f(A)/n
Donde:
fr(A): frecuencia relativa de ocurrencia del
evento A
f(A):cantidad de veces que ocurrió el evento A
en las n pruebas realizadas
n: cantidad de pruebas realizadas
1. La probabilidad es un número real positivo o cero para cualquier evento
A.
P(A) ≥ 0
2. Todo espacio muestral tiene la probabilidad 1
P(S) = 1
3. Si A y B son dos eventos mutuamente excluyentes cualesquiera:
P(A+B) = P(A) + P(B)
si A.B = ø
1. P (ø) = 0
2. P (A') = 1 - P(A)
3. P (A+B) = P(A) + P(B) - P(A.B)
4. P (A.B') = P (A) - P(A.B)
5. P (A'.B') = P (A+B)'
6. P (A'+B') = P (A.B)'
si A.B ≠ ø
Si A y B son eventos de un espacio de
probabilidad, tales que P(B) > 0; entonces la
probabilidad condicional de A dado B es:
P(A B)
P(A / B) 
P(B)
siendo P(B)  0
P(A . B) = P(A/B) . P(B) = P(B/A) . P(A)
Para eventos independientes:
P(A . B) = P(A) . P(B)

Se dice que dos o más eventos son
independientes si la ocurrencia o no
ocurrencia de uno no afecta de ninguna
manera la ocurrencia de cualquiera de los
otros.
Variables aleatorias. Clasificación
31


Dado un Espacio Muestral S de un
experimento aleatorio, una variable aleatoria
(va) es cualquier regla que asocia un número
con cada resultado de S.
Una variable aleatoria es generalmente
denotada como “x”, pudiendo ser discreta o
continua.
Una VA es discreta si su conjunto de valores
posibles es un conjunto discreto, es decir, está
formado por un número contable o numerable
en secuencia.
Una VA es continua si su conjunto de posibles
valores es todo un intervalo de números,
enteros o fraccionarios.

Cualitativas o discretas: Conjunto finito o
numerable de valores posibles (atributos,
etiquetas, …)
◦ Nominales
◦ Ordinales

Cuantitativas o continuas: Conjunto infinito
de valores posibles.
35

Lugar de nacimiento
Profesión
36

Peso
Edad
◦ Bajo
◦ Medio
◦ Alto
Adolescente
Adulto
Temperatura
Baja
Media
Alta
37

Peso
Edad
Temperatura
◦ Kg
años
ºC
38
Sea p una función de una variable real,
discontinua, que toma valores en el intervalo
[0,1] subconjunto de R; p es una función de
probabilidad de una variable aleatoria X si:
 p( X )
xR
1
Sea f una función real integrable; f es una
función de densidad probabilística si:
f(X)  0,
 x R



f ( X ) dx  1
Sea p una función de una variable real,
discontinua, que toma valores en el intervalo
[0,1] subconjunto de R; p es una función de
probabilidad de una variable aleatoria X si:
 p( X )
xR
1
Sea f una función real integrable; f es una
función de densidad probabilística si:
f(X)  0,
 x R



f ( X ) dx  1
Definiciones de Estadística
Estadística: Censo o recuento de la población, de los
recursos naturales o industriales o de otra manifestación de
un Estado, comarca, etc. Estudio de los hechos que se
pueden numerar o contar y del resultado de la comparación
de las cifras que a ellos se refieren (Diccionario ARISTOS).
Estadística Aplicada: Es la parte de las Matemáticas que
tiene por objeto el desarrollo de técnicas para el
conocimiento numérico de un conjunto.
Estadística:
recolectar,
interpretar
evaluarse la
El desarrollo y aplicación de métodos para
organizar, presentar, resumir, analizar e
datos cuantitativos, de manera que pueda
confiabilidad de sus resultados.
Estadística: Está relacionada con los métodos científicos para la recolección,
organización, tabulación, presentación y análisis de los datos, así como para
sacar conclusiones válidas y tomar decisiones razonables en base a ese análisis.
Estadística: Investiga la posibilidad de obtener inferencias válidas a partir de los
datos estadísticos y construye los métodos para realizar dichas inferencias.
Estadística: Trata de problemas relativos a las características operatorias de las
reglas de comportamiento inductivo basado en experimentos aleatorios.
Estadística: Estudia los fenómenos decisorios estadísticos.
Estadística general: estudia métodos para obtener información acerca de la
estructura de la población respecto a las características escogidas y se dan
procedimientos para expresar esa información en forma compacta.
Ciencia cuyo objeto es la creación de métodos y
técnicas que permitan recolectar, organizar, tabular,
presentar y analizar datos estadísticos con el fin de
obtener conclusiones científicas para tomar decisiones y
aplicarlas en la práctica.



Descripción de grandes colecciones de
datos empíricos y su reducción a
estadígrafos. (Estadística Descriptiva).
Análisis científico de datos experimentales
(Inferencia Estadística).
Predicción del futuro (Máxima aspiración
práctica de toda ciencia).




Describe
Caracteriza
Resume
Organiza
Descriptiva

A partir del estudio de
una muestra, se
“infieren” conclusiones
para la población.
Inferencial
48
Población
Muestra
Definición
Conjunto de elementos Parte de la población
que van a ser
seleccionada para la
considerados en la
investigación
investigación
Características
Parámetros: cualquier
característica medible
de la población
Estadígrafos: función
evaluada con lo datos
de una muestra
Símbolos
Tamaño: N
Media: 
Desviación estándar: 
Tamaño: n
Media: x
Desviación estándar: s
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos.
6. Presentación de los resultados.
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea
estadística.
Definir
objetivo de la investigación
(incluye el objeto)
3. Adquisición o registro
de los datos necesarios.
Ejemplo:
de mantenimiento,
4. Tratamiento estadístico
de losproblemas
datos.
fluctuación de la fuerza de trabajo, etc.
5. Análisis de los datos.
6. Presentación de los resultados.
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro
de los datos necesarios.
•Preparación
teórica (características
locales y temporales del objeto de
4. Tratamiento estadístico
de los datos.
investigación;
definir
unidad
de
5. Análisis de los datos.registro)
•Preparación técnico-organizativa (tipo
de registro, extensión del registro y
6. Presentación de los resultados.
frecuencia del registro)

Definir la unidad de registro
Ejemplo, en el análisis de los activos fijos, las
unidades de registro pueden ser los equipos o
máquinas, en el análisis de la fuerza de trabajo
las unidades son los obreros, en el análisis de
los costos las unidades pueden ser los
productos....
Definir
las características locales, temporales y
objetivas de la unidad de registro
Ejemplo : Objeto de investigación: Análisis de las especificaciones para
el tiempo de servicio de un mesero o dependiente de un Restaurante ( a
la
carta o de
especializados).
Objeto
investigación: Análisis de las
especificaciones
de calidad del diámetro de los ejes
Unidad de registro: dependiente
utilizados en los molinos de los centrales.
Unidad
de registro:
ejes
Características
locales y temporales:
Restaurante (Restaurante Italiano,
todo
incluido), segunda
semana, noviembre 2007.
Fecha:
Julio/00-Oct/01
Material:
Acero 45
Características objetivas: anticipación, años de experiencia, sexo (f ó
Longitud
Peso: 46.5 Kg
M), edad, ….del eje: 1540 mm
Diámetro: 74.91.5mm
Variable a estudiar: tiempo de servicio (desde que el cliente entra hasta
Lugar:
Taller de Corte 44420 .Empresa Planta
que se le sirve el plato fuerte):≤ 10 minutos.
Mecánica



Establecimiento del tipo de registro a realizar
Determinación de la frecuencia del registro
Determinación de la extensión del registro
Determinación de la extensión del registro


Registro Total
Registro por Muestreo
Registro Total: Es muy costoso, requiere gran
cantidad de medios y fuerza de trabajo en
largos períodos, tal es el caso de los censos de
población.
Registro por Muestreo: Es más barato, requiere
menos recursos, pero tiene la desventaja de
que requiere ser diseñado correctamente para
que la muestra sea representativa de la
población.
Muestra representativa: Es aquella que
contiene todas las características de la
población en la misma proporción en que
figuran en esa población.
Ejemplo: si nuestra población de mujeres
tiene una tercera parte de mujeres de raza
negra, una muestra que sea representativa de
la población respecto a la raza deberá tener
una tercera parte de mujeres de raza negra.
El Muestreo es una herramienta de la
investigación científica cuya función básica es
determinar, que parte de una población debe
examinarse, con el fin de hacer inferencias
confiables sobre el total de la población de
procedencia.
Importancia del muestreo
El hecho de utilizar un muestreo en un estudio
estadístico tiene los siguientes fines:
Práctico (rápido)
Lógico (si las pruebas son destructivas)
Económico (ahorra recursos de todo tipo)
Tipos de muestreo
Aleatorio
o probabilístico
No aleatorio o no probabilístico
Muestreo aleatorio
Cada elemento de la población tiene alguna
probabilidad de pertenecer a la muestra. Este
tipo de muestreo exige más análisis estadístico
y planeación al inicio de una investigación.
Muestreo Aleatorio
Muestreo
Aleatorio Simple o M.A.S.
Muestreo Estratificado
Muestreo Sistemático
Muestreo por Conglomerados o Agrupado
Muestreo aleatorio simple: Método para
seleccionar muestras de manera que cada
miembro de la población tiene igual
probabilidad de quedar incluido.
Métodos para aleatorizar una población:
utilización de tablas aleatorias
programas de aleatorización en los paquetes
estadísticos
Muestreo Aleatorio Simple o M.A.S
Diseño muestral:
Se enumeran todos los miembros de la
población y luego seleccionamos un número
de forma aleatoria, aquel elemento de la
población que posea dicho número será
seleccionado constituyendo el primer
elemento de la muestra.
Muestreo Aleatorio Simple o M.A.S
recomendable
su uso cuando tenemos una población
relativamente homogénea en que todos sus
elementos sean accesibles.
Al aplicar una encuesta a los clientes en un hotel
(diferentes nacionalidades), para medir calidad del
servicio quizás si se aplica este tipo de muestreo no
se garantice la representatividad de la muestra.
Muestreo estratificado
En este tipo de muestreo la población se
divide precisamente en esos grupos
homogéneos llamados estratos y se toman
muestras aleatorias separadamente en cada
uno de los estratos.
Estratos:
Grupos dentro de una población
formados de tal modo que cada grupo es
relativamente homogéneo, pero existe una
variación más amplia entre los grupos.
Muestreo Estratificado
Diseño muestral:
Se determina el tamaño de muestra dentro de
cada estrato, los elementos dentro de cada
estrato se seleccionan aleatoriamente
Determinación del tamaño de muestra dentro de cada estrato



Afijación simple: a cada categoría se le asigna el mismo
número de individuos.
Afijación proporcional: la asignación de los individuos a cada
categoría es proporcional al número de individuos que la
componen.
Afijación óptima: el número de individuos que se asigna a
cada categoría está en función de la desviación típica. Así,
cuando en una categoría la desviación típica es muy pequeña,
nos bastará con una muestra pequeña.
Determinación del tamaño de muestra dentro
de cada estrato

Afijación proporcional:
Ni
ni  n  N


Ni: tamaño de la población del estrato
ni: tamaño de la muestra del estrato
Muestreo estratificado
Es recomendable su en poblaciones en las que se
pueden diferenciar grupos con características
propias. Cuando los miembros de estos grupos
individuales son relativamente homogéneos, pero los
grupos difieren considerablemente entre sí, el
muestreo estratificado es mejor que el aleatorio
simple para inferir acerca de los parámetros de la
población.
Muestreo Estratificado
Ejemplo
En una empresa que brinda servicios al turismo se decidió
realizar una encuesta a los trabajadores con el objetivo de
valorar algunos elementos de la cultura organizacional que
pudieran ser causa de los bajos rendimientos registrados en los
últimos meses. Los investigadores consideraron, de acuerdo a
los objetivos del estudio y a las hipótesis planteadas, que sería
conveniente considerar como estratos las diferentes categorías
ocupacionales. En la empresa laboran 150 trabajadores,
divididos en cinco categorías ocupacionales. Se determinó que el
tamaño de muestra debía ser de 80 encuestados.
Realice el diseño muestral y determine cuántos trabajadores se
encuestarán por categorías
Muestreo Estratificado
Ejemplo19
Categorías
Ni
Dirigentes
5
Técnicos
25
Administrativos
13
Servicio
12
Obreros
95
Total
150
ni
Muestreo Estratificado
Pueden formarse estratos por edades, género,
ocupación, nacionalidad, nivel
socioeconómico …
Muestreo sistemático: Método de muestro
aleatorio, en el cual los elementos se
seleccionan a intervalos uniformes que se
miden en el tiempo, orden o espacio.
Muestreo sistemático
Diseño muestral:
Se realiza fijando, en primer lugar, un tamaño de
muestra determinado y calculando después el
cociente N/n: un elemento cada 100, uno cada 50,
etc.; aunque puede fijarse a priori esta proporción o
frecuencia: un elemento cada 15 minutos.
En Esta forma de muestreo sólo se selecciona
aleatoriamente un elemento: el primero.
Muestreo sistemático
Este muestreo se usa frecuentemente en Control de la
Calidad, Control de Procesos, Estudio del trabajo. Sin
embargo tiene el peligro de que los resultados
obtenidos en la muestra estén viciados por factores
subjetivos, ya que se conoce de antemano qué
elemento va a ser seleccionado.
Muestreo sistemático
Ejemplo , Usted va a realizar 100 encuestas a
los clientes de un centro comercial donde
como promedio acuden diariamente 2000 de
ellos. Seleccione la muestra mediante un
muestreo sistemático, realice el diseño
muestral.
Muestreo no aleatorio
Consecutivo
Conveniencia
A criterio o intencional
Por cuotas
Con fines especiales
Muestreo no aleatorio
Consecutivo: consiste en reclutar todos los
individuos de la población, accesibles, en el
período de reclutamiento fijado.
Ejemplo: Se realiza un estudio para conocer
las horas de sueño diarias de niños recién
nacidos.
Se toman todos los bebés que acuden a un
centro de salud ¨X¨ durante un año.
Muestreo no aleatorio
Conveniencia: se seleccionan los sujetos más
accesibles (voluntarios, participa el que le
convenga)
Ejemplo: se coloca un anuncio en un
periódico para recabar individuos para
participar en la investigación.
Muestreo no aleatorio
A criterio o intencional: el investigador
selecciona a los sujetos que considera más
apropiados para formar la muestra.
Ejemplo: se desea realizar un trabajo en
grupo con expertos en un tema dado.
Ejemplo: se realiza una encuesta a pacientes
diabéticos para saber a que atribuyen su
enfermedad
Muestreo no aleatorio
Muestreo con fines especiales: Se escoge la
muestra de un grupo previamente concebido
aunque no sea representativa de la población.
Por ejemplo, niños que rompen juguetes.
Aspectos a considerar en la delimitación del tamaño
de muestra

Si se trata de una población finita o infinita.

Nivel de confianza deseado.

Nivel de homogeneidad o heterogeneidad en la población, en
cuanto a la variable a estudiar.Esta característica (que más
adelante se verá que queda reflejada en el valor de p) se puede
estimar a través de muestras pilotos, experiencias previas o a
partir de conjeturas de los investigadores.

Precisión deseada en la estimación.

Recursos disponibles para realizar la investigación.
Cálculo
del tamaño de la muestra en poblaciones infinitas
n 
2
Zα

pq
2
2
d
n
= tamaño de la muestra.
Zα/2 = percentil de la distribución normal relacionado con el nivel de
confianza seleccionado por el investigador.
p = proporción estimada de la población que establecería un acuerdo
determinado sobre la variable a estudiar.
q = 1- p
d = error muestral, margen de error o diferencia máxima entre la media de la
muestra y la de la población que estamos dispuestos a aceptar.

Ejemplo
Para realizar una encuesta de satisfacción a clientes
de un determinado centro comercial, en la que
queremos una confianza del 95% que determina
que Z=1.96, deseamos un error muestral del 5% (d)
y consideramos que estarán satisfechos el 50%
(p=q=0.5) necesitaríamos una muestra de 385
clientes.
Cálculo
del tamaño de la muestra en poblaciones finitas
2
N Zα
n
2
d
n


pq
2
N  1  Z 2α
2

pq
= tamaño de la muestra.
Zα/2 = percentil de la distribución normal relacionado con el nivel de
confianza seleccionado por el investigador.
p = proporción estimada de la población que establecería un acuerdo
determinado sobre la variable a estudiar.
q = 1- p
d = error muestral, margen de error o diferencia máxima entre la media de la
muestra y la de la población que estamos dispuestos a aceptar.
Ejercicio
Se desea realizar una encuesta en el Hotel “X” referida
a la satisfacción de los clientes con la calidad del
alojamiento (habitación y cuarto de baño): incluye la
comodidad de las camas, iluminación, Mobiliario,
limpieza y funcionamiento del equipamiento. En el
hotel están hospedados 1000 turistas y queremos un
nivel de confianza del 95% que determina Z=1.96,
deseamos un error muestral del 5% y consideramos
que estarán satisfechos el 50% (p= 0.5) ¿Cuántos
turistas necesitaríamos encuestar?
Ejercicio
Un investigador de una empresa de urbanización quiere averiguar las
opiniones de los residentes ante las instalaciones recreativas del lugar y
los mejoramientos que les gustaría que se hicieran. En ese desarrollo
urbano viven residentes de varias edades y niveles de ingresos, pero
una gran proporción tiene un alto nivel de ingreso y su edad fluctúa
entre 30 y 50 años.
El investigador todavía no está seguro de que haya diferencias entre los
grupos de edad y los niveles de ingreso respecto al deseo de las
instalaciones recreativas. ¿Conviene aplicar en este caso:
Muestreo aleatorio simple.
Muestreo sistemático.
Muestreo de juicio.
Muestreo de conveniencia.
Muestreo aleatorio estratificado.
Estadística Descriptiva: Resultado del proceso
de tabulación u organización de los datos.
Se puede tener la información de la siguiente forma.
Recolección simple o no organizada: es decir listado
de los datos, presentación en su forma primaria.
Organizados: ordenamiento en tablas: que a su vez
pueden estar, agrupados o no.
 no agrupados: es decir se leen directamente los
valores observados.
agrupados: se construyen intervalos para resumir la
información observada.
¿Qué quiere decir Organizados?
 Cuando los datos se presentan en forma de tabla
de frecuencia. Esto es, se colocan los datos en
columnas que representan:
-los distintos valores de la variable.
-las frecuencias (las veces) conque ocurren sus
valores
Distribución de frecuencias: Representación tabular
de los datos correspondientes a una variable.
¿Por qué se dice que los datos están
organizados, pero no agrupados?
 Porque en esta tabla, se muestran todos y
cada uno de los valores que toma la variable.
La tabla puede ser ampliada con otros tipos
de frecuencia como:
 fi: frecuencia relativa = ni/n (definición
frecuencial de probabilidad)
 Ni: frecuencia absoluta acumulada
 Fi : frecuencia relativa acumulada
 Punto medio de la clase: (semisuma de los
límites de las clases)
Li  Ls
Yi 
2
Intervalo
Frecuencia
absoluta (ni)
Frecuencia relativa
(fi)
Frecuencia
acumulada
absoluta (Ni)
Frecuencia
acumulada relativa
(Fi)
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos. Preguntas sobre los datos
6. Presentación de los resultados.
1. ¿De dónde vienen los datos?. ¿La fuente es
parcial?, es decir, ¿es posible que haya un
interés en proporcionar datos que conduzcan
a una cierta conclusión más que a otras?.
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos. Preguntas sobre los datos
6. Presentación de los resultados.
2. ¿Los datos comprueban o contradicen otra
evidencia que se posee?
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos. Preguntas sobre los datos
6. Presentación de los resultados.
3. ¿Hace falta alguna evidencia cuya ausencia
podría ocasionar que se llegue a una
conclusión diferente?
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos. Preguntas sobre los datos
6. Presentación de los resultados.
4. ¿Cuántas
observaciones
se
tienen?
¿Representan a todos los grupos que se
desea estudiar?.
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos. Preguntas sobre los datos
6. Presentación de los resultados.
5. ¿La conclusión es lógica? ¿Se ha llegado a
conclusiones
que
nuestros
datos
no
confirman?
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos.
6. Presentación de los resultados.
La investigación estadística
1. Planteamiento de la tarea estadística.
2. Preparación de la tarea estadística.
3. Adquisición o registro de los datos necesarios.
4. Tratamiento estadístico de los datos.
5. Análisis de los datos.
6. Presentación de los resultados.
10
5

Datos…

20 observaciones
10
6
Valores
xi
1
2
3
4
5
6
Total
Frecuencias Frecuencias Frecuencias Frecuencias
acumuladas
relativas
relativas
ni
acum.
Ni
fi=ni/N
Fi=Ni/N
2
2
4
5
5
2
20
2
4
8
13
18
20
0.10
0.10
0.20
0.25
0.25
0.10
1.00
0.10
0.20
0.40
0.65
0.90
1.00
10
7
Valores
xi
Frecuencias Frecuencias Frecuencias Frecuencias
acumuladas
relativas
relativas
ni
acum.
Ni
fi=ni/N
Fi=Ni/N
1
2
3
4
5
6
Total
2
2
4
5
5
2
20
2
4
8
13
18
20
0.10
0.10
0.20
0.25
0.25
0.10
1.00
6
25
5
20
4
0.10
0.20
0.40
0.65
0.90
1.00
15
3
10
2
10
8
1
5
0
0
1
2
3
4
5
6
1
2
3
4
5
6
10
8

Datos…

50 observaciones
10
9
Clases
Marca de
clases
di
[50,60]
(60,70]
(70,80]
(80,90]
(90,100]
55
65
75
85
95
Total
Frecuencias Frecuencias Frecuencias Frecuencias
acumuladas relativas
relativas
ni
acum.
Ni
fi=ni/N
Fi=Ni/N
5
10
25
8
2
50
5
15
40
48
50
0.10
0.20
0.50
0.16
0.04
1.00
0.10
0.30
0.80
0.96
1.00
11
0
Clases
Marca de
clases
di
Frecuencias
ni
Frecuencias
acumuladas
Ni
Frecuencias
relativas
55
65
75
85
95
Total
5
10
25
8
2
50
5
15
40
48
50
0.10
0.20
0.50
0.16
0.04
1.00
[50,60]
(60,70]
(70,80]
(80,90]
(90,100]
30
60
25
50
20
40
15
30
10
20
5
10
0
11
1
0
55
65
75
85
95
55
65
fi=ni/N
75
Frecuencias
relativas
acum.
Fi=Ni/N
0.10
0.30
0.80
0.96
1.00
85
95
11
1
Medidas de tendencia central
11
2

Elemento que más se repite

Ejemplos:
◦ 2
3
5
5
5
8
Mo=5
◦ 2
2
5
5
7
8
Mo=2 Mo=5
11
3


Valor que divide la muestra en dos partes
iguales
Ejemplos:
◦2
3
◦2
◦2
4
Me=4
5
6
3 4
5
6
7
Me=4.5
3
5
6
700
Me=4.5
4
11
4


Valor promedio
Ejemplos:
◦ 3
◦
◦ 4
n
x
4
5
Media=4
4
4
Media=4
x
i 1
i
n
11
5

Analizar – Estadísticos descriptivos – Frecuencias…
11
6
11
7
Medidas de posición
11
8



Cuartiles: son tres valores que dividen a la
muestra en cuatro partes iguales
Percentiles: valores que dividen a la muestra
en 100 partes iguales
Cuantiles: valores que dividen a la muestra en
partes iguales
11
9

Analizar – Estadísticos descriptivos – Frecuencias…
12
0
12
1
Medidas de dispersión
12
2


Medida cuadrática de variabilidad

1 n
V  X    xi  x
n i 1
Ejemplos:
◦3
7
9
Var=6.22
◦4
4
4
Var=0

2
12
3

Medida lineal de variabilidad

Ejemplos:
s   V X 
◦3
7
9
s=2.49
◦4
4
4
s=0
12
4

Rango = máximo – mínimo

Ejemplos:
◦3
3
3
Amplitud=0
◦1
3
5
Amplitud=5-1=4
12
5

Analizar – Estadísticos descriptivos – Frecuencias…
12
6
12
7
Medidas de distribución
12
8

Nos permite identificar si los datos se
distribuyen de forma uniforme alrededor del
punto central (media)
12
9

g1 < 0: asimetría negativa

g1 = 0: simétrica

g1 > 0: asimetría positiva
◦ Los valores tienden a reunirse
más en la parte derecha de la
media
◦ Existe aproximadamente la
misma cantidad de valores a
los dos lados de la media, (±
0.5)
◦ Los valores se tienden a reunir
más en la parte izquierda de la
media
Características
Coeficiente de asimetría
13
0

Determina el grado de concentración que
presentan los valores en la región central de
la distribución
13
1

g2 > 0: Leptocúrtica
◦ Existe una gran
concentración de valores
alrededor de la media

g2 = 0: Mesocúrtica
◦ (± 0.5)

g2 < 0: Platicúrtica
◦ Existe poca concentración
de valores alrededor de la
media
Características
Coeficiente de curtosis
13
2

Analizar – Estadísticos descriptivos – Frecuencias…
13
3
Distribución simétrica
Distribución platicúrtica
13
4
Asimetría positiva
Leptocúrtica
13
5



Conocer cada una de las etapas componentes
del proceso de investigación por encuesta.
Aplicar, apoyados en el SPSS, las
herramientas estadísticas pertinentes en cada
una de los pasos del proceso de investigación
por encuestas.
Interpretar, a la luz del proceso de toma de
decisiones, los resultados derivados de la
aplicación de las herramientas estadísticas.
Encuesta
Herramienta para recolectar información mediante la
elaboración de un cuestionario sobre un tema o
temas específicos. Al hacer el cuestionario hay que
formular preguntas que revelen realmente la
información deseada (por ejemplo causas de
insatisfacción de los usuarios con el servicio
prestado)
La investigación por encuesta
1. Definición del problema y objetivos de la
investigación.
2. Selección y definición de las variables.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
La investigación por encuesta
1. Definición del problema y objetivos de la
investigación.
2. Selección y definición de las variables.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
La investigación por encuesta
1. Definición del problema y objetivos de la
Trabajo con expertos
investigación.
Prueba
piloto
2. Selección y definición de
las variables.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
Valorar:
1.
2.
3.
4.
5.
6.
7.
8.
La investigación por encuesta
Si el cuestionario responde a los objetivos del estudio
Si el cuestionario tiene lógica y consistencia interna.
La comprensión de las preguntas y aceptación por los encuestados.
Idoneidad de la secuencia de preguntas y de las preguntas cerradas
preestablecidas.
1. Definición del problema y objetivos de la
La discriminación de las preguntas.
investigación.
Idoneidad
de todos los aspectos del protocolo de procedimientos
Idoneidad y nivel de preparación de los encuestadores
2. Selección
y definición
las variables.
Aspectos
logísticos:
disponibilidad,de
recogida
y entrada de cuestionarios,
la propia supervisión, etc.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
La investigación por encuesta
1. Definición del problema y objetivos de la
investigación.
2. Selección y definición de las variables.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
Cálculo del tamaño de muestra
Población infinita:
n
2
Zα

pq
2
2
d
Población finita:
2
N Zα
n
2
d


pq
2
N  1  Z 2α
2

pq
Entendiendo el error muestral
1: si los resultados de una encuesta dicen que 100 personas
comprarían un producto y tenemos un error muestral del 5%
comprarán entre 95 y 105 personas.
2: si hacemos una encuesta de satisfacción a los empleados con un
error muestral del 3% y el 60% de los encuestados se muestran
satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total
de los empleados de la empresa lo estarán.
3: si los resultados de una encuesta electoral indicaran que un partido
iba a obtener el 55% de los votos y el error estimado fuera del 3%, se
estima que el porcentaje real de votos estará en el intervalo 52-58%
(55% +/- 3%).
La investigación por encuesta
1. Definición
del problema
y objetivos(Identificar
de la
• Revisión
de los cuestionarios
y
corregir errores)
investigación.
2. Selección
y definición
de las variables.
• Codificación,
clasificación
y preparación
de la base de datos
3. Diseño del cuestionario.
• Análisis de las preguntas y aplicación de
4. Validación
y prueba del cuestionario.
técnicas estadísticas
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
Fiabilidad del cuestionario
(Coeficiente Alfa de Cronbach)
La fiabilidad hace referencia al grado de
precisión que ofrecen las medidas obtenidas
mediante un test, es decir, es el grado en que
los ítems miden lo mismo
La investigación por encuesta
1. Definición del problema y objetivos de la
Trabajo
con expertos
investigación.
Fiabilidad
del
cuestionario
Prueba
piloto
2. Selección y definición de
las
variables.
3. Diseño del cuestionario.
4. Validación y prueba del cuestionario.
5. Selección de la muestra. Aplicación del
cuestionario.
6. Tratamiento y análisis de la información.
7. Presentación de los resultados.
Coeficiente Alfa de Cronbach
(Ejemplo)
SUJETOS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
ITEM1
4
2
5
3
5
2
5
4
2
3
2
4
2
4
1
4
ITEM2
5
2
6
2
6
1
3
5
1
2
3
5
3
5
2
5
ITEM3
5
1
4
3
4
1
2
5
1
1
1
6
1
4
1
6
ITEM4
4
2
5
3
5
1
5
5
2
1
2
4
1
6
2
5
TEST
18
7
20
11
20
5
15
19
6
7
8
19
7
19
6
20
Coeficiente Alfa de Cronbach
(Ejemplo)
SUJETOS
ITEM1 ITEM2 ITEM3 ITEM4
TEST
1
4
5
5
4
18
2
2
2
1
2
7
3
5
6
4
5
20
4
3
2
3
3
11
Item
1:
La
escuela
es
divertida
5
5
6
4
5
20
6
2
1
1
1
5
útiles 15
7 Item 2: En la 5escuela3aprendo
2 cosas 5
8
4
5
5
5
19
es1un rollo1
9 Item 3: La escuela
2
2
6
10
3
2
1
1
7
11Item 4: En la 2escuela3pierdo el
1 tiempo
2
8
12
4
5
6
4
19
2)muy
en desacuerdo;
131)completamente
2 en desacuerdo;
3
1
1
7
3) en desacuerdo; 4) de acuerdo; 5) muy de acuerdo; 6)
14
4
5
4
6
19
completamente de acuerdo
15
1
2
1
2
6
16
4
5
6
5
20
Reliability Statistics
Cronbach's
Alpha
.935
N of Items
4
Item-Total Statistics
La es cuela es divertida
En la es cuela aprendo
cos as útiles
La es cuela es un rollo
En la es cuela pierdo el
tiempo
Scale Mean if
Item Deleted
9.69
Scale
Variance if
Item Deleted
26.096
Corrected
Item-Total
Correlation
.842
Cronbach's
Alpha if Item
Deleted
.928
9.44
21.463
.883
.903
10.06
20.196
.840
.923
9.63
21.583
.881
.903
15
2


Son explicaciones tentativas del fenómeno
investigado.
Son proposiciones (Lógica Matemática)
15
3



H0: hipótesis nula o fundamental (hipótesis
de ninguna diferencia)
H1: hipótesis alternativa (por lo general
coincide con la hipótesis de investigación)
Ejemplos:
◦ H0: µ = µ0
◦ H1: µ ≠ µ0
15
4
Realidad
H0 cierta
H0 falsa
Aceptar H0
Decisión
correcta
Error de
tipo II (β)
Rechazar H0
Error de
tipo I (α)
Decisión
correcta
Acción
tomada
15
5





Error de Tipo I: Rechazar una hipótesis nula
(H0) cuando ella es cierta
 =Probabilidad de Error de Tipo I
: nivel de significación (5%)
Error de Tipo II: Aceptar la hipótesis nula (H0)
cuando debió ser rechazada
 = Probabilidad de Error de Tipo II
15
6



Significación < , se rechaza H0
Significación >= , se “acepta” H0
No existen razones suficientes para rechazar H0
15
7
Las técnicas o métodos estadísticos que no
parten del supuesto de que las distribuciones
o parámetros de la variable estudiada se
conocen,
son
llamados
Métodos
de
distribución libre ó Métodos no paramétricos
y tienen uso en gran variedad de situaciones.
1. Prueba de bondad del ajuste Kolmogorov-Smirnov
para una muestra
Se utiliza para probar el ajuste de un grupo de datos
a una distribución teórica dada, la Prueba de
Kolmogorov-Smirnov es muy potente para tamaños
de muestra pequeños.
H0: La variable sigue una distribución teórica X
 Estadígrafo:
Dn = máx | Fei - Fi |
donde:
Fei: Frecuencia relativa acumulada Esperada o Teórica
Fi: Frecuencia relativa observada Acumulada (se
determina cuando se agrupan los datos en clases)
Regla
de decisión (Región de rechazo de la H0):
Si
Dn > Dn* (Tabla Kolmogorov – Smirnov)
se rechaza la hipótesis de ajuste.
Prueba de Kolmogorov-Smirnov para una muestra
N
Parám etros norm ales a,b
Diferencias más
extrem as
Media
Desviación típica
Absoluta
Positiva
Negativa
Z de Kolmogorov-Sm irnov
Sig. as intót. (bilateral)
a. La distribución de contras te es la Norm al.
b. Se han calculado a partir de los datos.
tiempo de
servicio
45
31.24
2.917
.199
.199
-.146
1.332
.058
Otras pruebas no paramétricas: Podemos dividirlas en los grupos
siguientes:
1. Para dos muestras independientes.
Prueba U de Mann-Whitney
2. Para “k” muestras independientes.
Kruskal-Wallis H
3. Para dos muestras relacionadas
Prueba de Wilcoxon
Para k muestras relacionadas
Prueba de Friedman
Para una muestra
Prueba de rachas o corridas

Ejemplo En una instalación turística de Varadero, actualmente se
hospedan turistas de diferentes regiones del mundo (Europa, Asia,
Latinoamérica, América del Norte y África). Aprovechando la gran
representatividad de culturas que actualmente existe entre los
huéspedes del hotel, la gerencia decidió aplicar una encuesta para
evaluar los servicios recreativos y gastronómicos que se brindan.
Para ello, se aplicó una encuesta a 15 turistas de Asia, 12 de Europa,
21 de Latinoamérica, 14 de América del Norte y 10 de África. Entre
los ítems que incluía la encuesta existía uno relacionado con el nivel
de satisfacción con las actividades que se desarrollan en el cabaret.
Dicho nivel de satisfacción se evaluó en una escala de 1 a 10 (1
totalmente insatisfecho y 10 totalmente satisfecho). Al inicio de la
investigación se trazó como objetivo comparar las distintas regiones
en cuanto a su nivel de satisfacción. A continuación se muestran los
resultados obtenidos en la aplicación de la encuesta a los turistas
Asiáticos y de América del Norte.
Asia
4
5
3
6
5
4
7
4
3
2
3
4
5
6
América
Norte
6
7
8
5
6
7
8
9
6
6
5
6
7
8
7
¿A qué conclusión puede usted arribar a
partir de la aplicación a los datos anteriores
de la prueba de hipótesis correspondiente?
Trabaje con un nivel de confianza del 95%.
Rangos
PUNTAJE
país
Asia
América
Total
N
15
14
29
Rango
promedio
9.93
20.43
Suma de
rangos
149.00
286.00
Te st St atist icsb
Ma nn-Whitn ey U
Wi lcoxo n W
Z
As ymp. Sig. (2-ta iled)
Exact Sig. [2 *(1-tailed
Sig .)]
PUNTAJE
29 .000
14 9.00 0
-3.364
.00 1
a. No t cor recte d for ties.
b. Gr oupin g Va riab le: pa ís
a
.00 1
En el Hotel “Los Caneyes” se aplicó una encuesta para
evaluar algunos elementos del clima organizacional.
Uno de los ítems que estaba en el cuestionario era: el
ambiente de trabajo en el hotel me incentiva día a
día. La escala establecida para este ítem fue de 1
(totalmente en desacuerdo hasta 5 totalmente de
acuerdo). Se sospecha que existen diferencias entre
los graduados de nivel superior y los demás
trabajadores en cuanto a este ítem. A continuación
aparecen los resultados de la aplicación de la
encuesta a 12 graduados de nivel superior y 15 otros
trabajadores.
Nivel superior
2
3
2
4
1
3
2
4
2
3
1
2
Otros
trabajadores
4
2
4
5
4
5
6
3
4
5
3
4
5
4
4
¿A qué conclusión puede usted arribar a
partir de la aplicación a los datos anteriores
de la prueba de hipótesis correspondiente?
Trabaje con un nivel de confianza del 95%.

Ejercicio En una instalación turística se aplica desde
hace seis meses un nuevo sistema de
mantenimiento. Para comprobar la efectividad de
dicho sistema se realizó hace 1año atrás (cuando
no existía el sistema actual) una encuesta, la cuál
fue repetida recientemente. En la siguiente tabla se
muestran los resultados de la encuesta a 20
trabajadores. Los datos representan la suma de las
puntuaciones de la encuesta para cada trabajador,
donde los mayores valores corresponden a los
aspectos positivos, es decir, mayor efectividad.
Trab.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1 año
antes
14
15
14
13
15
16
14
12
14
15
12
14
15
16
14
13
12
14
15
16
actual
15
16
17
15
17
18
14
13
15
14
13
15
14
14
15
14
13
15
16
15
¿A qué conclusión puede usted arribar a
partir de la aplicación a los datos anteriores
de la prueba de hipótesis correspondiente?
Trabaje con un nivel de confianza del 95%.
Ranks
N
puntaje des pues
- puntaje antes
Negative Ranks
Positive Ranks
Ties
Total
4a
15 b
1c
20
Mean
Rank
9.75
10.07
a. puntaje des pues < puntaje antes
b. puntaje des pues > puntaje antes
c. puntaje antes = puntaje despues
Test Statisticsb
Z
As ymp. Sig. (2-tailed)
puntaje
despues puntaje
antes
-2.368a
.018
a. Based on negative ranks .
b. Wi lcoxon Signed Ranks Test
Sum of
Ranks
39.00
151.00

Ejemplo La gerencia de cierta instalación hotelera ha
decidido realizar estudios sobre la calidad de sus servicios
pues sus niveles de ocupación han disminuido
considerablemente lo que se corrobora con los resultados de
las encuestas realizadas a los turistas al evaluar la calidad
percibida.
Se realiza una generación de gráficos de pareto y se detecta
que el servicio de restaurante es el que mayor problemas
presenta (aproximadamente 70%).
Se decidió hacer primeramente un trabajo con 8 expertos
para determinar los requisitos fundamentales que están
afectando la calidad de este servicio, para esto se les pidió
que evaluaran cada uno en una escala del 1(el que más está
afectando la calidad del servicio) al 9(el que menos está
afectando la calidad del servicio) obteniéndose:
No
Requisito
1
Rapidez del servicio
2
Higiene
3
Variedad
4
Temperatura de los alimentos
5
Dominio del idioma
6
Presentación del plato
7
Sabor de los alimentos
8
Cortesía y destreza
9
Proporción y cantidad de los alimentos
Requisito
Expertos
E1
E2
E3
E4
E5
Rj
E6
E7
E8
1
2
1
1
1
2
2
2
2
13
2
4
4
4
4
4
3
3
4
30
3
5
5
5
5
3
5
5
3
36
4
3
3
3
3
5
4
4
5
30
5
9
9
9
7
7
9
7
9
66
6
8
8
8
9
9
7
9
8
66
7
1
2
2
2
1
1
1
1
11
8
6
6
6
6
6
8
8
6
52
9
7
7
7
8
8
6
6
7
56
Ra ngos
Rapidez del servicio
Higiene
Variedad
Temperatura de los
alimentos
Dominio del idioma
Presentación del plato
Sabor de los alimentos
Cortes ía y destreza
Proporción y cantidad
de los alimentos
Rango
promedio
1.63
3.75
4.50
3.75
8.06
8.31
1.38
6.63
7.00
Estadísticos de contraste
N
W de Kendalla
Chi-cuadrado
gl
Sig. as intót.
8
.916
58.619
8
.000
a. Coeficiente de concordancia de Kendall
Aplicación especial K- Muestras Relacionadas (Test Kendall´s W)
N
P
a
r
T
e
s
t
s
K
e
n
d
a
l
l
'
s
W
T
e
s
t
Ranks
problema1
problema2
problema3
problema4
problema5
problema6
problema7
problema8
problema9
problema10
problema11
problema12
Mean Rank
11.50
11.50
9.38
9.63
7.50
1.13
5.38
5.50
7.50
2.88
3.75
2.38
Test Statistics
N
Kendall's Wa
Chi-Square
df
As ymp. Sig.
8
.971
85.481
11
.000
a. Kendall's Coefficient of Concordance
18
4
1.
2.
IBM SPSS Statistics Base.pdf
Illowsky, B. Collaborative Statistics, 2010
<http://cnx.org/content/col10522/1.38/>
18
5