Download Ejemplo

Document related concepts
no text concepts found
Transcript
Estadística II
Plutarco Martínez Bustos
Calendario académico 2014 – 2
• Primer seguimiento: del 1 – al 6 de septiembre
• Segundo seguimiento: del 6 al 11 de octubre
• Tercer seguimiento: del 10 al 15 de noviembre
Contenido
• Unidad I. Distribuciones de probabilidad discretas y continuas
Distribución binomial, distribución de Poisson y distribución normal
• Unidad II. Intervalos de confianza
Intervalo de confianza para una y dos medias, intervalo de
confianza para una y dos proporciones
• Unidad III. Prueba de hipótesis
Prueba de hipótesis para una y dos medias
• Unidad IV. Uso del software estadística SPSS
Tablas de frecuencia, gráficos, medidas de dispersión, de tendencia
central, de forma, intervalos de confianza prueba de hipótesis.
• Unidad V. Técnicas de muestreo
Tipos de muestreo: Aleatorio simple, sistemático, estratificado por
conglomerados.
Bibliografía
• Levin Jack, Fundamentos de estadística en la
investigación social. 2da edición, Harla.
• Wayne D. Bioestadística Base Para el Análisis
de las Ciencias de la Salud. 4ta edición, Limusa
• Molina J y Rodrigo M. Estadística descriptiva
en Psicología. Material de clase. Disponible
en: http://ocw.uv.es/ciencias-de-lasalud/pruebas-1/1-3/ejercicios-proyectos-ycasos/
Distribuciones de Probabilidad
Una distribución de probabilidad indica toda la gama de
valores que pueden representarse como resultado de un
experimento si éste se llevase a cabo.
Toda distribución de probabilidad es generada por una
variable (porque puede tomar diferentes valores)
aleatoria x (porque el valor tomado es totalmente al azar)
El conocimiento acumulado en Psicología ha permitido
evidenciar como algunas variables de interés en este
campo se distribuyen de un modo característico, esto es,
tienen una distribución de probabilidad particular que se
repite a lo largo del tiempo y para diferentes muestras.
Distribuciones de Probabilidad
Variable aleatoria: Se define como cualquier característica
medible que toma diferentes valores con probabilidades
determinadas. Toda variable aleatoria posee una distribución
de probabilidad que describe su comportamiento. Si la
variable es discreta, es decir, si toma valores aislados dentro
de un intervalo, su distribución de probabilidad especifica
todos los valores posibles de la variable junto con la
probabilidad de que cada uno ocurra. En el caso continuo, es
decir, cuando la variable puede tomar cualquier valor de un
intervalo, la distribución de probabilidad permite determinar
las probabilidades correspondientes a con subintervalos de
valores. Dentro de las distribuciones a tratar están: la
distribución binomial, de Poisson (distribuciones discretas) y
la distribución normal (continua)
Distribución Binomial
La distribución binomial es una distribución discreta
muy importante que surge en muchas aplicaciones
bioestadísticas. Esta distribución aparece de forma
natural al realizar repeticiones independientes de
un experimento que tenga respuesta binaria,
generalmente clasificada como “éxito” con una
probabilidad 𝑝 y un “fracaso” con una probabilidad
𝑞 = 1 − 𝑝. Por ejemplo, esa respuesta puede ser el
hábito de fumar (sí/no), si un paciente hospitalizado
desarrolla o no una infección. La distribución de
probabilidad de la variable aleatoria binomial es:
Distribución Binomial
𝑛 𝑥 𝑛−𝑥
𝑏 𝑥, 𝑛, 𝑝 =
𝑝 𝑞
𝑥
Con 𝑥 = 0, 1, 2, … , 𝑛
Dónde:
𝑝: Probabilidad de éxito
𝑞 = 1 − 𝑝: Probabilidad de fracaso
𝑥: numero de éxitos
𝑛: Número de experimentos
Ejemplos
1. Supongamos que la probabilidad de que una pareja
tenga un hijo o una hija es igual. Calcular la probabilidad
de que una familia con 6 descendientes tenga 2 hijos.
2. En el programa de Psicología la probabilidad de que un
estudiante apruebe el semestre es del 90%. Si
consideramos 6 estudiantes, ¿Cuál es la probabilidad de
a. Tres estudiantes ganen
b. Tres pierdan
c. menos de dos pierdan
d. 5 ganen
Ejemplos
3. En la población colombiana la proporción de mujeres es de
0.60, ¿cuál es la probabilidad de que al extraer una muestra
aleatoria de 7 personas de esa población,
a. Dos son mujeres
b. al menos 5 son mujeres.
4. Los alumnos de cierta clase se encuentran en una
proporción del 67 % que estudian inglés y el resto francés.
Tomamos una muestra de 15 alumnos de la clase, calcular la
probabilidad de que:
a. Menos de tres alumnos de inglés.
b. De que los 15 alumnos estudien francés
c. De que estudien inglés entre 8 y 10 alumnos.
Distribución de Poisson
Los experimentos que resulten en valores
numéricos de una variable aleatoria X, que
representa el número de resultados durante un
intervalo o una región específica se llama
experimento de Poisson. Esta distribución esta dada
por:
𝑒 −𝜆 𝜆𝑥
𝑃 𝑥, 𝜆 =
𝑥!
Con 𝑥 = 0, 1, 2, … , 𝑛
Donde: 𝜆 = 𝑛𝑝 es el número promedio por
resultados y 𝑒 = 2,7182
Ejemplos
1. El psicólogo de una institución atiende en
promedio a 6 pacientes por día. Hallar la
probabilidad de que se atiendan
a. Cuatro pacientes en un día
b. Mas de tres pacientes en un día
2. La probabilidad de que un niño nazca pelirrojo
es de 0,012. ¿Cuál es la probabilidad de que
entre 800 recién nacidos hayan 5 pelirrojos?
Ejemplos
3. La probabilidad de que una persona adquiera una
enfermedad como consecuencia de la vacuna contra la
misma es de 0.0003. Hallar de que la adquieran
exactamente 5 personas de una población de 30000
vacunados.
4. La probabilidad de que un estudiante presente
problemas de escoliosis en una institución de la ciudad es
de 0.006. De los siguientes 2000 estudiantes revisados,
encuentre la probabilidad de que:
a. Menos de 3 presenten este problema
b. 3, 4, o 5 presenten este problema
c. Mas de 2 presentan este problema
Distribución Normal
Se trata de un modelo teórico de distribución de
probabilidad para variables aleatorias cuantitativas
continuas que se caracteriza, gráficamente, por tener
forma similar a la de una campana. Por ello, y por haber
sido estudiada inicialmente por el matemático Karl Gauss,
se le denomine también como curva o campana de
Gauss.
La importancia de esta distribución reside en el hecho de
que diversas variables, como los caracteres fisiológicos y
morfológicos de individuos —altura, peso, atributos
sociológicos, psicológicos y, en general, variables que
vienen determinados por muchos factores, se distribuyen
según el modelo de la curva normal.
Distribución Normal
En el caso de la distribución normal de parámetros
𝑥 y 𝜎, dicha función viene dada por:
2
𝑥−𝜇
1
−
𝑓 𝑥 =
𝑒 2𝜎2
2𝜋𝜎 2
Donde
𝜇: Media poblacional
𝜎 2 : Varianza
𝜎: Desviación típica o estándar
𝜋: 3.1416
Ejemplos
1. Hallar las siguientes probabilidades
a. 𝑝 𝑧 < 2.05
b. 𝑝 𝑧 < −1.25
c. 𝑝 𝑧 > 0.33
d. 𝑝 𝑧 > −2.34
e. 𝑝 −0.42 < 𝑧 < 2
f. 𝑝 1.58 < 𝑧 < 3
Ejemplos
2. Las estaturas de un grupo de estudiantes se
distribuyen de acuerdo a una distribución
normal de media 168 y desviación típica 8 cm.
Hallar la probabilidad de que un estudiante
mida:
a. Menos de 165 cm
b. Por lo menos 168 cm
c. Entre 166 y 170 cm?.
Ejemplos
3. Los pesos de 60 estudiantes siguen una
distribución Normal con media de 67 y desviación
estándar de 5. Calcula la probabilidad de que el
peso sea:
a) mayor de 80 kg.
b) 50 kg. o menos
c) menos de 60 kg.
d) como maximo 70 kg.
e) Entre 60 y 70 kg.
Ejemplos
4. Las puntuaciones de un determinado test
psicológico se distribuyen normalmente con
media de 15 y desviación típica de 5. Hallar la
probabilidad de que una persona obtenga:
a. Menos de 8 puntos
b. Por lo menos 10 puntos
c. Entre 13 y 16 puntos
Ejemplos
5. Las puntuaciones de un ejercicio de biología
fueron 1,2, … dependiendo del número de
respuestas correctas a 10 preguntas formuladas. La
puntuación media fue de 6.7 y la desviación típica
de 1.2. Suponiendo que las puntuaciones se
distribuyen normalmente. Hallar:
a. Porcentaje de estudiantes que obtuvo menos de
6 puntos
b. La puntación máxima del 10% más baja de la
clase
c. La puntuación mínima del 90% superior de la
clase
Ejemplo
6. La puntuación media en un examen final fue
de 72 y la desviación típica 9, El 97.5% de los
mejores alumnos recibió la calificación A. ¿Cuál
es la puntuación que un estudiante debe tener
para recibir un A?
Intervalos de Confianza
En el contexto de estimar un parámetro
poblacional, un intervalo de confianza es un
rango de valores (calculado en una muestra) en
el cual se encuentra el verdadero valor del
parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del
parámetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se
denota 1 − 𝛼
Intervalo de confianza para 𝜇
conociendo 𝜎
Si 𝑥 es la media de una muestra aleatoria de
tamaño 𝑛 de una población con varianza
conocida 𝜎 2
el intervalo de confianza
1 − 𝛼 100% para 𝜇 es:
𝜎
𝜎
𝑥 − 𝑧𝛼
< 𝜇 < 𝑥 + 𝑧𝛼
2 𝑛
2 𝑛
Donde 𝑧𝛼 2 es el valor de Z a la derecha del cual
se tienen un área de 𝛼 2
Ejemplos
1. Se ha obtenido una muestra de 35 alumnos
de una Facultad para estimar la calificación
media de los expedientes de los alumnos en la
Facultad. El promedio de esos 35 estudiantes
fue de 4.9. Se sabe por otros cursos que la
desviación típica de las puntuaciones en dicha
Facultad es de 2.01 puntos. Encuentre los
Intervalo de confianza del 90 % y 99% para la
calificación media de los expedientes de los
estudiantes.
Ejemplos
2. En una muestra de 65 sujetos las
puntuaciones en una escala de extroversión
tienen una media de 32.7 puntos y una
desviación típica de 12.64. Encuentre un
intervalo de confianza de 95% para la media
poblacional.
Ejemplos
3. En un hospital se ha tomado la temperatura a
una muestra de 64 pacientes para estimar la
temperatura media de sus enfermos. La media
de la muestra ha sido 37.1 °C y se sabe que la
desviación típica de toda la población es 1.04 °C.
Obtenga un intervalo de confianza, al 90 %, para
la media poblacional.
Intervalo de confianza para 𝜇 con 𝜎
desconocida
Si 𝑥 es la media de una muestra aleatoria de
tamaño 𝑛 de una población con varianza
desconocida 𝜎 2 el intervalo de confianza
1 − 𝛼 100% para 𝜇 es:
𝑠
𝑠
𝑥 − 𝑡𝛼
< 𝜇 < 𝑥 + 𝑡𝛼
2 𝑛
2 𝑛
Donde 𝑡𝛼 2 es un valor t Con 𝑣 = 𝑛 − 1 grados
de libertad del cual se tienen un área de 𝛼 2
Ejemplos
1. El consumo regular de cereales preendulzados
contribuye a la caída de los dientes, enfermedades
del corazón y otros procesos digestivos de acuerdo
con un estudio realizado. En una muestra aleatoria
de 20 porciones sencillas de un cereal el contenido
promedio de azúcar fue d 11.3 gramos con una
desviación estándar de 2.45 gramos. Suponiendo
que los contenidos de azúcar están distribuidos
normalmente, determine un IC del 95% para el
contenido promedio de azúcar de porciones
sencillas de dicho cereal
Ejemplos
2. Se desea hallar un intervalo de confianza para la
estatura promedio de todos los estudiantes de
Psicología de cierta universidad. Para tal efecto, de
los estudiantes de dicha carrera se seleccionó una
muestra aleatoria de 15 personas a quienes se les
preguntó su estatura en metros, obteniéndose los
siguientes resultados:
1.50, 1.63, 1.50, 1.69, 1.69, 1.79, 1.73, 1.69,
1.56, 1.70, 1.65, 1.74, 1.70, 1.70, 1.65
Halle un intervalo de confianza del 95%.
|
Ejemplos
3. La puntuación media de una muestra de 20
jueces de gimnasia rítmica, elegidos al azar, para
una misma prueba, presentó una media de 9,8 y
una desviación típica muestral de 0,09. Calcular
un intervalo de confianza con un 90% para la
nota media. (Suponemos que la variable que
mide la puntuación sigue una distribución
normal.)
Ejemplo
4. En un estudio de cáncer de pulmón se
considera que su tamaño es una variable
aleatoria con distribución aproximadamente
normal. Una muestra de 8 pacientes ha
proporcionado los resultados siguientes (en cm):
7,5 2,5 9,0 6,5 3,3 6,5 1,5 6,5
Determine un intervalo de confianza del 95%
para el tamaño medio de este tipo de cáncer
Intervalo de confianza para una
proporción
Si 𝑝 es la proporción de éxito en una muestra
aleatoria de tamaño n y q = 1 − 𝑝, un intervalo
de confianza aproximado de 1 − α 100% para
el parámetro binomial 𝑝 es:
𝑝𝑞
𝑝𝑞
𝑝 − 𝑧𝛼
< 𝑃 < 𝑝 + 𝑧𝛼
2 𝑛
2 𝑛
Con 𝑞 = 1 − 𝑝
Donde 𝑧𝛼 2 es el valor de 𝑧 con un área de 𝛼 2
Ejemplos
1. En una muestra de 300 universitarios el 80% ha
respondido que asiste semanalmente al cine. Entre
que valores se encuentra, con un nivel de confianza
del 95%, la proporción de universitarios que acude
todas las semanas al cine.
2. En una encuesta realizada a 150 familias de una
determinada población, se encontró que en 25 de
ellas había tres o más hijos. Halle el intervalo de
confianza para estimar la proporción real de las
familias en las que hay tres o más hijos, con un nivel
de confianza del 90%.
Ejemplos
3. En un estudio de prevalencia de factores de
riesgo en una cohorte de 412 mujeres mayores
de 15 años, se encontró que el 17.6% eran
hipertensas. Un intervalo de 95% de confianza
para la proporción de mujeres hipertensas.
4. El 65% de los alumnos de cierta localidad
utiliza con regularidad la biblioteca del pueblo.
Halla un intervalo en el que se encuentre el 95%
de las proporciones de alumnos que utilizan la
biblioteca en muestras de tamaño 60.
Intervalo de Confianza para 𝜇1 − 𝜇2
2
2
conociendo 𝜎1 y 𝜎2
Si 𝑥1 y 𝑥2 son las medias de muestras aleatorias
independientes de tamaños 𝑛1 𝑦 𝑛2 de
poblaciones con varianzas conocidas 𝜎12 y 𝜎22
respectivamente un IC 1 − α 100% para 𝜇1 −
𝜇2
𝑥1 − 𝑥2 − 𝑧𝛼 2
𝜎12
𝑛1
𝜎22
𝑛2
+
𝑥1 − 𝑥2 + 𝑧𝛼 2
𝜎12
𝑛1
𝜎22
+
𝑛2
< 𝜇1 − 𝜇2 <
Ejemplos
1. Un laboratorio está interesado en comparar el tiempo que
tarda en sufrir efecto un fármaco nuevo con el del fármaco
que comercializa actualmente. Sobre dos muestras
independientes de 25 enfermos cada una. Se estudia el
tiempo que tardan en remitir los síntomas, resultando para el
actual una media muestral de 18.21 horas con una desviación
estándar de 5.31. Para el nuevo la media ha sido de 16.82 con
una desviación estándar de 4.05. Se suponen que los tiempos
de remisión de los síntomas con ambos fármacos tienen
distribuciones normal
a. Determine un IC del 95% para la diferencia de tiempos
medios de remisión de los síntomas
b. ¿Es significativa la diferencia?
Técnicas Muestrales
Muestreo
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra,
entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica,
cuya función básica es determinar que parte de una población debe
examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la
que se reproduzca de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una muestra
sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, es decir ejemplificar las
características de ésta.
Clasificación
Métodos
de Muestreo
Según el método de selección de unidades o
elementos que componen una muestra, pueden
clasificarse en dos grandes grupos, muestreo
aleatorio y no aleatorio
Muestreo Aleatorio: Denominado también
muestreo probabilístico, se define como cualquier
método de selección de una muestra que se basa
en la teoría de probabilidad.
Muestreo no aleatorio: Es un método de selección
de una muestra sin utilización de aleatoriedad
denominado también como muestreo sin norma, ya
que los elementos se selección de cualquier manera
Tipos de Muestreo
Existen diferentes criterios de clasificación de los diferentes tipos de
muestreo, aunque en general pueden dividirse en dos grandes grupos:
métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro
de una bolsa, tablas de números aleatorios, números aleatorios generados
con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea
necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.
Tipos de Muestreo
2.- Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números
aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que
es un número elegido al azar, y los elementos que integran la muestra
son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se
toman los individuos de k en k, siendo k el resultado de dividir el
tamaño de la población entre el tamaño de la muestra: k= N/n. El
número i que empleamos como punto de partida será un número al
azar entre 1 y k.
Tipos de Muestreo
3.- Muestreo aleatorio estratificado:
Consiste en considerar categorías típicas diferentes entre sí (estratos)
que poseen gran homogeneidad respecto a alguna característica (se
puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple para elegir los elementos concretos que
formarán parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento
detallado de la población. (Tamaño geográfico, sexos, edades,...).
Tipos de Muestreo
4.- Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias,
los departamentos universitarios, una caja de determinado producto, etc.,
son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un
cierto numero de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos.
Selección del tamaño de la Muestra
Muestreo Aleatorio Simple(MAS)
MAS para la varianza. Para hacer estimaciones de la
varianza el tamaño de la muestra está dado por:
𝑛0
𝑛=
𝑛0
1+
𝑁
𝑍2𝑆2
𝑛0 = 2
𝑑
Donde:
N: Tamaño de la población
Z: Es la desviación correspondiente al nivel de confianza.
d: Es el error máximo admisible (asignada por el
investigador).
𝑆 2 : Varianza
Ejemplo
Se tiene una población de 1200 y su desviación
estándar es de 450 y el error es de 100.
Determine un tamaño de la muestra con una
confianza de
a. 90%
b. 95%
Ejemplo
𝑎.
𝑛0 =
𝑛=
b.
𝑍 2 𝑝𝑞
𝑑2
𝑛0
𝑛
1+ 𝑁0
=
𝑍 2 𝑝𝑞
𝑛0 = 2
𝑑
𝑛0
𝑛=
𝑛
1+ 𝑁0
=
=
=
1.652 ∗4502
1002
55.13
55.13
1+ 1200
= 52.7≈53
1.962 ∗4502
1002
77.79
77.79
1+ 1200
= 55.13
= 77.79
= 73.05≈73
Selección del tamaño de la Muestra
Muestreo para Proporciones: Este método se aplica cuando se
trabaja con características cualitativas, denominadas también
atributos. El tamaño de la muestra esta dado por:
𝑛0
𝑛=
𝑛0
1+
𝑁
𝑍 2 𝑝𝑞
𝑛0 = 2
𝑑
Donde:
N: Tamaño de la población
Z: Es la desviación correspondiente al nivel de confianza.
D: Es el error máximo admisible (asignada por el investigador).
p: Proporción de elementos de la población que tienen la
característica a estudiar (asignada por el investigador)
q: Proporción de elementos de la población que no tienen la
característica a estudiar
Ejemplo
1. El orientador de una institución educativa desea observar
que trastornos son los que se presentan con mayor frecuencia
en los niños (as) de la institución donde labora, cuenta con
una población de 3500 estudiantes y desea determinar un
tamaño de muestra con una confianza del 95% (Z=1.96) y una
proporción de estudiantes con trastornos del 90% y un error
del 5%. Determine el tamaño de muestra deseado.
2. Se quiere realizar una encuesta a 27 estudiantes de
Estadística II para determinar el grado de aceptación que
tienen de la asignatura. Para ello se desea tomar una muestra
con una confianza del 95%, un error de 8% y una proporción
del 95%.
Ejemplo
𝑛0 =
𝑛=
𝑍 2 𝑝𝑞
𝑑2
𝑛0
𝑛
1+ 𝑁0
=
=
1.962 ∗0.9∗0.1
0.052
138.3
138.3
1+ 3500
= 138.3
= 133.04≈133
¿Que sucede si se desea aumentar el margen de error al 8%?
𝑛0 =
𝑛=
𝑍 2 𝑝𝑞
𝑑2
𝑛0
𝑛
1+ 𝑁0
=
1.962 ∗0.9∗0.1
0.082
=
54.02
54.02
1+ 3500
= 54.02
= 53.2
Muestreo Estratificado
Este método se emplea de preferencia, cuando
se desea una selección más eficiente que la
obtenida con el método aleatorio simple.
Este proceso de estratificación requiere que la
población se divida en grupos homogéneos
llamados estratos, donde cada elemento tiene
una característica tal que no le permita
pertenecer a otro estrato.
Muestreo Estratificado
Este tipo de muestreo ofrece una variedad de
sistemas, los que se diferencian según la forma en
que se agrupen los elementos. Sus casos son:
Afijación Igual: En este tipo de muestreo debe
seleccionarse un número igual de elementos en
cada grupo mediante procedimientos al azar.
Afijación Proporcional: En este tipo de muestreo el
tamaño por estrato se escoge de tal forma que sea
proporcional al tamaño poblacional del mismo
Muestreo Estratificado
Afijación Optima: Este método utiliza la mejor
subdivisión posible de una muestra total,
repartida en todos los estratos, considerando
tanto la variación como el tamaño de cada
estrato, además se tiene en cuenta el costo de la
investigación.
Muestreo Estratificado –Tamaño de la muestra
afijación proporcional
El tamaño de la muestra se obtendrá mediante
la siguiente formula
𝑛0
2
𝑊ℎ 𝑠ℎ Siendo 𝑛 =
𝑛0
𝑛0 =
Y V=
1+
𝑉
𝑑 2
𝑍
𝑤ℎ =
𝑁
𝑁ℎ
𝑁
Y los tamaños muestrales en cada estrato, se
procederá mediante la siguiente formula:
𝑛ℎ = 𝑛𝑤ℎ
Muestreo Estratificado –Tamaño de la muestra
afijación proporcional
El tamaño de la muestra se obtendrá mediante
la siguiente formula
𝑛0
𝑊ℎ 𝑝𝑞 Siendo 𝑛 =
𝑛0
𝑛 =
0
Y V=
1+
𝑉
𝑑 2
𝑍
𝑤ℎ =
𝑁
𝑁ℎ
𝑁
Y los tamaños muestrales en cada estrato, se
procederá mediante la siguiente formula:
𝑛ℎ = 𝑛𝑤ℎ
Ejemplo
Dos estudiantes de último semestre de Psicología de la
Universidad Cooperativa desean realizar su trabajo de grado
en una institución educativa de la ciudad para observar los
tipos de conducta de los estudiantes de grado 6, 7, 8 y 9.
Cuentan con una población de 915 estudiantes de los grados
en mención. Ellos desean obtener los resultados por cursos
por tal motivo toman cada grado como un estrato. La
información está dada de la siguiente manera:
Encuentre un tamaño de muestra con afijación proporcional
para una confianza del 95% y un error del 8%
6º
N1 =
268
P=0.5
7º
N2 =
234
P=0.5
8º
N3 =
204
P=0.9
9º
N4 =
209
P=0.8
Asociación Entre
Variables
Concepto de asociación entre variables
El análisis estadístico de la asociación (relación,
covarianza,
correlación)
entre
variables
representa una parte básica del análisis de datos
en cuanto que muchas de las preguntas e
hipótesis que se plantean en los estudios que se
llevan a cabo en la práctica implican analizar la
existencia de relación entre variables.
La existencia de algún tipo de asociación entre
dos o más variables representa la presencia de
algún tipo de tendencia o patrón de
emparejamiento entre los distintos valores de
esas variables.
Correlaciones Bivariadas
SPSS nos proporciona los siguientes coeficientes para la relación entre
variables.
Peason: Es una medida de la asociación lineal entre dos variables. Los
valores del coeficiente de correlación van de -1 a 1. El signo del
coeficiente indica la dirección de la relación y su valor absoluto indica
la fuerza. Los valores mayores indican que la relación es más
estrecha.
Tau-b de Kendall: Es una medida no paramétrica de asociación para
variables ordinales o de rangos que tiene en consideración los
empates. El signo del coeficiente indica la dirección de la relación y su
valor absoluto indica la magnitud de la misma, de tal modo que los
mayores valores absolutos indican relaciones más fuertes. Los valores
posibles van de -1 a 1,
Correlaciones Bivariadas
Spearman: Versión no paramétrica del coeficiente
de correlación de Pearson, que se basa en los
rangos de los datos en lugar de hacerlo en los
valores reales. Resulta apropiada para datos
ordinales, o los de intervalo que no satisfagan el
supuesto de normalidad. Los valores del coeficiente
van de -1 a +1. El signo del coeficiente indica la
dirección de la relación y el valor absoluto del
coeficiente de correlación indica la fuerza de la
relación entre las variables. Los valores absolutos
mayores indican que la relación es mayor.
P-Value (P-valor)
Es el dato obtenido a partir del valor del estadístico del
contraste, en las observaciones que corresponden a la
realización de la muestra de tamaño n extraída de la
población X
Interpretación:
Se rechaza la hipótesis nula si el valor p asociado al
resultado observado es igual o menor que el nivel de
significación establecido, convencionalmente 0,05 o 0,01.
Es decir, el valor p nos muestra la probabilidad de haber
obtenido el resultado que hemos obtenido si suponemos
que la hipótesis nula es cierta. Si el valor p es inferior al
nivel de significación nos indica que lo más probable es
que la hipótesis de partida sea falsa
Ejemplo
Con los datos de la base correlación encuentre
las relaciones de las variables