Download La moda

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Varianza wikipedia , lookup

Transcript
Historia de la Estadística
Se cree que los orígenes de la estadística están ligados al
antiguo Egipto y a los censos chinos hace unos 4000
años, aproximadamente.
Desde esa época, diversos estados realizaron estudios
sobre algunas características de sus poblaciones, sus
riquezas, posesiones, etc.
Q
En 1662, John Graunt, un mercader
Inglés, publicó un
libro sobre los nacimientos y defunciones ocurridos en
Londres; el libro tenia conclusiones acerca de ciertos
aspectos relacionados con estos acontecimientos. Esta
obra es considerada como el punto de partida de la
estadística moderna.
Historia de la Estadística
La palabra estadística comenzó a usarse en el siglo
XVIII, en Alemania, en relación a estudios donde
los grandes números, que representaban datos,
eran de importancia para el estado. Sin embargo, la
estadística moderna se desarrolló en el siglo XX a
partir de los estudios de Karl Pearson.
Hoy la estadística tiene gran importancia, no sólo
por que presenta información, sino que además
permite inferir y y predecir lo que va a ocurrir, y
por lo tanto, es una herramienta fundamental a la
hora de tomar decisiones de importancia.
Conceptos Básicos
En muchas ocasiones, para llevar
a cabo una investigación se hacen
encuestas, las cuales son dirigidas
a una muestra representativa de la
población. Para comprender mejor
este tipo de estudios es importante
que conozcas los siguientes
términos básicos:
POBLACION
Es un conjunto de personas, eventos o cosas de las
cuales se desea hacer un estudio, y tienen una
característica en común.
MUESTRA
Es un subconjunto cualquiera de la población;
importante escoger la muestra en forma aleatoria
azar), pues así se logra que sea representativa y
puedan obtener conclusiones más afines acerca de
características de la población.
es
(al
se
las
Para estudiar alguna característica especifica
de la población se pueden definir los
siguientes tipos de variables:
VARIABLES CUALITATIVAS
Relacionadas con características no numéricas
de un individuo.
por ejemplo: Atributos de una persona
Estado civil de una persona
Estrato
Gustos - hobies
VARIABLES CUANTITATIVAS
Relacionadas
con
las
numéricas del individuo.
características
Las variables cuantitativas se dividen en:
Discretas (aquellas que no admiten otro valor
entre 2 valores distintos y consecutivos) o
Continuas (aquellas que pueden tomar una
infinidad de valores entre dos de ellos).
EN UNA INVESTIGACION SE RECOLECTA
LA INFORMACION
Al ordenar datos muy numerosos, es usual agruparlos en clases o
categorías. Al determinar cuantos pertenecen a cada clase, establecemos
la frecuencia. Construimos así una tabla de datos llamada Tabla de
frecuencias.
EJEMPLO
Los siguientes datos corresponden a las notas obtenidas por un curso
de 24 alumnos en un trabajo de matemática:
4.2
5.0
5.6
5.0
3.2
4.2
5.6
6.0
2.8
3.9
4.2
4.2
50
50
3.9
3.9
3.2
3.2
4.2
5.6
6.0
6.0
3.2
6.0
Ordenemos estos datos en la siguiente tabla:
Nota
Frecuencia
Absoluta (f i)
Frecuencia
Relativa (h i)
2.8
1
1/24
Frecuencia
relativa
porcentual (%)
4.2
3.2
4
4/24
16.7
3.9
3
3/24
12.5
4.2
5
5/24
20.8
5.0
4
4/24
16.7
5.6
3
3/24
12.5
6.0
4
4/24
16.7
La FRECUENCIA ABSOLUTA de una clase es el numero de
datos que forma dicha clase
La FRECUENCIA RELATIVA corresponde a la razón entre la
frecuencia absoluta y el total de datos, la cual se puede
expresar mediante el uso de porcentajes.
Tabla de frecuencia de datos
agrupados
En ocasiones, el agrupar los datos en intervalos, nos
puede ayudar para realizar un mejor análisis de ellos.
Consideremos los siguientes datos, expresados en
metros, correspondientes a las estaturas de 80
estudiantes de cuarto año de educación media.
ESTATURAS DE 80 ESTUDIANTES
(Unidad de medida metros)
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75
1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75
1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93
1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79
1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76
1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76
1,76 1,76 1,79 1,88 1,63 1,80 1,72 1,75 1,79 1,77
Para construir una tabla de frecuencias para datos
agrupados, determinamos el tamaño de cada intervalo,
dividiendo el valor del rango por la cantidad de intervalos
que se desea obtener.
Importante recordar:
El rango, está dado por la diferencia
entre el máximo y el mínimo valor de la
variable.
El tamaño del intervalo se aproxima al
impar más cercano.
RANGO


Mide la amplitud de los valores de la
muestra y se calcula por diferencia entre
el valor más elevado y el valor más bajo
que se presenta en la agrupación de
datos utilizados para realizar el análisis
objeto de estudio.
Notamos que la estatura mayor es 1,93 m
y la estatura menor es 1,63m; El rango es
de 0,30m = 30cm. Formaremos
9
intervalos. Para calcular el tamaño de cada
uno dividimos 30 / 9 = 3,33 ≈ 4. si no da
entero, lo aproximamos.
EL TAMAÑO DEL INTERVALO SE CALCULA ASI:
En nuestro ejercicio: √80= 8,94≈9, éste debe ser
el número de intervalos.
Notamos que la estatura mayor es 1,93 m y la estatura menor
es 1,63m; El rango es de 0,30m = 30 cm. Formaremos 9
intervalos. Para calcular el tamaño de cada uno dividimos 30 :
9 = 3,33≈3. si no da entero, lo aproximamos.
Intervalos
1,63 – 1,65
1,66 – 1,69
1,70 – 1,73
1,74 – 1,77
1,78 – 1,81
1,82 – 1,84
1,85 – 1,87
1,88 – 1,90
1,91 – 1,93
Frecuencia
Absoluta
Total : 80
EJEMPLO
Los siguientes datos corresponden a las notas obtenidas por un curso
de 50 alumnos en un trabajo de matemática:
4.2
5.0
5.6
8.0
3.6
3.2
4.2
5.6
6.0
2.8
3.9
4.2
4.2
50
50
3.9
3.9
3.2
3.2
4.2
5.6
4.2
1.0
5.0
6.0
5.6
3.2
5.0
1.0
3.6
8.2
4.2
5.6
6.0
2.8
3.9
4.2
4.2
50
50
3.9
3.9
3.2
3.2
2.2
1.6
6.0
6.0
3.2
9.0
MARCA DE CLASE
La marca de clase es el punto
medio de cada intervalo.
La marca de clase es el valor que representa a
todo el intervalo para el cálculo de
algunos parámetros como la media aritmética o
la desviación típica.
Ejemplo : 163-193 = 30 / 2 = 15
MEDIDAS DE TENDENCIA
CENTRAL
• Las medidas de tendencia central tienen
como objetivo el sintetizar los datos en
un valor representativo, las medidas de
dispersión nos dicen hasta que punto
estas medidas de tendencia central son
representativas como síntesis de la
información.
MEDIDAS DE TENDENCIA CENTRAL
MEDIA:
Media aritmética, es la que se obtiene sumando los datos y
dividiéndolos por el número de ellos.
Se aplica por ejemplo para resumir el número de pacientes promedio que se
atiende en un turno.
Otro ejemplo, es el número promedio de controles prenatales que tiene una
gestante.
Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:
1. Calcular su media.
2. Si los todos los datos anteriores los multiplicamos por 3, cúal será la
nueva media.
2. A un conjunto de 5 números cuya media es 7.31 se le añaden los números
4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números?
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la
población exactamente en dos. Por ejemplo el número mediana de hijos en el
centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de
atenciones por paciente en un consultorio.
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
MODA:
Valor o (valores) que aparece(n) con mayor frecuencia. Una
distribución unimodal tiene una sola moda y una distribución bimodal tiene dos.
Útil como medida resumen para las variables nominales. Por ejemplo, el color del
uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda
en colores del uniforme quirúrgico.
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y
esa frecuencia es la máxima, la distribución esbimodal o multimodal, es
decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma
frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
MEDIDAS DE TENDENCIA CENTRAL
EJERCICIO
El número de diás necesarios por 10 equipos de trabajadores para
terminar 10 instalaciones de iguales características han sido: 21, 32,
15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana,
moda.
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre
el número total de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima
de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de
mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par
(10 individuos), los dos valores que se encuentran en el medio son 60
y 60. Si realizamos el cálculo de la media de estos dos valores nos dará
a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia
es 60
EL TAMAÑO DEL INTERVALO SE CALCULA ASI:
En nuestro ejercicio: √100= 10, éste debe ser el
número de intervalos.
MEDIDAS DE TENDENCIA CENTRAL PARA
DATOS AGRUPADOS
22905
LRC: Límites Reales de Clase. (Inferior- Superior)
Xi = Marca de Clase
fi = Frecuecia Absoluta
fa. = Frecuencia Acumulada
f rel% = Frecuencia Relativa %
Frel%ac=Frecuencia Relativa porcentual acumulada
MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL PARA
DATOS AGRUPADOS
Numero de observaciones
que faltan para alcanzar la
mediana
MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MODA
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la
clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la
clase modal
ai es la amplitud de la clase.
MEDIDAS DE TENDENCIA CENTRAL EN
EXCEL
MEDIDAS DE TENDENCIA CENTRAL
GRAFICADAS EN EXCEL
MEDIDAS DE TENDENCIA
CENTRAL
1Construya la tabla de frecuencia y calcule la media-mediana y moda.
MEDIDAS DE TENDENCIA
CENTRAL
1Construya la tabla de frecuencia y calcule la media-mediana y moda
MEDIDAS DE DISPERSION
• Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor
central. Distinguimos entre medidas de
dispersión:
• Absolutas, que no son comparables entre
diferentes muestras
• Relativas que nos permitirán comparar varias
muestras.
MEDIDAS DE DISPERSION
MEDIDAS DE DISPERSION
DESVIACION MEDIA.
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media
La desviación media se representa por
MEDIDAS DE DISPERSION
DESVIACION MEDIA PARA DATOS AGRUPADOS:
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la
desviación media es:
MEDIDAS DE DISPERSION
Xi
10-15
15-20
20-25
25-30
30-35
fi
12,5
17,5
22,5
27,5
32,5
Xi *fi
3
5
7
4
2
Xm=
Dm=
|X - Xm| |(X - Xm)*fi|
37,5
9,286
27,858
87,5
4,286
21,43
157,5
0,714
4,998
110
5,714
22,856
65
10,714
21,428
457,5
98,57
457,5/21 =21,7857
98,57/21 =4,6938
MEDIDAS DE DISPERSION
VARIANZA
Mide la distancia existente entre los valores de la serie y la media.
Sumatoria de las diferencias al cuadrado entre 1 valor y la Media
por el número de veces que se ha repetido cada valor, la
Sumatoria se divide por el tamaño de la muestra.
VARIANZA
Varianza para datos no agrupados
MEDIDAS DE DISPERSION
VARIANZA
Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.
2
Si
a
todos
los
valores
de
la
variable
se
les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de
dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos
sus respectivas varianzas se puede calcular la varianza total
MEDIDAS DE DISPERSION
Calculo de la varianza para datos agrupados
X^2 = 1877,4889
MEDIDAS DE DISPERSION
DESVIACION TIPICA
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ
MEDIDAS DE DISPERSION
Propiedades de la desviación típica
1 La desviación típica será siempre un valor positivo o cero, en el caso de que
las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación
típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación
típica queda multiplicada por dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones típicas se puede calcular la desviación típica total.
MEDIDAS DE DISPERSION
COEFICIENTE DE VARIACION
COEFICIENTE DE VARIACION DE PEARSON
El coeficiente de variación es la relación entre la desviación típica de una
muestra y su media.
El coeficiente de variación se suele expresar en porcentajes:
El coeficiente de variación permite comparar las dispersiones de dos
distribuciones distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se
comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
MEDIDAS DE DISPERSION
Gracias
por tu
atención
Finnn