Download Estadistica Descriptiva

Document related concepts

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Media (matemáticas) wikipedia , lookup

Transcript
Razonamiento Cuantitativo
Fundamentos de estadística
descriptiva
Sexta Unidad: Fundamentos de estadística
descriptiva
Capitulo 12 Pág. 669 - 709
 Diagramas


De dispersión, de barras, grafica circular
Polígono de frecuencias e Histograma
 Medidas de tendencia central
 Media aritmética
 Media ponderada
 Mediana
 Moda
 Medidas de dispersión
 Rango
 Desviación estándar
Dr. Edwin Alfonso Sosa
2
Muestra es un subconjunto de la
población
 Población: Todos los
elemento de interés.
 Muestra: Algunos
Población
elementos de la
población
Muestra
 Se hacen inferencias
estadísticas de la
población basados en
la información de la
muestra.
Dr. Edwin Alfonso Sosa
3
Distribución de frecuencias y graficas
Datos en bruto:
Cualitativos o
Cuantitativos
Distribución de frecuencias
tabla
graficas
Dr. Edwin Alfonso Sosa
4
Distribución de frecuencias
Sondeo: A un grupo de estudiantes se le pregunta cuantos hermanos
tienen.
Numero
Frecuencia
Frecuencia relativa
f/N
X
f
1
4
4/25 = 16%
2
7
7/25 = 28%
3
6
6/25 = 24%
4
3
3/25 = 12%
5
3
3/25 = 12%
6
2
2/25 = 8%
Total = 100%
Dr. Edwin Alfonso Sosa
5
Histograma
Frecuencia
8
6
4
2
0
1
2
3
4
5
6
Num . Herm anos
 Serie de rectángulos cuyas longitudes representan
la frecuencia y se colocan uno al lado del otro.
Dr. Edwin Alfonso Sosa
6
Polígono de Frecuencias
Frecuencia
8
6
4
2
0
1
2
3
4
5
6
Num . de Herm anos
 Se coloca un punto a la altura de cada frecuencia.
Dr. Edwin Alfonso Sosa
7
Frecuencia
Diagrama de barras
7
6
5
4
3
2
1
0
A
B
C
D
 Una distribución de frecuencia de observaciones no
numéricas puede presentarse en forma de grafica
de barras. Las barras no se tocan.
Dr. Edwin Alfonso Sosa
8
Grafica Circular
A
B
C
D
 Se emplea un circulo para representar el total de todas las
categorías y lo divide en sectores o pedazos cuyo tamaño
representa la magnitud relativas de cada categoría.
Dr. Edwin Alfonso Sosa
9
Diagrama de Dispersión
Valor y
8
6
4
2
0
0
1
2
3
4
5
Valor x
 Ayuda a determinar tendencias entre el valor x y
valor y .
 Se pueden identificar “outliers”.
Dr. Edwin Alfonso Sosa
10
Medidas de tendencia central
Encontrar un numero que sirva como
un tipo de valor representativo para el
conjunto completo de números en la
muestra. Un valor alrededor del cual
todos los números de la muestra
tienden acumularse.
Dr. Edwin Alfonso Sosa
11
Media Aritmética
 La media es el conjunto de todos los
números que se encuentra al sumar todos los
valores en el conjunto y dividir el resultado
entre el numero de valores.
 Para la siguiente lista de datos, calcule la
media aritmética: 7, 8, 9, 9, 10, 10, 10, 12,
12, 13:
x

x
n
x 100

x

 10
n
Dr. Edwin Alfonso Sosa
10
12
Media Aritmética ponderada
x valor del dato
x f

w
f
w media aritmetica ponderada
f
frecuencia del valor

sumatoria
Dr. Edwin Alfonso Sosa
13
Ej. Media aritmética ponderada
x f

w
f
Curso
12
  1.71
7
Calificación Puntos Créditos Puntos x Créditos
x
f
x•f
Historia
D
1
3
3
Química
C
2
3
6
Arte
B
3
1
3
Σx = 6
Σf = 7
Σx•f = 12
Dr. Edwin Alfonso Sosa
14
Mediana
 La mediana es una especie de “medio”
numero. Aquel valor que divide a un grupo
de números en dos partes, de manera que la
mitad de los números se encuentren por
debajo de la mediana y la otra mitad se halle
por encima.
 No se afecta con los valores extremos.
Dr. Edwin Alfonso Sosa
15
Pasos para encontrar la mediana
1. Distribuya los datos en orden numérico
2. Si el numero de datos es impar, la mediana
es el dato que se encuentra en la misma
mitad de la lista.
3. Si el numero de datos es par, la mediana es
la media aritmética de los dos datos que se
encuentran en la mitad de la lista.
 Para la siguiente lista de datos, calcule la
mediana: 7, 8, 9, 9, 10, 10, 10, 12, 12, 13:
Dr. Edwin Alfonso Sosa
16
Encuentre la mediana
 147, 159, 132, 181, 174, 253
1. 132, 147, 159, 174, 181, 253
2. Numero Par de datos:
159  174 333

 166.5
2
2
Dr. Edwin Alfonso Sosa
17
Moda
 La moda es el valor que ocurre con mayor
frecuencia. Algunos conjuntos de números
poseen dos valores que tienen lugar con mas
frecuencia y son bimodales. Otros conjuntos
no tienen moda en absoluto (si no se da
ningún valor mas frecuentemente que los
otros o si mas de dos valores presentan la
mayor frecuencia).
 Para la siguiente lista de datos, calcule la
moda: 7, 8, 9, 9, 10, 10, 10, 12, 12, 13: 10
Dr. Edwin Alfonso Sosa
18
Las medidas de tendencia central no son
suficientes para caracterizar una distribución
 ¿En cual de las distribuciones (A y B) que se
muestran la media aritmética, 7, la representa
mejor?
A
B
15
15
10
10
5
5
0
0
Ambas distribuciones de numero tienen la misma media (y
mediana también), 7, pero fuera de esto son completamente
independientes. En la segunda los valores difieren bastante
de 7.
Dr. Edwin Alfonso Sosa
19
Medidas de dispersión
Necesitamos medidas de
dispersión o despliegue de los
datos
Dr. Edwin Alfonso Sosa
20
Rango
 Para cualquier conjunto de datos, el rango de
un conjunto de datos se da por:
 Rango
= (valor mayor en el conjunto)
– (valor menor en el conjunto).
 La distribución A y B tienen un rango:
Ra = 9 – 5 = 4
 Rb = 13 – 1 = 12
 R b > Ra

Dr. Edwin Alfonso Sosa
21
Varianza y desviación estándar
 Varianza, s2, mide la desviación de los
datos alrededor de la media aritmética. Para
obtenerla:
1.
2.
3.
Calculas el cuadrado de las desviaciones
para cada dato.
Sumas los resultados anteriores
Divides entre n – 1.
 La desviación estándar, s, es la raíz
cuadrada de la varianza.
Dr. Edwin Alfonso Sosa
22
Formula de Varianza

x  x


2
s
s
2
2
desviacion estandar
n 1
x valor del dato
x media aritmetica
n cantidad total de datos

sumatoria
Dr. Edwin Alfonso Sosa
23
Formula Desviación estándar
 x  x 
2
s
s desviacion estandar
n 1
x valor del dato
x media aritmetica
n cantidad total de datos

sumatoria
Dr. Edwin Alfonso Sosa
24
Ejemplo: Distribución A
x  x
x
x  x 
5
-2
4
6
-1
1
7
0
0
8
1
1
9
N=5
2
4
2
 x  x
2
Dr. Edwin Alfonso Sosa
 10
25
Desviación estándar de la distribución A
 x  x
2
s
n 1
10
10


 1.6
5 1
4
Dr. Edwin Alfonso Sosa
26
Ejemplo: Distribución B
x  x
x
x  x 
1
-6
36
2
-5
25
7
0
0
12
5
25
13
N=5
6
36
2
 x  x
2
Dr. Edwin Alfonso Sosa
 122
27
Desviación estándar de la distribución B
 x  x
2
s
n 1
122
122


 5.5
5 1
4
Por lo tanto la dispersión de los datos
alrededor de la media es mayor en la
distribución B.
Dr. Edwin Alfonso Sosa
28
Encuentre los valores estadísticos de la
muestra X
 X = {-3, -1, 0, 2, 5, 7, 11,
12, 12}
 Moda = 12
 Mediana = 5
 Media aritmética = 5.0
 Rango = 12 – (-3) = 15
 Varianza = 34.0
 Desviación estándar
 s = 5.83
Dr. Edwin Alfonso Sosa
x  x
x
x  x 
-3
-8
64
-1
-6
36
0
-5
25
2
-3
9
5
0
0
7
2
4
11
6
36
12
7
49
12
7
49
2
29
Ejemplo
Tabla1
Sumas:
x
y
x∙y
x2
y2
1
2
2
1
4
2
4
8
4
16
3
6
18
9
36
6
12
28 14 56
Dr. Edwin Alfonso Sosa
x  x
2
1
0
1
2
30