Download Estadística

Document related concepts

Parámetro estadístico wikipedia , lookup

Estadística descriptiva wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Estadístico muestral wikipedia , lookup

Transcript
CAPÍTULO 4
Introducción a la Estadística.
Modelos de regresión
CAPÍTULO 4:
Estadística. Modelos de regresión

Estadística unidimensional

Estadística bidimensional
Estadística Unidimensional




4.1
4.2
4.3
4.4
Origen de la Estadística
Nociones generales
Tablas de frecuencias
Parámetros estadísticos:
Medidas de centralización
 Medidas de dispersión

4.1 Origen de la Estadística


El origen de la Estadística está
estrechamente relacionado con los
censos realizados a lo largo de la
historia.
Desde las culturas más antiguas,
existe una enorme preocupación por
conocer el capital humano y la
distribución de los recursos.
4.1 Origen de la Estadística



En China, desde la cultura Han hasta los
tiempos modernos, se han llevado a cabo
numerosos recuentos de la población.
El Imperio Romano erigió la figura del
censor, que, con el paso del tiempo, fue
desempeñando una labor fundamental en el
control del Imperio.
En la Edad Media, Carlomagno ordenó la
creación de un registro de todas sus
propiedades, así como de los bienes
privados.
4.1 Origen de la Estadística


En el año 1662, el inglés John
Graunt publicó un tratado con las
observaciones políticas y naturales
referidas a la ciudad de Londres.
Puede considerarse el primer trabajo
estadístico serio sobre la población.
Nacía así una nueva ciencia: la
Estadística.
4.1 Origen de la Estadística


Curiosamente, J. Graunt no conocía
los trabajos de B. Pascal (16231662) ni de C. Huygens (1629-1695)
sobre estos mismos temas.
En Londres y en París se estaban
construyendo,
casi
de
manera
simultánea, las dos disciplinas que
actualmente llamamos Estadística y
Probabilidad.
4.1 Origen de la Estadística


La estadística es sus orígenes era más bien
una ciencia de carácter demográfico pero,
con el matemático belga Adolphe
Quetelet (1796-1874), dio un paso de
gigante,
asentándose
las
bases
fundamentales
del
futuro
trabajo
estadístico.
De esta forma, la estadística fue
invadiendo la mayoría de los campos de las
ciencias naturales y humanas.
4.1 Origen de la Estadística


Hoy, la Estadística es, sobre todo,
un instrumento de decisión, una
ciencia que usa los números para
tener más conocimiento de la
naturaleza y de la experiencia.
La estadística es un conjunto de
métodos que nos ayudan a tomar
decisiones razonables, incluso en
casos de incertidumbre.
4.2 Nociones generales


La Estadística es el estudio de
los mejores modos de acumular
y analizar datos y de establecer
conclusiones acerca del colectivo
del que se han recogido tales
datos.
Los conceptos básicos son los
siguientes:
4.2 Nociones generales



Población. Conjunto de todos los
elementos que nos interesan y que serán
objeto de estudio.
Muestra. Subconjunto, extraído de la
población, cuyo estudio sirve para inferir
(sacar conclusiones) de las características
de toda la población. El número de
elementos de la muestra se llama tamaño
de la misma.
Individuo. Cada uno de los elementos de la
población o de la muestra.
4.2 Nociones generales



Carácter estadístico. Cada una de las
propiedades (aspectos) que pueden estudiarse en
los individuos de una población. Un carácter
permite clasificar a los individuos de la población.
Caracteres cualitativos son los que no se
pueden medir ni comparar, porque no toman
valores numéricos: sexo, estado civil, raza,…
Caracteres cuantitativos son los que se pueden
medir, es decir, los que toman valores numéricos:
edad, talla, peso, número de hermanos,..
4.2 Nociones generales


Variable estadística: Conjunto de
valores que toma un carácter estadístico.
Pueden ser cualitativas o cuantitativas
dependiendo del carácter estadístico
Las variables estadísticas cuantitativas se
llaman:


discretas cuando los valores son aislados (edad,
número de hijos, …)
continuas cuando pueden tomar todos los
valores de un intervalo (talla, peso,…).
4.2 Nociones generales



Las dos ramas de la Estadística:
Estadística descriptiva: Trata de
describir y analizar algunas características
de los individuos de un grupo dado, sin
extraer conclusiones para un grupo mayor.
Estadística inferencial: Trabaja con
muestras y pretende, a partir de ellas,
inferir características de toda la población.
Es decir, se pretende tomar como
generales propiedades que sólo se cumplen
en casos particulares.
4.2 Nociones generales






Nos ocupamos ahora de la Estadística
descriptiva, para la que se siguen los siguientes
pasos:
Selección de los caracteres a estudiar.
Análisis de cada carácter, anotando los valores que
toman los individuos en ellos.
Clasificación y organización en tablas de los
resultados obtenidos.
Cálculo de parámetros estadísticos a partir de los
datos obtenidos.
Realización de gráficos estadísticos.
4.3 Tablas de frecuencias


Las tablas de frecuencias sirven para
ordenar y organizar los datos.
Si el carácter estadístico que estamos
estudiando toma N valores, que
podemos llamar xi ( 1  i  N ), estos
serán los valores que toma la variable
estadística.
4.3 Tablas de frecuencias



La Frecuencia absoluta (fi) es el número
de veces que se repite el valor xi.
La Frecuencia relativa (fri) del valor xi se
calcula dividiendo su frecuencia absoluta
por el número total de individuos que
estamos estudiando. Esta frecuencia
también se suele expresar en “tantos por
ciento”.
fi
fri 
n
i  1, 2,..., N
n = nº total de datos
4.4. Parámetros estadísticos


Designamos con este nombre a los
números que describen, de manera
concisa, el comportamiento y las
características generales de un
conjunto de datos estadísticos.
Se agrupan en dos categorías:

Medidas de centralización

Medidas de dispersión.
4.4. Parámetros estadísticos
Medidas de centralización


Se refieren al promedio de un
conjunto de datos, y siempre llevan la
unidad de medida del carácter que se
está tratando.
Vamos a estudiar:
 La Media

La Moda

La Mediana.
4.4. Parámetros estadísticos
Medidas de centralización


La Media x
Es el parámetro de centralización más
importante, puesto que en la mayoría de
los casos es el valor idóneo para
representar a todos los datos. Es la media
aritmética de los datos.
x1  x2  ...xn
x

n

n
x
i 1 i
n


N
xf
i 1 i i
n
4.4. Parámetros estadísticos
Medidas de centralización


La Moda
Es el valor que se presenta con mayor
frecuencia en un conjunto de datos.
4.4. Parámetros estadísticos
Medidas de centralización



La Mediana
Es el valor central de los datos cuando
éstos se han dispuesto ordenadamente de
menor a mayor.
Cuando el número de datos sea par, la
Mediana es la media aritmética de los dos
datos que ocupan los lugares centrales.
Medidas de centralización
EJEMPLO 1

Preguntados por su edad a diez alumnos/as de
Primer Curso de CC. Ambientales, se han obtenido
los siguientes resultados:
18, 20, 18, 19, 20, 18, 18, 18, 19, 19 años

x
n
x
i 1 i
n


x 
18  20  18  19  20  18  18  18  19  19 187

 18, 7 años.
10
10
N
xf
i 1 i i
n
18  5  19  3  20  2 187


 18, 7 años.
10
10
Medidas de centralización
EJEMPLO 1

Preguntados por su edad a diez alumnos/as de
Primer Curso de CC. Ambientales, se han obtenido
los siguientes resultados:
18, 20, 18, 19, 20, 18, 18, 18, 19, 19 años
Moda = 18 años
Es el dato que más se repite
5 veces (tiene la mayor frecuencia).

Medidas de centralización
EJEMPLO 1

Para calcular la Mediana se ordenan los datos de
menor a mayor:
18, 18, 18, 18, 18, 19, 19, 19, 20, 20
Como el número de datos es par la Mediana se
obtiene tomando la media de los dos datos
centrales, los de lugares 5º y 6º, que son 18 y 19.
18  19
Mediana 
 18,5 años
2
Medidas de centralización
EJEMPLO 2



De los empleados del ayuntamiento de
Pozogrande, 38 cobran al mes 900 €, 8
perciben 1500 €, y los 4 restantes 2500 €.
¿Cuánto cobran los empleados por término
medio?
¿Es representativa, en este caso, la media?
¿Calcula otras medidas de centralización
que sean más representativas?
Medidas de centralización
EJEMPLO 2

De los empleados del ayuntamiento de
Pozogrande, 38 cobran al mes 900 €, 8 perciben
1500 €, y los 4 restantes 2500 €.

x 
N
xf
i 1 i i
n
900  38  1500  8  2500  4 56200


 1124 euros.
50
50
Moda = 900 euros
900  900
Mediana 
 900 euros
2
Medidas de centralización
EJEMPLO 2
Diagrama de Barras
40
Nº Empleados
35
30
25
20
15
10
5
0
Sueldos en euros
4.4. Parámetros estadísticos
Medidas de dispersión


Las medidas de dispersión completan el
análisis numérico de un conjunto de
datos, pues determinan la mayor o menor
variación de los datos.
Dan una idea del alejamiento de ellos
respecto a las medidas de centralización.

Rango

Desviación Media

Varianza y Desviación Típica.
4.4. Parámetros estadísticos
Medidas de dispersión


El Rango (Amplitud o Recorrido) es la
diferencia entre el mayor valor y el menor
valor de los datos.
En el ejemplo 2, sería:
Rango = 2500 – 900 = 1600 €.
4.4. Parámetros estadísticos
Medidas de dispersión

La Desviación Media (DM) se define
como la media aritmética de las
desviaciones absolutas de cada valor
respecto a la media.

Desviacion Media ( DM ) 
n
i 1
xi  x
n
4.4. Parámetros estadísticos
Medidas de dispersión

Las medidas de dispersión más
importantes son: La Varianza (Sx2) y la
Desviación Típica (Sx).
 i1  xi  x 
n
Sx2 
n
S x  Varianza
 i1 xi
n
2

n
2
x
 i1 i  fi
N
2
 x2 
n
 x2
4.4. Parámetros estadísticos
Medidas de dispersión

Dos fórmulas para la Varianza (Sx2):
 i 1  xi  x 
n
Sx 
2
n
2
x
 i 1 i
n
2
Sx 
2
n
x
2