Download Introducción a la Estadística (118445)

Document related concepts
no text concepts found
Transcript
Estadística
La estadística es la parte de las matemáticas que se ocupa de los métodos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.
Dentro del campo de la estadística pueden estudiarse características de la sociedad,
de las personas, de los animales, de las plantas, de determinados productos o de cualquier
objeto de interés humano en general, bien lejos del concepto de las "cosas que pertenecen al
Estado".
Al hacer un estudio de una determinada población, observamos una característica o
propiedad de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de
nuestra clase, podemos estudiar el lugar donde viven, el número de hermanos, la
estatura, etc. Cada una de estas características estudiadas se llama variable estadística.
Si tenemos en cuenta las preguntas planteadas en la introducción:


Primera variable: ¿En qué vienen a la escuela?
Segunda variable: ¿Cuántas personas viven en su casa?
El resultado de la primer variable puede ser: caminando, ómnibus, auto, moto, bicicleta,
otros. Este tipo de variable se llama cualitativa.
El resultado de la segunda variable puede ser: 2, 3, 4, 5, .... Este tipo de variable se
llama cuantitativa.
Una variable se llama cuantitativa cuando toma valores numéricos y cualitativos,
cuando toma valores no numéricos.
Una vez definidas las variables a estudiar tenemos que establecer cuál será la población
a investigar. En algunos casos se trabaja con toda una población que es el conjunto
formado por todos los elementos a estudiar, el cual puede llamarse conjunto completo.
Otras veces no es posible trabajar con toda la población. Supongamos que debemos
estudiar la altura de los niños que cumplen 10 años en el presente año. Nos damos
cuenta que no podemos hacerlo con todos los cientos de miles de niños que cumplen 10
años en el país, lo que sería toda la población o conjunto completo. Podemos hacerlo
con un grupo que sea manejable. O sea que vamos a usar una muestra. Queremos que
esa muestra sea una buena representación de todo el conjunto. No podemos quedarnos
con los más altos, porque en ese caso estaríamos deformando los resultados. Tampoco
con los más bajos, ni siquiera con los que están en el medio. Tienen que estar todos
mezclados.
Podemos ver que hacer un muestreo tiene varias dificultades. Hay que buscar una
muestra que no le de preferencia a ninguna de las cualidades a estudiar. Tiene que ser lo
más heterogénea posible, pensando siempre que sea una representación en pequeño de
toda la población.
Por lo tanto un muestreo consiste justamente en tomar una parte de un conjunto,
estudiar una de sus características y tratar de analizar si con cuidado podemos extender
los resultados y conclusiones a todo el conjunto, a toda la población estudiada.
MUESTRA:
POBLACIÓN O CONJUNTO
COMPLETO:
Conjunto formado por todos los
elementos a estudiar.
Parte de una población que se considera
representativa de la misma.
MUESTREO:
Acción de escoger muestras representativas.
Cuando se han recogido los datos correspondientes a una variable estadística, hay que
tabularlos; es decir, hay que confeccionar con ellos una tabla en la que aparezcan
ordenadamente:


Los valores de la variable que se está estudiando.
El número de individuos de cada valor; es decir, su frecuencia.
La frecuencia absoluta es el número de veces que se presenta un valor al estudiar una
variable.
Para hacer el recuento, se leen los datos uno a uno y se marca una señal en el
correspondiente valor. Si las señales se agrupan, de cinco en cinco por ejemplo, es más
fácil contarlas.
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos.
Para tener una información clara y rápida de lo obtenido en el estudio se han creado las
gráficas estadísticas.
Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un
estudio determinado, ya que no siempre se puede utilizar la misma para todos los casos.
Las más comunes son:




Diagrama de barras
Histograma
Polígono de frecuencias
Diagrama de sectores
Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el
eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje
vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad.
Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se
superpongan) cuya altura debe ser proporcional a la frecuencia que representan.
Rápidamente podemos ver que el fútbol es el deporte preferido, por la longitud de la
barra.
 Todas las barras deben ser del mismo ancho para no confundir al lector.
 Los espacios entre barras deben ser igual a la mitad del ancho de las barras.
 Se deben incluir las escalas y algunas indicaciones para que ayuden a la lectura de las
gráficas.
 Los ejes de las gráficas se deben identificar en forma clara.
 Se deben incluir dentro del cuerpo de la gráfica, o debajo, todo tipo de "claves" para
la interpretación de las gráficas.
 El título de la gráfica debe aparecer debajo del cuerpo.
 Las notas de pie de página, o sobre fuentes, cuando sean necesarias, se deben
colocar después del título.
Un histograma es una representación gráfica de una variable en forma de barras, donde
la superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en
el que están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.
En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en
ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
Ejemplo:
Para realizar el polígono unimos los puntos medios de las bases superiores del
diagrama de barras o del histograma.
También conocido como gráfico de torta o gráfico circular.
Se representan los datos en un círculo, de modo que la frecuencia de cada valor viene
dada por un trozo de área del círculo. Así, el círculo queda dividido en sectores cuya
amplitud es proporcional a las frecuencias de los valores. Sirve para representar
cualquier tipo de variable.
EJEMPLO:
En la clase se realizó la siguiente encuesta: ¿Qué libros prefieres leer?
Los resultados se ordenaron en esta tabla
Tipos de libros De Misterio De Aventuras Historietas Total
N° de alumnos
15
9
6
30
Si queremos representar esta información en un gráfico de torta tenemos que realizar
unos cálculos previamente.
Como la medida de la superficie de cada sector es directamente proporcional a la
medida del ángulo central, se hace una proporcionalidad directa entre la cantidad de
alumnos que hay en el sector con respecto al total de alumnos y el ángulo del sector (la
incógnita) con respecto al ángulo central de todo el círculo, o sea 360°.
Para el sector de libros de misterio tenemos:
30 alumnos ---------------360° (todo el círculo)
15 alumnos --------------- incógnita (sector del círculo correspondiente a libros de
misterio)
Ángulo sector Misterio = 360° X 15 alumnos / 30 alumnos = 180° (la mitad del
círculo)
Ángulo sector Aventuras = 360° X 9 alumnos / 30 alumnos = 108°
Ángulo sector Historietas = 360° X 6 alumnos / 30 alumnos = 72°
Si sumamos la amplitud de los tres sectores nos tiene que dar el círculo completo:
180° + 108° + 72° = 360°
La estadística maneja gran cantidad de datos e intenta resumirlos en unos pocos
representativos. Estos son los parámetros centrales.
Los parámetros centrales más usados son:



Media aritmética
Mediana
Moda
La media y la mediana sólo se pueden obtener en variables cuantitativas, mientras que
la moda se puede obtener en variables cualitativas y cuantitativas.
La media de varias cantidades, es la suma de todas las cantidades dividida entre el
número de ellas. También se llama promedio.
EJEMPLO:
Cinco amigos cuentan las canicas que tienen cada uno.
Son: 10, 15, 5, 17 y 8. La media de esas cantidades es:
media = (10 + 15 + 5 + 17 + 8) / 5 = 11
El significado del resultado es claro: es lo que le
tocaría a cada uno de los cinco si se juntaran todas las
canicas y se repartieran por igual.
Para hallar la media de los datos de una tabla de frecuencias correspondiente a una
variable cuantitativa:


Se multiplica cada dato por su frecuencia y se suman los resultados.
La suma total se divide por la suma de todas las frecuencias.
EJEMPLO:
El número de hijos de las familias de 40 alumnos se registró en la siguiente tabla:
N° de hijos Frecuencia
1
7
2
14
3
9
4
8
5
2
Media = (1X7 + 2X14 + 3X9 + 4X8 + 5X2) / 40 = 2,6
Se llama mediana de un conjunto de datos numéricos al que ocupa el valor central.
Para calcularla, ordenamos las cantidades de menor a mayor y elegimos la del medio.
Si hay un número par de datos, la mediana es el promedio de los dos valores centrales.
La moda es el valor que mayor frecuencia absoluta tiene en un estudio estadístico, o sea
el que se repite más.
Puede ocurrir que la moda no sea única, es decir, que haya más de un valor con la
frecuencia máxima. Se habla entonces de distribuciones bimodales, trimodales ...
EJEMPLO:
En la siguiente tabla se registraron los datos de una encuesta
realizada a 100 niñas de la escuela. La pregunta fue:
Colores Frecuencia
Azul
43
¿Cuál es tu color preferido?
Verde
15
Amarillo
12
Rojo
30
Si observamos la tabla vemos que el color azul es la moda,
ya que es el valor con mayor frecuencia.
100
Introducción a la Estadística
Matemática Liceo la coronilla
Prof.: Richard Gómez