Download estadistica

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA
Taller de Profundización de 3er. Año - IFD Comenio de Canelones
En la cantina de una escuela se
comenzará a vender las siguientes
frutas: manzanas, bananas y naranjas
Queremos saber cuánto compraremos
de cada tipo por semana
¿Qué podemos hacer para decidirlo?
MÉTODO ESTADÍSTICO
• Decidir que variables quiero estudiar
• Recoger datos
• Organizarlos
• Analizarlos
• Sacar conclusiones
• Tomar decisiones
La Estadística es la ciencia que
trata de la recopilación,
organización y análisis de datos,
con el fin de realizar una toma de
decisiones más efectiva.
El campo de la Estadística puede dividirse en dos
áreas: descriptiva e inferencial.
La Estadística Descriptiva consiste en un
conjunto de procedimientos empleados para
organizar y resumir ciertos datos. Se vale de la
elaboración de tablas, gráficos y del cálculo de
indicadores.
La Estadística Inferencial se compone de un
conjunto de métodos que basándose en los
resultados obtenidos del análisis de una muestra,
infiere, induce, estima, las características de la
población de la que fue seleccionada dicha muestra.
VALORACIÓN DE LA ESTADÍSTICA
• Conocer la realidad del entorno
• Evaluar críticamente la realidad del entorno
VALORACIÓN DEL TRABAJO ESTADÍSTICO
• Actuación sistemática, rigurosa y precisa en los
procesos de recogida y recuento de datos
• Actitud de investigación
• Trabajo en equipo
Términos básicos:
Población: Conjunto de todos los elementos
que cumplen una determinada
característica, que deseamos medir o
estudiar.
Unidad de análisis: Cada uno de los
elementos de la población.
Muestra: Cualquier subconjunto de la
población.
Variable: característica de interés, lo que
observamos de cada individuo.
Ejemplo: edad, estudios cursados, sueldo
Valor: Cada uno de los posibles estados con lo
que puede presentarse la variable.
Ejemplo: Si la variable es sexo, los valores
posibles son masculino, femenino.
Dato: es un valor individual, valor de la variable
asociado a un individuo de la población o
muestra.
Dato y valor no son lo mismo, por ejemplo, si en
120 personas se observa el sexo, se obtendrán
120 datos que corresponden a 2 valores:
masculino o femenino.
Distribución: Conjunto de datos correspondientes a la
misma variable para todos los individuos de la población o
muestra.
Individuos
Variables
Sexo
edad
estatura
AA
1
8
120
PQ
1
7
124
AR
2
8
125
NN
2
8
123
JF
2
9
119
PK
1
8
122
RC
2
8
121
LS
2
7
123
PP
1
9
126
TIPOS DE VARIABLES

 Nominales (Ej : sexo, opción política)


 Cualitativ as 
Ordinales (Ej : nivel educativo, estado de una vivienda)





Discretas (Ej : edad, nº integrante s de una familia)


 Cuantitati vas 

Continuas (Ej : Peso, estatura)


Descripción de datos nominales
Frecuencia absoluta: (fa) El número de datos que tienen
el mismo valor, es la frecuencia absoluta de dicho valor.
La suma de las frecuencias de todos los valores que
puede tomar la variable en estudio, es igual al número
total de datos, o sea el cardinal de la población o
muestra.
Frecuencia relativa: (fr) es la razón entre la frecuencia
absoluta (fa) y el cardinal de la población o muestra (n).
Se cumple que: 0  fr  1. La frecuencia relativa también
se puede expresar como un porcentaje, simplemente
multiplicándola por 100.
Ejemplo: Preguntamos el sexo a una muestra de
consumidores de cierta marca de cigarrillos, y codificamos
sus dos valores con números: 0 (hombre) y 1 (mujer).
Obtuvimos la siguiente tabla primaria:
individuo
sexo
A
1
B
1
C
0
D
0
E
1
De la cual realizamos la siguiente tabla de
frecuencias:
x
fa
fr
0
2
0,4 = 40%
1
3
0,6 = 60%
El siguiente paso es realizar un gráfico. Hay distintos tipos de gráficos.
Gráfico circular o de sectores: este gráfico sólo sirve para datos del tipo
nominal, que no tenga muchos valores distintos de la variable. Cada valor
de la variable queda representado por un sector circular cuya amplitud se
calcula multiplicando la frecuencia relativa por 360°s
Gráfico de barras simples o barras seccionadas:
Medidas de tendencia central: para este tipo de variable la única que podemos
definir es la moda, que es el valor más frecuente. En el ejemplo, la moda es
1(femenino)
Descripción de datos ordinales
Este tipo de variable nos permite ordenar los datos
y por lo tanto podemos agregar una nueva columna
a la tabla de frecuencias que corresponde a la
frecuencia acumulada. A cada valor de la variable,
le corresponde como frecuencia acumulada el
número de datos existente en la distribución con un
valor igual o menor a él. Podemos hablar de
frecuencia acumulada relativa o absoluta.
Trabajaremos con el siguiente ejemplo:
Se preguntó a los padres de los alumnos de una escuela, sobre su
nivel de instrucción, con las siguientes opciones:
1 – sin instrucción
2 – primaria completa
3 – secundaria completa
4 – terciaria
obteniéndose los resultados, cuyas frecuencias absolutas fa son:
X
fa
Fa
fr
1
20
2
40
20
60
10%
20%
3
80
140
4
60
200
40%
30%
Fr
10%
30%
70%
100%
En la segunda columna, las frecuencias acumuladas absolutas Fa, en
la tercer columna las relativas fr y en la cuarta las relativas
acumuladas Fr
En este caso es recomendable un gráfico de barras simples:
Medidas de tendencia central: Al poder ordenar los datos de menor a mayor, es
posible definir, una medida que pueda representar el orden: la mediana. Es el
valor central de la distribución ordenada de datos, el que la divide en dos partes
con igual cantidad de datos. La ubicamos como la primera que pasa el 50% en la
frecuencia relativa acumulada.
En el ejemplo: la mediana es el valor 3 (secundaria) que coincide con la moda.
Descripción de datos cuantitativos
La mediana utiliza cantidades de datos o
frecuencias, no distingue entre magnitudes,
dado que lo relevante en los datos ordinales
es el orden.
Por ello para los datos cuantitativos,
definiremos un indicador que sea sensible a
las magnitudes de los datos y no solo a su
frecuencia: la media aritmética
Ejemplo:
Consideremos los datos:
1, 2, 2, 2, 3, 6, 6, 8, 8, 8.
La media aritmética es:
X
1  2  2  2  3  6  6  8  8  8 1.1  2.3  3.1  6.2  8.3

 4, 6
10
10
En general, la media aritmética puede expresarse así:
X 
x1 . f a1  x2 . f
a2
n
   x p . f ap
Si tenemos pocos valores distintos de la variable, podemos
realizar un gráfico de barras. Pero si tenemos muchos
valores distintos de la variable debemos hacer un
histograma, donde los datos se agrupan en intervalos o
clases.
Se recomienda que el número de intervalos sea entre 5 y 20
Rango = valor máximo – valor mínimo
Longitud de cada intervalo = (Rango + 1) / nº de intervalos.
Ejemplo:
Las alturas en centímetros de todos los estudiantes de un
curso son:
168, 160, 168, 175, 175, 160, 165, 154, 163, 165, 168, 168,
158, 149, 160, 161, 162, 166, 163, 159, 178, 169, 158, 163,
171, 170, 165, 150, 167, 164, 162, 165, 163, 156, 174, 165,
173, 172, 168, 168.
Las agrupamos en 6 intervalos. El rango es 178 – 149 = 29
Por lo tanto, la longitud de cada intervalo es 30 / 6 = 5
Clase modal: de 164 a 169
Clase de la mediana: de 164 a 169
Media: 165,5
Para calcular la media, deberemos hallar la marca de
clase de cada una de ellas que es el punto medio de
cada intervalo
INTERVALO
MARCA DE
CLASE
fa
149  x < 154
151,5
2
154  x < 159
156,5
4
159  x < 164
161,5
11
164  x < 169
166,5
14
169  x < 174
171,5
5
174  x < 179
176,5
4
En este caso la media es:
151,5.2  156,5.4  161,5.11  166,5.14  171,5.5  176,5.4 6620
X

 165,5
40
40
Polígono de frecuencias
Para pensar:
Si el ingreso medio per
cápita de un país A es 100
dólares y el de un país B es
de 250 dólares, ¿cuál de
ellos tiene mejor
distribución de la riqueza?
Medidas de dispersión
Consideremos las siguientes muestras
M1 = {5, 6, 6, 6, 7} y M2= {1, 2, 6, 10, 11}
Ambas tienen una media de 6
Sin embargo la primer muestra tiene menor
variación respecto a la media.
Es por eso que la media debe ir acompañada de
otros indicadores que se llaman
medidas de dispersión.
Algunas de ellas son:
1º) El rango = valor máximo – valor mínimo
2º) desviación media =
 xi  X 
2
3º) varianza =
n
 xi  X
n
xi


n
2
X
2
4º) desviación típica o standard :   var
La dirección del liceo desea averiguar que
porcentaje de alumnos utiliza la biblioteca,
para ello le pide a los adscriptos que
encuesten a 30 alumnos por turno.
Identificar: población, muestra, unidad de
análisis y variable.
Clasificar la variable.
Discutir la representatividad de la
muestra siendo que el turno 3 tiene la
mitad de estudiantes que el turno 1.
De una encuesta realizada a un grupo de jóvenes,
sobre sus preferencias deportivas, se obtuvo el
siguiente gráfico.
¿Cuál es el deporte favorito?
Si fueron encuestados 200 jóvenes ¿cuántos
prefieren tenis?
Si sabemos que 36 prefieren basquetbol ¿cuántos
fueron encuestados?
11%
futbol
25%
47%
voleibol
basquetbol
tenis
17%
Un ejemplo:
Cuatro jugadoras de baloncesto se han sometido a la siguiente prueba: Cada
una de ellas ha hecho 10 lanzamientos a canasta a una distancia de 1 m, otros
10 lanzamientos desde 2m y así sucesivamente hasta 8m. En cada caso se
han anotado los siguientes encestes:
¿Qué jugadora es más eficaz en el
enceste?
Razona la respuesta usando los
datos numéricos y la gráfica que se
adjunta
5 años
La producción de información estadística.
-Determinación de la población y los elementos que la integran
- Organización icónica de la información cualitativa
Primero
Datos estadísticos
-Análisis de la frecuencia de los sucesos
- Representación en tablas
Segundo
Información estadística
-Descripción e interpretación de información en tablas
-Representación gráfica de la información
Tercero
El trabajo estadístico
-muestra y variable para precisar la recolección de datos
-conclusiones a partir de la interpretación de tablas
Cuarto
El tratamiento de la información estadística
-la frecuencia absoluta y relativa
-las representaciones en diagramas de barras
Quinto
Las medidas de tendencia central
-la moda, media y mediana
Histogramas
Sexto
Medidas de dispersión: el rango
Polígonos de frecuencias
Enunciados de problemas para Primaria