Download Apuntes Introducción a la estadistica

Document related concepts
no text concepts found
Transcript
Liceo Industrial Benjamín Dávila Larrain
Laboratorio Químico
Módulo Calidad
Prof. Pamela Mondaca M
NOMBRE:
CURSO:
INTRODUCCIÓN A LA ESTADÍSTICA.
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las
observaciones, para poder hacer comparaciones y sacar conclusiones.
La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos
relativos a un conjunto de objetos, personas, procesos, etc. A través de la cuantificación y el
ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una
herramienta de suma utilidad para la toma de decisiones.
Población o Universo: es el total del conjunto de elementos u objetos de los cuales se
quiere obtener información. Aquí el término población tiene un significado mucho más
amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e
incluso al tiempo.
Muestra: es un subconjunto de unidades de análisis de una población dada, destinado a
suministrar información sobre la población. Para que este subconjunto de unidades de
análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los
elementos.
Variable: es la cualidad o cantidad medible que se estudia de las unidades de análisis y
que varían de una unidad a otra. Por ejemplo: edad, ingreso de un individuo, sexo, cantidad
de lluvia caída, etc.
Las variables se clasifican en dos grupos de acuerdo al nivel de medición utilizado para su
observación:
1) Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la
característica que miden de la unidad de análisis es una cualidad.
- Nominal es la modalidad no numérica que no admite orden. Ej. Estado civil.
- Ordinal es la modalidad no numérica que tiene orden. Ej. Medallas de Oro, plata, bronce.
2) Variables cuantitativas: son las variables que se expresan mediante un número, realizando
operaciones aritméticas con ellas, puesto que lo que miden es una cantidad, pueden ser discretas
o continuas.
- Discreta es aquella que toma valores aislados
- Continua puede tomar valores comprendidos entre dos números.
Frecuencia: es el número de veces que se presenta cada valor de la variable.
Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una
variable y sus correspondientes frecuencias.
Por ejemplo: consideremos la variable “número de aulas por escuela”, medida en las escuelas de
una localidad.
Número de aulas Frecuencia
por escuela
(1)
(2)
8
7
9
7
10
12
11
11
12
15
13
10
14
5
67
En la columna (1) se observan los
valores que toma la variable “número de
aulas por escuela”, que varían de 8 a 14.
En la columna (2) se ha colocado la
cantidad de escuelas correspondiente a
cada valor de la variable. Si sumamos
esta columna obtenemos la cantidad
total de escuelas bajo estudio.
Representación gráfica: en general la representación gráfica de una tabla de frecuencias
permite percibir con mayor claridad algunas características de la masa de datos que se
investiga. Por ello, a través de gráficos, resulta bastante más fácil transmitir conclusiones a
personas no habituadas a la interpretación de tablas de frecuencias.
Liceo Industrial Benjamín Dávila Larrain
Laboratorio Químico
Módulo Calidad
Prof. Pamela Mondaca M
Para representar gráficamente una distribución de frecuencias se utiliza un par de ejes de
coordenadas. En el eje de las abscisas se representará la variable estudiada y en el eje de las
ordenadas, las correspondientes frecuencias.
El siguiente es un gráfico de frecuencias confeccionado con los datos del ejemplo anterior.
Frecuencia
15
10
5
1
2
3
4
5
6
7
8
Número de aulas
9 10 11 12 13 14
 P ol í gonos de fre cue nc i as
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos
mediante segmentos.
Ejemplo: Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora
Te mpe ra tura
6
7º
9
12°
12
14°
15
11°
18
12°
21
10°
24
8°
 Diagrama de sectores.
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente
para las variables cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la
frecuencia absoluta correspondiente.
El diagrama circular se construye con la ayuda de un transportador de ángulos.
Ejemplo: En una clase de 30 alumnos, 12 juegan a baloncesto, 6 practican la natación, 9 juegan al
fútbol y el resto no practica ningún deporte.
Liceo Industrial Benjamín Dávila Larrain
Laboratorio Químico
Módulo Calidad
Prof. Pamela Mondaca M
Al umnos
Án gul o
Ba l onc e s to
12
144°
Na ta c i ón
6
72°
Fútbol
9
108°
S i n de porte
3
36°
Tota l
30
360°
 Histograma.
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y
que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y
por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores representados.
 Polígono de frecuencia.
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectángulo.
Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla:
ci
fi
Fi
[5 0 , 60 ]
55
8
8
[6 0 , 70 ]
65
10
18
[7 0 , 80 ]
75
16
34
[8 0 , 90 ]
85
14
48
[9 0 , 10 0 ]
95
10
58
[1 0 0 , 1 1 0 ]
110
5
63
[1 1 0 , 1 2 0 ]
115
2
65
65
Liceo Industrial Benjamín Dávila Larrain
Laboratorio Químico
Módulo Calidad
Prof. Pamela Mondaca M
 Histograma y polígono de frecuencias acumuladas.
Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el
histograma de frecuencias acumuladas o su correspondiente polígono.
Parámetros estadísticos
Al obtener de una población la distribución de frecuencias de una variable lo que se persigue es
reducir o condensar en pocas cifras el conjunto de observaciones relativas a dicha variable.
1) Medidas de centralización:
 Moda o modo: (Mo) es el valor de la variable que más veces se repite, o sea, el valor que
presenta mayor frecuencia. Se puede encontrar para variables cuantitativas y cualitativas.
Es útil como medida de tendencia central, sólo en aquellos casos en que un valor de la variable es
mucho más frecuente que el resto. Se basa en la idea de “lo que es moda” o en el
“comportamiento de la mayoría” para tomar a cierto valor como representativo del comportamiento
de los datos.
 Mediana: (Me) Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor. Se encuentra solo en variables cuantitativas. Si todos los
valores observados de la variable se ordenan en sentido creciente (o decreciente), la
mediana es el valor de la variable que ocupa el lugar central, es decir, el que deja a un lado
y a otro el mismo número de observaciones.
 Media aritmética ( ) : es el número que se obtiene al dividir la suma de todas las
observaciones por la cantidad de observaciones sumadas.
2) Medidas de posición:
 Cuartiles: son los tres valores de la variable dividen a un conjunto de datos ordenados en
cuatro partes iguales, cada uno corresponde al 25%.
 Deciles: son los nueve valores que dividen la serie de datos en diez partes iguales,
corresponden a los valores de 10%, 20%, etc.
 Percentiles: son los 99 valores que dividen la serie de datos en 100 partes iguales,
corresponden a los valores de 1%, 2%, etc.
3) Medidas de dispersión:
 Rango: es la diferencia entre el mayor y el menor de los datos de una distribución
estadística.

Desviación media (
): La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
Liceo Industrial Benjamín Dávila Larrain
Laboratorio Químico
Módulo Calidad
Prof. Pamela Mondaca M

Varianza ( ): La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media.

Desviación típica (σ): La desviación típica es la raíz cuadrada de la varianza.
 Coeficiente de variación:
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
 Puntuaciones típicas:
Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la
desviación típica. Este proceso se llama tipificación.
Esquema de Estadística