Download estadístico de muestra

Document related concepts

Parámetro estadístico wikipedia , lookup

Muestra estadística wikipedia , lookup

Estadístico muestral wikipedia , lookup

Media (matemáticas) wikipedia , lookup

Tamaño del efecto wikipedia , lookup

Transcript
Introducción a la Estadística
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
1
Una visión general de la inferencia estadística
Las 4 fases de un estudio o experimento
1. Definición de la población y parámetros de interés
2. Selección de la muestra
3. Análisis de datos
4. Inferencia hacia la población de interés
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
2
Una visión general de la inferencia estadística
Selección de la muestra: Aleatorización, Replicación y estratificación (o bloqueo)
Población de interés
descrita por parámetros.
Ejemplo: mapachines
adultos en el Refugio de
Vida Silvestre Maquenque
Parámetro: Proporción de
mapachines infectados
con el virus de rabia
Muestra seleccionada de
la población descrita por
estadísticos.
Ejemplo:
Un estudio sobre 100
mapachines adultos del
RVS Maquenque
encontró que el 47%
estaba infectado con el
virus de la rabia.
Análisis: Gráficos, Estimación y Pruebas
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
3
1. Definición de la población y parámetros de interés
 En el ejemplo, la población de interés es todos los mapachines
adultos que viven en el Refugio de Vida Silvestre Maquenque.
 El parámetro de interés es la proporción de mapachines adultos
infectados por el virus de la rabia.
 Podría ser posible, aunque extremadamente impráctico, que
cada mapachín adulto viviendo dentro de los límites del RVS
Maquenque fuera capturado y examinado con un examen para
detectar el virus (de esta manera se conocería el valor del
parámetro).
 Sin embargo, en la práctica es imposible examinar cada
mapachín del RVS Maquenque.
 Por lo tanto, se toma una muestra.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
4
2. Selección de la muestra
 Se requiere una muestra que sea representativa
 Se requiere que la respuesta de nuestra muestra sea precisa.
 Se requiere que la muestra tome en consideración divisiones o
grupos establecidos de la población de interés.
 Para alcanzar estos 3 requerimientos se debe recurrir a 3
principios fundamentales de la estadística (ARE):
Aleatorización
Replicación = Tamaño de muestra
Estratificación
(o Bloqueo)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
5
2. Selección de la muestra
Aleatorización
 Este es el aspecto más importante de un estudio o experimento
 Asegura que la muestra es “representativa” de la población
asegurando que, “en promedio”, la muestra contiene una
proporción de unidades de población que es aproximadamente
igual a la proporción encontrada en la población.
 Si un experimento no es aleatorizado o un estudio no colecta
sus muestra al azar, raramente proporciona información útil.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
6
2. Selección de la muestra
Replicación
 Asegura que los resultados de un experimento o estudio serán lo
suficientemente precisos para ser útiles.
 Una muestra grande no implica que la muestra sea representativa
(sólo la aleatorización asegura representatividad).
 No se debe confundir replicación con repetir el estudio una
segunda vez.
 Se escogen 100 mapachines para dar cierta precisión a los
resultados.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
7
2. Selección de la muestra
Estratificación (o Bloqueo)
 En ciertos estudios o experimentos el investigador conoce de
antemano una variable que influye marcadamente sobre la
variable respuesta. Por ejemplo, en el caso de los mapachines se
puede reconocer relaciones fuertes entre diferentes regiones del
RVS Maquenque y la variable respuesta.
 La estratificación posibilita incrementar la precisión del estimado
al estratificar o bloquear la población en grupos más
homogéneos.
 En cada estrato o bloque se realiza un muestreo aleatorio y los
resultados son entonces combinados.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
8
3. Análisis de Datos
 Una vez que el muestreo fue realizado se tiene un conjunto de
información (estadísticos) colectado de la población.
 El análisis de los datos depende de los datos colectados ( la
muestra) y de la manera que los datos fueron colectados (el
muestreo). Debe haber concordancia entre diseño de muestreo
y análisis.
 Por ejemplo, si los datos fueron colectados usando un muestreo
aleatorio estratificado, entonces se deben usar métodos de
análisis para muestreos estratificados.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
9
4. Inferencia hacia la población de interés
 El interés está realmente en la población, no en la muestra.
 La muestra es simplemente un elemento para obtener
información sobre la población.
 La información de la muestra debe ser usada para hacer
inferencias sobre la población mediante:
Gráficos
Estimación
Prueba de Hipótesis
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
10
4. Inferencia hacia la población de interés
Gráficos
 Un buen gráfico (figura) es preferible a una tabla de números o
estadísticos.
 El gráfico debe ser claro, relevante e informativo.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
11
4. Inferencia hacia la población de interés
Estimación
 El número obtenido de nuestra muestra es un estimado del
verdadero (y desconocido) valor del parámetro poblacional.
 Siempre se debe reportar una medida de precisión del estimado.
 Hay diferentes manera de reportar la precisión de un estimado.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
12
4. Inferencia hacia la población de interés
Prueba de Hipótesis (Estadística)
 Puede haber un estudio previo en el RVS Maquenque y se quiere
comparar si la tasa de infección aumento, es estable o
disminuyó.
 Puede haber un estudio en otra zona o parque nacional y se
quiere comparar si la tasa de infección es mayor, igual o menor.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
13
Variables Aleatorias
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
14
Escalas o Niveles de medida
Existen 4 escalas de medidas que deben ser consideradas:
1. Datos Nominales
2. Datos Ordinales
3. Datos de Intervalo
4. Datos de Razón (Racional)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
15
Escalas de medidas
1. Datos Nominales
 Son datos de clasificación (ejemplo: macho, hembra)
 No tienen orden (no tiene sentido afirmar que macho > hembra).
 Las etiquetas son arbitrarias: macho/hembra, 1/0.
 Se puede examinar si el dato en escala nominal pertenece a un determinado valor (por
ejemplo si el sexo de un animal es hembra) o contar el número de ocurrencia de cada
valor (contar el número de machos en una muestra).
2. Datos Ordinales
 Los datos pueden ser ordenados pero las diferencias entre valores no pueden ser
cuantificadas.
 Escala de satisfacción de 1 a 5.
 Clasificación de hoteles (1 a 5 estrellas).
 Se puede ordenar un dato como menor o mayor que otro valor, pero no se puede
“cuantificar” la diferencia entre 2 valores ordinales.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
16
Escalas de medidas
3. Datos de Intervalos
 Los datos pueden ser ordenados, tienen una escala constante, pero no tienen un cero
natural.
 Esto implica que las diferencias entre valores tienen sentido, pero los cocientes entre
valores no. Ejemplo: 30°C - 20°C es igual a 20°C -10°C, pero 20°C/10°C no
es 2 veces más caliente.
 Temperaturas, fechas.
 El valor 0°C es arbitrario.
4. Datos de Cociente
 Los datos pueden ser ordenados, tienen un a escala constante, y tienen un cero
natural.
 Altura, peso, edad, largo, ancho, etc.
 Tiene sentido decir que 10 m es 2 veces más largo que 5 m.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
17
Variables
Variable Aleatoria (Random Variable)
 Una propiedad medida (peso corporal, número de individuos, pH, temperatura) por
observaciones individuales.
 El nombre aleatorio no significa que el peso de un individuo es aleatorio, sino que no se
puede predecir el peso de un individuo hasta que se mide.
 Es una medida numérica de un resultado aleatorio
Ejemplo
Variable aleatoria:
peso corporal de
mapachines adultos
Población Estadística: Pesos corporales de
mapachines adultos del Parque Nacional
Manuel Antonio
Muestra
3,8 kg
3,4 kg
3,9 kg
2,4 kg
2,4 kg
3,5 kg
3,7 kg
3,4 kg
3,4 kg
2,6 kg
3,6 kg
3,6 kg
2,8 kg
3,4 kg
3,4 kg
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
18
Tipos de variables
Variable Nominal
Variable Cualitativa o
Categórica
Variable Ordinal
Variable
Variable Discreta
Variable Cuantitativa
Variable Continua
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
19
Tipos de variables
Variable continua Variable categórica
Variable discreta
Peso corporal (kg)
Sexo
No. de garrapatas
12.8
Hembra
16
14.5
Macho
5
11.0
Hembra
14
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
20
Tipos de variables
Variables Categóricas
Son factores con 2 o más niveles.
Ejemplos
 Vivo/muerto
 Macho/hembra
 Edades de tilapias (por ejemplo, 5 clases)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
21
Tipos de variables
Variables Discretas
 Variables que pueden tomar sólo números enteros.
Ejemplos
 Numero de huevos por nido
 Numero de crías por camada
 Numero de animales o plantas por unidad espacial o temporal
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
22
Tipos de variables
Variables Continuas
 Variables que pueden tomar cualquier valor dentro de un
intervalo.
Ejemplos
 Peso corporal de tapires
 Altura de árboles
 Largo de ala de tucanes
 Oxigeno disuelto en el agua
 Concentración de pesticida en tejidos de peces
 Desviaciones del promedio de pulsaciones por minuto del corazón
(números reales negativos y positivos)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
23
Estadística Descriptiva e Inferencial
Estadística Descriptiva
Estadística
Estadística Inferencial
(Estimación de parámetros y
Prueba de hipótesis)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
24
Estadística Descriptiva e Inferencial
Estadística descriptiva
Estadística inferencial
Describe, analiza y representa un
grupo de datos utilizando métodos
numéricos y gráficos que resumen y
presentan la información contenida en
ellos.
Comprende los métodos y
procedimientos para deducir
propiedades (hacer inferencias) de
una población a partir de una pequeña
parte de la misma (muestra).
Podemos clasificar la estadística en descriptiva, cuando los resultados del
análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando
el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de
datos más amplio.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
25
Estadística Inferencial
 La estadística inferencial se concentra en la estimación
de parámetros y la prueba de hipótesis estadísticas.
 La población aquí no se refiere a una población
biológica ,se refiere a una población estadística.
 Una población estadística es definida como la colección
de todas las posibles observaciones de interés y sobre
la cual nosotros deseamos hacer inferencias.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
26
Ejemplos de Poblaciones Estadísticas
Población estadística: Venados de cola blanca (Odocoileus viginianus)
en la Provincia de Guanacaste.
Medida: peso corporal
Diseño de muestreo: muestreo aleatorio estratificado, con estratificación
basada en sexo y edad.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
27
Ejemplos de Poblaciones Estadísticas
Población estadística: Cajas nidos del pato arcoiris (Aix sponsa) en el
Refugio Nacional de Vida Silvestre Ottawa, Ohio,
EUA.
Medidas: uso/no uso.
Diseño de muestreo: muestreo aleatorio simple.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
28
Ejemplos de Poblaciones Estadísticas
Población estadística: Osos hormigueros (Myrmecophaga
tridactyla) en 4 Parques Nacionales de
Brasil.
Medidas: Densidad (Número de individuos /ha).
Diseño de muestreo: muestreo aleatorio estratificado, con estratificación
basada en cada uno de los parques nacionales.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
29
Estadística Descriptiva
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
30
Resumen Estadístico de una Variable
Parámetro de población vs estadístico de muestra
 Es muy importante distinguir entre un parámetro de población y un
estadístico de muestra.
 Un parámetro es un resumen numérico de una población. Como una
población tiene muchos miembros o elementos, el valor del parámetro es
difícil de conocer, al menos que se realice un censo.
 Cualquier medida calculada de un subconjunto de la población (muestra)
es un estadístico.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
31
Resumen Estadístico de una Variable
Parámetro de población vs estadístico de muestra
Situación
Parámetro Poblacional
Estadístico de muestra
Encuesta política a favor de
candidatos presidenciales
Proporción de votantes a favor de
un candidato
Proporción a favor de un
candidato de 1000 encuestados
Nivel de DDT (pesticida) en
huevos de una especie de ave
rapaz que habita en Guatemala
Nivel medio de DDT en todos los
huevos de la especie en
Guatemala
Nivel medio de DDT en 150
huevos de la especie colectados
en Guatemala
 Para distinguir entre parámetros poblacionales y estadísticos de muestra
se usan diferentes símbolos. Generalmente se usan letras Griegas para
referirse a parámetros y letras Romanas para referirse a estadísticos.
 Se debe recordar que los estadísticos de muestra estiman el parámetro de
población y la Estadística tiene como objetivo evaluar que tan bien el
estadístico estima el verdadero parámetro de la población.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
32
Estimación de Parámetros
 Un parámetro usualmente necesita ser estimado
 Si se intenta conocer el peso corporal de los mapachines del PN Manuel Antonio no
se pueden pesar todos los mapachines del parque.
 La estimación de parámetros se basa en la colecta de una muestra representativa de
datos.
 Estos datos son colectados de acuerdo a un protocolo de base científica (diseño de
muestreo).
Población Estadística: Mapachines adultos del Parque Nacional Manuel Antonio
Medida: Pesos corporal
Población estadística
Muestra
PN Manuel Antonio
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
33
Definiciones
Muestreo: la selección de una porción de un todo de tal manera que
podemos usar esa porción para informarnos sobre el todo.
Población estadística: la colección completa de elementos de estudio. La
agregación completa de elementos de donde la muestra es colectada.
Elemento: un miembro de una población (un animal, una planta, una caja
nido, una madriguera).
Muestra: es un grupo de unidades seleccionados de un grupo mayor (la
población). La inferencia estadística trata de como obtener información (inferir) sobre los
parámetros a partir de subconjuntos de valores (muestras) de la variable.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
34
Definiciones
Unidad de muestreo
Es aquel elemento o conjunto de elementos considerados para ser
seleccionados por un protocolo de muestreo. En muestreos de un solo nivel
(single-stage), la unidad de muestreo equivale al elemento. En un muestreo de
3 niveles (ejemplo, grupo de casas, familia, adultos), todos son unidades de
muestreos y solo los últimos son elementos. Cada uno de los niveles se
denominaría, unidad de muestreo primaria, unidad de muestreo secundaria,
unidad de muestreo final o terciaria (en el ejemplo).
Parámetro (estadísticos de población)
 Un parámetro es un valor, usualmente desconocido (y por lo tanto tiene que
ser estimado), que representa cierta característica de la población.
 Ejemplos: peso corporal, tamaño de población, diversidad de especies.
 Se considera un valor fijo (no varían, no son variables aleatorias).
 Generalmente se caracterizan con letras griegas: μ, σ, Ψ
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
35
Definiciones
Estadístico (Estadístico muestral)
 Es una cantidad que es calculada de una muestra de datos.
 Brinda información sobre valores no conocidos en la población correspondiente
 Por ejemplo, el promedio de los datos en una muestra brinda información sobre el promedio
total en la población de donde se tomó la muestra.
 La media muestral, la varianza muestral, etc., son estadísticos muestrales.
 Generalmente se caracterizan con letras romanas ( ejemplo, x ,s 2), mientras que los
equivalentes valores no conocidos (parámetros) son caracterizados con letras griegas
(ejemplo, µ, σ).
Estimado
 Un estimado es una indicación del valor de una cantidad no conocida (parámetro) basado en los
datos observados.
 Más formalmente, un estimado es el valor de un estimador y es usado para indicar el valor de un
parámetro.
 Ejemplo: Estimado del peso promedio de los mapachines adultos del PN Manuel Antonio = 5.5 kg
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
36
Definiciones
Estimador
Es una formula o expresión matemática usado para calcular un estimado.
Ejemplo:
x

x
i
Estimador de la media de la población
n
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
37
Medidas de Tendencia Central
Media, Mediana y Moda
Ejemplo
Valores de DDT (ppm) en una muestra de 20 huevos de una especie de ave
rapaz en México.
18 18 21 21 21 21 21 21 21 21 25 25 25 25 25 25 35 35 50 70
 En lugar de reportar los 20 valores se quiere reportar un valor “típico” que
caracterice a la muestra.
 Una medida apropiada puede ser un valor en el medio reconociendo que
algunos huevos van a tener menos DDT y otros van a tener más DDT
debido a variación en el tipo y cantidad de alimento consumido por las
hembras.
 3 medidas de tendencia central son la media, la mediana y la moda.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
38
Medidas de Tendencia Central
Media, Mediana y Moda
Parámetro
Estadístico
Como se calcula
n
Media de la
población (μ)
Media de la
muestra ( y )
y
i 1
i
n
Se ordenan los datos
de menor a mayor
Si n es impar la
mediana es X(n+1)/2
Si n es par la
mediana es (X(n/2) +
X (n/2+1))/2
Comentarios
Medida de localización.
La media es sólo válida para datos de
intervalo o cociente.
Es sensitiva a valores atípicos (outliers).
La mediana divide al conjunto de datos en 2
mitades con igual número de
observaciones.
La mediana es valido para datos ordinales,
datos de intervalo, o datos de cociente
(racional).
No es sensitiva a valores atípicos.
Mediana de la
población (no
símbolo)
Mediana de
la muestra
(no símbolo)
Moda de la
población (no
símbolo)
La moda es el valor
Moda de la
que ocurre más
La moda es válido para todas las escalas de
muestra (no frecuentemente
medidas.
símbolo)
(pueden existir
múltiples modas)
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
39
Medidas de Tendencia Central
Media, Mediana y Moda
Ejemplo
Valores de DDT (ppm) en una muestra de 20 huevos de una especie de ave
rapaz en México.
18 18 21 21 21 21 21 21 21 21 25 25 25 25 25 25 35 35 50 70
21 + 25/2
Mediana
Tamaño de muestra
Media muestral
Mediana muestral
Moda muestral
20
544/20 = 27,2 ppm
(21 + 25)/2 = 23 ppm
21 ppm
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
40
Medidas de Tendencia Central
Media, Mediana y Moda
 Es muy raro que las 3 medidas sean exactamente iguales.
 Si los datos tiene una distribución perfectamente simétrica
entonces las medidas serán exactamente iguales (media =
mediana = moda).
 Como la distribución se torna asimétrica, la media muestral se
aleja de la mediana en la dirección de la cola más larga.
 La media es afectada por valores extremos, pero la mediana no.
 Un simple manera de recordar la relación entre las 3 medidas es:
“La mediana se ubica siempre entre la media y la moda”
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
41
Medidas de Tendencia Central
Moda
18,0
Mediana Media
19,0
19,3
Frecuencia
Mean = 20,0
Mediana =20,0
Moda = 20,0
Frecuencia
Frecuencia
Media, Mediana y Moda
Media
20,7
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
Mediana Moda
21,0
22,0
42
Medidas de Tendencia Central
Media, Mediana y Moda
Si tuvieran que reportar una medida de tendencia central o
localización para describir los salarios de los empleados de la UNA
¿Qué medida escogerían?
La mediana es mejor, porque refleja mejor que la media los
ingresos de los empleados de la UNA, ya que la media puede
estar inflada por la presencia de 2 o 3 salarios altos.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
43
Medidas de Tendencia Central
Media Geométrica y Media Armónica
 Otras 2 medidas de tendencia central
 Las veremos en el práctico
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
44
Medidas de Dispersión
La Varianza y el Desvío Estándar
 No es suficiente reportar una media u otra medida de localización o
posición porque siempre hay variación en los datos.
 Una medida de la variabilidad es quizás la medida más importante en
estadística.
 A mayor variabilidad en nuestros datos, mayor será nuestra
incertidumbre en los valores de los parámetros estimados de los
datos, y más baja será nuestra capacidad de poder encontrar
diferencias entre estimados.
 El desvío estándar (DE) mide la dispersión (variación) de los datos con
respecto al centro de los mismos.
 Si todos las observaciones son iguales, entonces el DE = 0.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
45
Medidas de Dispersión
El Desvío Estándar y la Varianza
Parámetro
Estadístico
Desvío
Estándar de la
población ()
Desvío
Estándar de la
muestra (s)
Como se calcula
n
(y
i 1
i
 y)2
n 1
n
Varianza de la
población (2)
Varianza de la
muestra (s2)
 ( y  y)
i 1
i
n 1
2
Comentarios
El desvío estándar es la raíz cuadrada de
la varianza.
Sensible a valores atípicos (outliers).
La varianza es el cuadrado del desvío
estándar.
Sensible a valores atípicos (outliers).
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
46
Medidas de Dispersión
Asimetría y Kurtosis
 Hasta ahora hemos visto los 2 primeros momentos
de una distribución muestral, la media y la varianza.
 La asimetría involucra el 3er momento y la kurtosis
involucra el 4to momento.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
47
Medidas de Dispersión
Asimetría
 La asimetría describe como la muestra difiere en su forma de una distribución
simétrica.
 La asimetría es el 3er momento dividido por el desvío estándar al cubo (s3) (es el 3er
momento de una distribución estandarizado).
 Una distribución normal es simétrica y tiene asimetría = 0.
 Una asimetría positiva indica una cola larga hacia la derecha.
 Una asimetría negativa indica un acola larga hacia la izquierda.
n
3er
Momento
m3 
(y
i 1
i
 y )3
Asimetría
positiva
n
s3  s y  ( s 2 )3
3
m
Asimetría  g1  3
s3
Asimetría
negativa
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
48
Medidas de Dispersión
Kurtosis
 La kurtosis mide cuanto de la densidad de probabilidades está distribuido
en las colas vs el centro de la distribución.
 Se dice que una distribución muestral es platikurtica (aplanada) cuando
g2 < 0 y leptokurtica (picuda) cuando g2 > 0.
Platikurtica
n
4to
Momento
m4 
4
(
y

y
)
 i
i 1
n
s4  s y  ( s 2 ) 4
4
Asimetría  g 2 
Leptokurtica
m4
3
s4
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
49
Medidas de Dispersión
Percentiles
 Un percentil es el valor de una variable por debajo del cual se
encuentra cierto porcentaje de las observaciones.
Por ejemplo: P20 (percentil de orden 20) es el valor de la
variable, tal que, el 20% de los datos son iguales o inferiores a
P20.
Puede o no coincidir con un valor observado
 El 25 percentil es el 1er cuartil, el 50 percentil es la mediana, y el
75 percentil es el 3er cuartil.
 Por ejemplo, si un estudiante mide 185 cm y constituye el 90 percentil,
entonces 90% de los estudiantes tienen alturas menos de 185 cm y 10%
de los estudiantes tienen pesos mayores a 185 cm.
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
50
Medidas de Dispersión
Percentiles
P20 = X(0,20 x 24) = 4,8  5 (la 5ta observación) = 2,1
P75 = X(0,75 x 24) = X18 + X19/2 =(el promedio de las observaciones 18 y 19)= (7,5 + 8,0)/2 =7,75
P50 = X(0,50 x 24) = X12 + X13 = 4,9 + 5,2/2 = 5,05
P20 = 2,1
P75 = 7,75
Xmin = 1,1
0
1,0
Xmax = 9,9
2,0
3,0
4,0
5,0
6,0
7,0
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
8,0
9,0
10,0
51
Medidas de Dispersión
Coeficiente de Variación
 El coeficiente de variación es una medida de variabilidad.
 Se calcula dividiendo el desvío estándar por la media (y se lo
multiplica por 100 para expresarlo como porcentaje).
 Por ejemplo, si un grupo de datos tiene un CV = 16,5% y otro
grupo de datos tiene un CV = 25%, se puede concluir que el
primer grupo de datos es menos variable que el segundo.
s
CV  100
y
Desvío
estándar
Media
Estadística Básica - Manuel Spínola (ICOMVIS - UNA)
52