Download File

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Rango intercuartílico wikipedia , lookup

Transcript
MÉTODOS CUANTITATIVOS
¿Qué es la estadística?

Los métodos empleados para resumir y organizar
datos se denominan estadística descriptiva;
mientras que los métodos para tomar decisiones
se denominan inferencia estadística.
Población y muestra

El término población se refiere a los elementos del universo
respecto al cual se quieren obtener conclusiones o tomar
decisiones. A cada elemento se le puede asociar una medición que
bien puede ser numérica o cualitativa dependiendo de la
característica que se quiera estudiar. El término muestra se
refiere al subconjunto de observaciones seleccionadas de la
población de interés.
Variables


A cada característica de los elementos de una
población se le llama variables. Nos encontraremos con
varios tipos de variables: cualitativas y cuantitativas.
Las variables cualitativas son aquellas que se refieren
a categorías o atributos de los elementos (individuos)
estudiados. Las variables cuantitativas son aquellas
cuyos datos son de tipo numérico.
Variables cualitativas
Dicotómicas: Sólo hay dos categorías, que son
excluyentes una de la otra
 Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
 Nominal: tiene mas de dos categorías y no hay orden
entre ellas.
 Ejemplo: color de los ojos, grupo sanguíneo
 Ordinal: tiene varias categorías y hay orden entre
ellas.
 Ejemplo: grado tumoral, calificación del riesgo en
anestesia.

Variables cuantitativas

Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de medida
Ejemplo: presión arterial, edad, peso.
Discretas: números finitos o infinitos numerables de
elementos. Se asocia con el concepto de conteo.
 Ejemplo: N° de hijos, N° de casos de tuberculosis por
estado.



Hay ocasiones en las que las medidas cuantitativas
continuas son transformadas en ordinales mediante la
utilización de uno o varios puntos de corte.
Ejemplo: la variable peso es codificada en varias
categorías y se utiliza en términos como: bajo-peso,
peso-normal, sobrepeso, obesidad
 Las
descripciones numéricas de datos suelen
ser importantes. Dado un conjunto de n
observaciones
 La estadística descriptiva nos puede ayudar
mediante resúmenes numéricos, que son
medidas de tendencia central, o también
llamadas de posición y medidas de
dispersión
x1 , x2 ,....., xn

Las medidas descriptivas más comunes de tendencia
central o localización son: la media aritmética y
la mediana.
Media

La media aritmética o simplemente promedio (también
llamada media muestral ya que generalmente se
calcula con relación a una muestra) se calcula de la
siguiente forma: si las observaciones de una muestra de
tamaño n son x1, x2,…,xn entonces
n
x
x 1  x 2  ...  x n i  1
X

n
n
i
Es intuitiva y fácil de calcular.
 Su valor puede que no coincida con ninguno de los
valores de la muestra
 La suma de las diferencias de cada valor de la
muestra con la media su resultado es cero, es decir,

n
 (x  x)  0
i 1
i
Mediana

La mediana se suele definir como el valor “más
intermedio” una vez que los datos han sido ordenados
en forma creciente. Se suele denotar por Me. La forma
más general de calcular la mediana es la siguiente:
 x  n  1 2

Me   x
 n 2   x  ( n 2) 1


2
si n es impar
si n es par
La mediana es aquel valor que deja el cincuenta por
ciento de los datos por debajo y otro cincuenta por
encima.
 Cabe destacar que es preferible el uso de la mediana
como medida descriptiva del centro cuando se quiere
reducir o eliminar el efecto de valores extremos en un
conjunto de datos (muy grandes o muy pequeños).

Moda

Es una medida de tendencia central que se puede
utilizar sea cual sea el tipo de variable a estudiar. La
moda de un conjunto de observaciones es el valor que
más se repite, aquel cuya frecuencia absoluta es
máxima. Puede ser única, que haya más de una, o que
no exista.

Las medidas descriptivas más comunes de
dispersión son: el rango, la varianza, la
desviación
estándar
y
el
rango
intercuartílico.
Rango

El rango de la muestra es la medida de variabilidad
más sencilla entre todas las mencionadas; y se define
como la diferencia entre la observación más grande y
la más pequeña:
r  xmax  xmin

Aunque es una medida muy fácil de calcular, ignora
toda la información de la muestra entre las
observaciones más grande y más pequeña. Sin
embargo, vale la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al control de
calidad.
Varianza
n
S 
2
 (x  x)
i 1
i
n 1
2
Desviación estándar

Esta medida de variabilidad se denomina varianza.
Como S2 no tiene las mismas unidades que los datos,
se define la desviación estándar como la raíz cuadrada
(positiva) de la varianza a fin de tener una medida en
las mismas unidades de los datos. La desviación
estándar es útil para comparar dispersión entre dos
poblaciones, pero también lo es para calcular el
porcentaje de la población que pueden localizarse a
menos de una distancia específica de la media.
Cuartiles


Los cuartiles dividen a un conjunto de datos en cuatro
partes iguales.
Para explicarlo un poco mejor, piense en un conjunto
de datos ordenados de menor a mayor. Al valor de en
medio es la mediana. Esto es, 50 por ciento de los datos
son mayores que la mediana y 50 por ciento son
menores. De manera similar los cuartiles dividen a un
conjunto de datos en cuatro partes iguales.

El primer cuartil, al que se le llama Q1, es el valor por
debajo del cual se encuentra el 25% de los datos, y el
tercer cuartil usualmente llamado Q3, es el valor por
debajo de el se encuentra el 75% de los datos. Q2 es la
mediana. Los valores Q1, Q2 y Q3 dividen al conjunto
de datos ordenados en cuatro partes iguales. Q1 se
puede entender como la mediana de la mitad inferior
de los datos ordenados y Q3 como la mediana de la
mitad superior de los datos ordenado.