Download descargar - Centro de Estudios Adlerianos

Document related concepts
no text concepts found
Transcript
Centro de Estudios Adlerianos
Conceptos Básicos de Estadística
Eduardo Aguilar
Enero - 2010
Para qué sirve estadística?


Estadística nos ayuda a generalizar conclusiones
que inferimos a partir de datos (hechos)
particulares. Ejemplo: elecciones nacionales
Con estadística no podemos demostrar que una
hipótesis (conjetura) es correcta: apenas podemos
descartar una hipótesis por ser poco verosímil a la
luz de los datos (hechos) que disponemos.
Para qué sirve probabilidad?


Probabilidad nos ayuda a deducir conclusiones
particulares a partir de un conocimiento general.
Ejemplo: dado balanceado, moneda balanceada.
Para medir probabilidades usamos números reales
comprendidos entre 0 y 1. (o porcentajes)
Importante! Estadistica vs Probabilidad


Estadística parte de
conocimiento
particular (datos)
Estadística INFIERE
conocimiento general


Probabilidad parte de
conocimiento general
(modelo, ley)
Probabilidad
DEDUCE
conocimiento
particular
Marie-Louise von Franz
El hombre y sus símbolos
“...Pero las estadísticas son injustas con el indivíduo.
A pesar de que el diámetro promedio de las piedras
de una pila sea de cinco centímetros, encontraremos
que poquísimas piedras de ese montón tienen
exactamente cinco centímetros de diámetro...”
Cuándo precisamos estadística?
Dos dificultades al inferir conclusiones generales:
•
Diferencias observadas pequeñas comparadas
con imprecision experimental y variabilidad
biológica.
•
Para protegernos de conclusiones equivocadas
debidas a nuestra capacidad para detectar
patrones.
Jean Baudrillard
(sociólogo francés)
“Les statistiques sont une forme d'accomplissement
de désir, tout comme les rêves.”
Al igual que los sueños, las estadísticas son una forma de
realización de deseos
En la práctica...
•
No es necesario conocer los detalles
matemáticos: hay programas que se encargan de
hacer los cálculos PERO
•
Es imprescindible entender conceptualmente
cuándo usar una determinada herramienta y,
sobre todo, no perder de vista sus limitaciones.
Anónimo
“Sin datos,
todo lo que sos es
una persona más opinando”
Conceptos: muestra y población
•
Muestra es el conjunto de información (datos)
que dispongo para inferir
conclusiones generales.
•
Población es el conjunto de indivíduos (objetos)
a los cuales se aplican
las conclusiones generales.
Muestra “representativa”
•
Eliminar tendencias en la selección de los
elementos de la muestra:
el candidato ideal es cualquiera!
•
El tamaño de la muestra determina la
incertidumbre de nuestra generalización.
•
Siempre considerar el tamaño de la muestra.
Proyecciones de Resultados Electorales
Tamaño Muestra: 1209 Error: 3%
Resultados Elecciones Nacionales
Población: ciudadanos habilitados
Opción
Porcentaje
F. Amplio
49
P. Nacional
32
P. Colorado
14
P. Indep.60
2,5
Blanco y Anulado
2,5
Proyecciones Para Elecciones Octubre
18/10/2009 - Consultora Cifra
50
Porcentaje
40
30
20
10
0
F. Amplio
P. Nacional
P. Colorado
Opción de voto
P. Indep.
Blanco y Anulado
Qué es una variable aleatoria?
Toda observación (intención de voto, resultado
lotería, temperatura de mañana, etc) cuyo valor no
podemos conocer de antemano con certeza.
Qué es una distribución de
probabilidad?
Para cada valor posible
de una variable aleatoria,
la distribución de probabilidad informa
la probabilidad de la variable
tomar ese valor.
Por qué la distribución Normal es
importante?
La distribución Normal (o Gausiana, o campana)
emerge cuando
varios componentes aleatorios independientes
se superponen
para generar la variabilidad.
Primer Experimento:
Histograma com los pesos de mil gotas
Segundo Experimento:
Pesos de mil pares de gotas
Tercer Experimento:
Pesos de diez mil decenas de gotas
Por qué la distribución Normal es
importante?
Porque los promedios de grupos de medidas
tienen una distribución Normal !
( Teorema del Límite Central )
Des McHale
(humorista irlandés)
“The average human has one breast and one
testicle.”
El humano promedio tiene un seno y un testículo
Tipos de variables aleatorias
•
Nominales (o categóricas): voto
•
Ordinales: estrellas de hoteles
•
Intervalo: temperatura en grados Celsius
•
Racionales: temperatura em grados Kelvin
Variables Correlacionadas
Dos (o más) variables están
correlacionadas si tienen
variaciones sincronizadas (conjuntas).
•
•
Diámetro abdominal y probabilidad de infarto
coronario
Presión atmosférica y probabilidad de lluvia
Importante!
Correlación NO implica Causalidad
Anónimo
“Está demostrado que festejar el cumpleaños es
saludable.
Las estadísticas muestran que las personas que
más cumpleaños festejan
son las más longevas”
Dos usos diferentes de estadística
•
•
Estudios para generar nuevo conocimiento
(escuela bayesiana - Fisher)
–
Investigación científica
–
Datamining (exploración de datos)
Estudio para tomar decisiones concretas
(escuela frecuentista – Neyman-Pearson)
–
Control de calidad
–
Eficacia de medicamentos
Dos tipos de estudio para generar
conocimiento
Estudios Exploratorios
Estudios para descartar
una hipótesis
específica
•
Usa Base de Datos
pre-existente
•
•
Busca relaciones
sugestivas de nuevas
hipótesis.
Los datos no pueden •
•
usarse para evaluar
las nuevas hipótesis.
Usa datos recabados
en experimento
planificado.
Estudia la
verosimilitud de una
hipotesis específica.
El orden es importante!
Para generalizar conocimiento particular:



PRIMERO formulo una conjetura (hipótesis)
concreta
SEGUNDO planifico cómo recabar datos
(experimento)
TERCERO uso estadística para evaluar la
verosimilitud de la conjetura a la luz de los datos
obtenidos.
Andrew Lang
Biography (poeta escocés)
“He [an unsophisticated forecaster] uses
statistics as a drunken man uses lamp posts for support rather than for illumination.”
Él [un predictor burdo] utiliza las estadísticas como un
borracho utiliza las columnas de alumbrado
más para apoyarse que para iluminarse.
Qué significa
“estadísticamente significativo”?
•
Es una medida de la verosimilitud de nuestra
conjetura a la luz de los datos recogidos.
•
Cuál es la probabilidad de haber recogido esos
datos si nuestra conjetura es falsa?
• Cuanto menor es esa probabilidad más
significativo desde el punto de vista estadistico
es el resultado del experimento.
Algunos valores arbitrarios
•
Un experimento produce resultados
significativos si la probabilidad (valor p) es
menor a 0,05.
•
Parámetros tales como el valor promedio se
presentan con su intervalo de confianza del
95%.
•
El poder estadístico de un control de calidad
debe ser como mínimo de 80%.
Henri Poincaré
“On fait la science avec des faits, comme on fait une
maison avec des pierres : mais une accumulation de
faits n'est pas plus une science qu'un tas de pierres
n'est une maison.”
Hacemos ciencia usando datos, análogamente a como construimos una
casa usando piedras:
PERO datos acumulados no constituyen una ciencia así como
un montón de piedras no es una casa.
FIN
al
FIN