Download estadistica loreto

Document related concepts
no text concepts found
Transcript
Estadística…
Melo- Fernández
Definición de Estadística
"Ciencia que se ocupa del estudio de fenómenos de tipo
genérico, normalmente complejos y enmarcados en un
universo variable, mediante el empleo de modelos de
reducción de la información y de análisis de validación de
los resultados en términos de representatividad".
EXISTEN DOS TIPOS DE ESTADÍSTICA
Estadística Descriptiva: procedimientos empleados
para organizar y resumir conjuntos de observaciones en
forma cuantitativa. Los conjuntos de datos que
contienen observaciones de más de una variable
permiten estudiar la relación o asociación que existe
entre ellas.
ESTADISTICA INFERENCIAL
Métodos empleados para inferir algo acerca de una
población basándose en los datos obtenidos a partir de
una muestra. Los datos estadísticos son cálculos
aritméticos realizados sobre los valores obtenidos en una
porción de la población, seleccionada según criterios
rigurosos.
FIABILIDAD
Por fiabilidad se entiende obtener una información
válida, sin errores, y representativa. Para esto se
utiliza, el análisis de la validez de los resultados y
también, establecer estos resultados en términos de
representatividad.
VALIDEZ Y REPRESENTATIVIDAD
El análisis de la validez es el estudio de todos los
posibles errores que pueden aparecer en las fases
del proceso estadístico, desde la recogida de datos
hasta la interpretación de los resultados, pasando
por los supuestos en los que se basa el
razonamiento. Unir el análisis de validez con su
interpretación en términos de representatividad,
es lo que va a configurar la fiabilidad final de los
resultados de una investigación estadística.
POBLACIÓN
"Una población es un conjunto de todos los
elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones".
Levin & Rubin (1996).
"Una población es un conjunto de elementos
que presentan una característica común".
Cadenas (1974).
Ejemplo:
“Los miembros del
Colegio de Ingenieros
de Latinoamérica”
•El tamaño que tiene una población es un factor de
suma importancia en el proceso de investigación
estadística, y este tamaño viene dado por el número
de elementos que constituyen la población, según
el número de elementos la población puede ser
finita o infinita *
MUESTRA
"Se
llama muestra a una parte de la
población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos
elementos de la población, pero no de
todos". Levin & Rubin (1996).
Ejemplo;
El estudio realizado a 50 miembros del
Colegio de Ingenieros de Latinoamérica
El estudio de muestras es más sencillo que el estudio de la población
completa; cuesta menos y lleva menos tiempo. Por último se ha probado
que el examen de una población entera todavía permite la aceptación de
elementos defectuosos, por tanto, en algunos casos, el muestreo puede
elevar el nivel de calidad.
MUESTREO
Procedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica
que sirve para obtener una o más muestras de
población.
TIPOS DE
MUESTREO
Existen dos métodos para seleccionar
muestras de poblaciones:
MUESTREO NO ALEATORIO O DE JUICIO:
Se basa en la experiencia de alguien con la
población.
MUESTREO ALEATORIO O DE
PROBABILIDAD:
Todos los elementos de la población tienen la
oportunidad de ser escogidos en la muestra.
VARIABLES
“Una variable es un símbolo, tal como X, Y, Hx,
que puede tomar un valor cualquiera de un
conjunto determinado de ellos, llamado
dominio de la variable. Si la variable puede
tomar solamente un valor, se llama constante."
Según, Murray R. Spiegel, (1992)
TIPOS DE VARIABLES
Variables cualitativas (o categóricas): aquellas que no
aparecen en forma numérica, sino como categorías o atributos
(sexo, profesión, color de ojos)
Variables cuantitativas: las que pueden expresarse
numéricamente (temperatura, salario, número de goles en un
partido). Se pueden cuantificar los resultados experimentales
por medio de instrumentos adoptando unidades de medida
para valorar los diferentes resultados.
Variables discretas: son el resultado de contar y sólo toman
valores enteros (número de hijos)
Variables continuas: son el resultado de medir, y pueden
contener decimales (temperatura, peso, altura). Pueden
tomar, entonces, cualquier valor de un determinado intervalo.
LAS VARIABLES PUEDEN CORRESPONDER
A CUATRO NIVELES DE MEDICIÓN:
1) Nominal: datos que sólo pueden clasificarse en categorías; existen
sólo conteos; no existe orden particular para los grupos. Ejemplo:
color de ojos.
2) Ordinal: corresponde a aquellos datos que se pueden agrupar en
categorías y “ordenarlas” según algún tipo de gradación. Ejemplo;
nivel de dolor
3) de Intervalo: incluye todas las características de la escala ordinal,
pero la distancia entre valores es constante pues los valores que
toma, corresponden al orden de los números naturales. Ejemplo: nº
de hijos
4) de Razón: tiene características de la escala de intervalo, pero se
agrega un punto cero absoluto que significa ausencia del atributo y
la razón de dos números es significativo pudiéndose aplicarles todo
tipo de instrumental matemático. Ejemplo: ingreso familiar.
LA MODA
LA MEDIANA
LA MEDIA
MEDIDAS DE
CENTRALIZACIÓN
MEDIA ARITMÉTICA
La media aritmética de una variable se define como la
suma ponderada de los valores de la variable por sus
frecuencias relativas y se calcula mediante la expresión:
Lo denotaremos
por:
* Xi representa el valor de la variable o en su caso la
marca de clase *
PROPIEDADES:
* Si multiplicamos o dividimos todas las observaciones por un mismo
número, la media queda multiplicada o dividida por dicho numero.
* Si le sumamos a todas las observaciones un mismo número, la media
aumentará en dicha cantidad.
* Además de la media aritmética existen otros conceptos de media,
como son la media geométrica y la media armónica.
MEDIA GEOMÉTRICA:
La media geométrica de N observaciones es la raíz de índice N del
producto de todas las observaciones. La representaremos por G
Solo se puede calcular si no hay observaciones negativas. Es una medida
estadística poco o nada usual.
MEDIA
ARMÓNICA
La media armónica de N observaciones es la inversa
de la media de las inversas de las observaciones y la
denotaremos por H
Al igual que
en el caso de
la media
geométrica
su utilización
es bastante
poco
frecuente
LA
MEDIANA
Valor de la variable que deja el mismo número de
datos antes y después que él. De acuerdo con esta
definición el conjunto de datos menores o iguales
que la mediana representarán el 50% de los datos, y
los que sean mayores que la mediana representarán
el otro 50% del total de datos de la muestra.
Si n es impar --> Me será la observación central de los valores,
una vez que estos han sido ordenados en orden creciente o
decreciente.
Si n es par --> Me será el promedio aritmético de las dos
observaciones centrales.
La moda
-> Es el valor que cuenta con una mayor frecuencia
en una distribución de datos .
Distribución bimodal de los datos: cuando encontremos
dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta máxima.
Distribución trimodal de los datos: es en la que encontramos
tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.
 Cuando tratamos con datos agrupados antes
de definir la moda, se ha de definir el intervalo
modal. El intervalo modal es el de mayor
frecuencia absoluta.
MODA DE DATOS AGRUPADOS:
L1 = Límite inferior de la
clase modal.
D1 = Exceso de la
frecuencia modal sobre la
clase contigua inferior.
D2 = Exceso de la
frecuencia modal sobre la
clase contigua superior.
C = Tamaño del intervalo
de la clase modal.
TIPOS DE FRECUENCIAS
Una de los primeros pasos que se realizan en cualquier
estudio estadístico es la tabulación de resultados, es decir,
recoger la información de la muestra resumida en una tabla en
la que a cada valor de la variable se le asocian determinados
números que representan el número de veces que ha
aparecido, su proporción con respecto a otros valores de la
variable, etc. Estos números se denominan frecuencias.
FRECUENCIA
ABSOLUTA
La frecuencia absoluta de una variable estadística es el
número de veces que aparece en la muestra dicho valor
de la variable, la representaremos por ni
FRECUENCIA RELATIVA
La frecuencia absoluta, es una medida que está influida por
el tamaño de la muestra, al aumentar el tamaño de la
muestra aumentará también el tamaño de la frecuencia
absoluta. Esto hace que no sea una medida útil para poder
comparar. Para esto es necesario introducir el concepto de
frecuencia relativa, que es el cociente entre la frecuencia
absoluta y el tamaño de la muestra. La denotaremos por fi
Donde N =
Tamaño de la
muestra
PORCENTAJE:
La frecuencia relativa es un tanto por uno, sin
embargo, hoy día es bastante frecuente hablar
siempre en términos de tantos por ciento o
porcentajes, por lo que esta medida resulta de
multiplicar la frecuencia relativa por 100. La
denotaremos por pi.
FRECUENCIA ABSOLUTA
ACUMULADA
La frecuencia absoluta acumulada de un valor de
la variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual
que el de la variable y lo representaremos por Ni.
FRECUENCIA RELATIVA
ACUMULADA
Al igual que en el caso anterior la frecuencia
relativa acumulada es la frecuencia absoluta
acumulada dividido por el tamaño de la
muestra, y la denotaremos por Fi
PORCENTAJE
ACUMULADO
Análogamente se define el Porcentaje
Acumulado y lo vamos a denotar por Pi como la
frecuencia relativa acumulada por 100.