Download ESTADISTICA resumen 1 parcial

Document related concepts

Medidas de dispersión wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Varianza wikipedia , lookup

Nivel de medida wikipedia , lookup

Transcript
ESTADISTICA_ 1° PARCIAL
- ESTADÍSTICA: es la ciencia q se ocupa de la ordenación y análisis de datos
precedentes de muestras, y de la realizacion de inferencias acerca de la población
con datos de las muestras. 2 ramas:
a) Descriptiva: describe los datos
b) Inferencial: hace inferencias acerca de la población con datos de la muestra
- POBLACIÓN: conjunto de elementos q cumplen una característica. Puede ser
finita o infinita. De observaciones y de individuos.
- MUESTRA: es un subconjunto de elementos de una población. Debe ser
representativa de la misma. De observaciones y de individuos.
- PARÁMETROS: una propiedad (constante) q describe a la poblacion
- ESTADÍSTICOS: una propiedad (constante) q describe a la muestra.
- VARIABLE: la característica q se va a estudiar. Corresponde a un fenómeno
observable.
- MODALIDAD: son los diferentes valores de la variable.
- MEDICION: cuantificar una variable, es decir, representar el SRE con el SRN
mediante un HOMOMORFISMO. Elementos:
a) Sist. relacional empírico (objetos y sus relaciones) - SRE
b) Sist. relacional numerico (los numeros y sus relaciones) - SRN
HOMOMORFISMO: relacion q va del SER al SRN conservando las relaciones.
ESCALAS:
a) NOMINAL: CLASIFICACION en clases a partir de una característica. Las
clases deben ser exhaustivas y exclusivas. Informa sobre las igualdades y
desigualdades pero no ordena. Transformaciones inyectivas. Ej.: sexo,
estado civil.
b) ORDINAL: ORDENA. Asignación de numeros a los diferentes valores.
Refleja distintos grados de la variable, pero no dice cuanto varia.
Transformaciones crecientes. Ej.: niveles, dureza
c) INTERVALA: CERO ARBITRARIO. Igualdad o desigualdad de diferencias.
Transformaciones afines: reemplazo siempre q se conserve la relacion. Ej.:
temperatura, calendario.
d) DE RAZON: CERO REAL. Ausencia de característica. Igualdad o
desigualdad de razones. Transformaciones A.: multiplicación por una
constante. Ej.: longitud, peso.
- CLASIFICACON DE VARIABLES:
a) CUANTITATIVAS: intervalal o de razon. Es una representación numérica
de la variable. 2 tipos:
 Discretas: valores aislados. Ej.: años, edad
 Continuas: valores intermedios. Ej.: peso, altura
b) CUALITATIVAS: nominal (clasificacion en clases). Cualidades o atributos.
c) CUASI – CUALITATIVAS: ordinal (niveles, grados de la variable).
Oredenacion de valores por jerarquias.
- FUENTES DE VARIACIÓN:
a) SISTEMATICAS: son controlables, pertenecen al metodo. Son esperadas
por los experimentadores.
b) FORTUITAS: azarosas. No son controlables, son impredecibles.
1
- DISTRIBUCIÓN DE FRECUENCIAS
Funciones:
a) organizar y ordenar racionalmente los datos
b) ofrecer la información necesaria para hacer los graficos
c) facilitar los calculos
Frecuencias:
a) absoluta (ni)
b) relativa (pi): ni/n
c) acumulada (na)
d) relativa acumulada (pa): na/n
e) porcentuales (pi%, pa%): pi o á .100
Intervalos:
a) Limites aparentes: valor mayor y menor de la variable en ese intervalo.
b) Limites exactos: + - 0.5
c) Punto medio
d) Amplitud
e) Abiertos
Tres reglas:
a) intervalo sup. Debe incluir el mayor valor observable
b) intervalo inf. Debe incluir el menor valor observable
c) los intervalos deben tener todos la misma amplitud
LOS VALORES SE UBICAN DE MAYOR A MENOR.
- DIAGRAMA DE TALLO Y HOJA: los valores se ubican de menor a mayor.
Primero los tallos y después las hojas. No es de facil lectura, pero presenta todas
las puntuaciones de todos los sujetos al mismo tiempo.
- GRAFICOS
a) RECTÁNGULOS O DE BARRAS: para variables en nivel ordinal o nominal.
Se puede graficar mas de una distribución.
b) DE TORTA O PICTOGRAMA: se usan frecuencias porcentuales. Se puede
graficar solo una distribución.
c) POLÍGONO DE FRECUENCIAS: para variables cuantitativas discretas.
Información q deben incluir: titulo, n (muestra), valores, frecuencias, referencias,
fuente.
- MEDIDAS DE POSICIÓN: son indices q permiten comparar un valor con el
resto del grupo. Cuantiles:
a) CENTILES O PERCENTILES: son 99 y dividen a la distribución en 100
partes iguales. (Ck)
b) DECILES: son 9 y dividen a la distribución en 10 partes iguales. (Dk)
c) QUARTILES: son 3 y dividen a la distribución en 4 iguales. (Qk)
- MEDIDAS DE TENDENCIA CENTRAL: se analizan los datos en general.
a) MEDIA (X): es un promedio. Debe ser representativa. Con intervalos se
toma el punto medio.
Propiedades:
 la suma de las puntuaciones diferenciadas es igual a cero.
 Si sumamos un constante a lo valores la media tambien aumentara.
 Idem con multiplicación
2
 ¿2/5/6?
No usar la media con:
 intervalos abiertos
 valores extremos
usar la Mediana
 escala ordinal
b) MEDIANA (Md): es un punto q divide a la distribución, dejando por debajo
al 50% y por arriba al 49%. C50.
Si la distribución es simétrica la Md = a la media.
Cuando el n es un numero impar la Md es el numero central, pero cuando es par
la MD es un promedio de los dos numeros centrales.
No usar con: intervalos abiertos y escala nominal. En estos casos usar la Moda.
c) MODA (Mo): es el Valor de la variable con mayor frecuencia absoluta.
 Amodal: cuando todas las frecuencias son iguales.
 Bimodal: cuando hay dos valores con la misma frecuencia máxima.
Entonces hay dos modas, pero si los valores son consecutivos se
hace un promedio de ellos
 Con intervalos se usa el punto medio.
- MEDIDAS DE VARIACIÓN: marcan cuan homogéneos o heterogéneos son los
valores de una muestra, es decir, la dispersión, la variabilidad. Indica la
representatividad de la media.
a) Nominal y ordinal: ENTROPÍA: cuantifica el nivel de incertidumbre acerca
de la clase a la q pertenece un dato. A MAYOR ENTROPÍA, MAYOR
DISPERSIÓN E INCERTIDUMBRE.
b) Intervalal:
 AMPLITU D TOTAL: es sensible a los valores extremos y esta
ligado al tamaño de la toma. At
 AMPLITUD SEMI – INTERCUARTIL: para variables cuantitativas..
se usa cuando la media no es representativa. Problema: valores
extremos. Q.
 VARIANZA: es un promedio del cuadrado de las puntuaciones
diferenciadas. Es para variables cuantitativas. Sirve para comparar el
grado de dispersión de 2 o mas grupos de valores en una misma
variable. Es sensible a los diferentes grados de concentración en
torno al punto medio. Sx. Propiedades:
1. si sumamos una constante a los valores la varianza no
cambiara.
2. si se multiplica una constante a los valores la varianza sera
igual a la varianza original por el cuadrado de la constante.
3. la varianza y la desviación tipica tienen valores positivos.
 DESVIACIÓN TIPICA: es la raiz cuadrada de la varianza. Sx.
 CUASI – VARIANZA: Sx´. n – 1
c) de razon: COEFICIENTE DE VARIACIÓN: CV. Expresa la desviación estandar
relativa a la media en unidades de 100. permite compara la variabilidad de grupo
con diferentes a la medias. Es un indice de la representatividad de la media,
cuanto mayor es el CV, menos representativa es la media.
3
- PUNTUACIONES TIPICAS: (Zi) es el cociente entre la puntuación diferencial y
la desviación tipica. Indica el numero de desviaciones tipicas q esa observación se
separa de la media del grupo de observaciones. Al proceso de obtención de las
puntuaciones tipicas se lo llama TIPIFICACION. Permiten hacer comparaciones
entre unidades de distintos grupos, entre variables medidas de distintas formas, o
incluso entre variables diferentes.
La media siempre es igual a cero, pero la varianza y la desviación tipica es igual a
uno.
Problema: suelen ser negativas y con decimales. Esto hace q sean icomodas para
trabajar.
Puntuaciones equivalentes: misma puntuación tipica para elementos de grupos
diferentes .
- ESCALAS DERIVADAS: (Ti) transformación de las puntuaciones tipicas en
otras, pero reteniendo las relaciones entre ellas. Para esto, multiplicamos la
puntuación por una constante A y luego le sumamos una constante B.
La media de estas nuevas puntuaciones sera la constante B.
La desviación tipica será el valor absoluta de la constante A.
La varianza sera el cuadrado de la constante A.
- INDICES DE ASIMETRÍA: el grado de asimetría de una distribución hace
referencia al grado en que los datos se reparten equilibradamente por encima y
por debajo de la tendencia central. Indices q cuantifican esta propiedad:
a) se basa en la relacion entre media y moda, y se define como la distancia
entre estos, medida en desviaciones tipicas. Cuando la media es inferior a
la moda el indice sera negativo (grafico: curva hacia la derecha); cuando la
media es mayor a la moda el indice sera positivo (grafico: curva hacia la
izquierda); cuando la moda y la media son iguales, el indice sera cero o
cera de este. Este solo e puede calcular con distribuciones unimodales.
b) Indice de asimetría de Pearson: es el promedio de las puntuaciones tipicas
al cubo. Es el mas usado.
c) Indice de asimetría intercuartilico: se basa en los cuartiles.
- INDICE DE CURTOSIS: se basa en el promedio de las tipicas elevadas a la
cuarta potencia, y se le resta la constante tres. Cuando el indice es igual a cero
tiene un grado de curtosis similar al de la distribucion normal, se llama
MESOCURTICA; si es positivo su grado de apuntamiento es mayor q el de la
distribución normal, se llama LEPTOCURTICA; cuando es negativo es menor q el
de la distribución normal se llama PLATUCURTICA.
4