Download ESTADISTICA resumen 1 parcial
Document related concepts
Transcript
ESTADISTICA_ 1° PARCIAL - ESTADÍSTICA: es la ciencia q se ocupa de la ordenación y análisis de datos precedentes de muestras, y de la realizacion de inferencias acerca de la población con datos de las muestras. 2 ramas: a) Descriptiva: describe los datos b) Inferencial: hace inferencias acerca de la población con datos de la muestra - POBLACIÓN: conjunto de elementos q cumplen una característica. Puede ser finita o infinita. De observaciones y de individuos. - MUESTRA: es un subconjunto de elementos de una población. Debe ser representativa de la misma. De observaciones y de individuos. - PARÁMETROS: una propiedad (constante) q describe a la poblacion - ESTADÍSTICOS: una propiedad (constante) q describe a la muestra. - VARIABLE: la característica q se va a estudiar. Corresponde a un fenómeno observable. - MODALIDAD: son los diferentes valores de la variable. - MEDICION: cuantificar una variable, es decir, representar el SRE con el SRN mediante un HOMOMORFISMO. Elementos: a) Sist. relacional empírico (objetos y sus relaciones) - SRE b) Sist. relacional numerico (los numeros y sus relaciones) - SRN HOMOMORFISMO: relacion q va del SER al SRN conservando las relaciones. ESCALAS: a) NOMINAL: CLASIFICACION en clases a partir de una característica. Las clases deben ser exhaustivas y exclusivas. Informa sobre las igualdades y desigualdades pero no ordena. Transformaciones inyectivas. Ej.: sexo, estado civil. b) ORDINAL: ORDENA. Asignación de numeros a los diferentes valores. Refleja distintos grados de la variable, pero no dice cuanto varia. Transformaciones crecientes. Ej.: niveles, dureza c) INTERVALA: CERO ARBITRARIO. Igualdad o desigualdad de diferencias. Transformaciones afines: reemplazo siempre q se conserve la relacion. Ej.: temperatura, calendario. d) DE RAZON: CERO REAL. Ausencia de característica. Igualdad o desigualdad de razones. Transformaciones A.: multiplicación por una constante. Ej.: longitud, peso. - CLASIFICACON DE VARIABLES: a) CUANTITATIVAS: intervalal o de razon. Es una representación numérica de la variable. 2 tipos: Discretas: valores aislados. Ej.: años, edad Continuas: valores intermedios. Ej.: peso, altura b) CUALITATIVAS: nominal (clasificacion en clases). Cualidades o atributos. c) CUASI – CUALITATIVAS: ordinal (niveles, grados de la variable). Oredenacion de valores por jerarquias. - FUENTES DE VARIACIÓN: a) SISTEMATICAS: son controlables, pertenecen al metodo. Son esperadas por los experimentadores. b) FORTUITAS: azarosas. No son controlables, son impredecibles. 1 - DISTRIBUCIÓN DE FRECUENCIAS Funciones: a) organizar y ordenar racionalmente los datos b) ofrecer la información necesaria para hacer los graficos c) facilitar los calculos Frecuencias: a) absoluta (ni) b) relativa (pi): ni/n c) acumulada (na) d) relativa acumulada (pa): na/n e) porcentuales (pi%, pa%): pi o á .100 Intervalos: a) Limites aparentes: valor mayor y menor de la variable en ese intervalo. b) Limites exactos: + - 0.5 c) Punto medio d) Amplitud e) Abiertos Tres reglas: a) intervalo sup. Debe incluir el mayor valor observable b) intervalo inf. Debe incluir el menor valor observable c) los intervalos deben tener todos la misma amplitud LOS VALORES SE UBICAN DE MAYOR A MENOR. - DIAGRAMA DE TALLO Y HOJA: los valores se ubican de menor a mayor. Primero los tallos y después las hojas. No es de facil lectura, pero presenta todas las puntuaciones de todos los sujetos al mismo tiempo. - GRAFICOS a) RECTÁNGULOS O DE BARRAS: para variables en nivel ordinal o nominal. Se puede graficar mas de una distribución. b) DE TORTA O PICTOGRAMA: se usan frecuencias porcentuales. Se puede graficar solo una distribución. c) POLÍGONO DE FRECUENCIAS: para variables cuantitativas discretas. Información q deben incluir: titulo, n (muestra), valores, frecuencias, referencias, fuente. - MEDIDAS DE POSICIÓN: son indices q permiten comparar un valor con el resto del grupo. Cuantiles: a) CENTILES O PERCENTILES: son 99 y dividen a la distribución en 100 partes iguales. (Ck) b) DECILES: son 9 y dividen a la distribución en 10 partes iguales. (Dk) c) QUARTILES: son 3 y dividen a la distribución en 4 iguales. (Qk) - MEDIDAS DE TENDENCIA CENTRAL: se analizan los datos en general. a) MEDIA (X): es un promedio. Debe ser representativa. Con intervalos se toma el punto medio. Propiedades: la suma de las puntuaciones diferenciadas es igual a cero. Si sumamos un constante a lo valores la media tambien aumentara. Idem con multiplicación 2 ¿2/5/6? No usar la media con: intervalos abiertos valores extremos usar la Mediana escala ordinal b) MEDIANA (Md): es un punto q divide a la distribución, dejando por debajo al 50% y por arriba al 49%. C50. Si la distribución es simétrica la Md = a la media. Cuando el n es un numero impar la Md es el numero central, pero cuando es par la MD es un promedio de los dos numeros centrales. No usar con: intervalos abiertos y escala nominal. En estos casos usar la Moda. c) MODA (Mo): es el Valor de la variable con mayor frecuencia absoluta. Amodal: cuando todas las frecuencias son iguales. Bimodal: cuando hay dos valores con la misma frecuencia máxima. Entonces hay dos modas, pero si los valores son consecutivos se hace un promedio de ellos Con intervalos se usa el punto medio. - MEDIDAS DE VARIACIÓN: marcan cuan homogéneos o heterogéneos son los valores de una muestra, es decir, la dispersión, la variabilidad. Indica la representatividad de la media. a) Nominal y ordinal: ENTROPÍA: cuantifica el nivel de incertidumbre acerca de la clase a la q pertenece un dato. A MAYOR ENTROPÍA, MAYOR DISPERSIÓN E INCERTIDUMBRE. b) Intervalal: AMPLITU D TOTAL: es sensible a los valores extremos y esta ligado al tamaño de la toma. At AMPLITUD SEMI – INTERCUARTIL: para variables cuantitativas.. se usa cuando la media no es representativa. Problema: valores extremos. Q. VARIANZA: es un promedio del cuadrado de las puntuaciones diferenciadas. Es para variables cuantitativas. Sirve para comparar el grado de dispersión de 2 o mas grupos de valores en una misma variable. Es sensible a los diferentes grados de concentración en torno al punto medio. Sx. Propiedades: 1. si sumamos una constante a los valores la varianza no cambiara. 2. si se multiplica una constante a los valores la varianza sera igual a la varianza original por el cuadrado de la constante. 3. la varianza y la desviación tipica tienen valores positivos. DESVIACIÓN TIPICA: es la raiz cuadrada de la varianza. Sx. CUASI – VARIANZA: Sx´. n – 1 c) de razon: COEFICIENTE DE VARIACIÓN: CV. Expresa la desviación estandar relativa a la media en unidades de 100. permite compara la variabilidad de grupo con diferentes a la medias. Es un indice de la representatividad de la media, cuanto mayor es el CV, menos representativa es la media. 3 - PUNTUACIONES TIPICAS: (Zi) es el cociente entre la puntuación diferencial y la desviación tipica. Indica el numero de desviaciones tipicas q esa observación se separa de la media del grupo de observaciones. Al proceso de obtención de las puntuaciones tipicas se lo llama TIPIFICACION. Permiten hacer comparaciones entre unidades de distintos grupos, entre variables medidas de distintas formas, o incluso entre variables diferentes. La media siempre es igual a cero, pero la varianza y la desviación tipica es igual a uno. Problema: suelen ser negativas y con decimales. Esto hace q sean icomodas para trabajar. Puntuaciones equivalentes: misma puntuación tipica para elementos de grupos diferentes . - ESCALAS DERIVADAS: (Ti) transformación de las puntuaciones tipicas en otras, pero reteniendo las relaciones entre ellas. Para esto, multiplicamos la puntuación por una constante A y luego le sumamos una constante B. La media de estas nuevas puntuaciones sera la constante B. La desviación tipica será el valor absoluta de la constante A. La varianza sera el cuadrado de la constante A. - INDICES DE ASIMETRÍA: el grado de asimetría de una distribución hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central. Indices q cuantifican esta propiedad: a) se basa en la relacion entre media y moda, y se define como la distancia entre estos, medida en desviaciones tipicas. Cuando la media es inferior a la moda el indice sera negativo (grafico: curva hacia la derecha); cuando la media es mayor a la moda el indice sera positivo (grafico: curva hacia la izquierda); cuando la moda y la media son iguales, el indice sera cero o cera de este. Este solo e puede calcular con distribuciones unimodales. b) Indice de asimetría de Pearson: es el promedio de las puntuaciones tipicas al cubo. Es el mas usado. c) Indice de asimetría intercuartilico: se basa en los cuartiles. - INDICE DE CURTOSIS: se basa en el promedio de las tipicas elevadas a la cuarta potencia, y se le resta la constante tres. Cuando el indice es igual a cero tiene un grado de curtosis similar al de la distribucion normal, se llama MESOCURTICA; si es positivo su grado de apuntamiento es mayor q el de la distribución normal, se llama LEPTOCURTICA; cuando es negativo es menor q el de la distribución normal se llama PLATUCURTICA. 4