Download Probabilidad sesión 2 - Universidad Cultural
Document related concepts
Transcript
Probabilidad sesión 2 Conceptos Básicos. Población.- Se define como el conjunto completo de individuos (personas, animales o cosas) que tienen una cierta característica considerada de interés para el estudio estadístico. Muestra.- La muestra es el subconjunto (cantidad menor a la población) de la población seleccionada. Variables.- Las características de interés en una población o una muestra se llaman variables. Conjunto.- Puede considerarse como una colección de objetos, números, animales, personas y cualquier dato “contable”. En general, mientras no se especifique lo contrario, denotamos un conjunto por una letra mayúscula A, B, C. Estadística descriptiva Datos NO Agrupados.- Los datos no agrupados es un conjunto de información si ningún orden, que “no” nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema Datos NO agrupados = Datos sin NINGUN tipo de ORDEN. Medidas de tendencia central y de posición, para datos no agrupados. Media.- Suma de todos los valores del conjunto de datos y dividiendo el resultado por el número de valores considerados. µ media de la población 𝑋 Media de la muestra Ejemplo.A continuación se presentan los sueldos mensuales de 12 estudiantes recién egresados. Calcule el sueldo mensual inicial medio. 3450 3490 3355 3550 3730 3925 3650 3540 3480 3520 (Suma de todos los datos)/(Cantidad de datos) 42480/12=Media 3540 3310 3480 Mediana.- Es el valor medio cuando los datos están acomodados en orden ascendente (Listamos valores de Menor a mayor).Con un número impar de datos, la mediana es el valor de en medio (el valor que queda en medio del listado).Con un número par, la mediana es el promedio de los valores de las dos datos de en medio (se saca el promedio de los dos valores que queden en medio del listado). Moda.- Valor que ocurre con mayor frecuencia y más de una vez en un conjunto de números. Medidas de dispersión Varianza.- Medida de la variabilidad que utiliza todos los datos. Se basa en la diferencia entre el valor de cada observación y la media. Desviación estándar.- Raíz cuadrada de la varianza. “En palabras menos formales, la desviación estándar es la sumatoria del error, es decir, nosotros tomamos que tan alejados se encuentran cada uno de los valores de la media, y se suman.” Similar a un blanco para tiro con arco, sumamos que tan lejos está cada flecha del centro y lo sumamos, en eso consiste la desviación estándar.” DATOS AGRUPADOS.- Los datos agrupados consisten en aquellos que si se encuentran ordenados. Tabla de distribución de frecuencia.Cuando la muestra es grande (n mayor que 30) resulta conveniente organizar los datos en intervalos de clase para construir su distribución de frecuencias. Para ejemplificar esta situación, analicemos los datos siguientes correspondientes a la edad de 55 personas 27 23 41 38 44 29 35 26 18 22 24 25 36 22 52 31 30 22 45 28 18 20 18 28 44 25 29 28 24 36 21 23 32 26 33 25 27 25 34 32 23 54 38 23 31 23 26 48 16 27 27 33 29 29 28 El número de intervalos de clase depende del número de observaciones. Una mayor cantidad de datos requiere un mayor número de clases. Por lo general la distribución de frecuencias debe tener como mínimo 5 intervalos, pero no más de 15. Medidas de tendencia central y de posición, para datos agrupados. Media para datos agrupados Mediana datos agrupados.- Moda Medidas de dispersión Desviación estándar para muestra Representaciones con un conjunto de datos