Download Probabilidad sesión 2 - Universidad Cultural

Document related concepts

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Varianza wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Transcript
Probabilidad sesión 2
Conceptos Básicos.
Población.- Se define como el conjunto completo de individuos (personas, animales o cosas)
que tienen una cierta característica considerada de interés para el estudio estadístico.
Muestra.- La muestra es el subconjunto (cantidad menor a la población) de la población
seleccionada.
Variables.- Las características de interés en una población o una muestra se llaman variables.
Conjunto.- Puede considerarse como una colección de objetos, números, animales, personas y
cualquier dato “contable”. En general, mientras no se especifique lo contrario, denotamos un
conjunto por una letra mayúscula A, B, C.
Estadística descriptiva
Datos NO Agrupados.- Los datos no agrupados es un conjunto de información
si ningún orden, que “no” nos establece relación clara con lo que se pretende
desarrollar a lo largo de un problema
Datos NO agrupados = Datos sin NINGUN
tipo de ORDEN.
Medidas de tendencia central y de
posición, para datos no agrupados.
Media.- Suma de todos los valores del conjunto de datos y dividiendo el resultado por el número
de valores considerados.
µ media de la población
𝑋 Media de la muestra
Ejemplo.A continuación se presentan los sueldos mensuales de 12 estudiantes recién egresados. Calcule
el sueldo mensual inicial medio.
3450
3490
3355
3550
3730
3925
3650
3540
3480
3520
(Suma de todos los datos)/(Cantidad de datos) 42480/12=Media 3540
3310
3480
Mediana.- Es el valor medio cuando los datos están acomodados en orden ascendente (Listamos
valores de Menor a mayor).Con un número impar de datos, la mediana es el valor de en medio
(el valor que queda en medio del listado).Con un número par, la mediana es el promedio de los
valores de las dos datos de en medio (se saca el promedio de los dos valores que queden en
medio del listado).
Moda.- Valor que ocurre con mayor frecuencia y más de una vez en un conjunto de números.
Medidas de dispersión
Varianza.- Medida de la variabilidad que utiliza todos los datos.
Se basa en la diferencia entre el valor de cada observación y la media.
Desviación estándar.- Raíz cuadrada de la varianza. “En palabras menos formales, la desviación
estándar es la sumatoria del error, es decir, nosotros tomamos que tan alejados se encuentran
cada uno de los valores de la media, y se suman.” Similar a un blanco para tiro con arco,
sumamos que tan lejos está cada flecha del centro y lo sumamos, en eso consiste la desviación
estándar.”
DATOS AGRUPADOS.- Los datos agrupados consisten en aquellos que si se encuentran
ordenados.
Tabla de distribución de frecuencia.Cuando la muestra es grande (n mayor que 30) resulta conveniente organizar los datos en
intervalos de clase para construir su distribución de frecuencias.
Para ejemplificar esta situación, analicemos los datos siguientes correspondientes a la edad de
55 personas
27 23 41 38 44 29 35 26 18 22 24
25 36 22 52 31 30 22 45 28 18 20
18 28 44 25 29 28 24 36 21 23 32
26 33 25 27 25 34 32 23 54 38 23
31 23 26 48 16 27 27 33 29 29 28
El número de intervalos de clase depende del número de observaciones. Una mayor cantidad de
datos requiere un mayor número de clases. Por lo general la distribución de frecuencias debe
tener como mínimo 5 intervalos, pero no más de 15.
Medidas de tendencia central y de
posición, para datos agrupados.
Media para datos agrupados
Mediana datos agrupados.-
Moda
Medidas de dispersión
Desviación estándar para muestra
Representaciones con un conjunto de datos