Download Cuadernillo Probabilidad y Estadistica_2011

Document related concepts
no text concepts found
Transcript
UNIVERSIDAD DEL CARIBE
PROBABILIDAD Y ESTADÍSTICA
CURSO PROPEDEUTICO
Fecha de revisión: Mayo de 2011
1
ÍNDICE
PRESENTACIÓN ............................................................................................................. 3
INTRODUCCÍON GENERAL A LA PROBABILIDAD Y ESTADÍSTICA ......................... 4
OBJETIVOS ..................................................................................................................... 5
ORIENTACIONES BIBLIOGRÁFICAS Y COMPLEMENTARIA ..................................... 6
OTROS MEDIOS DIDÁCTICOS....................................................................................... 6
PLAN DE TRABAJO........................................................................................................ 7
1) ESTADÍSTICA DESCRIPTIVA..................................................................................... 8
a) Distribución de frecuencias................................................................................... 8
b) Medidas de tendencia central para datos No agrupados ................................. 16
c) Medidas de tendencia central para datos agrupados ....................................... 19
d) Medidas de dispersión para datos No agrupados ............................................ 23
e) Medidas de dispersión para datos agrupados .................................................. 26
2) PROBABILIDAD ........................................................................................................ 29
a) Espacio muestral y eventos ................................................................................ 29
b) Conteo de puntos de la muestra ......................................................................... 31
c) Probabilidad de un evento ................................................................................... 35
d) Reglas aditivas ..................................................................................................... 39
e) Probabilidad condicional ..................................................................................... 42
f) Reglas multiplicativas ........................................................................................... 44
2
PRESENTACIÓN
Este documento pretende ayudarte en el curso, es decir, es una herramienta adicional
para explicar temas de esta asignatura, además presenta ejercicios y actividades
adicionales que están diseñadas para que puedas realizarlas a la par del curso y explica
temas específicos de Probabilidad y Estadística para que la puedas comprender con
éxito.
Este curso te proporcionará herramientas que te ayudarán alcanzar el nivel necesario
para ingresar la Universidad del Caribe para que tengas éxito en tus estudios
universitarios.
3
INTRODUCCÍON GENERAL A LA PROBABILIDAD
Y ESTADÍSTICA
La Estadística es una ciencia y está considerada como una rama de las Matemáticas y
podría definirse como la recopilación y la interpretación de datos obtenidos en un
estudio y además, es una ciencia transversal a otras disciplinas desde la física hasta
ciencias sociales y se utiliza para tomar decisiones. Esta disciplina se clasifica
básicamente en dos partes: en Estadística descriptiva y Estadística Analítica ó
Inferencial.
Para el curso estudiaremos la Estadística desde sus conceptos básicos, estudiaremos
la Estadística descriptiva, entraremos a una rama de la Estadística que esta
estrechamente vinculada, la cual es el estudio de la Probabilidad.
4
OBJETIVOS
Objetivo del curso:
Al término del curso el estudiante será capaz de: identificar las técnicas del análisis
estadístico simple para la adecuada toma de decisiones.
Propósitos:
Listar los conceptos y definiciones básicas en el lenguaje de la estadística para el
entendimiento de los conceptos estadísticos básicos.
Explicar los métodos estadísticos para la descripción de datos.
Describir la importancia de los conceptos y herramientas de la probabilidad para la toma
de decisiones.
5
ORIENTACIONES BIBLIOGRÁFICAS Y
COMPLEMENTARIA
BIBLIOGRÁFIA BÁSICA
• Kohler Heinz. Estadística para negocios y economía. Editorial CECSA.
Comentario:
El contenido del curso se encuentra en este libro. Este libro explica muy bien los
contenidos del temario y se recomienda para este curso ya que es introductorio a los
temas de estadística y las explicaciones son muy claras y simples.
•
Walpole Ronald E., Myers Raymond H. Probabilidad y estadística. Editorial
McGraw Hill.
Comentario:
Este libro es un poco más avanzado que el anterior. Utilizaremos este libro para abordar
temas de las unidad II, pero antes utilizaremos el libro anterior que servirá como
introducción a estos temas.
•
Johnson. Estadistica
9789706868350
elemental:
lo
esencial.
Cengage
learning.
ISBN
BIBLIOGRÁFIA COMPLEMENTARIA
• Freud John E., Gary A Simon. Estadística elemental. Editorial Prentice Hall.
• Meyer Paul L. Probabilidad y aplicaciones estadísticas. Editorial Addison Wesley
Longman.
• John Neter William Wasserman, G.A. Whit More. Fundamentos de estadística
para negocios y economía. Editorial CECSA.
• Webster Allen. Estadística aplicada a los negocios y la economía. Editorial
Mcgrawhill.
OTROS MEDIOS DIDÁCTICOS
La página electrónica siguiente cuenta con problemas de estadística, definiciones y
formulas:
http://mathworld.wolfram.com
6
PLAN DE TRABAJO
7
1) ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se dedica a analizar y representar los datos. Este análisis es muy
básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones
obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de
tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un
valor central.
¿Alguna vez se ha preguntado lo que hacen otras personas cuando están en la Internet? El
Stanford Institute for the Quantitative Study of Society apoyó un estudio para analizar
cómo es que las personas utilizan la Internet. A 400 encuestados se les pidió
seleccionaran cuál de las 17 actividades comunes realizaron en Internet. La siguiente
gráfica resuma la información.
Esta gráfica resume toda la información. ¿Puede imaginar toda esta información en
oraciones? Las gráficas verdaderamente valen más que mil palabras. A continuación se
dará un procedimiento para construir este tipo de gráficas.
8
a) Distribución de frecuencias
Distribución de frecuencias es como se denomina en estadística a la agrupación de datos
en categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría. Esto significa una de las cosas más importantes de la matemática, su estadística
con la agrupación de datos. La distribución de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el número existente en cada clase.
Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En
el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en
el que están agrupados los datos.
En otras palabras un histograma es la representación grafica de la distribución de
frecuencias.
Los histogramas también permiten la comparación de los resultados de un proceso.
Ejemplo 1.1:
La siguiente tabla proporciona la vida (en años) de las baterías para automóvil de una
muestra aleatoria de cierta marca.
Tabla 1.1 Vida de las baterías de automóvil
1.6 1.9 2.2 2.5 2.6 2.6 2.9 3 3 3.1 3.1 3.1 3.1 3.2 3.2 3.2 3.3 3.3 3.3 3.4 3.4 3.4 3.5 3.5 3.6 3.7 3.7 3.7 3.8 3.8 3.9 3.9 4.1 4.1 4.2 4.3 4.4 4.5 4.7 4.7 Construya un Histograma para mostrar los datos.
Para construir un Histograma antes se recomienda realizar un diagrama de tallo y hojas.
Para el diagrama de tallo y hojas primero se divide cada dato en dos partes uno que se le
denomina tallo y otro que será llamado hoja. Por ejemplo para el primer dato 1.6 el digito
1 se le denomina tallo y el digito 6 se le denomina hoja. Por lo tanto para estos datos
tendriamos cuatro tallos diferentes que serían: 1, 2, 3 y 4. Estos tallos se listan de forma
consecutiva en el lado izquierdo de una linea vertical y en lado derecho se listan las hojas
correspondientes a cada tallo, de tal forma que quedaría así:
9
Figura 1.1 Diagrama de tallo y hojas para el ejercicio.
Cada tallo en realidad se convertira en una barra del histograma, es decir con este arreglo
del diagrama de tallo y hojas se tendrán 4 barras en el histograma, para algunas personas
no puede ser de gran utildad visualizar un histograma con solo 4 barras y pueden
determinar un arreglo diferente, por ejemplo pueden decidir tomar multiplos de 0.5 y el
diagrama de tallo y hojas quedaría construido de esta forma:
Figura 1.2 Diagrama opcional de tallo y hojas para el ejercicio
Para este diagrama de tallo y hojas cada digito del tallo se escribe dos veces y se
diferencian con algún símbolo, por ejemplo con un “*”, para el digito del tallo dos se
escriben 2 tallos los cuales son: 2 y 2*. El tallo 2 podrá tener las hojas 0, 1, 2, 3 y 4; el
tallo 2* podrá tener las hojas 5, 6, 7, 8 y 9. Es decir que todos los tallos pueden tener el
mismo número de hojas. Esta condición se debe cumplir siempre.
Para este ejercicio hemos construido 2 diagramas de tallo y hojas, ambos son válidos ó
correctos. La elección de alguno de estos dos depende del interés de la persona que desea
mostrar los datos, para algunas personas puede ser más interesante viasualizar los datos
por años de duración de las baterias y para algunas otras puede ser de mayor interés
mostrar los datos por semestre (medio año ó 0.5 años) de duración.
Déspues de construido el digrama de tallo y hojas se debe elaborar una distribución de
frecuencias. Para construir el Histograma a partir de la distribución de frecuencias sólo se
necesitan 4 datos básicos los cuales son: Intervalo de clase, Clase, Marca de clase y
Frecuencia.
A partir del diagrama de tallo y hojas se determina el intervalo de clase, se realiza a partir
de los dígitos de cada tallo (tomaremos el primer diagrama de tallo y hojas), por ejemplo
tenemos los tallos 1, 2, 3 y 4; y para el tallo 1 nos preguntamos ¿què valores puede tener
el tallo 1? La respuesta sería: 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9. Es decir del 0 al 9 y si déspues
unimos el digito del tallo y el de la hoja quedaría 1.0 a 1.9. De esta forma obtenemos
10
nuestro primer intervalo de clase. Si repetimos el procedimiento con los demas tallos
tendremos:
Tabla 1.2 Intervalo de clase para la vida de las baterías de automóvil
Todos los intervalos de clase deben de ser del mismo ancho, por ejemplo el primer
intervalo es de 1.0 a 1.9 si realizamos una resta del valor máximo menos el valor mínimo
obtendremos que el ancho del intervalo sería de 0.9 años, este ancho es el mismo para los
demás intervalos de clase. Esta propiedad se debe conservar para la Clase.
Una propiedad de los histogramas es que las barras que lo forman no deben tener
espacios entre ellas, ya que si existen espacios entre las barras NO sería un histograma y
sería una simple grafica de barras.
Podemos observar que los intervalos de clase no incluyen todos los numeros posibles del
espacio de datos, en el ejercicio el primer intervalo es de 1.0 a 1.9 y el segundo es de 2.0
a 2.9, es decir se salta de 1.9 a 2.0 si utilizamos este intervalo de clase y en un futuro
obtenemos un dato de 1.95 años nos enfrentariamos al problema de donde colocarlo ¿en
el primer intervalo o en el segundo? Por lo tanto la Clase debe de cubrir estos “saltos”.
Para la clase se toma el valor maximo del primer intervalo y el valor minimo del
siguiente intervalo y se suman para déspues dividirse entre 2 y el valor que resulte sera el
valor maximo de la primera clase y el valor minimo de la segunda clase, por ejemplo 1.9
y 2.0 si los sumamos nos da 3.9 y si déspues esto lo dividimos entre 2 el resultado es
1.95, este valor es el valor maximo de la primera clase y el valor minimo de la segunda
clase. Si repetimos este procedimiento con todas las clases obtendremos:
Tabla 1.3 Clase incompleta para la vida de las baterías de automóvil
Para obtener el valor minimo de la primera clase calculamos el ancho de clase y para esto
utilizamos la segunda clase, por ejemplo en el ejercicio la segunda clase es 1.95 a 2.95
por lo tanto el ancho de clase es de 1, como todas las clases deben tener el mismo ancho
le restamos a 1.95 el valor de 1 y asi obtenemos el valor minimo de la primera clase que
sería de 0.95. Lo mismo hacemos para el valor maximo de la ultima clase pero en lugar
11
de restarle el ancho de clase se lo sumamos al valor minimo, por ejemplo 3.95 + 1 = 4.95,
y asi obtenemos:
Tabla 1.4 Clase completa para la vida de las baterías de automóvil
Para obtener la marca de clase simplemente sumamos los dos valores de cada clase y los
dividimos entre 2. Por ejemplo para la primera clase su marca de clase sería 0.95+1.95=
2.9 y si luego lo dividos entre 2 obtenemos 1.45. Si repetimos esto para cada clase
obtendremos:
Tabla 1.5 Marca de clase para la vida de las baterías de automóvil
Para obtener el valor de la frecuencia simplemente contamos los digitos (hojas) que hay
en cada tallo en el diagrama de tallo y hojas. Por ejemplo en el ejercicio en el tallo 1 estan
las hojas (digitos) 6 y 9, es decir son 2 hojas ó digitos y esta es la frecuencia. Si hacemos
lo mismo para todos los tallos obtenemos:
Tabla 1.6 Frecuencia para la vida de las baterías de automóvil
Ya terminada la distribución de frecuencias podemos construir el Histograma, en el eje de
las X vamos a colocar los valores de las clases y en el eje de las Y colocaremos los
valores de las frecuencias. El Histograma quedaría de la siguiente manera:
12
Figura 1.3 Muestra el Histograma de frecuencias del ejemplo 1.1.
Caso de estudio “Descifrado de claves secretas”
El análisis criotográfico, que es el estudio cientifico que se ocupa de convertir a texto
simple mensajes cifrados o codificados cuya clave no se conoce, proporciona una
ilustración asombrosa de la forma en que las distribuciones de frecuencias arrojan luz
sobre una cantidad enorme de datos sin elaborar. Considere el mensaje secreto (está
escrito en ingles) de la tabla 1.7.
Tabla 1.7 Un mensaje codificado
IMEUX
ANEMO
MJDAM VNNES
MAMQK SXNES
CGNEM DPRPM
KVSXD MVSCX
LNEMO MSPMX
MTKPO KDNUB
OMRKP MNEMO
VNOSP
MDVON
MPDJD
VLNEM
WNEMR UVOMV
MNPKN
NSXXW
NNEMG
SNUPI
MPDLE
DBMXD
ESTTD
MPDLE
DNKNM
DPZKO
NUBNE
13
EONUC
MVSPM
SPMMV
DNERM
NONES
CMPNG
VMOON
NOLUJ
ASWUV
NTUIM
MLUJM
MOMXB
RPMSN
AUIMA
PNSDV
NSWUV
SVANE
ESNNU
MPVWN
LWMVA
POBPU
PVMA
Para descifrar el mensaje, se utiliza la distribución de frecuencias relativa con la de las
letras de un texto normal en inglés, mostrado en la tabla 1.8. Aun cuando es dificil
esperar un aperamiento letra por letra, la yuxtaposición puede ser muy útil para romper el
código. Después de varios intentos algunas letras pueden identificarse, (por ejemplo, M
como e y N como t), luego porciones de palabras y, finalmente, todo el mensaje. (Nota:
un buen descifrador de claves observa no sólo las frecuencias generales de las letras, sino
que tambien considera las asociaciones preferidas de una letra con otras, el orden de
frecuencia de las dobles más comunes, de letras iniciales, de letras finales, de las palabras
más frecuentes compuestas sólo de una letra y mucho más). La clave para este mensaje es
sencilla, a continuación se describe en la tabla 1.9, el primer renglón que sigue muestra el
texto simple y el segundo, el texto en clave.
Tabla 1.8 Distribución de frecuencia de 200 letras de un texto normal en ingles
Letra Frecuencia Frecuencia
Letra
Frecuencia Frecuencia
absoluta
Relativa (%)
absoluta
Relativa (%)
a
16
8
n
14
7
b
3
1.5
o
16
8
c
6
3
p
4
2
d
8
4
q
1
0.5
e
26
13
r
13
6.5
f
4
2
s
12
6
g
3
1.5
t
18
9
h
12
6
u
6
3
i
13
6.5
v
2
1
j
1
0.5
w
3
1.5
k
1
0.5
x
1
0.5
l
7
3.5
y
4
2
m
6
3
z
0
0
Totales
200
100%
Tabla 1.9 La clave codificada
a b c d e f g h i j k l m n o p q r s t u v w x y z
S C R A M B L E D Z Y X W V U T Q P O N K J I H G F
14
Ejercicios 1a
1. Los resultados siguientes representan las calificaciones de la población del curso
de probabilidad y Estadistica 2009:
9.9 8.9 7.9 6.7 6.2
9.7 8.7 7.9 6.7 6.1
9.0 8.5 7.9 6.6 5.5
9.0 8.2 7.0 6.6 5.3
a) Construya un diagrama de tallo y hojas para las calificaciones del curso donde los
tallos sean 5, 6, 7, 8, 9.
b) Construya la distribución de frecuencias de las calificaciones.
c) Construya el histograma de acuerdo a la distribución de frecuencias del inciso b.
2. Se toma una muestra aleatoria de la prueba ENLACE 2009 que se realizó a
estudiantes de tercero de primaria en las escuelas de Benito Juárez, Qroo. en el
tema de Matematicas. Dicha muestra declara los puntos obtenidos promedio en
Matematicas de diferentes escuelas tanto publicas como privadas:
692.5 598.0 583.7 540.9 515.9
636.7 594.9 568.5 533.6 512.5
616.1 591.8 549.8 529.8 450.6
613.9 587.7 545.0 527.2 409.7
a) Construya un diagrama de tallo y hojas para los puntos promedio donde los tallos
sean 4, 4*, 5, 5*, 6, 6*. (utilice multiplos de 50 para los tallos)
b) Construya la distribución de frecuencias de los puntos promedio.
c) Construya el histograma de acuerdo a la distribución de frecuencias del inciso b.
3.
1.09
1.58
2.11
1.64
1.37
El contenido de nicotina, en miligramos, de 25 cigarros de cierta marca se
registraron como sigue:
1.92 1.70 1.85 1.82
2.03 1.69 1.64 2.09
0.72 1.40 1.75 1.69
1.93 1.79 2.28 1.74
2.31 2.17 2.55 1.47
a) Construya un diagrama de tallo y hojas para los datos en que los tallos son los
digitos a la izquierda del punto decimal, cada uno repetido 4 veces de modo que
las hojas de doble digito 00 a 24 se asocien con los tallos codificados con la letra
a, las hojas de 25 a 49 se asocien con los talloss codificados con la letra b,
etcétera. De esta forma, un número como el 1.58 tiene un valor de tallo 1c y una
hoja igual a 58.
b) Construya la distribución de frecuencias de los miligramos de nicotina.
c) Construya el histograma de acuerdo a la distribución de frecuencias del inciso b.
15
b) Medidas de tendencia central para datos No agrupados
La media, moda y mediana son medidas de tendencia central, que al calcularlas nos dan
una idea de cual es el centro de la distribución de los datos. Cuando los datos no estan
agrupados ó en grupos utilizaremos las siguientes formulas.
Las medidas de tendencia central son valores numéricos que localizan, en algún sentido,
el centro de un conjunto de datos.
Media
Es el promedio con el que probablemente el lector esté más familiarizado. Para
determinar la media de los datos NO agrupados utilizamos la siguientes formulas:
Para una población:
µ=
X1 + X 2 + X 3 + ....X N
N
(1.1)
donde N es el numero de datos de la población.
€
Para una muestra:
(1.2)
donde n es el numero de datos de la muestra
Ejemplo1.2:
Determine la media de los datos NO agrupados del ejemplo 1.1
Como los datos del ejercicio son de una muestra utilizamos la formula (1.2), el resultado
es el siguiente:
Moda
Para determinar la moda de los datos NO agrupados es encontrar el valor que con mas
frecuencia se presenta del conjunto de datos.
Ejemplo1.3:
Determine la moda de los datos NO agrupados del ejemplo 1.1
16
Mediana
Es el valor de los datos que ocupa la posición media cuando los datos están clasificados
en orden de acuerdo a su tamaño. Para determinar la mediana de los datos NO agrupados,
primero deben ordenarse los datos de menor a mayor, y déspues pueden usarse las
siguientes formulas:
Para una población:
(1.3)
Para una muestra:
(1.4)
Ejemplo1.4:
Determine la mediana de los datos NO agrupados del ejemplo 1.1
Como los datos del ejercicio son de una muestra utilizamos la formula (1.4), el resultado
es el siguiente:
Como el resultado es el dato 20.5 en un arreglo ordenado tomamos el dato 20 y el 21,
déspues calculamos el promedio y esa será nuestra mediana.
por lo tanto
17
Ejercicios 1b
1. Determine la
ejercicios 1a.
2. Determine la
ejercicios 1a.
3. Determine la
ejercicios 1a.
4. Determine la
ejercicios 1a.
5. Determine la
ejercicios 1a.
6. Determine la
ejercicios 1a.
7. Determine la
ejercicios 1a.
8. Determine la
ejercicios 1a.
9. Determine la
ejercicios 1a.
media de los datos NO agrupados del ejercicio 1 del grupo de
moda de los datos NO agrupados del ejercicio 1 del grupo de
mediana de los datos NO agrupados del ejercicio 1 del grupo de
media de los datos NO agrupados del ejercicio 2 del grupo de
moda de los datos NO agrupados del ejercicio 2 del grupo de
mediana de los datos NO agrupados del ejercicio 2 del grupo de
media de los datos NO agrupados del ejercicio 3 del grupo de
moda de los datos NO agrupados del ejercicio 3 del grupo de
mediana de los datos NO agrupados del ejercicio 3 del grupo de
18
c) Medidas de tendencia central para datos agrupados
La media, moda y mediana son medidas de tendencia central, que al calcularlas nos dan
una idea de cual es el centro de la distribución de los datos. Cuando los datos estan
agrupados ó en grupos utilizaremos las siguientes formulas.
Media
Es el promedio con el que probablemente el lector esté más familiarizado. Para
determinar la media de los datos agrupados utilizamos las siguiente formulas:
Para una población:
(1.5)
Para una muestra:
(1.6)
donde, f es la frecuencia y X es la marca de clase.
Ejemplo1.5:
Determine la media de los datos agrupados del ejemplo 1.1
Los datos agrupados del ejemplo 1.1 estan resumidos en la tabla 1.6.
Como los datos del ejercicio son de una muestra utilizamos la formula (1.6), el resultado
es el siguiente:
Moda
Para determinar la moda de los datos agrupados utilizamos las siguientes formulas:
Para una población:
(1.7)
19
Para una muestra:
(1.8)
donde, L es el límite inferior de la clase modal, d1 y d2, respectivamente, son las
diferencias absolutas entre la densidad de frecuencia de clase modal y de la clase
precedente o siguiente, w es el ancho de clase.
Ejemplo1.6:
Determine la moda de los datos agrupados del ejemplo 1.1
La clase modal es la clase donde se encuentra la moda de los datos NO agrupados, la
moda de los datos NO agrupados es 3.1 como ya lo calculamos antes. El valor de 3.1 lo
incluye la tercera clase de la tabla 1.6, por lo tanto esa es nuestra clase modal.
Como los datos del ejercicio son de una muestra utilizamos la formula (1.8), el resultado
es el siguiente:
Mediana
Es el valor de los datos que ocupa la posición media cuando los datos están clasificados
en orden de acuerdo a su tamaño. Para determinar la mediana de los datos agrupados
utilizamos las siguientes formulas:
Para una población:
(1.9)
Para una muestra:
(1.10)
donde, L es el limite inferior de la clase mediana, f la frecuencia de la clase mediana, w el
ancho de clase, F es la suma de frecuencias hasta (pero sin incluir) la clase mediana.
20
Ejemplo1.7:
Determine la mediana de los datos agrupados del ejemplo 1.1
La clase mediana es la clase donde se encuentra la mediana de los datos NO agrupados,
como ya lo calculamos antes la mediana de los datos NO agrupados es 3.4. EL valor de
3.4 lo incluye la tercera clase de la tabla 5, por lo tanto esa es nuestra clase mediana.
Como los datos del ejercicio son de una muestra utilizamos la formula (1.10), el resultado
es el siguiente:
21
Ejercicios 1c
1. Determine la media de los datos agrupados del ejercicio 1 del grupo de ejercicios
1a.
2. Determine la moda de los datos agrupados del ejercicio 1 del grupo de ejercicios
1a.
3. Determine la mediana de los datos agrupados del ejercicio 1 del grupo de
ejercicios 1a.
4. Determine la media de los datos agrupados del ejercicio 2 del grupo de ejercicios
1a.
5. Determine la moda de los datos agrupados del ejercicio 2 del grupo de ejercicios
1a.
6. Determine la mediana de los datos agrupados del ejercicio 2 del grupo de
ejercicios 1a.
7. Determine la media de los datos agrupados del ejercicio 3 del grupo de ejercicios
1a.
8. Determine la moda de los datos agrupados del ejercicio 3 del grupo de ejercicios
1a.
9. Determine la mediana de los datos agrupados del ejercicio 3 del grupo de
ejercicios 1a.
22
d) Medidas de dispersión para datos No agrupados
También llamadas medidas de variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número, si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto
menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos. Las medidas de dispersión más utilizadas son la desviación y
estandar y la varianza, estas medidas son las que se estudiaran solo en este documeto.
Desviación estandar
La desviación estandar y la varianza son medidas de dispersión y nos dan una idea de que
tan dispersos estan los datos.
Para determinar la desviación estandar de los datos NO agrupados utilizamos las
siguientes formulas:
Para una población:
(1.11)
Para una muestra:
(1.12)
Ejemplo1.8:
Determine la desviación estándar de los datos NO agrupados del ejemplo 1.1
Como los datos del ejercicio son de una muestra utilizamos la formula (1.12), el resultado
es el siguiente:
Varianza
Para determinar la varianza de los datos NO agrupados utilizamos las siguientes
formulas:
Para una población:
23
(1.13)
Para una muestra:
(1.14)
Ejemplo1.9:
Determine la varianza de los datos NO agrupados del ejemplo 1.1
Como los datos del ejercicio son de una muestra utilizamos la formula (1.14), el resultado
es el siguiente:
Caso Practico “El 85avo percentil de límite de velocidad”
Para el iniciado, la “regla del 85avo percentil” parece extraña, poco ortodoxa, y hasta
puede ser temible, pero este punto de referencia de límite de velocidad ha guiado a
ingenieros de tráfico durante décadas. La idea es que los límites de velocidad máxima
deben establecerse de manera que 85% de los vehículos en un tramo particular de
carretera estén en ese límite o abajo del mismo. Según políticas en California, los
ingenieros de tráfico rutinariamente miden la rapidez con que circulan los automovilistas
y luego establecen el límite en el 85avo percentil de la velocidad de tráfico.
24
Ejercicios 1d
1. Determine la desviación estandar de los datos NO agrupados del ejercicio 1 del
grupo de ejercicios 1a.
2. Determine la varianza de los datos NO agrupados del ejercicio 2 del grupo de
ejercicios 1a.
3. Determine la desviación estandar de los datos NO agrupados del ejercicio 3 del
grupo de ejercicios 1a.
25
e) Medidas de dispersión para datos agrupados
La desviación estandar y la varianza son medidas de dispersión y nos dan una idea de que
tan dispersos estan los datos. En este caso tomaremos los datos en grupos.
Desviación estandar
Para determinar la desviación estandar de los datos agrupados utilizamos las siguientes
formulas:
Para una población:
(1.15)
Para una muestra:
(1.16)
para ambas formulas la media es la de los datos agrupados.
Ejemplo1.10:
Determine la desviación estándar de los datos agrupados
Los datos agrupados del ejemplo 1.1 estan resumidos en la tabla 1.6.
Como los datos del ejercicio son de una muestra utilizamos la formula (1.16), pero antes
acompletamos la tabla 1.6 para incorporar fX, X2 y fX2.
Tabla 1.7 Frecuencia para la vida de las baterías de automóvil donde se incorpora fX X2 y
fX2 para calcular la desviación estandar del ejemplo 1.10
Como los datos del ejercicio son de una muestra utilizamos la formula (1.16), el resultado
es el siguiente:
26
Varianza
Para determinar la varianza de los datos agrupados utilizamos las siguientes formulas:
Para una población:
(1.17)
Para una muestra:
(1.18)
para ambas formulas la media es la de los datos agrupados.
Ejemplo1.11:
Determine la varianza de los datos agrupados
Como los datos del ejercicio son de una muestra utilizamos la formula (1.18), el resultado
es el siguiente:
27
Ejercicios 1e
1. Determine la desviación estandar de los datos agrupados del ejercicio 1 del grupo
de ejercicios 1a.
2. Determine la varianza de los datos agrupados del ejercicio 2 del grupo de
ejercicios 1a.
3. Determine la desviación estandar de los datos agrupados del ejercicio 3 del grupo
de ejercicios 1a.
28
2) PROBABILIDAD
La probabilidad surge cuando el hombre se interésa en los juegos de azar y lógicamente
en aumentar sus ganancias en los juegos, por este motivo algunos matemáticos
proporcionaron estrategias a los jugadores, estos pioneros fueron Pascal, Leibniz, Fermat
y Bernoulli.
¿Qué queremos decir cuando hacemos afirmaciones como “Brasil probablemente ganara
la copa mundial”?, ó “tengo 50% de posibilidad obtener un numero par al lanzar un
dado”. En cada caso expresamos un resultado del cual no estamos seguros pero debido a
la experiencia o a datos pasados o a partir de la comprensión del experimento tenemos
algún grado de confianza en la validez de cada afirmación. La probabilidad de ocurrencia
de algún evento que resulta de un experimento estadístico se evalúa por medio de un
conjunto de números reales denominados pesos o probabilidades que van de 0 a 1. Y la
suma de todas las probabilidades o pesos posibles de un experimento es 1. Es decir si la
probabilidad de un evento es cercana a 1 tenemos razón suficiente para creer que es
bastante probable que ocurra. El caso contrario es cuando la probabilidad de un evento es
muy cercana a 0.
a) Espacio muestral y eventos
Espacio muestral es el conjunto de todos los resultados posibles de un experimento
estadistico y se representa con el simbolo S.
Ejemplo 2.1:
Considere el experimento de lanzar un dado. Si nos interésa el número que muestra la
cara superior el espacio muestral sería:
Es decir, los posibles resultados son: 1, 2, 3, 4, 5, 6.
Un evento es un subconjunto del espacio muestral.
Ejemplo 2.2:
Si lanzamos un dado podemos estar interésados en el evento (A) que caiga un número
par, estó ocurrirá si la cara muestra un elemento del subconjunto A.
29
Ejercicios 2a
1. Determine el espacio muestral de un experimento que consiste en lanzar una
moneda.
2. Determine el espacio muestral de un experimento que consiste en lanzar una
moneda y déspues lanzarla una segunda vez si sale cara, pero si sale cruz en el
primer lanzamiento, entonces se lanza un dado.
3. Liste los elementos de cada uno de los espacios muestrales siguientes:
a) El conjunto de enteros entre 1 y 50 divisibles entre 8.
b) El conjunto de números primos entre 1 y 50.
4. Un experimento consiste en lanzar un dado y déspues lanzar una moneda una vez
si el número en el dado es par. Si el número es impar, la moneda se lanza dos
veces más. Determine el espacio muestral de este experimento.
30
b) Conteo de puntos de la muestra
Uno de los problemas de la Estadística es evaluar el elemento de posibilidad asociado a
ciertos eventos cuando se lleva a cabo un experimento. Algunas veces se deben resolver
problemas de probabilidad mediante el conteo del número de puntos en el espacio
muestral sin listar realmente cada elemento.
Regla de multiplicación.
Si una operación se puede llevar a cabo en n1 formas, y si para cada una de éstas se puede
realizar una segunda operación en n2 formas, entonces las dos operaciones se pueden
ejecutar juntas n1n2 formas.
Ejemplo 2.3:
¿Cuántos almuerzos que consisten en una sopa, emparedado, postre y una bebida son
posibles si podemos seleccionar de 4 sopas, 3 tipos de emparedados, 3 postres y 5
bebidas?
n1=tipo de sopa=4
n2=tipo de emparedado=3
n3=tipo de postre=3
n4=tipo de bebida=5
n1 x n2 x n3 x n4= 4x3x3x5= 180 diferentes maneras de elegir un almuerzo.
Permutaciones
Algunas ocasiones nos interésa encontrar un espacio muestral que contiene como
elementos a todas las posibles ordenaciones o arreglos de un grupo de objetos. Por
ejemplo, podemos querer saber cuantos arreglos diferentes son posibles para sentar a 5
personas alrededor de una mesa los diferentes arreglos se llaman permutaciones.
El número de permutaciones de n objetos distintos tomados de r a la vez es:
(2.1)
Ejemplo 2.4:
¿Cuantos arreglos diferentes son posibles para sentar a 5 personas alrededor de una
mesa?
n=# de asientos en la mesa =5
r= # de personas en la mesa = 5
31
El número de permutaciones distintas de n cosas de las que n1 son de una clase, n2 de una
segunda clase, n3 de una tercera clase,…., nk de una k-ésima clase es:
(2.2)
Ejemplo 2.5:
¿De cuantas formas diferentes se pueden arreglar 5 focos azules, 2 focos verdes y 4 focos
amarillos en una serie de luces navideña con 11 porta focos?
n=# de porta focos =11
n1= # focos azules =5
n2= # focos verdes =2
n3= # focos amarillos =4
11!
39916800
39916800
=
=
= 6930
(5!)(2!)(4!) (120)(2)(24)
5760
€
Combinaciones
En ocasiones nos interésa el número de formas de seleccionar r objetos de n sin importar
el orden. Estas selecciones se llaman combinaciones.
El número de tales combinaciones de n objetos distintos tomados de r es:
(2.3)
Ejemplo 2.6:
De 4 químicos y 5 físicos encuentre el número de comités que se pueden formar que
consistan de 2 químicos y 3 físicos.
El número de formas de seleccionar a 2 químicos de un total de 4 es:
n=# total de químicos disponible = 4
r= # de químicos que se necesitan para formar el comité = 2
El número de formas de seleccionar a 3 físicos de un total de 5 es:
n=# total de físicos disponible = 5
r= # de físicos que se necesitan para formar el comité = 3
32
Al utilizar la regla de la multiplicación con n1=6 y n2=10, podemos formar
n1=# de formas de seleccionar a 2 químicos de un total de 4 = 6
n2=# de formas de seleccionar a 3 físicos de un total de 5 = 10
Existen 60 formas diferentes de formar comités con 2 químicos y 3 físicos.
33
Ejercicios 2b
1. Si un experimento consiste en lanzar un ddo y después extraer una letra al azar del
alfabeto ingles, ¿cuántos puntos hay en el espacio muestral?
2. Cierto calzado se recibe en cinco diferentes estilos con cada estilo disponible en
cuatro colores distintos. Si la tienda desea mostrar pares de estos zapatos que
muestren la totalidad de los diversos estilos y colores, ¿cuántos diferentes pares
tendría que mostrar?
3. ¿De cuantos formas distintas se puede responder una prueba de falso y verdadero
que consta de nueve preguntas?
4. ¿cuántas permutaciones se pueden hacer con las letras de la palabra columna?
5. ¿Cuantas permutaciones comienzan con la letra m del total de permutaciones que
se pueden hacer con las letras de la palabra columna?
34
c) Probabilidad de un evento
La probabilidad de la ocurrencia de un evento que resulta de un experimento estadistico
se evalua por medio de números reales denominados probabilidades que van de 0 a 1.
Probabilidad simple
La probabilidad simple se refiere a la probabilidad de ocurrencia de un solo evento, es
decir, la probabilidad de un evento es igual al numero total de éxitos (solo éxitos) entre el
numero total de posibles resultados (éxitos y fracasos) ó espacio muestral.
Ejemplo 2.7:
Considere el experimento de lanzar un dado. Si nos interésa saber la probabilidad de
obtener un 5.
Entonces los posibles resultados son: 1, 2, 3, 4, 5 y 6. A esto se le conoce también como
espacio muestral. Y el número total de éxitos es solo un éxito (solo existe un 5 en un
dado común). Por lo tanto
P(Obtener un 5) =
Algunas ocasiones es de gran ayuda construir un diagrama de árbol para comprender
mejor el problema. Para este problema el diagrama de árbol sería muy simple, a
continuación se planteara otro problema para ejemplificar el diagrama de árbol.
Ejemplo 2.8:
Un experimento consiste en lanzar un dado y después en lanzar una moneda una vez.
¿Qué posibles resultados podría obtener?, ¿Cuál es la probabilidad de obtener un 3 y
águila?
Se dibuja un diagrama de árbol:
35
Lanzar dado
Lanzar moneda
Resultados
Águila
1, Águila
Sol
1, Sol
Águila
2, Águila
Sol
2, Sol
Águila
3, Águila
Sol
3, Sol
Águila
4, Águila
Sol
4, Sol
Águila
5, Águila
Sol
5, Sol
Águila
6, Águila
Sol
6, Sol
1
2
3
Inicio
4
5
6
Figura 2.1 Muestra el diagrama de árbol del ejemplo 2.8.
Se observan 12 posibles resultados, la cantidad de resultados también se puede obtener de
multiplicar el número de ramas del primer evento (lanzar un dado) es decir, 6 por el
número de ramas del segundo evento (lanzar una moneda) es decir, 2. Por lo tanto 6 X 2
= 12 posibles resultados. Y la probabilidad de obtener un 3 y águila es:
Caso Practico “Tratando de vencer las posibilidades”
Numerosos jóvenes en EUA aspiran a hacerse atletas profesionales. Sólo unos pocos lo
logran. Por cada 2400 jugadores universitarios de baloncesto de alto rendimiento, sólo 64
forman parte de un equipo profesional; esto se traduce a una posibilidad de sólo 0.027
(64/2400).
Hay muchos otros datos interesantes, por ejemplo, muchos estudiantes de secundaria
sueñan en convertirse en jugadores profesionales de baloncesto, pero la probabilidad que
su sueño se convierta en realidad es de sólo 0.000427 (64/150000).
Una vez que un jugador haya llegado a un equipo universitario de baloncesto, podría
estar muy interesado en las posibilidades de llegar a ser un jugador de alto rendimiento.
De los 3800 jugadores que pertencen a una equipo universitario, 2400 son jugadores de
alto rendimiento. Por lo tanto, si un jugador ha llegado a un equipo universitario, las
posibilidades de que juegue como de alto rendimiento son 0.6316 (2400/3800).
36
El jugador universitario de alto rendimiento que está jugando está interesado en sus
posibilidades de llegar al siguiente nivel. De los 2400 jugadores universitarios de alto
rendimiento, sólo 64 llegan a equipos profesionales, mientras que 2336 no llegan. Las
posibilidades están fuertemente contra él para que llegue al siguiente nivel.
37
Ejercicios 2c
1. ¿Cuál es la probabilidad de sacar una carta roja en una baraja de 52 cartas?
2. ¿Cuál es la probabilidad de sacar un rey en una baraja de 52 cartas?
3. ¿Cuál es la probabilidad de sacar un 8 cuando se lanzan 2 dados al mismo
tiempo?
4. ¿Cuál es la probabilidad de sacar un 8 cuando se lanzan 3 dados al mismo
tiempo?
5. ¿cuál es la probabilidad de obtener un aguila y un sol cuando se lanzan 2 monedas
al mismo tiempo?
38
d) Reglas aditivas
Si A y B son 2 eventos cualquiera, entonces
(2.4)
Para esto considere el diagrama de Venn de la figura 2.2. Donde se ilustra esta regla
aditiva de probabilidad.
Figura 2.2 Muestra el diagrama de Venn de la regla aditiva.
Ejemplo 2.9:
La probabilidad de que Jose apruebe un curso de Matematicas es de 2/3, y la propabilidad
de que aprube un curso de Ingles es de 4/5. Si la probabilidad de aprobar ambos cursos es
de 1/2. ¿Cuál es la probabilidad de que Jose apruebe al menos uno de los dos cursos?
Si M es el evento de aprobar Matemativas e I es el evento de aprobar Ingles, entonces
tenemos,
En algunas ocaciones los eventos A y B son excluyentes, es decir, no contienen
elementos en comun, para estos casos la P(A∩B)=0
Ejemplo 2.10:
¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados?
Si S es el evento de obtener un 7 y O es el evento de obtener un 11, entonces para obtener
un 7 ocurre para seis de los 36 puntos muestrales y obtener un total de once ocurre ocurre
para 2 de los 36 puntos muestrales. Por lo tanto,
Regla del complemento
Si un evento A y su complemento del evento A se denota A´entonces
(2.5)
39
Ejemplo 2.11
Si las probabilidades de que un vendedor de autos venda cero, uno, dos, tres, cuatro y
cinco autos por semana son 0.05, 0.25, 0.35, 0.20, 0.10 y 0.05 respectivamente. ¿Cuál es
la probabilidad de que de venda al menos un auto la proxima semana?
Sea el evento A de que al menos venda un auto el vendedor. Por lo tanto A´es el evento
de que se venda menos de un auto ó mejor dicho el evento de que no venda ningun auto.
40
Ejercicios 2d
1. ¿Cuál es la probabilidad de sacar una carta roja o un ás en una baraja de 52
cartas?
2. ¿Cuál es la probabilidad de sacar un rey ó un 8 en una baraja de 52 cartas?
3. Una caja contiene 500 sobres de los cuales 75 contienen $100 en efectivo, 150
contienen $25 y 275 contienen $10.
a) Calcule la probabilidad de sacar un sobre que contenga menos de $100
b) Calcule la probabilidad de sacar un sobre que contenga $100 ó $25
4. ¿Cuál es la probabilidad de obtener un 7 ú 11 cuando se lanzan dos dados?
5. ¿Cuál es la probabilidad de obtener 6 ó menos cuando se lanzan tres dados?
41
e) Probabilidad condicional
La probabilidad que un evento B ocurra cuando se sabe que ya ocurrió un evento A se
llama probabilidad condicional.
La probabilidad condicional de B, dado A, se denota de la siguiente manera:
(2.6)
Ejemplo 2.12:
La probabilidad de que un vuelo programado salga a tiempo es P(D)=0.85; la
probabilidad que llegue a tiempo es P(A)=0.83 y la probabilidad de que salga y llegue a
tiempo es P(D∩A)= 0.80. Encuentre la probabilidad de que un avión llegue a tiempo
dado que salio a tiempo.
La probabilidad de que un avión llegue a tiempo, dado que salio a tiempo es:
Ejemplo 2.13:
La información de la tabla 2.1 muestra la población de adultos de una ciudad pequeña.
Tabla 2.1 Población de adultos que
pequeña
Empleado Desempleado
Hombre
460
40
Mujer
140
260
Total
600
300
estan empleados y desempleados de una ciudad
Total
500
400
900
Si M es el evento de elegir una Mujer y E el evento de elegir un empleado, entonces
encuentre la propabilidad de elegir una mujer dado que tenga empleo.
42
Ejercicios 2e
1. En un experimento para estudiar la relación de la hipertensión arterial y los
habitos de fumar, se reunen los siguientes datos para 180 individuos:
No Fumadores Fumadores moderados Fumadores empedernidos
Con Hipertensión
21
36
30
Sin Hipertensión
48
26
19
Si se selecciona uno de estos individuos al azar, encuentre la probabilidad de que
la persona:
a) Sufra hipertensión dado dado que es fumadora empedernida
b) No sufra hipertensión dado que No fume
c) Sea un no fumador dado que la persona sufra hipertensión
d) Sea un fumador moderado dado que no sufra hipertensión
2. ¿Cuál es la probabilidad de sacar un rey ó un 8 en una baraja de 52 cartas dado
que ya se saco un ás previamente
3. Una muestra aleatoria de 200 adultos se clasifica abajo por sexo y su nivel de
educación
Educación
Hombre Mujer
Primaria
38
45
Secundaria
28
50
Preparatoria
22
17
Si se selecciona una persona al azar de este grupo, encuentre la probabilidad de
que la persona:
a) Sea hombre dado que tiene educación primaria
b) Sea mujer dado que tiene educación secundaria
c) Tenga educación preparatoria dado que sea mujer
d) Tenga educación secundaria dado que sea hombre
43
f) Reglas multiplicativas
Al despejar la formula de probabilidad condicional obtenemos la regla multiplicativa:
(2.7)
Ejemplo 2.14
En una caja que contiene 30 focos sabemos que 5 de ellos estan defectuosos. Si
seleccionamos 2 focos al azar de esta caja y los separamos déspues de haberlos sacados
sin reemplazarlos, ¿cuál es la probabilidad de que ambos focos esten defectuosos?
Si A es el evento de sacar el primer foco defectuoso y B el evento de sacar el segundo
foco defectuoso, entonces
Si dos eventos son independientes entonces,
(2.8)
Ejemplo 2.14:
En una pequeña ciudad que tiene una ambulancia y un carro de bomberos para
emergencias, la probabilidad de que la ambulancia este disponible cuando se necesite es
de 0.95 y la probabilidad de que el carro de bomberos este disponible cuando se necesite
es de 0.94. En un accidente donde se ocupen la ambulancia y el carro de bomberos,
encuentre la probabilidad de que ambos esten disponibles.
Sea A el evento de que la ambulancia este disponible y B el evento de que el carro de
bomberos este disponible, entonces
44
Ejercicios 2f
1. Un agente de bienes raices tiene ocho llaves maestras para abrir varias casas
nuevas. Sólo una llave maestra abrira cualquiera de las casas. Si 40% de estas
casas por lo general se dejan abiertas, ¿cuál es la probabilidad de que el agente
pueda entrar en una casa especifica si selecciona tres llaves maestras al azar antes
de salir de la oficina?
2. Considere el experimento de lanzar un dado dos veces. ¿Cuál es la probabilidad
de obtener un 5 en el primer lanzamiento y un 3 en el segundo lanzamiento?
3. Un fabricante de una vacuna para la gripe se interésa en la calidad de su suero.
Tres diferentes departamentos procesan los lotes de suero y tienen tasas de
rechazo de 0.10, 0.08 y 0.12 respectivamente. Las inspecciones de los tres
departamentos son secuenciales e independientes.
a) ¿Cuál es la probabilidad de que un lote sobreviva la primera inspección y que
sea rechazado en la segunda inspección?
b) ¿Cuál es la probabilidad de que un lote pase las tres inspecciones?
4. En un juego de poker usted recibe 4 cartas de una baraja de 52 cartas. ¿Cuál es la
probabilidad de que le repartan 4 reyes?
45