Download Probabilidad y Estadística

Document related concepts
no text concepts found
Transcript
Reforma del Bachillerato Tecnológico 2004
SUBSECRETARIA DE EDUCACIÓN MEDIA SUPERIOR
DIRECCIÓN GENERAL DE EDUCACIÓN TECNOLÓGICA AGROPECUARIA
SAETA-
Educación humana y de calidad
Probabilidad y Estadística
(Basado en la Reforma del Bachillerato Tecnológico 2004)
Guía
d i d á c t i ca
Compiladores:
 Alejandro Acebo Gutiérrez
 Rubén Henríquez
 Francisco Romo Romero
 Tirso Cuevas Nolasco
 Raúl Arellano Ibarra
 Ernesto Zamora Hernández
Junio de 2006
DIRECTORIO
Lic. Reyes Tamez Guerra
Secretario de Educación Pública
Yoloxochitl Bustamante Díaz
Subsecretario de Educación Media Superior
Ing. Ernesto Guajardo Maldonado
Director General de Educación Tecnológica Agropecuaria
Prof. Saúl Arellano Valadez
Director Técnico
Ing. Agustín Velázquez Servín
Director de Apoyo a la Operación Desconcentrada
M.C. Maria Elena Hernández Mejia
Coordinadora Nacional del Programa Sistema Abierto de Educación Tecnológica Agropecuaria
ASIGNATURA: “Probabilidad y Estadística ”
REGISTRO No. IV
SEP / SEMS / DGETA
JOSE MARIA IBARRARAN No. 804
COL. SAN JOSE INSURGENTES SUR.
06720, MÉXICO, D.F.
TEL. 01 5 328 10 00 y 01 5 328 10 97
ISBN
2
Se autoriza la reproducción del contenido con fines educativos que no
implique lucro directo ó indirecto, siempre y cuando se cite la fuente,
previa autorización por escrito de la DGETA.
COMITÉ EDITORIAL
Prof. Saúl Arellano Valadez
M. en C. María Elena Hernández Mejía
En el proceso de elaboración de esta antología, participaron los siguientes docentes del
estado de: Aguascalientes, Nayarit, Tabasco y Veracruz
NOMBRE
Alejandro Acebo Gutiérrez
Rubén Henríquez
Francisco Romo Romero
Tirso Cuevas Nolasco
Raúl Arellano Ibarra
Ernesto Zamora Hernández
PLANTEL
CBTa No. 107
CBTa No. 107
CBTa No. 88
CBTa No. 86
CBTa No. 61
CBTa No. 30
ESTADO
Nayarit
Nayarit
Zacatecas
Veracruz
Aguascalientes
Aguascalientes
3
GUÍA DE CONTENIDOS
Pág.
VARIABLES Y REPRESENTACIONES ______________________________ 9
Introducción _____________________________________________ 9
Población y muestras ____________________________________ 10
Variable discreta y continua _______________________________ 11
Redondeo de datos ______________________________________ 14
Notación sistematizada ___________________________________ 15
Cifras significativas ______________________________________ 16
Cálculos ______________________________________________ 16
DISTRIBUCIONES DE FRECUENCIAS ____________________________ 19
Toma y ordenación de datos _______________________________ 19
Distribuciones de frecuencias ______________________________ 20
Intervalos de clase ______________________________________ 20
Límites de clase ________________________________________ 21
Límites reales de clase ___________________________________ 21
Tamaño del intervalo de clase _____________________________ 21
Marca de clase _________________________________________ 22
Histograma y polígono de frecuencia ________________________ 23
Distribución de frecuencia relativa __________________________ 27
Distribución de frecuencia acumulada _______________________ 27
Distribución de frecuencias relativas acumuladas _______________ 30
MEDIDAS DE TENDENCIA CENTRAL _____________________________ 33
Promedios _____________________________________________ 33
Media ________________________________________________ 33
Mediana ______________________________________________ 34
4
Moda _________________________________________________ 35
Cuartiles, deciles, percentiles ______________________________ 50
Regresión líneal ________________________________________ 53
MEDIDAS DE DISPERSIÓN _____________________________________ 55
Dispersión _____________________________________________ 55
Rango ________________________________________________ 56
Desviación media _______________________________________ 60
Varianza ______________________________________________ 61
Desviación típica ________________________________________ 62
Rango semi cuartílico ____________________________________ 63
Rango entre percentiles __________________________________ 63
PROBABILIDAD ______________________________________________ 70
Introducción ____________________________________________ 70
Conceptos básicos ______________________________________ 70
Modelos matemáticos ____________________________________ 72
Permutaciones y combinaciones ____________________________ 73
Diagrama de árbol _______________________________________ 73
Proceso de contar _______________________________________ 74
Combinaciones _________________________________________ 85
Teorema del Binomio ____________________________________ 91
PROBABILIDAD AXIOMÁTICA ___________________________________ 93
Simbología básica _______________________________________ 93
Probabilidad para eventos _______________________________ 104
Probabilidad condicional _________________________________ 104
Eventos independientes _________________________________ 104
Eventos dependientes ___________________________________ 106
5
Teorema de Bayes _____________________________________ 110
GLOSARIO _________________________________________________ 111
BIBLIOGRAFÍA CONSULTADA _________________________________ 115
BIBLIOGRAFÍA RECOMENDADA ________________________________ 116
6
INTRODUCCIÓN
El presente trabajo esta dirigido a los estudiantes del SAETA que cursan el Bachillerato
Tecnológico bajo el enfoque de estrategias educativas centradas en el aprendizaje, con la
firme intención de que sirva de guía y que con las actividades que desarrollaras te permitirán
adquirir los conocimientos que competen a los contenidos del programa de estudios de la
asignatura de Probabilidad y Estadística que se imparte en el quinto semestre y que estas a
punto de iniciar.
Con el desarrollo de los contenidos programáticos dentro y fuera del aula, tú como
participante entusiasta y responsable de tu propio aprendizaje, te permitirá comprender los
conceptos analizados y la aplicación significativa para resolver problemas de la vida cotidiana.
La meta se logrará con tú valiosa participación porque eres el principal actor de tu
propio aprendizaje y que con el apoyo de tu facilitador determinarás el éxito en tú desempeño
escolar, familiar y laboral.
7
MENSAJE
Ya sabes que no puedes gozar del juego de la vida a menos que
conozcas sus reglas, sea de convivencia de juego de pelota, de uso de
computadora o tan sólo de salón.
Igualmente no puedes cuantificar o cualificar tu entorno, sino hasta que
comprendas las reglas de la probabilidad y estadística, que te harán
comprender las formas de presentar las ocurrencias de un fenómeno social,
físico o biológico que te llevarán a ampliar tu horizonte de conocimientos en
donde verás la estructura matemática en numerosas ecuaciones, pero más que
recetas de cálculo, verás ecuaciones y ordenamientos como guías para pensar.
Yo disfruto de la probabilidad y la estadística, y tú también lo harás,
porque la comprenderás. Si te tomas la idea de enfocarte hacia esta disciplina.
Y resolver los problemas matemáticos. Ahora trata de comprender los
conceptos, si después vienen los cálculos los harás comprendiéndolos.
Disfruta de la probabilidad de que ocurra tu felicidad.
Y serás parte de la estadística de los estudiantes felices.
VARIABLES Y REPRESENTACIONES
INTRODUCCIÓN
8
Estadística: Es un método científico que recopila, organiza, analiza e interpreta los datos
obtenidos para tener conocimiento de los hechos pasados, para prever situaciones futuras y
tomar decisiones en base a la experiencia.
En el estudio de la estadística, se diferencian dos tipos de estadísticas:
Estadística descriptiva o deductiva y Estadística inferencial o inductiva.
Estadística Descriptiva: Es aquella cuyo objetivo es describir cuantitativamente una
serie de personas, animales o cosas, su estudio incluye las técnicas de colectar,
presentar, analizar e interpretar datos.
Esta parte de la estadística es la que estudiaremos en el presente curso de probabilidad y
estadística 1, será la que nos auxilie a resolver preguntas de investigaciones como las
siguientes: ¿Cómo ordenar los datos y analizarlos adecuadamente? ¿Qué tipo de
representación gráfica es más conveniente utilizar para presentar los datos? ¿Cuál es la
media aritmética o promedio de los datos obtenidos? ¿Qué tan dispersos están los datos con
respecto a otra muestra?
Estadística Inferencial: Es aquella cuyo objetivo es obtener información sobre una
población o grupo grande de personas o cosas, mediante un metódico procedimiento
de los datos de una muestra tomada de él.
Este último tipo de estadística no la utilizaremos en éste curso, pero hagamos un ejercicio
para analizar cuál es la diferencia entre estos dos tipos de estadística:
A un grupo de 50 alumnos del CBTA 107 extensión Xalisco le preguntamos ¿Cuál es la
materia que les gusta más? Los datos arrojados por ésta encuesta, en éste grupo en
particular, es incumbencia de la Estadística Descriptiva, ya que ordenamos los datos, los
analizamos obteniendo sus parámetros como la media, la desviación, los graficamos y hasta
los interpretamos Pero…
Si queremos hacer conclusiones a nivel estatal de todos los alumnos de los CBTAs del
estado de Nayarit, éste grupo de 50 encuestados sería una parte de las diferentes muestras
que nos servirían para saber la tendencia de toda la población estudiantil respecto a la
materia que les gusta mas, y debemos tomar más muestras de estudiantes de otros CBTAs,
por lo cual ya entraríamos en el campo de la Estadística Inferencial y sus datos deberán de
analizarse de otra manera más profunda, haciendo pruebas de hipótesis para obtener las
inferencias o conclusiones a futuro.
Con tus propias palabras escribe
¿CUAL ES LA DIFERENCIA ENTRE ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA
INFERENCIAL?
_______________________________________________________________
9
______________________________________________________________________
______________________________________________________________________
Población: Es el conjunto de todos los elementos, medidas, individuos y objetos que tienen
una característica en común, pero en muchas ocasiones debido a limitaciones de tiempo o
de recursos no se puede trabajar con la totalidad de la población.
Muestra: Es la parte de una población que podemos utilizar para obtener conclusiones de
toda una población sin tener que analizar su totalidad.
La muestra elegida debe cumplir con ciertos requisitos indispensables:
a) Validez. Debe representar a la población, esto es, ha de pertenecer a ésta y ser elegida al
azar o 67en forma aleatoria, para que todos los elementos de la población tengan la misma
probabilidad de ser considerados.
b) Confiable. Los resultados que se obtengan deben poder generalizarse a toda la población
con cierto grado de precisión.
c) Práctica. Debe ser sencilla de llevar acabo.
d) Eficiente. Debe proporcionar la mayor información con el menor costo.
DATOS: Son las medidas, valores o características susceptibles de ser observadas y
contadas.
VARIABLES: Es una propiedad o característica de algún evento, objeto o persona, que
puede tener diversos valores en diferentes instantes, según las condiciones. La altura, el
peso, el tiempo de reacción y la dosis de un medicamento, son ejemplos de variables.
Las variables son las herramientas fundamentales de la estadística y se clasifican de la
siguiente manera:
En las VARIABLES CATEGÓRICAS los valores pueden ser EXPRESIONES y también estas
expresiones pueden ser sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría
a la que pertenece cada individuo, la cual está determinada por el valor de la variable.
Hagamos unos ejemplos:
10
Si queremos saber la forma en que se trasladan los estudiantes del CBTA-XALISCO para
recibir sus clases grupales; preguntaremos a cada estudiante del grupo, si usualmente se
trasladan de su casa a la escuela CAMINANDO o EN ALGÚN VEHICULO, por lo tanto los
valores de la variable serán (C) "caminando" o (V) " Vehículo" y se clasifican a los alumnos en
éstas dos categorías.
Otro ejemplo:
Si quisiéramos conocer la materia que prefieren los estudiantes de una lista de 4 materias en
donde se incluyen Ciencias Sociales, Matemáticas, Ciencias Naturales y Español; En este
caso la materia de preferencia puede tomar cuatro valores: (CS) que es Ciencias Sociales;
(M) que es Matemáticas, (CN) Ciencias Naturales y (E) será Español. Es claro pues que la
variable, materia de preferencia clasifica a los estudiantes en cuatro categorías.
Observa que los valores que pueden tomar las variables en los ejemplos anteriores son
EXPRESIONES y que estas expresiones han sido sustituidas por SÍMBOLOS que nos
permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada
por el valor de la variable. Los ejemplos anteriores son VARIABLES CATEGÓRICAS
NOMINALES.
Veamos ahora otros ejemplos de VARIABLES CATEGÓRICAS:
Si deseamos saber si el contenido de la materia de Procesos de Producción Pecuaria tiene
relación con las prácticas de campo que se realizaron el semestre pasado y le pedimos la
opinión a cada estudiante, los valores que puede tomar la variable pueden ser: "Nunca" (A),
"Raras veces" (B), "Algunas veces" (C), Casi siempre" (D) y "Siempre" (E). Observe que esta
variable clasifica a cada uno de los estudiantes que contestaron la pregunta, según la opinión
que haya elegido.
Otro ejemplo:
Si queremos saber cómo se alimentan los estudiantes del CBTA-XALISCO, para relacionarlo
con el aprovechamiento escolar, preguntaremos cada semana a todos los estudiante del
grupo, cuáles alimentos ingirieron durante la semana y clasificamos la variable calidad de la
alimentación de la siguiente manera: “MD” al alumno que se alimentó muy deficientemente,
“D” el de alimentación deficiente, “R” el de alimentación regular, “B” el de alimentación buena
y “MB” el de alimentación muy buena. Con esto todos los estudiantes del grupo, quedarán
distribuidos en cinco posibles categorías.
Observa que los valores de las variables también son EXPRESIONES, sin embargo, entre los
valores de estos dos ejemplos últimos hay UN ORDEN. Los ejemplos anteriores SON
VARIABLES CATEGÓRICAS ORDINALES.
Si comprendiste, escribe con tus propias palabras:
¿Cuándo es variable Categórica nominal?
______________________________________________________________________
¿Cuándo es una variable Categórica Ordinal?
11
______________________________________________________________________
Ahora con las VARIABLES NUMÉRICAS.
En las variables numéricas, sus valores no son expresiones sino NUMEROS y es en donde
además tiene sentido efectuar operaciones aritméticas con ellos y compararlos.
12
Si los valores de la variable son NÚMEROS ENTEROS, se llamará NUMÉRICA DISCRETA,
pero si los valores de la variable pueden tomar CUALQUIER VALOR NUMÉRICO en algún
intervalo de números reales (con decimales o fracciones), la variable será NUMÉRICA
CONTINUA.
Hagamos unos ejemplos:
Si queremos saber el número de hermanos de los alumnos del CBTA-XALISCO. Serán desde
cero en adelante y como es lógico no puede haber medio hermano o tres cuartos de
hermano, por lo tanto la variable número de hermanos es una variable numérica discreta.
Otro ejemplo será el número de preguntas acertadas en un examen de conocimientos; los
años cumplidos de los estudiantes, el número de materias que cursan en el quinto semestre,
etc.... Ya que son variables numéricas que pueden tomar sólo valores enteros.
Veamos por último los ejemplos de las variables numéricas continuas:
Si queremos saber la estatura de los alumnos del quinto semestre con una aproximación a
milímetros, tendríamos que utilizar una regla de dos metros y dividida en centímetros y
milímetros. Los valores posibles de la variable serán todos los números pertenecientes a
algún intervalo.
Otro ejemplo es El peso que tienen las personas que asisten a un evento será también una
variable numérica continua, pues podrán pesar kilos, con gramos y hasta miligramos,
dependiendo de la precisión que queramos los resultados.
Si observas estas variables numéricas pueden tomar cualquier valor en algún intervalo.
AHORA TE TOCA PRACTICAR LOS SIGUIENTES EJERCICIOS:
ACTIVIDADES DE APRENDIZAJE:
Describe los valores que pueden tomar las siguientes variables y escribe si ésta es, una
variable categórica nominal, categórica ordinal, numérica discreta o numérica continua:
a) El Género (sexo) de cada alumno del grupo de quinto semestre.
Variable: __________________________________________
b) La cantidad de estudiantes en cada grupo de una escuela:
Variable: _________________________________________
c) El Peso de los niños mexicanos de 6 años.
Variable: ________________________________________
13
d) El daño causado a los pulmones de los jóvenes que fuman.
Variable: _______________________________________
e) Tipo de material con el que se construyen los techos de las viviendas de una localidad.
Variable: ________________________________
f) El número de naranjas producidas por cada naranjo en una huerta.
Variable: _______________________________________
g) La cantidad de afecto o amor que siente un niño por su mamá.
Variable: ______________________________________
h) El tiempo de reacción de una sustancia química en el laboratorio.
Variable: ______________________________________
REDONDEO DE DATOS
Dado que estaremos dando nuestras respuestas finales con dos decimales y en ciertas
ocasiones hasta con cuatro cifras decimales, necesitamos decidir cómo determinar el valor de
los últimos dígitos.
Si nuestro resultado final tiene ENTEROS redondearemos a DOS DECIMALES
Primer ejemplo cuando el residuo es menor que 0.5: 34.01350 = 34.01 es la respuesta
potencial y .350 el residuo; como .350 es menor que 0.5, el último dígito de la respuesta
potencial permanece sin cambio y la respuesta final es 34.01
Segundo ejemplo cuando el residuo es mayor que 0.5: 34.01761
34.01 es la respuesta
potencial y .761 el residuo; como .761 es mayor que 0.5, al último dígito de la respuesta
potencial debemos sumar 1 al último dígito, por lo que la respuesta correcta es 34.02
Tercer ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es
impar: 43.07500 43.07 es la respuesta potencial y .500 el residuo; como es impar el último
dígito de la respuesta potencial se AUMENTA 1, por lo que la respuesta correcta es 43.08
Cuarto ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es
par: 17.06500 17.06 es la respuesta potencial y .500 el residuo; como es par el último dígito
de la respuesta potencial NO se aumenta 1, por lo que la respuesta correcta es 17.06
Si nuestro resultado final tiene puras DECIMALES redondeamos a CUATRO DECIMALES
14
Siguiendo los mismos principios anteriores, si tenemos una cifra de 0.7544762 su respuesta
correcta es 0.7545; en cambio si es 0.1136211 la respuesta correcta es 0.1136; si tenemos
que 0.3463500 lo correcto será 0.3464; finalmente si tenemos 0.7728500 lo correcto será
0.7728.
ACTIVIDADES DE APRENDIZAJE DE “REDONDEO”.
Redondea las siguientes cifras:
22.666666 = __________________
0.7654598 = ___________________
57.87754 = ____________________
0.0663597= ___________________
3876.2255 = ___________________
0.3877865 = ___________________
99.7156 = _____________________
0.005329 = _____________________
NOTACIÓN SISTEMATIZADA
En estadística, por lo general, trabajamos con datos agrupados resultantes de medir una o
más variables. Con gran frecuencia, los datos se obtienen de las muestras y en ocasiones de
las poblaciones. Para fines matemáticos, generalmente se utiliza la letra mayúscula X y a
veces la Y, para representar la(s) variable(s). Así, si estuviéramos midiendo la edad de los
sujetos, haríamos que X represente la variable “edad”. Si existen muchos valores de la
variable agregamos un subíndice al símbolo X. Ilustramos este proceso en la siguiente tabla,
la cual contiene las edades de seis sujetos:
Número
de sujeto
Símbolo
del dato
Valor del dato,
edades
1
2
3
4
5
6
X1
X2
X3
X4
X5
X6
8
10
7
6
10
12
En este ejemplo representamos la variable “edad” mediante el símbolo X, además, N
representa el número total de datos que hay en la distribución. En este ejemplo, N = 6, Cada
uno de los seis datos representa un valor específico de X. Distinguimos los seis datos
diferentes, al agregar un subíndice a X, correspondiente al número de sujeto que tiene el
valor dado. Así, el símbolo X1 corresponde al valor del dato 8, X2 al valor del dato 10 hasta el
X6 al 12. En general, podemos referirnos a un único dato de la distribución X como Xi, donde i
puede asumir cualquier valor de 1 a N, según el dato que queramos designar. En resumen:
X o Y representa la variable medida.
N representa el número total de sujetos o datos.
Xi es el i-ésimo dato, donde i puede variar de 1 a N
CIFRAS SIGNIFICATIVAS:
En la estadística analizamos datos; este análisis implica muchos cálculos matemáticos. Con
mucha frecuencia tenemos un residuo decimal, por ejemplo, después de realizar una división.
15
Cuando esto ocurre, necesitamos decidir la cantidad de cifras decimales que utilizaremos
para el residuo.
En las ciencias físicas, por lo general, se utiliza el mismo número de cifras significativas que
tienen los datos en bruto, Por ejemplo, si medimos el peso de cinco sujetos hasta tres cifras
significativas (173, 156, 162, 165, y 175 libras) y queremos calcular el promedio de estos
pesos, nuestra respuesta debe contener sólo tres cifras significativas. Así
X 173  156  162  165  175 831
X 

 166.2  166
N
5
5
La respuesta de 166.2 se redondea a tres cifras significativas, dando un resultado final de 166
libras. Por varias razones y mas por continuar una tradición, en el presente curso de
estadística utilizaremos DOS cifras decimales redondeadas cuando el resultado tenga
ENTEROS y CUATRO cifras decimales cuando NO EXISTAN ENTEROS, sin importar las
cifras significativas de los datos en bruto. Así cuando se pida que el resultado tenga dos cifras
decimales, debemos realizar los cálculos intermedios con al menos CUATRO cifras decimales
y redondear la respuesta final a dos cifras.
CÁLCULOS
Una de las operaciones que se realizan con más frecuencia en estadística consiste en sumar
todos o una parte de los datos que pertenecen a una distribución. Como no es práctico
escribir “suma de todos los datos” cada vez que se necesite emplear esta operación,
particularmente en las ecuaciones, se utiliza una abreviatura simbólica. La letra griega
mayúscula sigma ( ∑ ) indica la operación de sumatoria. La frase algebraica utilizada para la
sumatoria es:
N
X
i 1
i
Esta expresión se lee como “la suma de la variable X de i = 1 a N”. Las notaciones que
aparecen arriba y debajo del signo de la sumatoria indican los datos que deben incluirse en la
operación. El término que aparece debajo del signo de la sumatoria nos indica el primer dato
en esta operación, y el término que se encuentra arriba de dicho signo indica el último dato.
Así, esta frase señala que debemos sumar los datos X, comenzando con el primero y
concluyendo con el N-ésimo dato.
Así.
N
X
i 1
i
 X 1  X 2  X 3  ...  X N
Ecuación de una sumatoria
Al “aplicar la sumatoria” a los datos de las edades de la tabla anterior, tenemos que:
N
X
i 1
i
 X1  X 2  X 3  X 4  X 5  X 6 =
8 + 10 + 7 + 6 + 10 + 12 = 53
Cuando la sumatoria se realiza con todos los datos (de 1 a N), es frecuente que la propia
frase de esta operación se abrevie, omitiendo las notaciones arriba y abajo del signo de la
N
suma, al igual que el subíndice
i. Así.
X
X

Se abrevia con frecuencia como
i
i 1
En el ejemplo anterior,
= 53 Esta expresión indica que la suma de todos los datos X es
X
53.

16
Observa que no es necesario que la sumatoria se realice de 1 a N, Por ejemplo, podríamos
querer sumar sólo el segundo, tercer, cuarto y quinto dato. Recuerda que la notación
debajo del signo de la sumatoria nos dice dónde comenzar la suma, y el término arriba de
5 terminarla.
dicho signo nos dice dónde
Xi
Utilizaríamos el símbolo
Para los datos anteriores, tenemos que:

i 2
N
X
i 1
i
 X 2  X 3  X 4  X 5  10  7  6  10  33
3
X
Resolvamos algunos ejemplos:
i 1
i
Para los siguientes datos, determine
X1= 10, X2 = 12, X3 = 13, X4= 18
3
Por lo tanto:
X
i 1
i
 10  12  13  35
4
X
Para los siguientes datos, determine
X6=31
4
Por lo tanto:
X
i 2
i
i 2
 3:
X 1=20, X2=24, X3=25, X4=28, X5=30,
 3  (24  25  28)  3  80
4
Para los siguientes datos, determine
X6=31
4
Por lo tanto:
i
( X
i 2
i
(X
i 2
i
 3)
X 1=20, X2=24, X3=25, X4=28, X5=30,
 3)  (24  3)  (25  3)  (28  3)  86
Existen otros dos tipos de sumatorias que veremos con frecuencia en estadística y son: ∑X 2 y
(∑X)2. Aunque se parecen, son distintos y, en general, proporcionan diferentes respuestas.
El símbolo ∑X2 (suma de los cuadrados de los datos X) indica que primero debemos elevar el
cuadrado de los datos X y luego sumarlos. Así:,
X
2
 X 12  X 22  X 32  ... X N2
El símbolo (∑X)2, o (el cuadrado de la suma de los datos X), indica que primero debemos
sumar los datos X y luego elevar al cuadrado la suma resultante. Así,
( X ) 2  ( X 1  X 2  X 3  ... X N ) 2
La confusión es muy común cometerlo, sobre todo cuando se calculan las desviaciones
estándar, eso lo analizaremos un poco mas adelante.
ACTIVIDADES DE APRENDIZAJE “CÁLCULO”
Primer ejercicio si
X1=3; X2=6; X3=8; X4=2; X5=9; X6=1; X7=5
17
7
X
i 3

i
5
(X
i 1
4
X
i 2
i
i
 12) 
 205 
Segundo ejercicio si X1=10; X2=7; X3=3; X4=16; X5=2; X6=22;
6
( X i )  8 
2
i 2
5
( X i ) 2  510 
i 1
DISTRIBUCIONES DE FRECUENCIAS
18
La Tabla de Distribución de Datos o Tabla de Distribución de Frecuencias, además de ser un
instrumento útil para resumir un conjunto de datos obtenidos en una investigación, es una
herramienta muy importante con que cuenta la estadística para realizar las observaciones de
manera rápida y sencilla.
Para construir dicha Tabla realizaremos siete pasos
y para tu mejor aprendizaje,
desarrollaremos un ejemplo con una variable numérica continua, ya que deseamos conocer el
“tiempo en minutos que emplearon para estudiar” 50 estudiantes del CBTA en la materia de
estadística 1.
PASO UNO: TOMA Y ORDENACIÓN DE DATOS:
La recopilación de los datos consiste en asistir al grupo de estudiantes y obtener los valores
mediante una pregunta abierta sobre el tiempo en minutos que emplearon para estudiar el
tema de estadística o si desconfiamos, podemos medir directamente el tiempo durante las
asesorías que emplearon cada uno de los alumnos al estudiar estadística. En resumen para
recopilar los datos debemos "asistir" al lugar donde vamos a 'tomar" o "levantar" los datos.
Esto puede ser mediante entrevistas, cuestionarios, observaciones o mediciones directas a
los individuos o cosas que corresponda nuestra variable.
Supongamos que los 50 datos obtenidos en nuestra variable: tiempo de estudio de la materia
de estadística en minutos fueron los siguientes y que corresponden a los 50 estudiantes:
75
60
80
67
81
71
74
63
72
70
76
62
82
63
81
66
78
68
80
74
67
74
84
70
63
77
68
82
74
72
76
64
75
80
69
85
71
79
60
74
83
75
67
72
78
64
77
81
76
70
La Ordenación de los datos consiste en colocar los datos tomados en orden creciente (de
menor a mayor) o decreciente (de menor a mayor). Nosotros los vamos a ordenar en forma
creciente y sobre todo "contando" y "anotando" los que se repitan, que será la frecuencia.
Ordenación de datos:
DISTRIBUCIÓN DE FRECUENCIAS
19
Tiempo empleado en minutos
60
62
63
64
66
67
68
69
70
71
72
74
75
76
77
78
79
80
81
82
83
84
85
Conteo
//
/
///
//
/
///
//
/
///
//
///
/////
///
///
//
//
/
///
///
//
/
/
/
Total
Frecuencia
2
1
3
2
1
3
2
1
3
2
3
5
3
3
2
2
1
3
3
2
1
1
1
50
Es importante que la suma total sea igual al número de datos que tomamos en la
investigación.
PASO DOS: RANGO.
El rango o recorrido es la diferencia que hay entre el dato mayor y el menor. Una vez que se
ordenaron los datos en forma creciente obtenemos el rango
85
60
25
que es el dato mayor
que es el dato menor
será el rango o recorrido
PASO TRES: INTERVALOS DE CLASE.
Cuando se tiene un gran número de datos, se recomienda distribuirlos en clases o categorías
llamadas intervalos de clase o celdas. Para decidir la cantidad de intervalos de clase que se
van a utilizar (o número de clases) y la amplitud de los intervalos (o ancho del intervalo) se
siguen las siguientes operaciones:
Primero el NÚMERO DE CLASES o INTERVALOS se obtienen con la fórmula:
Q = 1 + 3.322 (log. n) donde n es el número de datos y log. Es el logaritmo de dicho número.
Siguiendo el ejemplo tenemos:
Q = 1+ 3.322 (og. 50) observa que obtendremos el logaritmo de 50. En una calculadora el
logaritmo de 50 es 1.69897... Redondeando su valor será 1.70 Este valor lo multiplicamos por
3.322 y nos da en la calculadora 5.64... Que redondeado será 5.64 y finalmente le sumamos
1 a dicha cantidad arrojándonos = 6.64 Si el número que nos arroje la formula tiene su
20
primera decimal igual o mayor que .5 se aumenta el entero. Así en nuestro ejemplo tenemos
que 6.6 seria igual a 7.
En resumen y de acuerdo a la formula el número de intervalos será de 7
Resulta claro que si lo ancho del intervalo es de 4 y el número de intervalos son 7; (4 ) (7) =
28 se cubrirá todo el rango que es de 25.
Debemos hacer uso de los Límites reales Inferiores (L.R.I.), quitando 0.5 al dato más chico
que en nuestro caso es de 60 minutos. Por lo tanto será de 59.5 el L.R.I. Luego a este se le
suma lo ancho del intervalo que es de 4 resultando 63.5 que es el Límite Real Superior
(L.R.S.) por lo que ahora si podemos decir que los dos datos 64 se deberán anotarse en el
2do. Intervalo que iniciaría en 63.5 hasta 67.5 como límite real superior.
Ahora si podemos construir cada uno de los intervalos con sus límites reales inferiores y
limites reales superiores.
ADELANTE AYÚDANOS A COMPLETAR EL SIGUIENTE CUADRO,
Recuerda que el ancho de cada intervalo es de 4 y que en total son siete (7) intervalos de
acuerdo a las operaciones realizadas anteriormente:
INTERVALOS DE CLASE
Límite Real Inferior
Límite Real Superior
59.5
63.5
63.5
71.5
71.5
79.5
87.5
PASO CUATRO: TAMAÑO DEL INTERVALO DE CLASE.
Con los datos del ejemplo, el dato más bajo es el 60 y como el ancho del intervalo es de 4, su
límite superior será de 64. El siguiente intervalo sería 64 más 4 del ancho del intervalo nos da
68 como limite superior y así sucesivamente. ...
Intervalos
60
64
68
72
a
a
a
a
64
68
72
etc…
Observación Importante: Si te fijas detenidamente en los intervalos y los datos ordenados
del cuadro anterior; los dos datos de 64 quedarían comprendidos en el 1er. y 2do. Intervalo,
es decir, pueden anotarse en el primero o en el segundo intervalo, también los 72 en el 3er o
4to intervalo; pero se sabe que una observación dada (los 64 y 72) deben colocarse en uno y
solamente uno de los intervalos de clase.
Ahora para el ANCHO DEL INTERVALO: Se divide el rango entre el número de intervalos
para obtener la anchura de cada intervalo o celda.
21
Rango =
Número de intervalos =
25
7
=
3.57 redondeando será igual a 4
Por lo tanto el ancho del intervalo será de 4
PASO CINCO: MARCA DE CLASE.
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites
reales inferiores más los límites reales superiores, dividiendo el resultado entre dos.
Hagámoslo practicando...Llena los espacios que faltan. Se suma 59.5 + 63.5 = 123 = 61.5
2
Intervalos de Clase
L.R. Inferior
L.R. Superior
59.5
63.5
63.5
67.5
67.5
71.5
71.5
75.5
75.5
79.5
79.5
83.5
83.5
87.5
MARCA DE CLASE
61.5
85.5
¿Como voy hacerle
aceboman?
PERO SI UNA GRÁFICA O DIBUJO DICE MAS QUE 100 PALABRAS
22
¿CÓMO PODEMOS PRESENTAR LOS DATOS DE UNA
VARIABLE NUMÉRICA EN UNA GRÁFICAS?
HISTOGRAMA y POLÍGONO DE FRECUENCIAS.
Cuando las variables son cuantitativas o numéricas sean discretas o continuas la
representación gráfica más común es el HISTOGRAMA DE FRECUENCIAS y el POLÍGONO
DE FRECUENCIAS.
HISTOGRAMA DE FRECUENCIAS:
Este tipo de gráfica consiste en una serie de rectángulos trazados en un sistema de
coordenadas cartesianas o rectangulares. Para realizar el histograma es necesario agrupar
los datos en intervalos de clase, con sus límites reales inferiores y superiores, además de su
frecuencia absoluta.
Los rectángulos tienen sus bases sobre el eje horizontal con centros en las marcas de clase
y su longitud es igual a la anchura de los intervalos de clase. La altura de cada rectángulo
corresponde al valor de la frecuencia que tenga el intervalo que representa. En éstos
histogramas los rectángulos se trazan adyacentes entre si.
¡¡¡ VAMOS A PRACTICARLO PARA APRENDER MEJOR!!!
De acuerdo a los datos de la "Tabla de distribución de frecuencias" del ejemplo (pag.16),
donde analizamos el tiempo que dedican a estudiar la materia de estadística 50 estudiantes,
vamos a construir su Histograma de Frecuencias.
Histograma:
F
R
E
Tiempo en minutos dedicados a estudiar
Estadística por 50 estudiantes
23
14 12 10 8 6 4 2 0 59.5 63.5 67.5
61.5
71.5 75.5
79.5
83.5
87.5
INTERVALOS DE CLASE (con sus L.R.I. y L.R.S.)
Si observas en el eje vertical de las "Y", se ubican las frecuencias absolutas, mientras que en
el eje horizontal de las "X" se ubican los intervalos de clase en donde cada límite real superior
corresponde al límite real inferior del siguiente intervalo. Las marcas de clase (61.5) aunque
es permitido no escribirse en el histograma, se pueden ubicar ya que corresponde al punto
medio de cada intervalo.
Como habrás observado, el histograma nos ayuda a mostrar la frecuencia absoluta con que
se presentan algunos datos; otra forma de gráfica son los…
14 F
R
E
C
U
E
N
C
I
A
S
12 10 8 6 4 2 0
61.5 65.5 69.5 73.5 77.5 81.5 85.5
MARCAS DE CLASE (puntos medios)
POLÍGONOS DE FRECUENCIA.
24
Los polígonos de frecuencia también se construyen a partir de datos con variables
cuantitativas o numéricas y se puede realizar a partir de un histograma si se desea.
Una vez trazado el histograma, se localizan los puntos medios o marcas de clase en la
parte superior de cada uno de los rectángulos o intervalos de clase. Se trazan segmentos de
recta que unen cada punto medio de cada uno de los intervalos.
Este polígono se encierra uniendo con el eje horizontal en el punto que corresponde al punto
medio de un rectángulo imaginario y adyacente al histograma, esto se hace en los extremos
izquierdos y derechos del polígono.
¡¡¡VAMOS HACIÉNDOLO CON EL MISMO EJEMPLO!!!
En el histograma se localizan los puntos medios en la parte superior de cada intervalo de
clase y en el eje horizontal, se indican las marcas de clase o puntos medios de cada intervalo.
Construyamos un polígono....
14 F
R
E
C
U
E
N
C
I
A
S
Polígono de Frecuencia: Tiempo en minutos dedicados a estudiar
Estadística por 50 estudiantes
12 10 8 6 4 2 0
61.5
65.5
69.5
73.5 77.5
81.5 85.5
MARCAS DE CLASE (Puntos medios)
Para trazar el polígono de frecuencia unimos con rectas los puntos medios o marcas de clase
con su frecuencia absoluta respectiva, en donde estaban la parte alta de los rectángulos del
histograma.
ACTIVIDADES DE APRENDIZAJE: Dibuja en ésta hoja el HISTOGRAMA y el POLIGONO
DE FRECUENCIAS del ejercicio de la página 16.
HISTOGRÁMA: “Estatura de 55 estudiantes”
25
POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes”
Escribe las conclusiones más importantes que nos indican las gráficas anteriores:
______________________________________________________________________
______________________________________________________________________
PASO SEIS: FRECUENCIA RELATIVA.
La Frecuencia Relativa, es la frecuencia que se representa con un Tanto por Ciento ( % ) y se
obtiene al dividir la frecuencia de un intervalo de clase entre el total de frecuencias de todas
las celdas por cien. La frecuencia Relativa se emplea para mostrar la proporción o
26
porcentajes de los valores incluidos en los intervalos de clase, por lo que también se le llama
Distribución Porcentual.
SIGAMOS PRACTICANDO Y APRENDIENDO.
Del 1er. y 2do Intervalos; Frecuencia Relativa de clase = 6 = 0.12 x 100 = 12 %
50
Del 6to intervalo; La Frecuencia Relativa = 9 = 0.18 x 100 = 18 %
50
Con todos los datos anteriores, finalmente construyamos nuestra…
Tabla de distribución de frecuencias de una variable numérica
“Tiempo dedicado a estudiar la materia de estadística”
Intervalos de Clase
Marca de
Frecuencia
Frecuencia
L.R.I.
L.R.S.
Clase
Absoluta
Relativa (%)
59.5
- 63.5
61.5
6
12
63.5
- 67.5
65.5
6
12
67.5
- 71.5
69.5
8
16
71.5
- 75.5
73.5
11
22
75.5
- 79.5
77.5
8
16
79.5
- 83.5
81.5
9
18
83.5
- 87.5
85.5
2
4
TOTAL = 50
100%
PASO SIETE: DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS
Así se llama al número de observaciones que pertenecen aun determinado intervalo. Para
obtener las frecuencias de cada clase es necesario contabilizar las observaciones, valores o
casos pertenecientes a cada intervalo, utilizando el cuadro donde ordenamos los datos que
está en la página 13. .
Sigamos Practicando
INTERVALOS DE CLASE
MARCA DE
FRECUENCIA
L.R. Inferior
L.R. Superior
CLASE
ABSOLUTA
59.5
63.5
61.5
6 (2+1+3)
63.5
67.5
65.5
67.5
71.5
69.5
71.5
75.5
73.5
11 (3+5+3)
75.5
79.5
77.5
79.5
83.5
81.5
83.5
87.5
85.5
2 (1+1)
TOTAL =
50
Con los datos anteriores terminamos los componentes principales del cuadro que también
recibe el nombre de... "TABLA DE DISTRIBUCIÓN DE FRECUENCIAS" por lo que...
Ya podemos obtener algunas CONCLUSIONES de nuestra investigación.
EJEMPLO DE ALGUNAS CONCLUSIONES…
Te recordamos que los 50 datos son del tiempo en minutos dedicado a estudiar estadística
por los estudiantes. Si analizamos detenidamente sus datos, podemos ver que el mayor
número de casos (frecuencia absoluta) es 11 y dedican de 71.5 a 75.5 minutos en estudiar
(su intervalo) pero además representan el mayor porcentaje con un 22% del total.
27
Caso contrario, son lo que dedican de 83.5 a 87.5 minutos en estudiar pues únicamente son 2
y representan un 4 % del total.
Si observamos en global el cuadro, podemos decir que la mayoría de los estudiantes (Los
intervalos 3,4 y 5) dedican de 67.5 a 79.5 minutos en estudiar y representan el 54 % del total.
Analizando otros datos podremos obtener más conclusiones de nuestro trabajo e ir
descubriendo lo importante de nuestra investigación. Mas adelante aprenderás a realizar
GRÁFICAS con los datos obtenidos de la tabla de frecuencias. Quedamos pendientes. .. ,
AHORA REALIZA LA SIGUIENTE ACTIVIDAD DE APRENDIZAJE:
1) siguiendo los siete pasos para una variable numérica, ordena los datos de la siguiente
variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de
distribución de frecuencias" de las “Estaturas de 55 estudiantes” con aproximación de un
centímetro. Datos:
154
160
159
161
162
165
173
168
161
160
156
160
149
174
170
160
161
163
160
163
159
166
169
168
168
170
162
157
152
157
151
153
162
169
165
163
163
159
165
159
166
156
168
156
163
166
170
155
166
160
153
165
163
166
160
Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución
de frecuencias
Paso 1 Ordenación de datos.
Paso 2 Rango... etc
Tabla de distribución de frecuencias de una variable numérica
“______________________________________________________”
Intervalos de Clase
L.R.I.
L.R.S.
Marca de Clase
Frecuencia
Absoluta
Frecuencia
Relativa (%)
TOTAL =
PRINCIPALES CONCLUSIONES:
28
1.____________________________________________________________________
2.____________________________________________________________________
3_____________________________________________________________________
DISTRIBUCIÓN DE FRECUENCIA RELATIVA ACUMULADA
29
Ahora estudiemos como se construye la DISTRIBUCIÓN DE FRECUENCIA ACUMULADA y
su gráfica LA OJIVA además de la FRECUENCIA RELATIVA ACUMULADA.
La frecuencia total de todos los valores menores que el límite real superior de un determinado
intervalo de clase, es conocida como frecuencia acumulada incluyendo hasta este intervalo.
Lo anterior lo comprenderás mejor si nos ayudas a resolver el ejemplo que sigue:
Si tomamos los datos obtenidos al medir el “tiempo en minutos que emplearon los estudiantes
en ir de su casa a la escuela”. Se construye la siguiente tabla de distribución de frecuencias y
una columna que corresponde a la distribución de frecuencia acumulada y otra a la
frecuencia relativa acumulada.
Concluyen los datos que faltan en la frecuencia acumulada de clase, de tal forma que sumen
un total de 243. En la columna de frecuencia acumulada relativa, también calcula los espacios
que faltan hasta que obtengas el 100%
INTERVALO
DE CLASE
MARCA
DE
CLASE
9.5 – 12.5
12.5 –15.5
15.5 – 18.5
18.5 – 21.5
21.5 – 24.5
24.5 – 27.5
27.5 – 30.5
30.5 – 33.5
33.5 – 36.5
T O T A L:
11
14
17
20
23
26
29
32
35
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
%
3
4
6
7
9
8
5
3
2
47
6.38%
8.51%
12.77%
14.89%
19.15%
17.02%
10.64%
6.38%
4.26%
100%
FRECUENCIA
ACUMULADA
7
13
20
3
(3+4 )
(7+6)
(
)
FRECUENCIA
RELATIVA
ACUMULADA
3/47X 100= 6.38%
7/47X100=14.89%
100%
243
LA OJIVA O POLÍGONO DE FRECUENCIA ACUMULADA.
Se le llama ojiva o polígono de frecuencia acumulada, a la gráfica que muestra la distribución
de frecuencia acumulada. Al construirla, los intervalos de clase se disponen en el eje
horizontal, y las frecuencias acumuladas se representan en el eje vertical. Luego se unen
los puntos localizados mediante segmentos.
Para entender la forma en que se traza una ojiva, considere el ejemplo de los datos obtenidos
al registrar el tiempo empleado por los estudiantes para ir de su casa a la escuela.
Primero se coloca un punto sobre el eje horizontal donde está el 9.5, puesto que no hay
observaciones de ésta o de inferior magnitud. Luego se traza el siguiente punto en el 12.5 a la
altura del 3, esto se puede hacer porque hay 3 registros iguales o menores de 12.5 de esta
manera se continúan representando el resto de los puntos.
30
Ejemplo: Tomando como base la distribución de frecuencia acumulada del ejemplo anterior, y
el tiempo en minutos que emplean los integrantes de un grupo de estudiantes de ir de su
casa a la escuela, construyamos la ojiva correspondiente:
50
45
FRECUENCIA ACUMULADA
40
35
30
25
20
15
10
5
0
9.5
12.5
15.5
18.5
21.5
24.5
27.5
30.5
33.5
INTERVALO DE CLASE
¿Esto es una ojiva Aceboman?
Yo creía que era la carga
explosiva de un misil de USA
En esta página transfiere los datos de la tabla de distribución de frecuencias del ejercicio de la
página 16 y en las dos columnas últimas obtén la FRECUENCIA ACUMULADA y la
FRECUENCIA RELATIVA ACUMULADA, además construye su gráfica llamada OJIVA.
31
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
INTERVALO
DE CLASE
MARCA
DE
CLASE
FRECUENCIA
ABSOLUTA
FRECUENCIA
ACUMULADA
FRECUENCIA
RELATIVA
ACUMULADA
100%
T O T A L:
55
227
DIBUJA LA OJIVA O POLIGONO DE FRECUENCIA ACUMULADA
32
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIOS
En estadística al promedio se le conoce como medida de tendencia central, ya que
está localizado hacia el medio o centro de una distribución, en la que la mayoría de los
valores tenderán a concentrarse. Entre los más comunes se pueden mencionar: la media
aritmética, la mediana y la moda
Media Aritmética
MEDIDAS DE TENDENCIA CENTRAL
Mediana
Moda
LA MEDIA ( X ).
La media aritmética o simplemente media, es el promedio aritmético de un conjunto de
observaciones y “se obtiene al sumar todos los datos y dividir dicha suma entre el total de
datos”.
MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS.
Algebraicamente se representa como:
Donde:
X = X 1  X 2  X 3  ...  Xn
n
X es la media aritmética de la muestra
X1 , X2, X3, ... Xn son los datos de la muestra y
“n” es el total de los datos de la muestra.
Ejemplo: En la muestra siguiente la media aritmética es:
X = 30  32  32  32  32  34  34  34  34  34  34  36  36  36  36  36  38  38  38  40
20
X=
696
= 34.8
20
Obsérvese que la “media” no necesariamente tiene que ser uno de los valores de la muestra.
Una manera más sencilla de encontrar esta “media aritmética” es multiplicando cada dato por
su frecuencia y continuar el proceso respectivo, como se ilustra a continuación:
X = 1(30)  4(32)  6(34)  5(36)  3(38)  1(40)
20
33
X=
30  128  204  180  114  40
20
X=
696
20
X = 34.8
Principales características de la media aritmética:
1. El cálculo de la media aritmética está basado en todos los valores de un conjunto de
datos. El valor de cada elemento en los datos afecta el valor de la media.
2. Cuando algunos valores extremos son incluidos en los datos, la media puede llegar a
ser menos representativa del conjunto de valores.
3. La media tienen dos propiedades matemáticas importantes que proporcionan un
análisis matemático adicional, haciéndola más popular que cualquier otro tipo de
promedio.
a. La suma algebraica de las desviaciones de los valores individuales respecto a la
media, es cero.
b. La suma del cuadrado de las desviaciones con respecto a la media es mínima.
~
LA MEDIANA ( X ) (Me)
~
La mediana ( X ) de una muestra de “n” datos, se localiza en la mitad de la muestra
del conjunto de elementos ordenados de mayor a menor o viceversa.
o
Su característica principal es dividir el conjunto ordenado en 2 grupos iguales; la mitad de los
números tendrá valores que son “menores que” la mediana y la otra mitad alcanza “valores
mayores” que ésta.
MEDIANA PARA DATOS NO AGRUPADOS
Si el número de elementos es impar, se toma el dato central; si es par la mediana está dada
por el promedio de los datos centrales, pudiéndose obtener un valor no dado en la muestra.
Ejemplo: ¿Cuál es la mediana aritmética de 3, 4, 4, 5, 6, 8, 8, 10?
Como los números están ya ordenados, la mediana es Me = 5+6 / 2 = “5.5“,
Otro ejemplo: 5.1, 6.5, 8.1, 9.1, 10.1, 15.5,
Como los números están ordenados, la mediana es Me = 8.1+9.1 / 2 = 8.6
Principales características de la mediana
1. La mediana es un promedio de posición y por su forma de cálculo no es afectada por
valores extremos.
2. La mediana no está definida algebraicamente como lo está la media aritmética.
34
3. La mediana en algunos casos, no puede ser calculada exactamente como sí puede
serlo la media.
4. Cuando el número de elementos incluidos en una serie de datos es par, la mediana es
aproximadamente el punto medio de los elementos centrales en una serie de datos.
^
LA MODA ( X ) (Mo)
La moda se define como el valor que tiene la mayor frecuencia (o que se repite mas) en un
grupo de datos,
Hay casos en que la moda no es única, esto es, puede ser bimodal con dos modas, o trimodal
con tres modas. También hay casos en que la moda no existe.
MODA PARA DATOS NO AGRUPADOS.
Ejemplo: ¿Cuál es la moda de la serie: 4, 5, 5, 6, 7, 7, 7, 8, 9, 1
La Moda es Mo = 7 porque es el número que más se repite.
Otro ejemplo: 60, 74, 82, 85, 90, 95,
La moda no existe.
Otro ejemplo: 10,12, 14, 16, 17, 17, 18, 19, 20, 20, 21.
La moda es bimodal o sea, Mo = 17 y 20
Principales características de la Moda.
1. La moda representa más elementos que cualquier otro valor dentro de un conjunto de
datos.
2. La moda no se calcula incluyendo todos los valores y no está definida algebraicamente
como si lo está la media.
3. La moda no es afectada por valores extremos.
4. Para una distribución de frecuencias, la moda no puede ser calculada exactamente,
como si puede serlo la media.
En resumen, hagamos una comparación de estas tres medidas de tendencia central.
COMPARACIÓN DE LA MEDIA, MEDIANA Y MODA.
En comparación con la media y la mediana, la moda es la menos útil para la mayoría de los
problemas estadísticos, ya que no se inclina por un análisis matemático, en el mismo sentido
que lo hacen las otras dos. Sin embargo, desde un punto de vista puramente descriptivo, la
moda es indicativa del valor típico en términos del valor que se presenta con mayor
frecuencia. La moda es más útil cuando uno o dos valores, o un grupo de éstos, ocurren con
35
mayores frecuencias que otros. Por el contrario, cuando la mayoría o todos los valores se
presentan casi con la misma frecuencia, la moda no sirve para describir datos.
Comparación entre la media, mediana y moda para datos no agrupados.
Medida
Definición
Media
Aritmética
Es la suma de los valores
de cierto número de
cantidades, dividido entre su
número.
Mediana
Moda
Es el valor que divide un
conjunto de datos
previamente ordenados.
Ventajas
1. Refleja cada valor.
2.
Tiene
propiedades
matemáticas atractivas.
3. Todos los valores afectan su
resultado.
4 Si se quiere calcular los
totales, es mejor usar la
media.
1. La mitad de los valores son
mayores, la otra mitad son
menores.
2. Es menos sensible a
valores extremos que la
media.
3. Si se quiere ubicar las
condiciones de una variable
categórica es mejor usar la
mediana.
1. Es la de menor sensibilidad
a los valores extremos.
Es el valor que ocurre con 2. Tiene más valores reunidos
mayor frecuencia.
en este punto que en cualquier
otro.
Limitaciones
1. Puede ser
excesivamente
influida por los valores
extremos.
1. Difícil de
determinar si hay gran
cantidad de datos.
2. Puede resultar falsa
si los datos son
irregulares y si hay
lagunas en los
valores.
1. No se presta para
análisis matemático.
2. Puede no haber un
valor modal para
algunos conjuntos de
datos.
3. Puede tener varias
modas.
Finalmente, la medida de tendencia central que se debe utilizar depende de la información
disponible y el objetivo que se desea alcanzar.
ACTIVIDADES DE APRENDIZAJE:
1) Calcula la media aritmética, la mediana y la moda de las series de valores siguientes:
a) 2, 3, 7, 4, 5, 4, 8.
Media Aritmética =___________________________________________= ________
Mediana = _________________________________________________ = ________
Moda = ___________________________________________________ = ________
b) 1, 9, 9, 4, 3, 5, 2, 7, 6.
Media Aritmética =___________________________________________= ________
36
Mediana = _________________________________________________ = ________
Moda = ___________________________________________________ = ________
2) Obtén la mediana y la moda de la siguiente variable categórica.
Variable categórica “Actividad Económica de 16 alumnos del 5to. Semestre”
Trabajo en hogar (TH); Trabajo albañil (TA); Trabajo en campo (TC); Trabajo en Tiendas (TT)
TH, TH, TC, TA, TC, TA, TT, TT, TC, TH, TC, TA, TT, TC, TC, TA.
Ordenación de los datos;
Media aritmética = No se puede utilizar
Mediana = _________________
Moda = ___________________
Ahora analicemos la media, mediana y moda pero con “DATOS
AGRUPADOS” o también se llaman de distribución de frecuencias
agrupadas.
Empecemos con la…
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Si los datos o valores han sido agrupados en intervalos de clase, entonces se considera que
todos los valores incluidos dentro de un determinado intervalo son iguales o están
representados por el punto medio del intervalo o la marca de clase. En este caso se procede
a multiplicar cada punto medio por su respectiva frecuencia. Luego se suman estos
productos, para finalmente dividir este resultado entre el total de datos.
Es importante señalar que el valor de la media de la frecuencia agrupada es suficientemente
aproximado para trabajos de estadística y que el valor de la media no será suficientemente
aproximado si la distribución de frecuencias agrupadas es muy irregular o demasiado
asimétrica.
La fórmula para la media aritmética en datos agrupados es la siguiente:
X
 ( f )( X )
n
Donde
f = Frecuencias absolutas de los intervalos.
X = Marca de clase o punto medio.
n = La suma de las frecuencias.
37
MEDIANA PARA DATOS AGRUPADOS
Cuando Los datos simples son agrupados en una distribución de frecuencias, cada uno de los
valores pierde su identidad en la tabla, significando que la mediana de los datos simples
puede no ser igual a la mediana obtenida de una distribución de frecuencias del mismo
conjunto de datos. Es importante mencionar, que la mediana de los datos agrupados es una
aproximación de la verdadera mediana. La aproximación puede ser obtenida mediante el uso
de la siguiente fórmula:
n

 2 c
Me  Li  
 (i )
Fme




n


c


Donde:
Me  Li   2
 (i )
Me = Mediana
fme




Li = Límite real inferior de la clase que contiene la mediana.
n = El número de datos o frecuencia total.
c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o
la suma de las frecuencias de los intervalos por debajo de la mediana.
fme = La frecuencia de la clase mediana.
i = Tamaño del intervalo o amplitud de la clase mediana.
MODA PARA DATOS AGRUPADOS.
Cuando la moda se calcula a través de la fórmula para datos agrupados, los valores y
frecuencia en la clase modal y las frecuencias en las clases inmediatamente antes y después
de la clase modal, son también empleadas. Por lo tanto se aplica la siguiente fórmula.
 d1 
Mo  Li  
(i)
 d1  d 2 
Donde:
Mo = Moda
L1 = Límite real inferior de la clase que contiene la moda
38
d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase
contigua inferior.
d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase
contigua superior.
i = Tamaño del intervalo o amplitud del intervalo de la clase modal.
A continuación resolveremos un ejercicio para utilizar las fórmulas de la media, la mediana y
la moda de datos agrupados.
Ejemplo: En la siguiente tabla se resumen los datos de los pesos en kilogramos de 50
estudiantes.
Con base a la siguiente tabla de distribución de frecuencias, calculemos los valores de la
media, la mediana y la moda, recordando cómo se conforman las columnas de Intervalos de
clase ( I ), Marca de clase o punto medio ( X ), Frecuencia absoluta( f ), Frecuencia relativa %
( f’ ) y la Frecuencia acumulada ( F ).
Intervalos de clase
(I)
30.5 – 33.5
33.5 – 36.5
36.5 – 39.5
39.5 – 42.5
42.5 – 45.5
45.5 – 48.5
48.5 – 51.5
51.5 – 54.5
Marca de
clase
(X)
32
35
38
41
44
47
50
53
TOTAL =
Frecuencia
Absoluta
(f )
1
2
6
11
16
9
4
1
50
Frecuencia
relativa
( f’ )
.02
.04
.12
.22
.32
.18
.08
.02
1.0 o 100%
Frecuencia
acumulada
(F)
1
3
9
20
36
45
49
50
CALCULO DE LA MEDIA ARITMÉTICA para datos agrupados
Su fórmula es…
X
 ( f )( X )
n
Esta expresión no se puede aplicar directamente, ya que únicamente se cuenta con el dato
del denominador, esto es n = 50, pero no se tiene el dato del numerador. Para ello se agrega
una columna a la tabla, donde se proporcionan los datos agrupados en intervalos. Esta
columna se construye multiplicando el punto medio de cada intervalo por su respectiva
frecuencia y cuando se tengan todos los productos, se procede a obtener la suma de ellos. La
tabla original ya con la columna Fx y la suma de ésta queda de la siguiente manera.
I
30.5 – 33.5
33.5 – 36.5
36.5 – 39.5
39.5 – 42.5
x
32
35
38
41
f
1
2
6
11
f’
.02
.04
.12
.22
F
1
3
9
20
fx
32
70
228
451
39
42.5 – 45.5
45.5 – 48.5
48.5 – 51.5
51.5 – 54.5
44
47
50
53
TOTAL =
16
9
4
1
50
.32
.18
.08
.02
1 o 100
36
45
49
50
704
423
200
53
2161
Entonces:
_
2161
X =
= 43.22 será el resultado de la media aritmética
50
MÁS ACTIVIDADES DE APRENDIZAJE:
Calcula la media aritmética de los tres ejercicios siguientes.
De la página 16…
Intervalos de Clase
L.R.I.
L.R.S.
59.5
63.5
67.5
71.5
75.5
79.5
83.5
-
63.5
67.5
71.5
75.5
79.5
83.5
87.5
Marca de
Clase (x )
Frecuencia
Absoluta (f )
61.5
65.5
69.5
73.5
77.5
81.5
85.5
TOTAL = 50
(f)(x)
6
6
8
11
8
9
2
De la pagina 18…
Intervalos de Clase
L.R.I.
L.R.S.
148.5
152.5
Marca de
Clase (x)
Frecuencia
Absoluta (f)
150.5
3
(f)(x)
TOTAL = 55
De la página 23…
Intervalo de clase
L.R.I.
L.R.S
Marca
de clase (x)
Frecuencia
de clase (f)
–
–
11
14
3
4
9.5
12.5
12.5
15.5
(f)(x)
40
T O T A L:
47
CALCULO DE LA MEDIANA para datos agrupados.
I
30.5 – 33.5
33.5 – 36.5
36.5 – 39.5
39.5 – 42.5
42.5 – 45.5
45.5 – 48.5
48.5 – 51.5
51.5 – 54.5
x
32
35
38
41
44
47
50
53
TOTAL =
f’’
.02
.04
.12
.22
.32
.18
.08
.02
1
f
1
2
6
11
16
9
4
1
50
F
1
3
9
20
36
45
49
50
Si partimos de la definición, la mediana es el dato central, como hay OCHO INTERVALOS
estará entre el cuarto y quinto intervalo; entonces, debe estar comprendida en el intervalo
42.5 – 45.5, ya que observando la columna “F”, a este intervalo le corresponde una
frecuencia acumulada de 36. Note Usted que si se toma el intervalo inmediato inferior, 39.5
– 42.5 se observa en la columna “F”, que hasta esta celda hay 20 VEINTE casos y como se
tiene un total de 50 datos, el caso central es el número 25. Así pues el intervalo donde está la
mediana es:
42.5 – 45.5 44
16
32
36
Algunos autores efectúan el siguiente razonamiento, sin utilizar la fórmula, pero si
interpolando una relación proporcional: ANALIZA DETENIDAMENTE
n = 50 por lo tanto la media está en 50/2 = 25
El L.R.I. de la mediana = 42.5
Como 20 casos (1+2+6+11) caen por debajo del L.R.I. de la mediana, necesitamos 5 datos
más, para llegar a 25. Dado que existen 16 casos (frecuencia) en el intervalo y éste tiene 3 de
amplitud o ancho, hacemos una regla de tres.
16 es a 3 como 5 es a x
16 : 3 :: 5 : x
x= (3)(5) =
16
Al L.R.I. le sumamos el resultado
15
16
= 0.9375
Me = 42.5 + 0.9735 = 43.4375
Finalmente mediana = 43.44 Kg.
41
Ahora utilicemos la fórmula para determinar la mediana en datos agrupados:
n


c


Me  Li   2
 (i )
Fme




Li = Límite real inferior de la clase que contiene la mediana.
n = El número de datos o frecuencia total.
c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o
la suma de las frecuencias de los intervalos por debajo de la mediana.
fme = La frecuencia de la clase mediana.
i = Tamaño del intervalo o amplitud de la clase mediana.
39.5 -- 42.5
41
11
.22
20
.40
451
42.5 – 45.5
44
16
.32
36
.72
704
Analizando estos dos intervalos se pueden obtener los siguientes valores:
L1 = 42.5 límite real inferior que contiene la mediana
n
 25
2
c = 20 es la frecuencia acumulada hasta la clase anterior a la clase mediana
n = 50 es el número total de frecuencias
de donde:
fme = 16 es la frecuencia de la clase mediana
i = 3 es el tamaño del intervalo o amplitud de la clase mediana.
Sustituyendo estos datos en la fórmula se tiene:
 25  20 
5
 15 
 15 
Me = 42.5+ 
( 3 ) = 42.5 +   ( 3 ) = 42.5 +   = 42.5 +  

 16 
16 
 16 
 16 
Me = 42.5 + 0.9375+ = 43.4375
Finalmente mediana = 43.44 Kg
MÁS ACTIVIDADES DE APRENDIZAJE:
Calcula la MEDIANA de los tres ejercicios que se han presentado.
42
De la página 16…
Intervalos de Clase
L.R.I.
L.R.S.
59.5
63.5
67.5
71.5
75.5
79.5
83.5
-
63.5
67.5
71.5
75.5
79.5
83.5
87.5
Marca de
Clase (x )
61.5
65.5
69.5
73.5
77.5
81.5
85.5
TOTAL =
Frecuencia
Absoluta (f )
6
6
8
11
8
9
2
50
De la pagina 18…
Intervalos de Clase
L.R.I.
L.R.S.
148.5
152.5
156.5
160.5
164.5
168.5
172.5
152.5
156.5
160.5
164.5
168.5
172.5
176.5
Marca de
Clase (x)
150.5
154.5
158.5
162.5
166.5
170.5
174.5
TOTAL =
Frecuencia
Absoluta (f)
3
7
13
12
13
5
2
55
De la página 23…
Intervalo de clase
L.R.I.
L.R.S.
Marca
De clase (x)
Frecuencia
de clase (f)
9.5 – 12.5
12.5 –15.5
15.5 – 18.5
18.5 – 21.5
21.5 – 24.5
24.5 – 27.5
27.5 – 30.5
30.5 – 33.5
33.5 – 36.5
11
14
17
20
23
26
29
32
35
3
4
6
7
9
8
5
3
2
T O T A L:
47
43
CALCULO DE LA MODA para datos agrupados.
Para determinar el valor de la moda, habrá que observar las columnas “ f ” y seleccionar el
intervalo que presenta la mayor frecuencia. En este caso, el intervalo que donde está incluida
la moda es:
42.5 – 45.5 44
16
.32
36
.72
704
La fórmula que se utiliza para encontrar el valor de la moda es:
 d1 
Mo  Li  
 (i)
d

d
2 
 1
L1 = Límite real inferior de la clase que contiene la moda
d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase
contigua inferior.
d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase
contigua superior.
i = Tamaño del intervalo o amplitud del intervalo de la clase modal.
Para determinar los valores de cada término en esta expresión, se requiere además del
intervalo donde está localizada la moda, de las celdas inmediata inferior y superior que queda
como sigue:
39.5 - 42.5
42.5 - 45.5
45.5 - 48.5
41
44
47
11
16
9
.22
.32
.18
20
36
45
.40
.72
.90
451
704
423
A partir de estos intervalos se adquieren los valores requeridos y que son:
Li = 42.5
d1 = 16 - 11 = 5
d2 = 16 – 9 = 7
i =3
Sustituyendo estos datos en la formula se obtiene:
 5 
Mo = 42.5 + 
 (3)
5  7 
Mo = 42.5 +
5
Mo = 42.5 +   ( 3 )
 12 
15
= 42.5 + 1.25 = 43.75
12
Finalmente la Moda = 43.75
44
MÁS ACTIVIDADES DE APRENDIZAJE:
Calcula la MODA de los tres ejercicios que se han presentado.
De la página 16…
Intervalos de Clase
Marca de
Frecuencia
L.R.I.
L.R.S.
Clase (x )
Absoluta (f )
59.5
- 63.5
61.5
6
63.5
- 67.5
65.5
6
67.5
- 71.5
69.5
8
71.5
- 75.5
73.5
11
75.5
- 79.5
77.5
8
79.5
- 83.5
81.5
9
83.5
- 87.5
85.5
2
TOTAL =
50
De la pagina 18…
Intervalos de Clase
L.R.I.
L.R.S.
148.5
152.5
156.5
160.5
164.5
168.5
172.5
152.5
156.5
160.5
164.5
168.5
172.5
176.5
Marca de
Clase (x)
Frecuencia
Absoluta (f)
150.5
154.5
158.5
162.5
166.5
170.5
174.5
3
7
13
12
13
5
2
55
TOTAL =
De la página 23…
Intervalo de clase
L.R.I.
L.R.S.
9.5 – 12.5
12.5 –15.5
15.5 – 18.5
18.5 – 21.5
21.5 – 24.5
24.5 – 27.5
27.5 – 30.5
30.5 – 33.5
33.5 – 36.5
T O T A L:
Marca
de clase (x)
Frecuencia
de clase (f)
11
14
17
20
23
26
29
32
35
3
4
6
7
9
8
5
3
2
47
45
REALIZA LA SIGUIENTE ACTIVIDAD DE APRENDIZAJE:
De las edades de 40 maestros de los C.B.T.a s, calcula las MEDIDAS DE TENDENCIA
CENTRAL (MEDIA, MEDIANA Y MODA) Tanto de los datos sin agrupar como agrupados.
Edades:
36, 53, 35, 28, 30, 36, 45, 29, 43, 28,
30, 46, 39, 54, 47, 44, 34, 40, 50, 38,
47, 56, 48, 42, 39, 47, 53, 51, 38, 29,
48, 52, 47, 46, 41, 40, 45, 39, 47, 38.
CALCULA PRIMERO LA MEDIA ARITMETICA, MEDIANA Y MODA DE LOS
DATOS SIN AGRUPAR.
Media Aritmética = _____________________________________________________
Ordena los datos:
______________________________________________________________________
______________________________________________________________________
Cual es la Mediana =____________________
Cual es la Moda = ___________________
46
AHORA PARA DATOS AGRUPADOS. Realiza la Tabla de distribución de frecuencias con
los 7 pasos:
PASO 1. Ordenación de datos:
EDAD DE
LOS
MAESTROS
CONTEO
FRECUENCIA
PASO DOS: Rango o recorrido:
PASO TRES: Intervalos de Clase:
Número de intervalos o clases:
Ancho del Intervalo o clase:
PASO CUATRO: Límites reales inferiores y límites reales superiores:
PASO CINCO: Marca de Clase
PASO SEIS: Frecuencia Absoluta
PASO SIETE: Frecuencia Relativa (%)
47
Realiza tus operaciones en orden y limpieza hasta llenar la tabla de frecuencias
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
“Edades de los maestros del C.B.T.a.”
Intervalos de
Marca
Frecuencia
Frecuenc Frecuencia
(f )(x)
Clase
de
Absoluta (f)
ia
Acumulada
L.R.I.
Clase
Relativa
(F)
L.R.S
(X)
(f’)
AHORA UTILIZA LAS FORMULAS PARA DATOS AGRUPADOS Y CALCULA…..
MEDIA ARITMETICA:
Resultado Media =__________
MEDIANA:
Resultado
Mediana =_______
MODA:
Resultado Moda =__________
48
FINALMENTE REALIZA UNA COMPARACIÓN DE LOS TRES EJERCICIOS
ANTERIORES, COMPARANDO SU MEDIA MEDIANA Y MODA DE CADA UNO
De la página 16
Intervalos de Clase
L.R.I.
L.R.S.
59.5
- 63.5
63.5
- 67.5
67.5
- 71.5
71.5
- 75.5
75.5
- 79.5
79.5
- 83.5
83.5
- 87.5
De la pagina 18
Intervalos de Clase
L.R.I.
L.R.S.
148.5
152.5
152.5
156.5
156.5
160.5
160.5
164.5
164.5
168.5
168.5
172.5
172.5
176.5
Marca de
Frecuencia
Clase (x )
Absoluta (f )
61.5
6
65.5
6
69.5
8
73.5
11
77.5
8
81.5
9
85.5
2
TOTAL =
50
Marca de
Clase (x)
150.5
154.5
158.5
162.5
166.5
170.5
174.5
TOTAL =
Frecuencia
Absoluta (f)
3
7
13
12
13
5
2
55
Media = ____________
Mediana=:___________
Moda=_____________
Media = ____________
Mediana=:___________
Moda=_____________
De la página 29…
Intervalo de clase
9.5 – 12.5
12.5 –15.5
15.5 – 18.5
18.5 – 21.5
21.5 – 24.5
24.5 – 27.5
27.5 – 30.5
30.5 – 33.5
33.5 – 36.5
T O T A L:
Marca
de clase (x)
11
14
17
20
23
26
29
32
35
Frecuencia
de clase (f)
3
4
6
7
9
8
5
3
2
47
Media = ____________
Mediana=:___________
Moda=_____________
49
CUARTILES, DECILES Y PERCENTILES:
La mediana no es más que uno de muchos fractiles; éstos dividen los datos en dos o más
partes, tan iguales “como sea posible”. Entre ellos también encontramos los cuartiles,
deciles y percentiles, que pretenden dividir los datos en cuatro, diez, y cien partes. Hasta
hace poco, los fractiles se manejaban principalmente para distribuciones de conjuntos
numerosos de datos.
El cuartil se utiliza a fin de conocer los intervalos dentro de los cuales quedan representados
proporcionalmente los términos de una distribución, para esto, se divide la distribución de
frecuencias en 4 partes iguales, cada una contiene IGUAL NÚMERO DE OBSERVACIONES
(el 25% del total). Los puntos de separación de los valores de X se llaman CUARTILES.



El primer cuartil corresponde al 25% y se designa con Q1.
El segundo cuartil se designa con Q2 que representa el valor de 50% y coincide con la
mediana.
El tercer cuartil es Q3 representa el 75% de las observaciones.
Si en lugar de dividir en 4 partes iguales se hace con 10 partes, se tienen 9 puntos de
división, CORRESPONDIENDO A CADA PUNTO UN DECIL, de donde, el primer decil es el
valor por debajo del cual está el 10% de las observaciones, para el segundo decil el 20% y
así sucesivamente.
PRIMER EJEMPLO:
Consideremos las siguientes lecturas de temperaturas altas en doce ciudades Europeas en
un día de junio:
90, 75, 86, 77, 85, 72, 78, 79, 94, 82, 74, y 93 grados.
Ordenando estas cifras de acuerdo con su tamaño, tenemos:
72 74 75 77 78 79 82 85 86 90 93 94
observa que son 12 datos
Para el cálculo de los cuartiles dividimos los datos en CUATRO PARTES IGUALES. Para
ilustrar dicho procedimiento tenemos la siguiente figura:
n = 12
72
74
75
77
78
79
82
85
86
90
93
94
Se puede apreciar que las líneas punteadas dividen los datos en cuatro partes iguales. Si
determinamos que los puntos centrales entre 75 y 77, 79 y 82, y 86 y 90 sean los tres
cuartiles, tenemos:
Q1 
75  77
 76
2
Q2 
79  82
 80.5
2
Q3 
86  90
 88
2
Es evidente que Q2 = 80.5, también es la mediana y se puede verificar con facilidad que se
satisfacen las tres propiedades de los cuartiles. Todo lo anterior funcionó muy bien porque los
doce datos resultó ser múltiplo de 4. No obstante ¿Qué podemos hacer si fueran 11 datos?
Como los siguientes.
50
72 74 75 78 79 82 85 86 90 93 94
observa que son 11 datos
Una solución es n = 11, la posición de la mediana es
dato
2
11 + 1 = 12 = 6 o sea el sexto
2
La mediana o Q2 ahora es 82.
n = 11
72
74
75
78
79
82
85
86
90
93
94
El cuartil inferior (Q1) es la mediana de los cinco valores por debajo de la mediana,
esto es, 75.
Y el cuartil superior (Q3) es la mediana de los cinco valores por arriba de la mediana, o sea,
90.
51
AHORA TE TOCA REALIZAR LAS ACTIVIDADES DE APRENDIZAJE:
Realiza un esquema o dibujo de cada uno de los ejercicios, aun lado de la página
a) Calcula a mediana (Q2) y los cuartiles (Q1) y (Q3) de las siguientes calificaciones de nueve
alumnos en una prueba de matemáticas.
86, 82, 73, 94, 88, 66, 79, 90, y 74
b) Calcula los tres cuartiles de las siguientes lecturas de presión de nueve personas después
de haber efectuado ejercicios de esfuerzo;
104, 100, 98, 111, 191, 94, 103, 96, 108 y 99.
52
REGRESIÓN LINEAL
La regresión lineal es un modelo de regresión mediante el cual es posible inferir datos
acerca de una población. Se conoce como regresión lineal ya que usa parámetros lineales
(potencia 1).
Supuestos del error
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los
supuestos del error:
Los errores son independientes.
Los errores tienen media cero.
Los errores tienen varianza constante.
Los errores tienen una distribución normal.
Tipos de modelos de regresión lineal
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple. Sólo se maneja una variable independiente, por lo que sólo cuenta
con dos parámetros.
Regresión lineal múltiple. Maneja varias variables independientes. Cuenta con varios
parámetros.
Regresión lineal simple
Para calcular los parámetros se cuenta con las siguientes fórmulas:
Regresión lineal múltiple
Para calcular los parámetros debe tomarse en cuenta que se está refiriendo a matrices:
53
Ahora estudiemos las…
54
MEDIDAS DE DISPERSIÓN
A menudo escuchamos que en los países latinoamericanos existe mucha DIFERENCIA entre
los ingresos que perciben por ejemplo los políticos y los trabajadores de otra clase social de
la población. Esas diferencias tienen sus raíces en distintos fenómenos sociales, políticos y
económicos; sin embargo, un economista diría “el ingreso per cápita en los países
latinoamericanos está más DISPERSO que el ingreso per cápita de los países
desarrollados”.
El concepto de DISPERSIÓN resulta importante en casi todos los estudios, ya que puede
darse el caso de poblaciones con igual valor central (Media aritmética, Mediana o Moda),
pero una puede estar más DISPERSA que la otra, es decir, los promedios nos sirven para
describir los datos representados por
la tendencia central del conjunto. Por lo tanto, el
promedio no logra por si mismo describir completamente a una colección de datos; se
necesitan otros valores que nos indiquen el grado en que las observaciones estudiadas se
apartan o VARÍAN con respecto al valor central, es decir, el GRADO DE VARIACIÓN O
DISPERSIÓN.
ANALIZA CON DETENIMIENTO EL SIGUIENTE EJEMPLO…
Con los siguientes datos de dos poblaciones, analicemos primeramente sus medias
aritméticas:
Población A) : 1 (7) , 2 (11), 3 (13), 4 (9), 5 (5), 6( 3), 7( 2), 8(1) = 169 = 3.31
51
n = 51
15 -13 -11 -Frecuencia 9 -7 -5 -3 -1 --
Histograma de los datos de la población A
Media aritmética (promedio) = 3.31
1
2
3
4
5
6
7
8
55
Población B) : 1 ( 3 ), 2 ( 9 ), 3 ( 15 ), 4 ( 12 ), 5 ( 9 ) =
A
159 = 3.31 igual que la población
48
n = 48
15-13-11-Frecuencia
9-7-5-3-1--
Histograma de los datos de la población B
Media aritmética (promedio) = 3.31
1
2
3
4
5
No obstante que en las dos poblaciones se obtuvo una media aritmética igual de 3.31; al
observar los dos histogramas nos damos cuenta que no son iguales PERO...
¿EN CUÁL HISTOGRAMA ESTÁN MÁS DISPERSOS LOS DATOS?
En la población “A”____________ o en la población “B”_____________
Explica porque? ________________________________________________________
______________________________________________________________________
Por tal motivo las medidas de tendencia central, no dicen nada por sí mismas, por lo que se
deben calcular las MEDIDAS DE DISPERSIÓN o LAS VARIACIONES de los datos. Por su
cálculo las MEDIDAS DE DISPERSIÓN se dividen en absolutas y relativas, aún que existen
mas, estudiaremos las siguientes:
DISPERSIÓN ABSOLUTA:
Rango o recorrido
Rango intercuartilico o desviación cuartil
Desviación Media
Varianza
Desviación Estándar
DISPERSIÓN RELATIVA:
Coeficiente de variación
RANGO O RECORRIDO:
Como se ha indicado con anterioridad, el rango o recorrido es la diferencia entre el
valor mayor y el valor menor de un grupo de datos o sea:
RANGO = Dato mayor – Dato menor
El rango es una medida de dispersión que no se utiliza mucho, aunque su cálculo es muy
rápido. Si analizamos el rango de los histogramas anteriores tenemos que;
56
En la primera población A su rango es:
R=8–1=8
(su rango o recorrido es 8)
En la segunda población B se rango es:
R=5–1=5
(su rango o recorrido es 5 )
Por lo tanto y como 8 > 5, podemos señalar con seguridad que los datos de la primera
población A), está más dispersa o desviados que los datos de la segunda población B).
57
AHORA ESTUDIAREMOS OTRAS
MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS
DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE DE
VARIACIÓN, que son medidas de dispersión que tienen relación con la media
aritmética, y por sus propiedades algebraicas son las de más frecuente aplicación y de
mayor importancia.
PERO ANTES QUE NADA …
¿QUE ES EL DESVÍO O DESVIACIÓN ?
El desvío de cada observación (o dato) es la DIFERENCIA ENTRE LA OBSERVACIÓN (o el
dato) Y LA MEDIA ARITMÉTICA. El desvío es un concepto fundamental que nos permitirá
comprender posteriormente otras medidas de dispersión. Por lo tanto.
x
Desvío ( d ) = x1 –
Pero hagamos un ejemplo…
Si el conjunto de datos son: 4, 2, 5, 8, 2, 1, 7, 8, 5, y 7 su media aritmética es = 4.9
¿Cuál es la dispersión de cada dato? ¿Cuál es el dato que está mas disperso? ¿Cuál es el
dato menos disperso?
Ordenamos los datos de menor a mayor 1, 2, 2, 4, 5, 5, 7, 7, 8, 8
y grafiquemos
x
1
2
4
4.9
7
8
9
Según la fórmula anterior, desvío es igual al dato menos la media aritmética por lo tanto
tenemos:
58
La desviación de cada dato será:
Calculo del desvío
Datos
d = X1 -x
1
1 – 4.9 =
2
2 – 4.9 =
2
2 – 4.9 =
4
4 – 4.9 =
5
5 – 4.9 =
5
5 – 4.9 =
7
7 – 4.9 =
7
7 – 4.9 =
8
8 – 4.9 =
9
8 – 4.9 =
49/10=
4.9
desvío =
- 3.9
-2.9
-2.9
-0.9
0.1
0.1
2.1
2.1
3.1
3.1
-10.6
+10.6= 0.0
Suman
– 10.6
Suman
+ 10.6
De acuerdo a los resultados de la tabla ¿Cuál es el dato que está más disperso?
Es el número 1, porque independientemente de su signo, su valor absoluto es el mas alto y es
de – 3.9 de desvío.
Ahora ¿Cuál es el dato menos disperso?. Es el número 5 porque está más cerca de la media
aritmética y tiene un desvío de 0.1.
Si observas la tabla anterior en muy importante obtener primero el valor de la media
aritmética que en nuestro caso fue de 49 / 10 = 4.9 para después restarle al valor de cada
dato, dicha media.
Por otro lado, al sumar los resultados NEGATIVOS de los desvíos nos arroja un valor de –
10.6 y al sumar los resultados POSITIVOS de los desvíos también nos da un valor de + 10.6
por lo tanto, se comprueba que la diferencia de los desvíos negativos y los positivos, nos da
cero o en su defecto tiende a ser cero.
Ahora resolvamos un problema para utilizar las medidas de dispersión
59
DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE
DE VARIACIÓN
CON D A T O S N O A G R U P A D O S
Número de
muestra
1
2
3
4
5
6
DATOS de la
resistencia del
concreto kg/cm2
358
369
363
358
336
341
Un constructor, para asegurarse de la calidad de su obra,
tomó seis muestras de concreto y obtuvo los resultados
del cuadro.
Al preguntarle uno de sus colaboradores ¿Cuál de todas
las muestras del grupo era la más dispersa?
el constructor elaboró la siguiente tabla:
Finalmente el constructor en base a la tabla y
a los cálculos realizados le indicó a su
colaborador:
LA MUESTRA NÚMERO 5 ES LA MÁS
DISPERSA, DEBIDO A QUE OBTUVO EL
MAYOR VALOR ABSOLUTO DE DESVÍO
CON -18.17.
En este caso particular, el mayor valor tuvo el
signo negativo lo que significa que la
observación es menor que el valor de la
media.
Número Resistencia
de
Kg/cm2
muestra
1
358
2
369
3
363
4
358
5
336
6
341
Suma
=2125
2125/6=
Media
=354.17
desvíos
d = x1 –
x
358 – 354.17 =
3.83
369 – 354.17 =
14.83
363 – 354.17 =
8.83
358 – 354.17 =
3.83
336 – 354.17 = 18.17
341 – 354.17 = 13.17
Diferencia = 0.02
Calculemos ahora la…
DESVIACIÓN MEDIA.:
La desviación media es la media aritmética de los valores absolutos (ignorando el signo) de
las desviaciones de cada elemento del conjunto de datos, es decir, hay que restar a la media
aritmética cada valor del conjunto de datos, ignorando el signo, y sumamos todas las
diferencias para dividirlo entre el número total de datos.
N
Su formula es dm 
x
i 1
1
N
x
Suma de los valores absolutos
Número de datos
60
Sigamos el mismo ejemplo y AUMENTEMOS UNA COLUMNA para los valores absolutos
al cuadro anterior:
Número
de
muestra
1
2
3
4
5
6
Datos de
resistencia
Desvío
x -x
358
369
363
358
336
341
2125

6
= 354.17
3.83
14.83
8.83
3.83
-18.17
-13.17
0.02
x
Valor absoluto
| x -x |
3.83
14.83
8.83
3.83
18.17
13.17
Suma = 62.66
Desviación media es igual a... La suma de los valores absolutos entre el número de muestras
Desviación Media ( dm ) = 62.66 = 10.44
6
Como se ve en el ejemplo anterior,
La Desviación Media MIDE LA DISPERSIÓN ALREDEDOR DEL PROMEDIO, mas que la
dispersión de ciertos valores, ya que el concepto de desviación media se origina cuando los
desvíos se toman en valor absolutos, eliminando así el efecto de que la suma de los desvíos
(x1 – x = 0 ) que es igual a cero (o tiende a cero).
Otra forma de hacerlo, es elevar al cuadrado los desvíos, por lo que surge la...
VARIANZA (S2) : Que es la media aritmética (promedio) de los cuadrados de los desvíos y
su fórmula es la siguiente:
N
S2 
(x
i 1
1
 x )2
Suma de desvíos al cuadrado
Número de datos
N
Sigamos el mismo ejemplo para calcular la varianza ( S2 ):
AUMENTAMOS OTRA COLUMNA a la tabla, ahora para los desvíos al cuadrado
Número
de
muestra
1
2
3
4
5
6
Datos de
resistencia
Desvío
x-
358
369
363
358
336
341
2125/6
x = 354.17
3.83
14.83
8.83
3.83
-18.17
-13.17
Se tiende a
0.02
x
Valor
Desvíos al
absoluto
cuadrado
| x -x |
(x - x ) 2
3.83
144.67
14.83
219.93
8.83
77.97
3.83
14.67
18.17
330.15
13.17
173.45
Suma= 62.66 Suma = 830.83
61
Calculamos la varianza según la fórmula anterior y tenemos:
Varianza (S2) =
Suma de desvíos al cuadrado = 830.83
Número de datos
= 138.47
6
DESVIACIÓN ESTÁNDAR o TÍPICA ( S ): Es la raíz cuadrada de la varianza (S2 )
También se puede definir como la raíz cuadrada de la media aritmética de los cuadrados de
los desvíos.
 ( x1  x)2
S
N
En el mismo ejemplo tendríamos lo siguiente:
Varianza (S2) fue igual a = 138.47 por lo tanto…
Desviación Estándar ( S ) =
138.47
= 11.77
Finalmente analicemos la medida de dispersión relativa llamada
COEFICIENTE DE VARIACIÓN ( C.V ): Es el resultado de la división de la desviación
estándar entre la media aritmética.
Este tipo de coeficiente es muy útil para medir la DISPERSIÓN RELATIVA en base a la
desviación estándar y la media y sirve básicamente para comparar muestras distintas en
términos numéricos adimensionales, es decir, que mientras las demás medidas de dispersión
tienen unidades, el coeficiente de variación carece de ellas.
Su formula es...
C. V. =
S ( Desviación Estándar) .
X ( Media Aritmética)
En el mismo ejemplo que estamos analizando, el coeficiente de variación será:
C. V =
11.77 . = 0.033
354.17
También se puede expresar en porcentaje al multiplicar por 100 esto es, (0.033) (100) =
3.30%
C.V. = 3.30 %
RANGO INTERCUARTIL
El rango intercuartil es el resultado de la diferencia entre el tercer cuartil Q 3 y el primero Q1,
se expresa:
Rango intercuartil Q = Q3 - Q1
62
Cuando habiéndose aplicado la media aritmética se quiere evitar la influencia de los valores
extremos, se analiza únicamente la situación intermedia de la distribución de frecuencias
aplicando el RANGO INTERCUARTIL.
El RANGO SEMIINTERCUARTIL o DESVIACIÓN CUARTIL, es la mitad del rango
intercuartil, se designa con QD
Rango semiintercuartil QD =
Q3 - Q1
2
Hagamos un ejemplo:
Calcular el rango intercuartil y la desviación cuartil de los siguientes datos.
72
n = 12
Q1 
74
75  77
 76
2
75
77
78
79
82
Q2 
79  82
 80.5
2
85
86
Q3 
90
93
94
86  90
 88
2
Rango intercuartil Q = Q3 – Q1
Q =88 – 76 = 12
Rango semiintrecuartil o Desviación cuartil QD = Q3 – Q1
2
QD =
12 = 6
2
El rango semiintercuartil (desviación cuartil) mide la dispersión con mayor precisión que el
rango, sin embargo, presenta las limitaciones siguientes:
a) No toma en consideración todos los valores de la distribución de frecuencias y
puede suceder que los valores menores a Q1 o superiores a Q3 estén muy
compactos o muy dispersos, y el valor de Q sería el mismo.
b) No es posible, conociendo únicamente Q, hacer la ubicación precisa de una
observación dentro de la distribución de frecuencias.
c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones
matemáticas que utiliza la estadística
Percentiles
Percentil, en estadística, parámetro que indica el porcentaje de individuos de una distribución
que tienen un valor inferior a él. Es una medida de posición.
Por ejemplo, el percentil 80, p80, es un número que supera al 80% de los datos de la
distribución. Los percentiles también se llaman centiles.
63
Ja, Ja, Ja, eso está
fácil y entendible
aceboman
Ja, Ja,Ja
UN RESUMEN DE LAS MEDIDAS DE DISPERSIÓN
ESTUDIADAS Y SU USO ADECUADO
RANGO ( R )= Es la diferencia del valor mayor menos el valor menor en un
conjunto de datos y se emplea de manera muy limitada, ya que es sólo una
apreciación de la amplitud de los datos, y presenta poca estabilidad; se usa, casi
siempre que se requiera rapidez.
RANGO INTERCUARTIL ( Q ): es el resultado de la diferencia entre el
tercer cuartil Q3 y el primero Q1. Su utilidad es baja y su valoración respecto a
la cantidad de datos que incluye en su aplicación en una distribución normal es
del 50 %
DESVIACIÓN MEDIA ( dm )= Es el promedio de los valores absolutos
(ignorando signos) de las desviaciones de cada dato; En ésta prueba se pueden
calcular los desvíos tanto con la media aritmética como la mediana, según
convenga. Actualmente ésta prueba casi no se usa. En una distribución normal,
la cantidad de datos que incluye en su aplicación es de aproximadamente el
58%.
VARIANZA ( S2 ) = Es el promedio de los cuadrados de los desvíos y se utiliza
en análisis estadístico avanzado, pero tiene el inconveniente de que sus unidades
son las mismas de la variable al cuadrado.
DESVIACIÓN ESTÁNDAR ( S ) = Es la raíz cuadrada de la varianza o del
promedio de los cuadrados de los desvíos. Es la más importante de todas las
medidas de dispersión ya que incluye más o menos el 68% de los términos de
una distribución normal, además por sus propiedades algebraicas se utiliza con
facilidad en el análisis estadístico
COEFICIENTE DE VARIACIÓN ( CV ) = Es el cociente entre la desviación
estándar y la media aritmética. Generalmente se utiliza para comparar muestras
distintas y saber cuál tiene mayor o menor dispersión en sus datos.
64
SIGAMOS PRACTICANDO PARA OBTENER LAS MEDIDAS DE DISPERSIÓN
PARA DATOS NO AGRUPADOS
Los siguientes datos son las edades de dos grupos de estudiantes del SAETA-XALISCO, de
la generación Agosto -2001. A cada uno de los grupos le obtendrás las medidas de dispersión
siguientes:
DESVIOS de cada edad, DESVIACIÓN MEDIA, VARIANZA,
DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN
GRUPO “D”
20 ESTUDIANTES
16
19
22
27
16
19
22
29
18
20
22
29
19
21
22
30
¡¡¡ Claro que puedo!!!
15
17
18
19
21
19
21
23
32
Valor
Edad Desvíos absoluto
16
16
18
19
19
19
19
20
21
21
22
22
22
22
23
27
29
29
30
32
GRUPO “F”
25 ESTUDIANTES
Desvíos al
cuadrado
15
17
18
20
22
15
17
19
20
22
Valor
Edad Desvíos absoluto
15
15
15
16
16
17
17
17
18
18
18
18
19
19
19
19
20
20
21
21
21
22
22
29
30
16 16
18 18
19 19
21 21
29 30
Desvíos al
cuadrado
65
En la siguiente página…
REALIZA TUS CÁLCULOS DE ACUERDO A LAS FÓRMULAS CORRESPONDIENTES,
HASTA OBTENER SUS RESULTADOS PARA CADA GRUPO.
Cálculos para el grupo “D”
RESULTADOS DEL GRUPO “D”
DESVIACIÓN MEDIA (dm) = ____________________
2
Cálculos para el grupo “F”
RESULTADOS DEL GRUPO “F”
DESVIACIÓN MEDIA (dm) = ____________________
VARIANZA (S ) = ______________________________
VARIANZA (S2) = _____________________________
DESVIACIÓN ESTÁNDAR ( S ) = _________________
DESVIACIÓN ESTÁNDAR (S) = _________________
COEFICIENTE DE VARIACIÓN ( CV ) = ____________
COEFICIENTE DE VARIACIÓN (CV) = ___________
AHORA CONTESTA ¿CUÁL DE LOS DOS GRUPOS TIENE SUS DATOS MÁS
DISPERSOS?
Respuesta:
Porque?___________________________________________________
_______________
66
FINALMENTE OBTENGAMOS LAS MEDIADAS DE DISPERSIÓN
PARA
DATOS
AGRUPAD OS
OBTENER LA DESVIACIÓN MEDIA (dm), VARIANZA (S2),
DESVIACIÓN ESTANDAR (S) Y COEFICIENTE DE VARIACIÓN (C.V.)
Completa las siguientes filas de las columnas para que calcules la Desviación media (dm), la
Varianza (S2) la Desviación estándar o típica ( S ).
Intervalo
Marc Frecuen Frecuen
Valor
Frecuen Desvío Frec. por
clase
a de
cia
cia por
absoluto
cia por
s al
desvíos
clase
marca
del
desvíos
cuadra
al
(estaturas )
(alumno
(X)
de clase
desvío
do
cuadrad
s)
f X1  X
o
2
(f)(X)
X1  X
X1  X
(f)
f
XX 2
121.5 –
126.5
124
126.5—
13.1.5
2
248
20.62
3
131.5—136.5
134
136.5—141.5
46.86
8
112.78
23
141.5—146.5
144
27
146.5—151.5
20
151.5—156.5
16
156.5—161.5
159
161.5—166.5
3
0.62
383.60
477
14.38
206.78
2
Totales
n = 104
15041
638.64
6383.92
Media aritmética = 15041/ 104 = 144.625 = 144.62
Aquí o aun lado de la página, realiza tus cálculos con orden y limpieza; y utilizando las
formulas correspondientes hasta que obtengas la Desviación media, Varianza y Desviación
estándar.
N
Formula para obtener la desviación media dm
= 
f
i 1
N
N
Formula para obtener la varianza =
N
S
 f (x
i 1
1
S2 
 f (x
i 1
x1  x
1
 x)2
N
 X )2
N
67
Formula para obtener la desviación estandar (S) =
Formula para obtener el coeficiente de variación en porcentaje
C.V . 
S
(100)
X
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Desviación estándar = ______________
Coeficiente
de
variación
=
ACTIVIDADES DE APRENDIZAJE:
_______________
Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y
coeficiente de variación) de los siguientes dos ejercicios.
De la página 16…
Intervalos de
Marca
Frecuencia
Clase
de Clase
Absoluta
(x)
(f )
59.5 - 63.5
61.5
6
63.5 - 67.5
65.5
6
67.5 - 71.5
69.5
8
71.5 - 75.5
73.5
11
75.5 - 79.5
77.5
8
79.5 - 83.5
81.5
9
83.5 - 87.5
85.5
2
TOTAL =
50
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Desviación
______________
Coeficiente
de
_______________
estándar
variación
=
=
68
De la pagina …18
Intervalos de
Clase
148.5
152.5
152.5
156.5
156.5
160.5
160.5
164.5
164.5
168.5
168.5
172.5
172.5
176.5
Marca
de
Clase
(x)
150.5
Frecuencia
Absoluta (f)
154.5
7
158.5
13
162.5
12
166.5
13
170.5
5
174.5
2
TOTAL =
55
3
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Desviación
______________
Coeficiente
de
_______________
estándar
variación
=
=
69
PROBABILIDAD
I N T R O D U C C I Ó N:
El problema central de la estadística es el manejo del azar y la incertidumbre. Los eventos
aleatorios siempre se han considerado como misteriosos. El libro de Job ponderó hace mucho
tiempo la función del intento divino en los acontecimientos al azar y fue, varios siglos más
tarde, que se usó el poder de las matemáticas para explicar la aleatoriedad. Los orígenes de
las matemáticas de la probabilidad se remontan al siglo XV, las primeras aplicaciones se
relacionan básicamente a los juegos de azar. Los jugadores ganadores utilizaron el
conocimiento probabilístico para desarrollar estrategias de apuestas en loterías, casinos,
carreras de caballos etc. Los avances científicos de los siglos que siguieron al Renacimiento,
enfatizando la observación y la experimentación cuidadosa, dieron lugar a la teoría de la
probabilidad para estudiar las leyes de la naturaleza y los problemas de la vida cotidiana.
CONCEPTOS BÁSICOS
Con el objeto de familiarizarse con el concepto de la probabilidad comenzaremos por dar una
definición de probabilidad que sólo es válida cuando todos los resultados son igualmente
probables.
Si hay n posibilidades igualmente probables y una de ellas debe ocurrir, entonces la
probabilidad de que ocurra algún evento o suceso de k de estas n posibilidades es k / n. Las
palabras SUCESO O EVENTO aquí los utilizaremos como sinónimos. Si un experimento se
repite muchas veces, digamos n y si el suceso o evento E1 se observa k veces, entonces la
probabilidad S del suceso E1 es el cociente de la razón k / n.
Probabilidad S = núm de veces que el suceso E1 ocurrió
Total de sucesos realizados
= k .
n
La experiencia justifica esta igualdad, pues a medida que n se hace mayor, la frecuencia
relativa se aproxima más a la probabilidad matemática. Este concepto se utiliza para definir la
razón citada como probabilidad empírica, algunos autores la citan como FORMULA
BÁSICA de la probabilidad.
Otro concepto importante es que la probabilidad de que suceda un evento es un número real
entre cero y uno. Entre más pequeño sea este número, el evento es menos probable, y entre
más cercano a uno sea este número, el evento es más probable. Cuando la probabilidad es
igual a ½ el evento tiene la misma probabilidad de ocurrir que de no ocurrir.
Coloquialmente también hablamos de probabilidades empleando porcentajes.
Así la posibilidad de que al tirar el dado el resultado sea 2 o 5 es de 2/6 = 1/3 que sería igual
al 33.33 % ya que se dividió 1/3 por 100.
70
¿Cuál es la probabilidad de obtener un número impar al lanzar un dado?.
S = ( 1, 2, 3, 4, 5, 6 )
E = ( 1, 3, 5, )
p(E)= 3 = 1
6
2
La probabilidad es de ½ o 0.5 en porcentaje será el 50%
¿Cuál es la probabilidad de extraer una ficha de dominó con 7 puntos de una caja, sin ver?.
S = (6,6), (6,5), (6,4), (6,3), (6,2), (6,1), (6,0), (5,5), (5,4), (5,3), (5,2), (5,1), (5,0), (4,4),
(4,3), (4,2), (4,1), (4,0), (3,3), (3,2), (3,1), (3,0), (2,2), (2,1), (2,0), (1,1), (1,0), (0,0)
E = { (6,1), (5,2), (4,3) }
p ( E ) = 3 = 0.1071 en porcentaje será el 10.71%
28
71
MODELOS MATEMÁTICOS
En la teoría de probabilidad matemática se define la probabilidad con los tres axiomas de
Kolmogorov.
Axiomas de Kolmogorov
Primer axioma La probabilidad de un suceso A es un número real entre 0 y 1.
.
Segundo axioma
Ocurre un suceso de la muestra de todos los sucesos o espacio de
sucesos
con probabilidad 1.
.
la probabilidad del espacio muestral es igual a 1:
p(S)=1
Tercer axioma
Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos,
disjuntos o de intersección vacía dos a dos), entonces:
.
72
PERMUTACIONES Y COMBINACIONES
Para pronosticar el triunfador de una elección municipal necesitamos al menos conocer
quiénes son los candidatos de los distintos partidos políticos, así como para pronosticar si la
selección mexicana de fútbol ganará un partido, es necesario saber si en caso de empate el
partido se decidirá en tiempos extras o por medio de penales. En general, NO ES POSIBLE
HACER PREDICCIONES RAZONABLES A MENOS DE QUE CONOZCAMOS LO QUE ES
POSIBLE, es decir, es necesario conocer LO QUE ES POSIBLE antes de juzgar LO QUE ES
PROBABLE. Por lo tanto estudiaremos someramente cómo determinar en algunos casos lo
que es posible.
En el estudio de “lo que es posible” hay esencialmente dos tipos de problemas. Existe el
problema de hacer una lista de todo lo que puede suceder en una situación determinada y se
tiene el problema de determinar cuántas cosas diferentes pueden suceder. El segundo tipo de
problema es de especial importancia porque hay muchas situaciones en que no necesitamos
una lista completa y por tanto, podemos ahorrarnos una gran cantidad de trabajo.
Presión sanguínea
DIAGRAMA DE ÁRBOL
Tipo sanguíneo
BAJA
NORMAL
ALTA
Aunque el primer tipo de problema
A
puede parecer directo y sencillo, existen
BAJA
problemas que ilustran que esto no
B
siempre es el caso; hagamos unos
NORMAL
ejercicios para reflexionar.
AB
ALTA
En un estudio médico se clasifica a los
BAJA
pacientes de acuerdo con el tipo de
sangre que tengan, ya sea, tipo A; B, AB
O
NORMAL
u O y también de acuerdo con su tipo de
ALTA
presión sanguínea, ya sea baja, normal
BAJA
o alta.
¿De cuántas maneras distintas se puede
NORMAL
clasificar a un paciente?
ALTA
Este tipo de problemas se puede
manejar sistemáticamente trazando un
DIAGRAMA DE ÁRBOL como el siguiente, donde se puede apreciar que la respuesta es 12.
Comenzando por la parte superior, el primer camino a lo largo de las “ramas” corresponde a
un paciente con tipo de sangre A y presión sanguínea baja, el segundo camino a un paciente
con tipo de sangre A y presión sanguínea normal … y el duodécimo camino corresponde a un
paciente que tiene sangre tipo O y una presión sanguínea alta.
La respuesta que obtuvimos es de 4 por 3 = 12, específicamente es el producto del número
de tipos de sangre por el número de niveles de presión sanguínea.
Otro ejemplo: ¿Cuántas palabras de tres letras se pueden formar si se dispone de un
alfabeto con dos letras; a y b.? (Nota: Son permisibles palabras como bba)
Solución: Si tenemos 2 letras (a, b) y formamos la palabra con tres letras tendremos 23 = 2 x 2
x 2 = 8 esto quiere decir que formaremos ocho palabras con tres letras.
73
Para comprender mejor hagamos otro “DIAGRAMA DE ÁRBOL”
Letra
Inical
Letra
central
letra
final
palabra
formada
a ………………….. a a a
a
b …………………… a a b
a
a ……………………
aba
b
b ………………….. a b b
a ………………….. b a a
a
b …………………. b a b
b
a …………………. b b a
b
b …………………. b b b
Te toca a ti resolver el siguiente ejercicio utilizando un principio de conteo.
¿Cuántas placas distintas hay con dos letras a la izquierda y tres números a la derecha?
Considerando que el alfabeto es de 27 letras castellanas y por supuesto 10 números
Realiza aquí tus operaciones. ANIMO TU PUEDES
PLACA DE NAYARIT
_____ _____
_____
Letras
s
_____
_____
n ú m e r o
SI OBTUVISTE BIEN EL RESULTADO, HAS DESCUBIERTO UN PRINCIPIO DEL CONTEO
QUE ES EL…
PROCESO DE CONTAR
Si un primer suceso o evento puede efectuarse de p1 maneras diferentes, y si después de
que este suceso ha sido efectuado, un segundo suceso puede efectuarse de p2 maneras
diferentes, entonces los dos sucesos pueden verificarse siguiendo el orden indicado de p1. p2
maneras diferentes.
Analiza con cuidado: De cuantas maneras diferentes se pueden seleccionar parejas de
diferentes sexo de un grupo de 4 hombres y 6 mujeres?
Solución: Como cada hombre puede ser seleccionado de cuatro maneras
diferentes y cada mujer puede ser seleccionada de 6 maneras diferentes;
entonces, cada pareja puede ser escogida de: 4 ( 6 ) = 24 maneras
diferentes.
74
Si el suceso o evento incluye más de dos sucesos diferentes podemos ampliar el principio
multiplicativo, de manera que si después de haber ocurrido los dos primeros sucesos, puede
ocurrir un tercero de p3 maneras diferentes, un cuarto de p4 maneras diferentes, y por último
un n-ésimo de pn maneras diferentes, entonces los sucesos pueden ocurrir en el orden
siguiente: p1 p2 p3 p4 …, pn maneras diferente.
Reflexiona y piensa: Una cafetería ofrece una comida especial que consiste en un
emparedado (usando una de ocho carnes distintas y uno de cuatro tipos diferentes de pan),
una de cuatro clases distintas de sopa y una de tres bebidas diferentes.
¿De cuántas maneras distintas una persona puede seleccionar una de estas comidas
especiales?
Solución: Dado que p1 = 8, p2 = 4, p3 = 4, p4 = 3, hay (8)(4)(4)(3) = 384
maneras diferentes en que se puede seleccionar una comida especial.
Sigue pensando y analizando: Un examen de estadística, consta de quince preguntas de
opción múltiple, de las cuales cada una tiene cuatro posibles respuestas.
¿De cuántas maneras distintas un estudiante puede marcar una respuesta para cada
pregunta?
Solución: puesto que p1=p2=p3=…= p15 = 4, en total hay
4.4.4.4.4.4.4.4.4.4.4.4.4.4.4 = 1,073,741,824 diferentes maneras en que
un estudiante puede marcar una respuesta para cada pregunta. Nótese
que sólo en una de las 1,073,741,824 posibilidades todas las
respuestas son correctas. Y si queremos saber todas las respuestas
incorrectas? será: 3.3.3.3.3.3.3.3.3.3.3.3.3.3 = 14,348,907 todas las
respuestas incorrectas.
En una calculadora científica este tipo de problema se resuelve de la siguiente forma: p 15 (o
quince preguntas) tiene 4 posibles respuestas = cuatro respuestas por las 15 preguntas
tenemos = 415 ponemos 4 y tecleamos X y , ponemos 15 y la tecla = y nos arroja el
resultado 1,073,741,824
El principio multiplicativo nos permite en muchos casos calcular el número de posibilidades
sin necesidad de listar todas ellas o de desarrollar un diagrama de árbol excesivamente
grande.
ES IMPORTANTE TENER EN CUENTA QUE PARA APLICAR ESTA REGLA, NO DEBE
HABER RESTRICCIONES EN LAS COMBINACIONES POSIBLES.
FACTORIAL ¿QUE ES EL FACTORIAL DE UN NÚMERO?
Uno de los principales conocimientos que nos servirán como base para el cálculo de las
técnicas de conteo (permutaciones y combinaciones), es el factorial de un número. Su
definición y algunos ejemplos se comentan enseguida.
75
El producto de cualquier número entero positivo n por todos los enteros menores que n se
llama FACTORIAL de n y se expresa con el símbolo n!, por lo tanto:
0! = 1 por definición
1! = 1 (1) = 1
2! = 2 (1) = 2
3! = 3 (2) (1) = 6
4! = 4 (3)(2)(1) = 24
5! = 5 (4)(3)(2)(1) = 120
.
.
.
n! = (n) (n-1) (n-2) ,…(1)
El factorial de los primeros números enteros positivos se pueden obtener directamente
utilizando una calculadora, para números mayores se obtienen con la formula aproximada de
Stirling o consultando tablas elaboradas con resultados.
En tu calculadora científica pon 6 y oprime la tecla n! y te arrojará 720, que es el factorial de
6.
Cuanto es el factorial de 7! = _______________________
8! = ______________________
9! =_______________________
10! = _______________________________
76
ACTIVIDADES DE APRENDIZAJE: Resuelve los siguientes problemas de probabilidades de
frecuencia relativa en fracciones ( 0 a 1) y en porcentajes (%). REALIZA AQUÍ TUS
CÁLCULOS.
1) ¿Cuál es la probabilidad de obtener un as de una baraja de póker (de 52 cartas)?
2) De cada 1000 personas a quienes se les practican exámenes médicos 35 tienen
problemas de la vista. ¿Cuál es la probabilidad de que una persona examinada padezca
algún malestar con su vista?
3) En una caja hay 75 canicas azules y 225 rojas. ¿Cuál es la probabilidad de sacar al azar
una canica azul? Además calcula ¿cual es la probabilidad de sacar una roja?
4) En una caja hay 25 tornillos en buen estado y 80 defectuosos. ¿Cuál es la probabilidad de
sacar de la caja al azar?
a) Un tornillo en buen estado
b) Un tornillo defectuoso?
77
MAS ACTIVIDADES DE APRENDIZAJE: UTILIZA LA HOJA DE AUN LADO O DE ATRAZ,
PARA RESOLVER LOS SIGUIENTES PROBLEMAS DE CONTEO (Diagrama de árbol y
principio multiplicativo,)
1) ¿De cuántas maneras diferentes se puede arreglar uno de los viajes especiales de fin de
semana a 12 ciudades distintas, por avión, tren o autobús, que ofrece una agencia de viajes?:
ELABORA UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN
LADO.
2) En un restaurante ofrecen 4 tipos de comidas (a,b,c,d); 3 tipos de sopas (1,2,3); y 3 tipos
de postres( x,y,z), ¿Cuáles son el número total de posibles formas de arreglos? ELABORA
UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN LADO.
3) Un examen de 10 preguntas consiste en 6 preguntas de elección múltiple, cada una con 4
posibles respuestas, y la otra parte del examen con 4 preguntas de falso y verdadero.
a) ¿De cuántas maneras (diferentes) se puede contestar el examen?
b) ¿En cuantas maneras es posible responder el examen y obtener todas las respuestas mal?
4) Una persona piensa comprar cierto automóvil. El fabricante ofrece cualquier combinación
de las siguientes alternativas: SEIS colores diferentes; DOS tipos de motor; TRES tipos de
rines; Transmisión manual o automática; sin radio, con radio AM-FM, con radio AM-FMTocacintas o con radio AM-FM-CD; y sin aire acondicionado o con aire acondicionado. Cada
comprador debe hacer UNA elección con respecto al color, motor, rines, transmisión, radio y
aire acondicionado.
5) De una ciudad A a otra B hay 4 caminos; a su vez de, la ciudad B a la C hay 6 caminos, si
todos los caminos son diferentes, de cuantas formas es posible:
a) Viajar de A hasta C pasando por B
b) Hacer el viaje “redondo” saliendo de A hasta C pasando por B y de C hasta A pasando por
B
c) Hacer el viaje “redondo” desde A hasta C pasando por B pero sin utilizar el mismo camino
más de una vez.
Ciudad
A
Ciudad
B
Ciudad
C
78
P E R M U T A C I O N E S.
Si estamos eligiendo de un conjunto de objetos, algunos de ellos en un orden o jerarquía
determinada estamos haciendo una permutación, esto es, si al seleccionar o acomodar (r)
objetos de un conjunto de (n) objetos distintos, cualquier arreglo (u orden) de estos objetos se
conoce como, una permutación.
En cada arreglo pueden participar parte o la totalidad de los elementos del conjunto.
Permutaciones tomando sólo “parte de los elementos” del conjunto a la vez
En esta técnica de conteo en la que EL ORDEN SI IMPORTA en que aparecen cada
elemento del conjunto y en donde en cada arreglo participan una parte de los elementos del
conjunto. También le llamaremos permutaciones de n elementos diferentes en grupos de r
elementos. Es decir, en cada arreglo aparecerá parte de los elementos del conjunto y se
n!
utilizará la siguiente fórmula:
n
pr 
(n  r )!
Iniciemos: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los
números 1,2,3 tomando DOS a la vez?
n=3
r=2
3 p2 
3!
3! 6
  6
(3  2)! 1! 1
n = 1
2
3
Serían: 12; 13; 21; 23; 31; 32.
Lo que hace que un arreglo sea diferente a otro es el orden en que aparecen los elementos
del conjunto en cada arreglo. Para una PERMUTACIÓN, el arreglo {1,2} es diferente al
arreglo {2,1}. Entonces, esta técnica de conteo es idónea para problemas en los que es
importante la jerarquía que tienen algunos elementos sobre otros. Algunos ejemplos de ello,
es cuando se requiere conocer el orden de llegada de personas, formas posibles de arranque
y llegada en una justa atlética, colocación de objetos, la jerarquía en algunos puestos
administrativos, la jerarquía en equipos médicos, el orden en que deben tomarse o medirse
algunos objetos en experimentos, etcétera.
Ahora: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números
1,2,3,4 tomando DOS a la vez?
n=4
r=2
4
p2 
4!
4! 24
 
 12
(4  2)! 2! 2
n = 1
2
3
4
Serían: 12; 13; 14; 21; 23; 24;
31; 32; 34; 41; 42; 43;
De nuevo te recordamos que es muy importante que te fijes que aquí si interesa el orden en
que se seleccionaron los dos números (la pareja) de entre los cuatro números (1,2,3,4) y
resulta que hay 12 permutaciones.
Un problema más complicado: ¿Cuántas diferentes quintas ( r ) de baloncesto pueden
formarse con 7 jugadores disponibles (n) para jugar cualquier posición?
7
p5 
7!
5040

 2520
(7  5)!
2
79
Se pueden formar 2520 quintas diferentes con 7 jugadores disponibles.
Observa como utilizando la ley de la multiplicación utilizando un ORDEN nos arroja el mismo
resultado: 7(6)(5)(4)(3)= o sea 7 opciones serían para la primer quinta, 6 la segunda quinta, 5
la tercer quinta, 4 la cuarta quinta y por último 3 la quinta, quinta. Si lo multiplicas nos dará
igual = 2520.
Otro para reafirmar el aprendizaje: el entrenador de la selección mexicana de fútbol debe
decidir cómo se deben tirar los cinco primeros penales obligatorios en caso de un empate.
¿Cuántas elecciones posibles puede considerar?
Partimos de que ya sabes que un equipo de fútbol tiene 11 jugadores.
¿ Hoooo? Eres mi
ídolo acaboman
11
p5 
11!
39916800 39916800


 55440
(11  5)!
6!
720
Otra vez, utilizando la ley de la multiplicación sería: 11(10)(9)(8)(7)== 55440
elecciones posibles para determinar cómo tirarán los cinco penales obligatorios.
Permutaciones tomando “todos los elementos” del conjunto
Otro tipo de permutaciones es cuando en cada arreglo participan TODOS LOS ELEMENTOS
DEL CONJUNTO(n), o sea cuando el número de permutaciones de n objetos se toman
TODOS los elementos n a la vez.
Iniciemos, Permutar los elementos de un conjunto de TRES tomando todos a la vez, es igual
a 3! = 6 los arreglos resultantes son los siguientes 123,- 132, - 213, - 231, - 312, - 321.
La fórmula que se utiliza para estos casos es
n Pn
 n!
Otro para comprender mejor: ¿De cuantas maneras distintas se pueden asignar a diez
profesores las diez secciones de un curso de economía? n = 10, obtenemos:
P  10!  3,628,800
10 10
Aquí si aplicamos la ley de la multiplicación sería: 10 (9)(8)(7)(6)(5)(4)(3)(2)(1) = 3,628,800
Fíjate que aquí si se multiplican toda la serie de los números.
Un último para confirmar: Obtener cuántos números pueden formarse con los dígitos 1,2,3,4,5
sin repetir ningún dígito, n = 5
P  5! 120
5
5
Si aplicamos la ley de la multiplicación sería 5(4)(3)(2)(1) = 120.
ESTO SI ESTÁ MUY INTERESANTE ¿VERDAD?
80
Pero… ¿Cómo se elabora un espacio muestral para permutaciones tomando todos los
elementos?
Ejemplo para pensar, sea S= { a,b,c,d, } un conjunto con cuatro elementos genéricos, calcular
las posibles formas en que se pueden permutar tomando todos los objetos a lan P
vez.
n  n!
Para ello la forma de cálculo está referida simplemente a sustituir el número de elementos en
n!.
Como ya se explicó, el factorial de un número es el producto de todos los enteros desde n
hasta 1. Entonces, para éste ejemplo el número de elementos es 4, así, 4! = (4)(3)(2)(1) = 24
que será el número de formas posibles, pero queremos saber todos los posibles arreglos o
los espacios maestrales para dicho problema.
Como primer paso se elabora una tabla que contenga todos los posibles arreglos para lo
cual utilizamos la regla del cociente.
Regla del cociente =
Número total de arreglos
Número de elementos
. = 24 = 6 arreglos
4
El número 6 nos indica que cada elemento del conjunto deberá repetirse seis veces en la
primera columna.
COMPLETA EL EJERCICIO PARA LAS PRIMERAS COLUMNAS (1)
N.A
Arreglo
N.A
Arreglo
N.A
Arreglo
N.A
Arreglo
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
1 a b c d 7
b
13
19
2 a b d c 8
b
14
20
3 a c b d 9
b
15
21
4 a c
10 b
16
22
5 a
11 b
17
23
6 a
12 b
18
24 d c b a
Como te darás cuenta se han creado cuatro subgrupos de seis elementos.
El segundo paso consiste en hacer la misma operación que el paso anterior, solamente que
esta vez, el total de arreglos serán 6 y el número de elementos serán tres, (6/3 = 2) ya que
uno de los cuatro elementos ya han sido permutados en la primera columna.
En el subgrupo de arreglos que comienzan con “a” ese elemento quedará fuera en esta
operación, o sea que los elementos a permutar serán el resto del conjunto; b,c,d.
Similarmente, en el subgrupo de arreglos que comienzan con “b” ese elemento quedará fuera
de esta operación, o sea que los elementos a permutar serán el resto del conjunto: a,c,d; y
así sucesivamente. A continuación podrás observar dicho procedimiento. COMPLETA EL
EJERCICIO EN LA SEGUNDA COLUMNA
El tercer paso es una característica de esta forma de permutación. Lo que procede es
permutar los dos últimos elementos del conjunto. Por ejemplo, en los arreglos 1 y 2 está el
arreglo parcial { a,b }. Si S = { a,b,c,d }, entonces los elementos que no están presentes en
esos arreglos son los elementos c y d, para el primer arreglo y d y c para el segundo arreglo.
COMPLETA EL EJERCICIO PARA LA TERCERA Y CUARTA COLUMNAS hasta llenar todos
los arreglos según corresponda.
81
Finalmente algunas características de las permutaciones tomando “todos los
elementos”.
a) En cada arreglo están presentes todos los elementos del conjunto: { a,b,c,d }.
b) Todos los arreglos son mutuamente excluyentes. Es decir, cada uno de ellos es
diferente al resto, por lo tanto no existen dos arreglos iguales.
c) Se forman bloques de arreglos que inician con el mismo elemento. Para este caso,
existen cuatro bloques de seis arreglos que inician con el mismo elemento. Este tipo de
agrupamiento es el mayor para 4!
d) El menor agrupamiento en bloques es por pares. De hecho, las dos últimas columnas
de cada par forman un modelo 2!
e) En el primer arreglo, todos los elementos están arreglados en un orden ascendente
f) En el último arreglo sucede lo contrario, están arreglados en forma descendente.
g) El arreglo de los elementos se realiza en estricto orden.
h) En referencia a los 24 arreglos, aparecen todos los elementos en la primera columna.
i) En referencia a cualquier bloque de seis, en la segunda columna aparecen n -1(4-1=3)
elementos del conjunto.
j) En referencia al bloque más pequeño, cualquier par de arreglos, en la tercera aparecen
n - 2 (4-2= 2) elementos del conjunto.
k) En referencia a cualquier arreglo, en la k-ésima columna aparece el elemento faltante
del conjunto.
l) Ninguno de los 24 arreglos presenta un elemento repetido.
AHORA… ¿Cómo se elabora un espacio muestral para permutaciones “tomando sólo
parte de los elementos” del conjunto a la vez?
Un problema para reflexionar: Supongamos que en el primer nivel de las eliminatorias
realizadas para participar en la final de los 400 metros femenil de Grecia 2004, participaron 5
atletas por evento. Entonces, sea S = {1,2,3,4,5} el conjunto de elementos que representa
esas cinco atletas. Supongamos, además que Ana Gabriela Guevara está representada por
el número 1.
a) Calcula el número de formas posibles en que esas cinco atletas pueden llegar a la
meta en el primero, segundo y tercer lugar.
b) Elabora el espacio muestral.
c) ¿De cuantas formas puede llegar Ana Gabriela en primero, segundo y tercer lugar?.
Si tenemos un conjunto de 5 elementos, de los cuales sólo nos interesa permutar 3 de ellos
(primero, segundo y tercer lugar) en cada arreglo. Así, n = 5 y r = 3 entonces…
5
p3 
5!
(5)(4)(3)(2)(1) 120


 60
(5  3)!
(2)(1)
2
Para dar respuesta a la pregunta a) podemos concluir que si participan 5 atletas y sólo
deseamos conocer las posibles formas en las cuales llegan los tres primeros lugares,
entonces tenemos 60 posibles formas.
La pregunta b) se resuelve de la siguiente manera:
Primer paso se elabora la tabla en la que colocaremos los arreglos, para lo cual realizamos
el cálculo del número de veces que aparecerá cada elemento en la primera columna,
utilizando de nuevo la regla del cociente.
Regla del cociente =
Número total de arreglos
Número de elementos
. = 60 = 12 arreglos
5
82
El número 12 nos indica que esas serán las veces que podría aparecer cada atleta en primer
lugar. COMPLETA LOS PRIMEROS LUGARES DE LLEGADAS DE LA TABLA
N.
Llegada
N.
Llegada
N.
Llegada
N.
Llegada
N.
Llegada
A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3°
1 1 2 3 13 2
25
37
49
2 1 2 4 14 2
26
38
50
3 1 2 5 15 2
27
39
51
4 1 3 2 16 2
28
40
52
5 1 3 4 17 2
29
41
53
6 1 3 5 18 2
30
42
54
7 1 4
19 2
31
43
55
8 1 4
20 2
32
44
56
9 1 4
21 2
33
45
57
10 1
22 2
34
46
58
11 1
23 2
35
47
59
12 1
24 2
36
48
60 5 4 3
El segundo paso consiste en calcular los segundos lugares para las otras cuatro corredoras.
Regla del cociente =
Número total de arreglos . = 12 = 3 arreglos
Número de elementos
4
Habrá que poner tres veces el 2, tres veces el 3 etc. a excepción del que ya está en 1er lugar.
COMPLETA LOS SEGUNDOS LUGARES DE LLEGADAS DE LA TABLA
El tercer paso puede tener dos lecturas; la primera determinar mediante la regla del cociente
el número de veces que aparecerá cada elemento en la tercer columna ( 3 / 3 = 1); La
segunda, colocar el resto de los elementos para el menor subgrupo. Recomendaremos la
segunda opción, por tanto, en este caso el subgrupo más pequeño es de tres elementos
idénticos. Por ejemplo, los arreglos uno, dos y tres tienen los elementos 1 y 2 hasta la
segunda columna. Al contrario de la anterior técnica de permutaciones (tomando todos los
elementos), en esta ocasión colocaremos el resto de los elementos en una forma vertical
hacia abajo. Esta acción nos servirá para distinguir esa tercia de arreglos idénticos.
COMPLETA LOS TERCEROS LUGARES DE LLEGADAS DE LA TABLA
¿AHORA SI PUEDES CONTESTAR A LA PREGUNTA c)?
¿De cuantas formas puede llegar Ana Gabriela Guevara en primero, segundo y tercer lugar?.
En primer lugar_________________ formas
En segundo lugar _______________ formas
En tercer lugar _________________formas
MUCHAS FELICIDADES GANASTE LA CARRERA
83
ACTIVIDADES DE APRENDIZAJE:
CALCULA LAS POSIBLES FORMAS DE PERMUTACION Y ELABORA LOS ESPACIOS
MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA.
1) Sea S = { a,b,c,}, o sea un conjunto con tres elementos genéricos, calcular las posibles
formas en que se pueden permutar tomando todos los objetos a la vez y elaborar el espacio
muestral correspondiente.
2) Sea W = { A,B,C,D} un conjunto con cuatro elementos, calcular las posibles formas en que
se pueden permutar tomando tres a la vez y elaborar el espacio muestral correspondiente.
3) Sea X = { a,b,c,d,e,f} un conjunto con seis elementos, calcular las posibles formas en que
se pueden permutar tomando dos a la vez y elaborar el espacio muestral correspondiente.
84
C O M B I N A C I O N E S:
Una combinación es un subconjunto o un arreglo de todos o parte de los objetos de un
conjunto sin considerar el orden de los objetos, donde el número total de combinaciones
posibles de un conjunto de objetos tomados todos a la vez es 1.
Por ejemplo, los arreglos posibles del conjunto de letras {a,b} son ab y ba. Puesto que el
orden del arreglo NO es considerado, el arreglo ab es el mismo que ba. Por tanto, hay
solamente una combinación posible para el conjunto.
Combinaciones “tomando parte del conjunto” de elementos
Esta técnica de conteo consiste en obtener en cualquier orden grupos de r elementos de un
total disponible de n elementos diferentes y en cada arreglo participan una parte de los
elementos del conjunto. Se utilizará la siguiente fórmula:
n Cr 
n!
r!(n  r )!
HAGAMOS LOS MISMOS EJEMPLOS QUE HICIMOS EN PERMUTACIONES
ÚNICAMENTE QUE AHORA CON COMBINACIONES PARA QUE ANALICES SUS
DIFERENCIAS.
Para iniciar: Cuantas diferentes combinaciones o grupos se pueden realizar con los números
1,2,3 tomando DOS a la vez?
n=3
r=2
3
C2 
3!
3! 6

 3
2!(3  2)! 2!1! 2
n = 1
2
3
Serían: 12; 13; 23
21; 31; 32; Estos se eliminan, porque no nos interesa el orden en que se seleccionan
los dos números ( r ) de entre los tres números ( n ). Aquí es mas chico el resultado que
en la permutación, porque el orden no tiene importancia.
Para que lo compares: Cuantas diferentes combinaciones o agrupaciones se pueden realizar
con los números 1,2,3,4 tomando DOS a la vez?
n=4
r=2
4
C2 
4!
4!
24


6
2!(4  2)! 2!2! 4
n = 1
2
3
4
Serían: 12; 13; 14; 23; 24; 34;
21; 31; 32; 41; 42; 43; Estos se eliminan por la misma razón anterior.
Es muy importante que te fijes que aquí NO interesa el orden en que seleccionan los dos
números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 6 combinaciones.
HAGAMOS ALGUNOS EJEMPLOS PARA QUE ESTES LISTO PARA TUS…
ACTIVIDADES DE APRENDIZAJE.
85
PRIMER PROBLEMA: Con una parte de su primer salario, un alumno de quinto semestre
decide comprar TRES de los SIETE discos compactos que ha sacado a la venta el grupo
MANA. ¿Cuántas posibilidades tiene? Ya que hay que elegir 3 discos (sin importar el orden)
de un conjunto de siete.
n=7
r=3
7
C3 
7!
7!
5040
5040



 35
3!(7  3)! 3!4! (6)(24) 144
Tiene 35 combinaciones al comprar tres discos de los siete.
OTRO PARA PENSAR; ¿De cuantas maneras una persona puede seleccionar TRES libros
de una lista de OCHO best-sellers? Aquí tampoco es importante el orden en que se
seleccionen los tres libros.
n=8
8!
8!
40320
40320
r=3



 56
8 C3 
3!(8  3)! 3!5! (6)(120)
720
Tiene 56 maneras para seleccionar los tres libros.
PARA REFLEXIONAR Y CONFIRMAR: Un alumno del CBTa No. 107 Ext. Xalisco del turno
vespertino, tiene 7 libros de física y 5 de matemáticas. Calcular de cuántas maneras se
pueden ordenar 3 libros de física y 2 de matemáticas en un librero.
Primeramente hacemos las combinaciones posibles de libros de física.
n=7
7!
7!
5040
5040



 35
7 C3 
r=3
combinaciones de libros de física
3!(7  3)! 3!4! (6)(24) 144
Ahora hacemos las combinaciones posibles de libros de matemáticas
5!
5!
120
120



 10
5 C2 
n=5
combinaciones
de
libros
2!(5  2)! 2!3! (2)(6) 12
matemáticas
r=2
Multiplicamos 35 por 10 nos resulta 350 combinaciones posibles.
de
AHORA… ¿Cómo se elaboran espacios muestrales para combinaciones “tomando sólo
parte del conjunto” de elementos?
De una manera general, la propuesta para elaborar espacios muestrales para este tipo de
técnica de conteo está basada en un sistema numérico a la n, el cual denominamos “Método
de la cifra”. (Tomado de: Técnicas de muestreo y espacios maestrales sin maestro. Héctor
Francisco Reynoso Titrado)
Sea S = { 1,2,3,4,5 }, un conjunto con cinco elementos genéricos. Calcule…
a) El número de posibles arreglos tomando cuatro de ellos a la vez,
b) Elabore el espacio muestral de esos arreglos o combinaciones.
5
C4 
5!
5!
120
120



 5...combinacio nes
4!(5  4)! 4!1! (24)(1)
24
La respuesta a la primera pregunta es 5 posibles combinaciones.
86
En el caso de la segunda pregunta, empezaremos por preparar el espacio para arreglar esas
cinco combinaciones
Primer paso Colocamos los primeros cuatro elementos del conjunto en el primer arreglo.
N.A.
1
2
3
4
5
a
1
Combinaciones
b
c
2
3
d
4
En el segundo paso, colocaremos el segundo arreglo que representaría el tope de los
arreglos que inician con los elementos 1,2 y 3. También cubrimos el tercer arreglo con la
columna k-1 con el elemento n-1, o sea el elemento 4
N.A.
1
2
3
4
5
a
1
1
1
Combinaciones
b
c
2
3
2
3
2
4
d
4
5
5
Observa cómo nuestra atención está siendo demandada en las últimas columnas, arreglando,
de los elementos menores a los mayores, similar a un sistema numérico. Finalmente…
Tercer paso, será cambiar el elemento 2 de la columna k-2, por el siguiente elemento, el 3
(arreglo número cuatro). Lo demás ya es sabido, no habrá elementos mayores a la izquierda.
N.A.
1
2
3
4
5
a
1
1
1
1
2
Combinaciones
b
c
2
3
2
3
2
4
3
4
3
4
d
4
5
5
5
5
Este método permite ir agotando los elementos a usar de
derecha a izquierda. Observa que en el cuarto arreglo ya
están agotadas la k-ésima columna con el n-ésimo
elemento, la columna k-1 con el elemento n-1 y la
columna k-2 con el elemento n-2. Así, lo único que nos
resta es colocar el elemento 2 en la primera columna y
combinarlo con el resto de los elementos del conjunto
que están a la derecha (arreglo número cinco).
Algunas características de las combinaciones
a) Las combinaciones son arreglos de elementos en los que no nos interesa el orden de
los mismos.
b) El primer arreglo tiene combinados los primeros elementos del conjunto.
c) El último arreglo tiene combinados los últimos elementos del conjunto.
d) Los elementos del conjunto aparecen arreglados del menor al mayor de los elementos,
al menos en las escalas nominales y de razón. Justamente, en esta característica está
87
basado el método de la cifra que usamos para elaborar espacios maestrales para
combinaciones.
e) El número que aparece cada elemento del conjunto es el espacio muestral está
dado por la siguiente fórmula:
Repeticiones de cada elemento en el espacio muestral (RCE) =
(c) (r) .
n
donde: c = Número de combinaciones o arreglos posibles
r = Elementos tomados a la vez en cada arreglo
n = Número total de elementos en el conjunto.
Para comprobar ésta formula con el ejemplo anterior tenemos: RCE = ( 5 ) ( 4 ) = 20 = 4
5
5
N.A.
1
2
3
4
5
a
1
1
1
1
2
Combinaciones
b
c
2
3
2
3
2
4
3
4
3
4
d
4
5
5
5
5
Observamos que cada elemento (1,2,3,4,5) en el
espacio muestral se repite cuatro veces; esto es, hay
cuatro 1, cuatro 2, cuatro 3, cuatro 4 y cuatro 5.
En resumen:
Es muy importante que recuerdes que en una permutación SI importa el orden y se relaciona
a sucesiones ordenadas; parejas ordenadas, tríadas ordenadas, etc. En las combinaciones
NO importa el orden y se relacionan con la selección de un subconjunto de un conjunto dado.
JA, JA, está bien fácil;
ya le entendí aceboman
Yo También
ya agarré la onda
ENTONCES REALIZA TUS ACTIVIDADES DE APRENDIZAJE:
88
CALCULA LAS POSIBLES FORMAS DE COMBINACIÓN POSIBLES Y ELABORA LOS
ESPACIOS MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA, PARA
REALIZAR LOS EJERCICIOS
1) Sea X = { a,b,c,d,e }, un conjunto con cinco elementos genéricos. Calcule a) el número de
posibles arreglos tomando dos de ellos a la vez, b) elabore el espacio muestral de esos
arreglos
2) Sea W = { 1,2,3,4,5}, un conjunto con cuatro elementos genéricos. Calcule a) el número de
posibles arreglos tomando tres de ellos a la vez, b) elabore el espacio muestral de esos
arreglos
3) Sea Z = { a,b,c,d,e,f }, un conjunto con cinco elementos genéricos. Calcule a) el número de
posibles arreglos tomando tres de ellos a la vez, b) elabore el espacio muestral de esos
arreglos
89
MÁS ACTIVIDADES DE APRENDIZAJE:
En cada uno de los siguientes problemas, decide si se trata de una permutación o de una
combinación y obtén su resultado correcto.
UTILIZA LA HOJA DE AUN LADO Y/O LA DE ATRAZ PARA TUS OPERACIONES.
1) Calcular el número de palabras de 5 letras, que se pueden formar con 12 letras diferentes,
aunque no necesariamente tengan algún significado.
Permutación _____ o combinación________
Resolver:
2) Calcular el número de palabras, que pueden formarse seleccionando 6 consonantes y 2
vocales entre 10 consonantes y 4 vocales, no necesariamente con significado.
Permutación _____ o combinación________
Resolver:
3) Calcular de cuántas maneras diferentes pueden colocarse 7 libros en un librero
Permutación _____ o combinación________
Resolver:
4) Un parque de diversiones tiene 28 recorridos distintos. ¿De cuántas maneras diferentes
una persona puede tomar cuatro de estos recorridos, suponiendo que el orden es importante
y que no quiera tomar un recorrido más de una vez?
Permutación _____ o combinación________
Resolver:
5) Una bolsa contiene 6 bolas rojas numeradas del 1 al 6 y 8 bolas azules numeradas del 1 al
8. ¿De cuántos modos se pueden seleccionar 6 bolas de manera que 2 sean rojas y 4
azules?
Permutación _____ o combinación________
Resolver:
6) La carta de una fonda indica que hay 4 sopas, 7 carnes, 8 ensaladas y 5 postres. ¿De
cuántos modos se puede ordenar una comida consistente en una sopa, una carne, 3
ensaladas y un postre?
Permutación _____ o combinación________
Resolver:
Analicemos otros temas relacionado con lo anterior…… ANIMO
90
TEOREMA DEL BINOMIO Y TRIÁNGULO DE PASCAL
En aritmética y álgebra ya se definió que
es igual a uno “
a° = 1 “Toda cantidad elevada a la cero potencia
OBSERVA DETENIDAMENTE “EL TEOREMA DEL BINOMIO”
(Tómate tu tiempo)
( x + y )1 = x + y
( x + y )2 = x2 + 2xy + y2
( x + y )3 = x3 + 3x2y + 3xy2 + y3
( x + y )4 = x4 + 4x3y + 6x2y2 + 4xy3 + y4
( x + y )5 = __________________________________
( x + y )6 = _______________________________________________
¿Puedes resolver los dos binomios que faltan?
¡Yo SI
puedo!
!!Yo No Puedo aceboman¡¡
Entonces analiza las siguientes conclusiones:
A la mejor se te ocurre algo
1. El número de términos es igual al grado del binomio más uno.
2. El grado del primer término es igual al grado del binomio y disminuye sucesivamente
en uno, en cada uno de los siguientes términos y es factor en todos los términos,
menos en el último.
3. El segundo término, “y” en los ejemplos, aparece en el segundo término del desarrollo
con exponente uno, y aumenta sucesivamente en uno en cada uno de los términos
siguientes hasta llegar al exponente del binomio, el cual es el último del resultado.
4. El coeficiente del primer término del resultado es uno y el del segundo es el exponte
del binomio; el último término también es uno.
5. El coeficiente de un término cualquiera es igual al coeficiente del término inmediato
anterior, por el exponente de “x” en éste término y dividido entre el número de términos
desarrollados.
6. El grado de cada término es igual al grado del binomio.
7. Los términos que equidistan de los extremos tienen coeficientes iguales
8. Cada término del binomio se considera con coeficiente y signo.
AHORA SI PUEDES?
ANIMO RESUELVELO
Matemáticamente el binomio de Newton es el siguiente:
( x  y) n  x n  nx n 1 y 
n(n  1) x n 2 y 2 n(n  1)(n  2) x n 3 y 3

 ...  y n
1(2)
1(2)(3)
91
El triángulo de TARTAGLIA junto con el triángulo de PASCAL, facilitan el calculo de los
coeficientes de la potencia de un binomio (o coeficientes binomiales) observa:
TRIANGULO DE PASCAL
( x + y )0 = primera fila
1
( x + y )1 =
1
( x + y )2 =
1
( x + y )3 =
( x + y )4 =
1
1
1
2
3
4
1
3
6
1
4
1
( x + y )5=
(x + y )6 =
Observa que si sumas dos coeficientes adyacentes, su suma es el coeficiente entre ellos una
fila abajo; por ejemplo, para obtener el 2 de la tercer fila sumamos los dos UNOS(1+1=2) de
la segunda fila; para obtener el 4 de la quinta fila sumamos el UNO y TRES (1 +3 = 4)
Preparados ahora si con todo este conocimiento, podemos escribir fácilmente TODO EL
DESARROLLO de los binomios (x+y)5 ; (x+y)6 y (x + y )7
(x + y )5 = _______________________________________________
Por supuesto que si deseamos desarrollar la sexta potencia del binomio, podemos hacerlo
utilizando los coeficientes de la quinta potencia y así sucesivamente. Fácil o no?
( x + y )6 = ____________________________________________________________
(x + y)7 = _________________________________________________________________
¡¡¡MUY BIEN FELICIDADES!!!
92
PROBABILIDAD AXIOMÁTICA
Los problemas de probabilidad en situaciones prácticas, son sucesos o eventos compuestos
que requerirían para su solución la enumeración de muchos puntos muestrales,
procedimiento lento y cansado; de ahí, que haya un segundo procedimiento que se llama
composición de sucesos o probabilidad axiomática. Esta composición se forma con dos o
más sucesos y se realiza con la UNIÓN o con la INTERSECCIÓN DE CONJUNTOS o con la
combinación de ambos; se basa en: la clasificación de los sucesos, las relaciones entre ellos
y tres leyes: LA ADITIVA (o regla de la suma), LA MULTIPLICATIVA (o regla del producto) Y
LA DE SUSTRACCIÓN ( o regla de la diferencia).
Como estamos refiriéndonos a la probabilidad axiomática, es conveniente recordar que un
axioma es una proposición matemática evidente por sí misma que no requiere demostración.
SIMBOLOGÍA BÁSICA DE CONJUNTOS
El propósito del presente apartado es realizar un recordatorio somero de la teoría de
conjuntos ya que es un instrumento adecuado para la sistematización de nuestra forma de
pensar y permitir la capacidad de análisis y comprensión de las interrelaciones que hay entre
todas las partes de un problema, y así facilitar su solución en el estudio de la probabilidad
axiomática.
A) UNIÓN ( su símbolo es U )
Si se reúnen los elementos de dos o más conjuntos para formar uno solo, a este
conjunto que resulta se la llama UNIÓN DE CONJUNTOS; si existen elementos comunes
entre los conjuntos originales éstos no se repiten en el conjunto unión.
Piensa detenidamente: Sean los conjuntos
P = { 1, 2, 3, 4,}
M = { 3, 4, 5, 6 }
En Diagrama de Venn - Euler
P ( P U M) = { 1, 2, 3, 4, 5, 6 }
P
1,2
M
3, 4 5, 6
P (P o M) = { 1, 2, 3, 4, 5, 6 }
B. INTERSECCIÓN (su símbolo es ∩ )
La intersección de dos conjuntos A y B es el conjunto que forman los elementos comunes a
ambos conjuntos, se representa con el símbolo ∩ colocado entre los conjuntos, así; A ∩ B
se lee “intersección de A y B” o “A intersección de B”
Ejemplo
1) Sean los conjuntos
A = { 1, 2, 3, 4, }
B = { 1, 2, 5, 6 }
93
En Diagrama de Venn - Euler
P (A ∩ B) = { 1, 2 }
A
P (A y B) = { 1, 2 }
Otra variante de lo mismo: Sean los conjuntos
1,2
P = { 1, 2, 3 }
B
M = { 6, 7 }
En Diagrama de Venn - Euler
P (P ∩ M) = Ø
P (P y M) = Ø
Ø = Se refiere a un conjunto vacío o disjunto
Debido a que no existen elementos en común
Ø
P
1, 2, 3
M
6, 7
C. COMPLEMENTO DE UN CONJUNTO
Cuando se ha establecido un conjunto universal u, a la diferencia de u y un conjunto sea
por ejemplo A, se le llama COMPLEMENTO de A, se expresa A’ . El apóstrofe señala que
hemos formado el complemento de A. Algunos autores expresan el complemento, así; A c con
una pequeña c de donde A’ = Ac , otros mas, lo expresan con una barra arriba de la letra
mayúscula.
Observa detenidamente:
u = { 1, 2, 3, 4, 5, 6 }
A = { 1, 2, 3 }
En diagrama de Venn - Euler
u
P ( A’ ) = { 4, 5, 6 }
A
A’= 4, 5, 6
D. DIFRENCIA ENTRE CONJUNTOS
Dados los conjuntos A y B, : la diferencia de A – B, en este orden, es el conjunto de todos los
elementos que pertenecen a A, pero no a B.
La diferencia de A y B se expresa
A – B que se lee “ A diferencia de B ” o “ A menos B “
En diagrama de Venn - Euler
Ejemplo:
A = { 1, 2, 3, 4, 5 }
B = { 1, 2 }
A – B = { 3, 4, 5 }
A -B
B
3, 4, 5
Se utiliza cuando es necesario que ocurra
el suceso A y simultáneamente No ocurra el suceso B
94
En muchos problemas de probabilidad debemos considerar eventos que se forman por medio
de UNIONES, INTERSECCIONES Y COMPLEMENTOS. Para ilustrar estos conceptos
reflexionemos y analicemos el siguiente problema:
EL ESPACIO DE LOS DÍAS DE LLUVIA EN JULIO EN LA PARTE MAS LLUVIOSA DE
NAYARIT ES EL CONJUNTO S = { 0, 1, 2, 3, …, 31},
TOMEMOS LOS SUBCONJUNTOS
A = { 0, 1, 2, 3, 4, 5, 6 }
B = { 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31}
C = { 0, 15, 31 }
D = { 18, 19, 20, 21, 22, 23, 24 }
E = { 22 }
A = es el evento que llueva a lo más seis días
B = es el evento que llueva cuando menos 20 días
C = es el evento que llueva o todos los días del mes, o quince días o bien ningún día del mes.
D = es el evento que llueva entre 18 y 24 días
E = es el evento que llueva exactamente 22 días al mes.
Analicemos y aprendamos a resolver los siguientes eventos:
a) A U D;
c) D ∩ B;
e) B’
g) D’ U B’
b) B U D;
d) A ∩ B;
f) D’
h) B’ ∩ A’
a) Como A U D es el evento de los resultados que están en A o en D, A U D es por tanto
el evento { 0, 1, 2, 3, 4, 5, 6, 18, 19, 20, 21, 22, 23, 24}
b) B U D = { 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31}
c) D ∩ B es el de los resultados que están tanto en D como en B, por lo que D ∩ B = {20,
21, 22, 23, 24} representa que llueva de 20 a 24 días durante el mes de julio.
d) A ∩ B; Observamos que A y B no tienen elementos en común, de modo que la
intersección de A y B es el conjunto vacío, esto es, A∩ B = Ø. Cuando dos eventos no
tienen resultados en común decimos que son mutuamente excluyentes y equivale a
que no pueden ocurrir los dos simultáneamente. Esto lo estudiamos en el siguiente
tema.
e) B’ es el evento formado por los resultados que no están en B, así que B’ = { 0, 1, 2, …,
19}; B’ es el evento que llueva de los 0 a los 19 días.
f) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} entonces D’ es el evento de que
llueva a lo más (o menos que) 17 días, o bien, que llueva mas de 25 días.
g) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} y B’ = { 0, 1, 2, …, 18, 19} entonces
D’ U B’ = { 0, 1, 2, …, 16, 17, 18, 19, 25, 26, …, 30, 31} ¿como se interpreta?
95
h) B’ ∩ A’ como B’ = { 0, 1, 2, …, 19} y A’ = { 7, 8, 9, …, 31} , entonces la intersección
B’ ∩ A’ es el evento { 7, 8, 9, …, 18, 19 } que llueva de 7 a 19 días.
TIPOS DE EVENTOS
En función de la relación de probabilidad que se puede establecer entre los eventos o
sucesos éstos se clasifican en:
MUTUAMENTE EXCLUYENTES O DISJUNTOS.
Son aquellos sucesos o eventos en los que en un mismo experimento aleatorio no es
posible que ocurran simultáneamente. En sucesos mutuamente excluyentes se tienen
que la ocurrencia de uno de ellos elimina automáticamente la posibilidad de que ocurra
el otro.
NO EXCLUYENTES ENTRE SI.
Son aquellos eventos en un mismo experimento aleatorio, en los que la posibilidad de
que ocurra uno de ellos, no impide que el otro suceso ocurra; es decir, pueden ocurrir
conjuntamente.
Analiza el primer problema: En un experimento aleatorio, se analiza en un momento dado el
estado de salud de los habitantes de una comunidad.
Consideremos los sucesos siguientes:
A: La persona es diabética.
B: La persona está sana.
C: La persona tiene un problema de salud permanente, tiene una enfermedad crónica
D: La persona tiene gripa.
E: La persona es hipertensa.
A y B = los eventos A y B SON MUTUAMENTE EXCLUYENTES, puesto que una persona
sana no puede ser diabética y si es diabética no está sana.
C y E = Los sucesos C y E NO SON MUTUAMENTE EXCLUYENTES porque en el conjunto
de personas que tienen un problema de salud permanente están los que sufren de
hipertensión, a la vez un hipertenso es una persona con un problema de salud permanente.
B y C = Los sucesos B y C SON MUTUAMENTE EXCLUYENTES porque una persona no
puede considerarse a la vez sana y tener un problema de salud permanente.
C y D = Los eventos C y D NO SON MUTUAMENTE EXCLUYENTES porque existe la
posibilidad de que una persona con un problema de salud permanente esté enfermo de gripa.
Otro para confirmar: se observa la escolaridad de las personas de 20 a 60 años de edad en
una comunidad.
Consideremos los sucesos siguientes:
A: Una persona tiene menos de 40 años
B: La persona es ingeniero
C: La persona es analfabeta
D: La persona tiene 40 años o más.
Los sucesos A y B NO SON MUTUAMENTE EXCUYENTES porque es posible que una
persona entre 20 y 40 años sea ingeniero, a la vez que un ingeniero puede tener menos de
40 años y mas de 20.
Los sucesos B y D NO SON MUTUAMENTE EXCLUYENTES ya que un ingeniero puede
tener más de 40 años y entre las personas de 40 a 60 años pueden haber ingenieros.
96
Los sucesos B y C SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, puesto que un
analfabeta no puede ser ingeniero y un ingeniero no es un analfabeta.
Los sucesos A y D SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, porque una
persona no puede tener menos de 40 años o mas de 40 años en un mismo momento.
Finalmente, antes de analizar problemas de probabilidad con uniones, complementos e
intersecciones de eventos; analicemos cuando intervienen tres o más eventos y sus
relaciones, dibujando la siguiente figura en donde el espacio muestral queda dividido en ocho
regiones diferentes.
Y
Z
Digamos que X es el evento que los autos nuevos
que
6
2
5
lleguen a la agencia sean automáticos, Y es el
1
evento que los autos nuevos que lleguen a la
3
4
agencia sean de cuatro puertas, Z que los autos
nuevos que lleguen a la agencia tengan rines
7
deportivos
8
X
¿Que representan las siguientes regiones o números?
a) La región 3.
b) la región 6,
c) la región 7.
La región 3 está formada por los resultados que están en X y en Y, ( X ∩ Y ), pero no están
en Z, de modo que representa el evento de que los autos nuevos que lleguen a la agencia
sean automáticos, de cuatro puertas y no tengan rines deportivos.
La región 6 está formada por los resultados que tiene el evento Z, esto es que los autos
nuevos que lleguen a la agencia tengan nomás rines deportivos.
La región 7 está formada por los resultados que NO están ni en Y ni en Z, por lo que
representa el evento que los autos que lleguen a la agencia NO tengan cuatro puertas ni
tampoco rines deportivos, pero que si sean automáticos.
Podrías
contestar
que
representa
(escríbelo)_________________________
la
región
1
y
la
8
?
___________________________________________________________________________
_
y
la
región
2
y
?,_____________________________________________________________
4
___________________________________________________________________________
_
Finalmente la región 5 ?_____________________________________________________
PROBABILIDAD DE UNIONES Y EVENTOS COMPLEMENTARIOS
Una vez que ya nos hemos familiarizado con los eventos y sus relaciones vamos a describir
algunas reglas sencillas que nos permitan determinar la probabilidad de que ocurra algún
evento. Para expresar simbólicamente estas reglas denotaremos por P ( A ) a la probabilidad
de que ocurra el evento A. Ya hemos comentado que la probabilidad de que suceda un
evento es un número real entre cero y uno y que entre más pequeño sea este número, el
evento es menos probable y entre más cercano a uno el número el evento es más probable.
97
REGLAS BÁSICAS DE PROBABILIDAD
1. Las probabilidades son números reales entre 0 y 1
2. P ( u ) = 1 y P ( Ø ) = 0 como el espacio muestral ( u ) universo “otros libros utilizan
P(S)” contiene a todos los posibles resultados que pueden ocurrir, se tienen que el
evento u ocurre con certeza, de modo que P (u ) = 1 y cuando con certeza un evento
no puede ocurrir, su probabilidad es cero P ( Ø ) = 0
3. Regla de la suma ( ley aditiva de la probabilidad)
Esta ley se utiliza cuando se quiere obtener la probabilidad de que ocurra el suceso A o el
suceso B, para lo cual es necesario revisar si los sucesos SON O NO MUTUAMENTE
EXCLUYENTES.
a) Cuando dos sucesos son mutuamente excluyentes se tiene que A ∩ B = Ø ; (es
el conjunto vacío) se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) es decir, que la
probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus probabilidades
individuales.
Hagamos un diagrama…
U
P (A )
+
P (B)
Eventos mutuamente
excluyentes
b) Regla para eventos complementarios ( ‘ ). En consecuencia de las reglas
anteriores, surge P ( A’ ) = 1 – P (A) ya que los eventos A y A’ son mutuamente excluyentes
por no tener elementos en común y su unión es todo el universo (u).
Hagamos un diagrama…
P (A’) =
U
1
–
P (A )
Eventos mutuamente
excluyentes
c) Cuando dos sucesos NO son mutuamente excluyentes, se tiene que A ∩ B ≠ Ø
(no es el conjunto vacío) ; se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) es
decir, que la probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus
probabilidades individuales y restar sus intersecciones para rectificar el doble conteo que se
lleva a cabo cuando se suman las dos probabilidades.
98
Hagamos un diagrama…
U
P (A)
P (B)
No son mutuamente
excluyentes
P (A U B)
=
P (A)
+
P (B)
–
P (A ∩ B)
AHORA SI PONGAMONOS A PRACTICAR DICHAS REGLAS DE LA PROBABILIDAD.
PRIMERO UTILIZANDO LA LEY ADITIVA Y CUANDO UN EVENTO ES MUTUAMENTE
EXCLUYENTE. P ( A U B ) = P ( A ) + P ( B )
Primer problema para pensar:
¿Cuál es la probabilidad de elegir al azar un 10 o un 4 al extraer una carta de una baraja
ordinaria de 52 cartas? (la “ o “ se interpreta como unión)
Como queremos un 10 o un 4 y como estos eventos son mutuamente excluyentes, aplicamos
la regla de la suma P ( A o B ) = P ( A ) + P ( B ). Así, P (10 U 4) ; donde A representa sacar
un 10 y B obtener un 4. y como existen cuatro 10, cuatro 4 y 52 cartas en la baraja, P (10 ) =
4/ 52 y P ( 4 ) = 4/52 tenemos
P ( 10 o 4 ) = 4/52 + 4/52 = 8/52 = 0.1538
Otro para reflexionar:
Supongamos que va a elegirse de manera aleatoria UN individuo entre una población de 130
personas. En esta población hay 40 NIÑOS menores de 12 años, 60 ADOLECENTES y 30
ADULTOS ¿Cuál es la probabilidad de que el individuo elegido sea un adolescente o un
adulto?
Los eventos son mutuamente excluyentes porque queremos obtener un adolescente o un
adulto y no los dos al mismo tiempo, por lo tanto utilizamos la ley aditiva P ( A o B ) = P ( A ) +
P ( B ). Donde P (A) será obtener un adolescente y P (B) será obtener un adulto. Como hay
60 adolescentes, 30 adultos y 130 personas en la población tenemos,
P ( A o B ) = P ( 60/130) + P ( 30/130 ). = 60/130 + 30/130 = 90/130 = 0.6923
Ahora con otro problema para que utilices mas reglas… ECHALE GANAS
Supongamos que A es el evento: el martes a las 16:00 hrs, estará lloviendo
B es el evento: el martes a las 16:00 hrs, estará despejado
Y que de acuerdo al Observatorio Nacional la P (A) = 0.45 y P (B) = 0.3,
¿Cuáles son las probabilidades de P ( A’ ), P ( A U B ) y P ( A ∩ B )?
Para que tu aprendizaje sea significativo contesta por favor las siguientes preguntas
99
Son
eventos mutuamente
_______________________
excluyentes
SI____
NO___
Porque?
___________________________________________________________________________
_
P
(
A’
) como se interpreta
__________________________
o
que
significa
en
éste
problema?:
___________________________________________________________________________
_
Que
nos
pide
el
problema
con
_________________________________________
P
(
A
U
B
):
___________________________________________________________________________
_
Como se interpreta P ( A ∩ B ) en el contexto del problema?
___________________________________________________________________________
Si P (A) es la probabilidad de que el martes esté lloviendo; P (A’) será la probabilidad de que
NO LLUEVA el martes a las 16:00 hrs. Por lo tanto utilizamos P ( A’ ) = 1 – P (A) y
sustituyendo los valores P (A’) = 1 – 0.45 = 0.55
Para poder calcular las probabilidades de P (A U B) y P ( A ∩ B) debemos primero observar
que los eventos A y B son mutuamente excluyentes, ya que el tiempo no puede estar
lloviendo y despejado simultáneamente, por lo que …
Bien y Fácil
aceboman
P (A∩ B) = P ( Ø ) = 0 la intersección de A y B es un evento nulo
Ya que no puede suceder al mismo tiempo.
Finalmente P (A U B) = P (A) + P(B) = P ( 0.45) + P (0.3) = 0.75
En resumen...
P (A’) = La probabilidad de que NO LLUEVA el martes a las 16:00 hrs = 0.55
P (A∩ B) = La probabilidad de estar lloviendo y despejado simultáneamente = P ( Ø ) = 0
P (A U B) = La probabilidad de que esté lloviendo o esté despejado = 0.75
Antes de realizar algunas actividades de aprendizaje finalmente…
Analicemos otro problema donde Si k eventos son mutuamente excluyentes, la probabilidad
de que ocurra alguno de ellos es igual a la suma de sus respectivas probabilidades
Si las probabilidades de que una agencia de automóviles venda 0, 1, 2, 3, 4, y 5 automóviles
durante cierta semana son respectivamente 0.05, 0.1, 0.15, 0.18, 0.12 y 0.05
¿Cuáles son las probabilidades de que vendan de 2 a 5 automóviles y de que vendan 5 o
más automóviles.
100
Como estos eventos son mutuamente excluyentes, usando la regla P (A1 U… Ak ) = P (A1 ) +
P(A2)... + P (A k ) para saber si la agencia venderá de 2 a 5 automóviles, por lo tanto será:
0.15 + 0.18 + 0.12 + 0.05 = 0.5
Ahora para calcular la probabilidad de que vendan 5 o más automóviles, o sea P (vender 5 o
más automóviles), COMO ES UN EVENTO COMPLEMENTARIO DE (A’) debemos primero
calcular la probabilidad de vender a lo más cuatro automóviles…(AK )
P ( Ak vender a lo más 4 automóviles) = 0.05 + 0.1 + 0.15 + 0.18 + 0.12 = 0.6
Ahora P (A’ vender cinco o más automóviles) = 1 – P (Ak ) = 1 – 0.6 = 0.4
ACTIVIDADES DE APRENDIZAJE:
Realiza tus esquemas, reflexiones y cálculos con orden hasta obtener lo que se te señala.
1) Determina si los siguientes eventos son mutuamente excluyentes. Explica tus respuestas.
a) El “toro” Valenzuela lanza el martes un juego sin hit ni carrera y el “Toro”
Valenzuela pierde el martes su juego:
_____________________________________________________________________
_
b) Lucía llega tarde a su empleo y Lucía quema accidentalmente una compresora del
taller donde trabaja.
_____________________________________________________________________
_
c) Lucía llega tarde a su empleo y Lucía emplea todo el día arreglando el pago del
impuesto predial de su casa.
_____________________________________________________________________
_
d) En una mano de póker la primera carta es as y en la misma mano de póker la
quinta carta es as.
e) En una mano de póker las primeras cuatro cartas son ases y en la misma mano de
póker la quinta carta es as.
_____________________________________________________________________
__
2) Al lanzar un dado una vez, ¿Cuál es la probabilidad de obtener un 1 o un número par?
3) Para participar en la rifa de un reloj, los alumnos del primer año compraron 18 boletos; los
de segundo año 12 boletos. Si son 50 boletos. ¿Cuál es la probabilidad de que un alumno de
primero o segundo gane la rifa?
101
4) En un experimento tiramos un par de dados y contamos los puntos obtenidos.
a) Describe el espacio muestral : ______________________________________
b) Si A = { 2, 3, 4, 5, y 6} y B = { 3, 5, 7, 9, 11} describe los eventos:
P ( A’ ) = _______________________________
__________________________
P
(
B’
)
=
P ( A U B ) : ________________________ P ( A ∩ B’ ) = _________________________
P ( A ∩ B ) = ____________________________________
5) Las probabilidades de que un hospital reciba a,1, 2, 3, 4, 5, 6, 7 y hasta 8 enfermos durante
un día son, respectivamente, 0.02, 0.04, 0.08, 0.13, 0.15, 0.17, 0.16 y 0.08. Determina las
probabilidades de que el hospital reciba
a) Cuatro o más pacientes;
b) A lo más cinco pacientes;
c) De 3 a 6 pacientes.
Ahora analicemos dos problemas para aplicar la ley aditiva cuando dos sucesos NO son
mutuamente excluyentes, donde ya se indicó que P ( A ∩ B ) ≠ Ø y se utiliza entonces…
P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) o sea la probabilidad de que A o B ocurran
indistintamente.
Problema para pensar: Un estudio de mercado estima que las probabilidades de que una
familia en cierta zona vea el noticiero de TV Azteca es de 0.3, que vea el noticiero de Televisa
es de 0.2 y de que vea a ambos es de 0.02.
¿Cuál es la probabilidad de que una familia vea al menos uno de los dos noticieros?
Sea A el evento la familia ve el noticiero de TV Azteca Entonces P ( A ) = 0.3
Sea B el evento la familia ve el noticiero de Televisa
Entonces P ( B ) = 0.2
y P ( A ∩ B ) = 0.02
Observemos primero que como la probabilidad de que vean ambos noticieros es positiva, los
eventos A y B NO son mutuamente excluyentes, por lo tanto se deben transmitir a diferente
horario.
P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P ( 0.3 ) + P ( 0.2 ) – P ( 0.02 ) = 0.48
Otro problema para reflexionar y confirmar aprendizaje…
Queremos determinar al utilizar una baraja de póker ¿Cuál es la probabilidad de sacar UN AS
o UN TREBOL de dicha baraja?
102
Sea A el evento sacar UN AS y como en la baraja hay 4 ases en 52 cartas P ( A ) = 4/52
Sea B el evento sacar UN TREBOL y en la baraja hay 13 tréboles en 52 cartas P (B) = 13/52
La probabilidad de obtener UN AS y UN TREBOL al mismo tiempo es de 1/ 52
Por lo
tanto…
P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P (4/52) + P ( 13/52) – P ( 1/52) = 16/52 =
0.3077
Pero ¿Por qué debemos restar la probabilidad de obtener un as y un trébol
a la vez?
Porque hemos contado el as de trébol dos veces. Sin restarlo, pensaríamos de
manera errónea que existen 17 eventos favorables en vez de 16.
Realiza las siguientes ACTIVIDADES DE APRENDIZAJE:
1) Una alumna del CBTa.- Xalisco estima que durante una fiesta la probabilidad de que se le
declare JOSE es de 0.7, la probabilidad de que se le declare ENRIQUE es de 0.4 y la
probabilidad de que se le declaren ambos es de 0.2. ¿Cuál es la probabilidad de que se le
declare alguno de los dos durante la fiesta?
2) Si extraes de una baraja de póker ordinaria, una sola carta ¿Cuál es la probabilidad de de
que sea:
Una reina o un corazón?
Un 3 o una carta negra?
103
PROBABILIDAD PARA EVENTOS SUCESIVOS
Regla del producto ( ley multiplicativa de la probabilidad)
La probabilidad de que ocurran SIMULTÁNEAMENTE DOS SUCESOS A y B, se obtiene con
el producto de sus probabilidades. Esto es, mientras que la regla de la suma proporciona la
probabilidad de que ocurra CUALQUIERA DE varios sucesos, la regla del producto analiza la
ocurrencia CONJUNTA O SUCESIVA de varios eventos.
Observa que la regla del producto analiza con frecuencia lo que ocurre en más de un
lanzamiento o extracción, mientras que la regla de la suma estudia sólo un lanzamiento o
extracción.
Al analizar la regla del producto, es útil distinguir tres condiciones:
A) CUANDO LOS EVENTOS SON MUTUAMENTE EXCLUYENTES
B) CUANDO LOS EVENTOS SON INDEPENDIENTES
C) CUANDO LOS EVENTOS SON DEPENDIENTES.
Regla del producto: Eventos mutuamente excluyentes
Ya se ha indicado anteriormente (cuando estudiamos la regla de la suma) que cuando dos
sucesos son mutuamente excluyentes la probabilidad de A y B es el conjunto vacío, P ( A
∩ B ) = Ø otros autores la señalan como P ( A y B ) = Ø , esto es, la ocurrencia de un evento
impide la ocurrencia del otro y la probabilidad de su ocurrencia CONJUNTA es nula o cero.
Regla del producto: Eventos Independientes
Dos eventos son independientes si la ocurrencia de un evento NO TIENE EFECTO sobre
la probabilidad de ocurrencia del otro.
El muestreo con reemplazo ilustra bien esta situación. Por ejemplo, suponga que vamos a
extraer dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. Denotamos por A a
la carta extraída primero y B a la carta obtenida en segundo lugar. Cuando A se reemplaza
antes de extraer a B, la aparición de A en la primera extracción no tiene efecto alguno sobre
la probabilidad de ocurrencia de B. Por lo tanto son eventos A y B son independientes. Bajo
esta condición, la regla del producto se convierte en…
P ( A ∩ B ) = P ( A ) P ( B ) . . . regla del producto para eventos independientes.
P(A y B)=P(A)P(B)
Vamos a analizar dos problemas para emplear esta ecuación. Suponga que vamos a obtener
al azar dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. ¿Cuál es la
probabilidad de que ambas cartas seas Ases?
Como el problema nos pide DOS cartas; la primera que sea As “y ” en la segunda extracción
sea también otro As y además con reemplazo, podemos utilizar la regla del producto P (A ∩
B) = P ( A ) P ( B )
104
P ( A ) = (un as en la primera extracción) P ( B ) = (un as en la segunda extracción)
4 ases o eventos favorables de 52 barajas
también 4 ases o eventos favorables de 52
barajas
P (A y B) = P ( 4/52 ) P ( 4/52 )
P (A y B) = ( 16/ 2704 ) = 0.0059
Otro para reflexionar y pensar. Se lanza un dado y se saca una canica de una bolsa; en la
bolsa hay 3 canicas, una roja, una azul y una verde. ¿Cuál es la probabilidad de que salga un
número primo y una canica azul?
Lee detenidamente el problema y contesta ¿los eventos (lanzar un dado y sacar una canica)
son
independientes?
_____
porque?
__________________________________________________
Si el lanzar el dado es el evento A, ¿Cuales son los eventos muestrales para A ?
A = { _____________}
P ( A ) = ( 4/ 6 )
el evento B será B = { sale una canica azul } P ( B ) = ( 1/3 )
P (A y B) = P ( 4/6 ) P ( 1/3 )
P (A y B) = ( 4/ 18 ) = 0.2222
Esto lo podemos comprobar contando de los resultados posibles, los que son favorables al
suceso A y B, así:
(A, 1) (A, 2) ( A, 3) (A, 4) (A, 5) ( A, 6)
(R, 1) (R, 2) ( R, 3) (R, 4) (R, 5) ( R, 6)
(V, 1) (V, 2) ( V, 3) (V, 4) (V, 5) ( V, 6)
P (A y B ) = 4 resultados favorables = 4
18 resultados posibles
18
= 0. 2222
La anterior regla del producto para eventos independientes, también se aplica en situaciones
con más de dos eventos. En tales casos, la probabilidad de la ocurrencia conjunta de los
eventos es igual al producto de las probabilidades individuales de cada evento. En forma de
ecuación es…
P ( A y B y C …Z ) = P ( A ) P ( B ) P ( C ) … P ( Z )
Queremos obtener al azar 4 individuos de una población de 110 habitantes, los cuales 50 son
varones y 60 mujeres. El muestreo es un individuo a la vez, con reemplazo. ¿Cuáles la
probabilidad de obtener 3 mujeres y 1 hombre, en ese mismo orden?
Como el problema pide una mujer en la primera, segunda y tercera extracción y un hombre en
la cuarta y como el muestreo es con reemplazo, aplicamos la ley del producto para más de
dos eventos independientes.
A = representa una mujer en la 1ra extracción B = una mujer en la 2da. Extracción
C = una mujer en la tercera extracción
D = un hombre en la cuarta extracción
P ( A y B y C y D ) = P (60/ 110) P (60/110) P (60/110) P (50/110) = 1080/ 14,641 = 0.0738
105
Regla del producto: Eventos dependientes
Dos eventos son dependientes si la ocurrencia de un evento, AFECTA la probabilidad de
ocurrencia del otro.
Cuando A y B son dependientes, la probabilidad de que ocurra B se ve afectada por la
ocurrencia de A. En este caso se utiliza la regla…
P ( A ∩ B ) = P ( A ) P ( B | A ) . . . Regla del producto para eventos dependientes
P(A y B)=P(A)P(B|A)
En esta nueva regla nos dice que la probabilidad de ocurrencia de A y B es igual a la
probabilidad de ocurrencia de A por la probabilidad de que B ocurra, dado que A ha
ocurrido.
El muestreo sin reemplazo ilustra bien esta situación de los eventos dependientes.
Primer problema para pensar…
Suponemos que vamos a extraer DOS cartas, una a la vez, sin reemplazo (sin volver a meter
la primera), de una baraja ordinaria ¿Cuál es la probabilidad de que ambas cartas sean ases?
Como va a ser sin reemplazo la ocurrencia de A realmente afecta la probabilidad de B por lo
tanto son eventos dependientes y usaremos la regla…
Aquí está
la clave
P(Ay B)=P(A)P(B|A)
P (A) = (un as en la primera extracción) = P ( 4/ 52)
P (B | A) = ( un as en la segunda extracción) = P ( 3/51 ) observa que aquí se trata de
obtener un as en la 2da. extracción dado un as en la 1ra extracción.
P ( A y B ) = P ( 4/52 ) P ( 3/51 ) = 12/ 2652 = 0.0045
Otro problema para aprender… Queremos obtener DOS frutas, una a la vez, de una bolsa de
frutas que contienen 4 manzanas, 6 naranjas y 5 duraznos, sin reemplazo ¿Cuál es la
probabilidad de obtener una naranja y una manzana, en ese mismo orden?
P ( A ) = Obtener una naranja en la 1ra extracción
Eventos favorables a A = 6 naranjas de 15 posibles (frutas)
P ( B | A ) = Obtener una manzana en la 2da extracción
Si es sin reemplazo: Eventos favorables a B = 4 manzanas de 14 posibles (ya que afectó la
1ra)
Por lo tanto…
P ( A y B ) = P ( A ) P ( B | A ) = P ( 6/15) P ( 4/14 ) = 24/ 210 = 0.1143
106
Un último problema para reafirmar y después realices tus actividades de aprendizaje:
De un grupo del CBTa – Xalisco turno vespertino, se van a elegir por sorteo a 3 alumnos que
se hagan cargo de una ceremonia escolar del “día del maestro”; en el grupo hay 24 hombres
y 12 mujeres. ¿Cuál es la probabilidad de que el grupo de representantes esté conformado de
las maneras siguientes; sean Tres hombres y sean dos hombres y una mujer
P ( A ) = Sean Tres hombres
P ( B ) = Sean dos hombres y una mujer
PARA QUE SEAN TRES HOMBRES
Para calcular P (A) es necesario que se den los sucesos siguientes:
A1, el primer alumno seleccionado sea hombre - - - - - A2 ; el segundo seleccionado sea hombre -
-
-
-
-
-
P ( A1 ) = 24/ 36
P ( A2 ) = 23/ 35
Observa que la ocurrencia de A, AFECTA la probabilidad de que ocurra A 2 puesto que tanto
el número de hombres como el número de alumnos cambia ( han disminuido) para el evento
A2.
A3 ; el tercer alumno seleccionado sea hombre - - - - P ( A3 ) = 22/34
Entonces P ( A ) = P ( A1 ) P ( A2 ) P ( A3 ) = (24/ 36) (23/ 35) (22/34 ) = 12144/ 42840 =
0.2834
= 28.34 %
PARA QUE SEAN DOS HOMBRES Y UNA MUJER
Para calcular P ( B ) se deben cumplir los sucesos siguientes:
B1 = Sale el primer hombre -- - - - - P ( B1 ) = 24/36
B2 = Sale el segundo hombre- - - - - P ( B2 ) = 23/35
B3 = Sale la tercera mujer- - - - - - P ( B3 ) = 12/34
Entonces P ( B ) = P (B1 ) P (B2 ) P (B3 ) = (24/ 36) (23/ 35) (12/34 ) = 6624/ 42840 = 0.1546
= 15.46 %
Observa que el orden en que salgan los dos hombres y la mujer no cambia el valor de la
probabilidad.
107
ACTIVIDADES DE APRENDIZAJE
1) Determina si los siguientes eventos son Independientes o dependientes. Explica tus
respuestas
a) Se toma una carta de una baraja de póker bien revuelta y sin regresar esta carta se toma
una segunda carta:
___________________________________________________________________________
_
b) Si A es el evento que el automovilista maneja en estado de ebriedad y B es el evento el
automovilista tuvo un accidente.
___________________________________________________________________________
_
c) Si A es el evento que una moneda caiga águila en un primer volado y B es el evento que la
moneda caiga águila en el segundo volado.
___________________________________________________________________________
d) Se toma una carta de una baraja bien revuelta. Se regresa la carta y después de revolver
la baraja se toma una segunda carta.
___________________________________________________________________________
e) El evento A es una luna llena y el evento B es comer una hamburguesa.
___________________________________________________________________________
2) Si se realiza un muestreo aleatorio, tomando un elemento a la vez, con reemplazo, de una
bolsa que contiene OCHO canicas azules, SIETE canicas rojas y CINCO canicas verdes.
¿Cuál es la probabilidad de obtener:
a) Una canica azul en una extracción de la bolsa?
b) Tres canicas azules en tres extracciones de la bolsa?
c) Una canica roja, una verde y una azul, en ese orden en tres extracciones de la bolsa.
3) En cierto grupo de la universidad, hay 15 estudiantes de música, 24 de historia y 46 de
psicología. Y se escoge a los alumnos al azar una persona a la vez, sin reemplazo ¿Cual es
la probabilidad de …
a) Dos estudiantes sean de historia?
b) Cuatro estudiantes sean de historia?
4) Si se lanzan dos monedas una sola vez. ¿Cuál es la probabilidad de que ambas caigan
con cara hacia arriba?
108
5) Dada una población de 30 bats, 5 guantes de béisbol y 60 pelotas, si el muestreo es
aleatorio, uno a la vez, sin reemplazo. ¿Cuál es la probabilidad de obtener:
a) Un guante si se extrae un objeto de la población
b) Un bat y una pelota si se extraen dos objetos de la población
c) Un bat, un guante y un bat, en ese orden, si se extraen tres objetos de la población?
6) Usted quiere llamar a una amiga por teléfono. Sólo recuerda los tres primeros dígitos de su
número telefónico y ha olvidado los últimos cuatro. ¿Cuál es la probabilidad de que marque al
azar el número correcto?
7) Durante una comida de fin de año se rifan dos televisores entre un grupo de empleados.
Los participantes en la rifa son cuatro hombres y ocho mujeres. Encuentra la probabilidad de
que los televisores los ganen…
a) Dos hombres
b) Dos mujeres
c) Un hombre y una mujer.
8) Determina la probabilidad de obtener de una baraja de póker bien revuelta dos tréboles
si..
a) Después de sacar la primer carta se regresa y se vuelve a revolver.
b) Se saca la segunda carta sin regresar la primera.
109
TEOREMA DE BAYES
El teorema de Bayes, descubierto por Thomas Bayes, en la teoría de la probabilidad, es el
resultado que da la distribución de probabilidad condicional de una variable aleatoria A dada
B en términos de la distribución de probabilidad condicional de la variable B dada A y la
distribución de probabilidad marginal de sólo A.
Sea A1, A2, ...,An un conjunto de sucesos incompatibles cuya unión es el total y tales que la
probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se
conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene
dada por la expresión:
donde:
P(Ai) son las probabilidades a priori.
P(B | Ai) es la probabilidad de B en la hipótesis Ai.
P(Ai | B) son las probabilidades a posteriori.
Esto se cumple
El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin
embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los
seguidores de la estadística tradicional sólo admiten probabilidadades basadas en
experimentos repetibles y que tengan una confirmación empírica mientras que los llamados
estadisticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces
para indicar como debemos modificar nuestras probabilidades subjetivas cuando recibimos
información adicional de un experimento. La estadística bayesiana está demostrando su
utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y permitir revisar
esas estimaciones en función de la evidencia es lo que está abriendo nuevas formas de hacer
conocimiento.
N
Como observación, se tiene
 P( A / B)  1 y su demostración
i 1
i
resulta evidente
110
GLOSARIO
ARREGLO DE DATOS. Organización de los datos brutos por observaciones en orden
ascendente o descendente.
CENSO. Medición o examen de cada elemento de la población.
CLASE. Intervalo en el cual se agrupan los datos en una tabla de distribución de frecuencias.
CLASE DE LA MEDIANA. Clase de distribución de frecuencias que contiene el valor medio
de
(MEDIANA DE CLASE) un conjunto de datos
COEFICIENTE DE VARIACIÓN. Medida de dispersión relativa de un conjunto de datos, se
calcula dividiendo la dispersión estándar entre la media y multiplicando el cociente por cien.
COMBINACIONES. Técnica de conteo. Si el orden de cualquier conjunto de elementos no
n!
importa, el número de ordenaciones o arreglos se determina por medio de:
n Cr 
r!(n  r )!
COMPLEMENTO DEL EVENTO A. El evento que contiene todos los puntos maestrales que
no están en A
CONJUNTO DE DATOS. Todos los datos reunidos en determinado estudio.
CUARTILES. Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo cuartil
(mediana) y tercer cuartil respectivamente. Se pueden usar los cuartiles para dividir al
conjunto de datos en cuatro partes, cada una de las cuales contiene aproximadamente el
25% de los datos.
DATOS. Los hechos y números que se reúnen, analizan e interpretan
DATOS CUALITATIVOS. Datos que indican etiquetas o nombres de categorías, para
artículos semejantes.
DATOS CUANTITATIVOS. Datos que indican cuánto o cuántos de algo. Los datos
cuantitativos siempre son numéricos.
DECILES. Fractiles que dividen los datos en diez partes iguales.
DESVIACIÓN ESTANDAR. Medida de la dispersión de un conjunto de datos; se calcula
sacando la raíz cuadrada positiva de la varianza.
DESVIACIÓN MEDIA. También se llama Desviación promedio o desviación media absoluta.
Es
la media aritmética de las desviaciones con respecto a la media aritmética en términos
absolutos.
DIAGRAMA DE ARBOL. Dispositivo gráfico útil para definir puntos maestrales de un
experimento donde se presentan varias etapas.
111
DIAGRAMA DE DISPERSIÓN. Método gráfico para mostrar la relación entre dos variables
cuantitativas. Una variable se representa sobre el eje horizontal y la otra sobre el eje vertical.
DISPERSIÓN. Esparcimiento o variabilidad de un conjunto de datos.
DISTRIBUCIÓN DE FRECUENCIAS. Representación organizada de los datos que muestra el
número de observaciones del conjunto de datos que caen dentro de cada clase mutuamente
excluyentes.
ERROR DE MUESTREO. El que se presenta porque se usa una muestra y no toda la
población, para estimar un parámetro de población.
ESTADÍSTICA. Ciencia de la recopilación, organización, análisis e interpretación de datos
numéricos con objeto de tomar decisiones más efectivas.
EVENTO. Uno o más de los posibles resultados al hacer algo, o bien uno de los posibles
resultados que se producen al efectuar un experimento.
EVENTOS INDEPENDIENTES. Dos eventos son independientes si la ocurrencia de un
evento no tiene efecto sobre la probabilidad de ocurrencia del otro.
EVENTOS DEPENDIENTES. Dos eventos son dependientes si la ocurrencia de un evento si
tiene efecto sobre la probabilidad de ocurrencia del otro.
EXPERIMENTO. Cualquier proceso que genere resultados bien definidos, que se representan
por Ei.
FRACTIL. En una distribución de frecuencias, la localización de un valor en determinada
fracción de los datos o arriba de ellos.
HISTOGRAMAS. Es la representación gráfica de una distribución de frecuencia.
INFERENCIA ESTADÍSTICA. El proceso de reunir datos obtenidos de una muestra para
hacer estimaciones o probar hipótesis acerca de las características de una población.
INTERVALO. Distancia existente entre el valor máximo y el más bajo en un conjunto de
datos.
MEDIA ARITMÉTICA. Suma de los valores dividida entre el número total de ellos.
MEDIA GEOMÉTRICA. Medida de tendencia central que se usa para medir la tasa promedio
de cambio o crecimiento de alguna cantidad; se calcula tomando la enésima raíz del producto
de n valores que representan el cambio.
MEDIA PONDERADA. Promedio que se calcula a fin de tener en cuenta la importancia de
cada valor para el total global; es decir, un promedio donde el valor de cada observación se
pondera mediante algún índice de su importancia.
MEDIDA DE TENDENCIA CENTRAL. Es el dato que queda al centro de un ordenamiento de
menor a mayor.
112
MEDIDA DE DISPERSIÓN. Aquella que describe cómo las observaciones están esparcidas
en un conjunto de datos.
MEDIANA. Es el dato intermedio de un conjunto, ordenado de menor a mayor o viceversa.
a) Si el número de datos es impar, se toma el dato central.
b) Si el número de datos es par, la mediana está dada por el promedio de los datos
centrales.
MODA. Es el valor que tiene la mayor frecuencia de un grupo de datos.
METODOS NO PARAMÉTRICOS. Métodos estadísticos que requieren muy poco o ningún
supuesto acerca de las distribuciones de probabilidad de la población, y acerca del nivel de
medición. Esos métodos se pueden aplicar cuando se dispone de datos nominales u
ordinales.
MUESTRA. Porción o subconjunto de la población que se estudia.
MUESTRA ALEATORIA SIMPLE. Muestra tomada de tal manera que cada muestra de
tamaño n tiene la misma probabilidad de ser seleccionada.
MUESTREO CON REEMPLAZO. Es un método en el cual cada miembro de la población
elegida para la muestra se regresa a la primera antes de elegir al siguiente miembro.
MUESTREO SIN REEMPLAZO. Es un método en el cual los miembros de la muestra no se
regresan a la población antes de elegir a los miembros siguientes.
MUTUAMENTE EXCLUYENTES. Dos eventos son mutuamente excluyentes si no pueden
ocurrir al mismo tiempo. Otra forma de decirlo es que dos eventos son mutuamente
excluyentes si la ocurrencia de uno impide la ocurrencia del otro.
OJIVA. Gráfica de una distribución de frecuencias acumulada.
PARÁMETRO. Una característica numérica de una población, como la media de población (
 ( ), proporción poblacional ( p ), etc.
µ ), desviación estándar poblacional
PERCENTILES. Fractiles que dividen los datos en 100 partes iguales.
PERMUTACIONES. Técnica de conteo. Se utiliza para obtener el número de posibles
arreglos resultantes de un conjunto de elementos,
n! considerando la importancia o jerarquía. El
p

número de arreglos posibles está determinado
por:
n r
(n  r )!
POBLACIÓN. Conjunto de todos los elementos que estamos estudiando y acerca de los
cuales tratamos de sacar conclusiones.
POLIGONO DE FRECUENCIAS. Gráfica lineal que une los puntos medios de cada clase en
un conjunto de datos; se grafica en la altura correspondiente a la frecuencia de cada clase.
PRINCIPIO DE MULTIPLICACIÓN. Técnica de conteo. Es una de las fórmulas que pueden
utilizarse para contar el número de posibles resultados de un experimento. Indica que si hay
m formas de hacer una cosa y n formas de hacer otra, existen (m) ( n ) formas de hacer
ambas.
113
PROBABILIDAD. Es el número de posibilidades que hay de que un fenómeno suceda o no
suceda.
PROMEDIO. Número que describe la centralización o tendencia central de los datos. Existe
un cierto número de promedios especializados, entre los que se incluye la media aritmética, la
media ponderada, la mediana, la moda, y la media geométrica.
RANGO. Medida de dispersión definida como el valor máximo menos el valor mínimo.
VARIABLE. Una característica de interés de los elementos.
VARIANZA. Medida de dispersión para un conjunto de datos, en las desviaciones de los
valores de los datos respecto a la media, elevadas al cuadrado.
114
BIBLIOGRAFÍA CONSULTADA.
1. FREUND John E. y Gary A. Simón. Estadística Elemental. Octava edición. México.
D.F. Editorial Prentice Hall. Traducción José Julián Díaz Díaz. 1994. pp. 566
2. FUENLABRADA De la Vega Trucíos Samuel. Probabilidad y Estadística. México. D.F.
Editorial MvGraw-Hill Interamericana. 2002. pp.255.
3. PAGANO, Roberto R. Estadística para las ciencias del comportamiento. Quinta
edición. Edit. Internacional Thomson Editores. México. 1999. pp. 548
4. PASTOR Guillermo. Estadística Básica. México D.F. Editorial Trillas. SEP-CONALEP.
1998. (reimp. 2003). Pp.198.
5. PÉREZ SEGUÍ María Luisa. Combinatoria. Instituto de Matemáticas, UNAM.
Cuadernos de olimpiadas. 2000.
6. REYNOSO Tirado Héctor Francisco. Lecturas seleccionadas de Estadística Básica.
Universidad Autónoma de Nayarit. México. Facultad de Economía. Septiembre de
2001. pp129.
7. REYNOSO Tirado Héctor Francisco. Glosario de estadística. Universidad Autónoma de
Nayarit. México. Facultad de Economía. Abril del 2002. pp.75.
8. REYNOSO Tirado Héctor Francisco. Técnicas de conteo y espacios maestrales sin
maestro. Universidad Autónoma de Nayarit. México. Facultad de Economía. Verano de
2003. pp.89.
9. SEP-SEIT-DGETA. Antología para el módulo 4 “Formación Matemática Básica”
Bachillerato Tecnológico Agropecuario. México. D.F. Sistema Abierto de Educación
Tecnológica Agropecuaria. SAETA. 1997. pp. 426.
10. SEP, CINVESTAB del IPN, Sección de matemática educativa “probabilidad “ (
Programa Nacional de Formación y Actualización de Profesores), México 1990
11. VILENKIN. N. ¿De cuantas formas? Combinatoria. Libro de la editorial MIR, Moscú,
1972. Impreso en el taller de publicaciones de Matemáticas de la Facultad de Ciencias
UNAM. Vínculos matemáticos No. 219. 1996.
115
BIBLIOGRAFÍA RECOMENDADA.
1. CÓNCAVOS, George, Probabilidad y estadística, Ed. Mc. Graw Hill, México 1998.
2. ALMAGRE, Guadalupe, Matemáticas 3, Ed. Limusa, México 1990.
3. Subsecretaría de Educación Básica Telesecundarias,
matemáticas I, México 1993.
Conceptos básicos de
4. MORENO, G. José y Ortiz, G. Mariano, Matemáticas primer curso, Ed. Mc Graw Hill,
México 1994.
5. WILLOUGHBY, S. Stepten, Probabilidad y estadística, Publicaciones Culturales,
México 1991.
6. ADDISON – WESLEY, Prealgebra.
7. GONZALEZ, H. Miguel, Estadística metodología. Escuela Normal Superior de Nayarit
(Departamento de Psicopedagogía), México 1992.
8. COBACH/SONORA, Cuadernillo básico de lectura de matemáticas 4, México 1995.
9. YAMANTE, Taro, Estadística, Ed. Harla, México 1990.
10. GOVINDEN y LINCOYAN, Curso práctico de estadística Ed. Mc. Graw Hill, México
1990.
ENCICLOPEDIAS DIGITALES
Microsoft ® Encarta ® 2006. © 1993-2005 Microsoft Corporation. Reservados todos los
derechos.
http://es.wikipedia.org/wiki/Portada
116