Download MATEMATICAS PARA ING - Universidad Tecnológica de la Selva

Document related concepts
no text concepts found
Transcript
MATEMÁTICAS PARA INGENIEROS
GUÍA DEL PROFESOR
SECRETARÍA DE EDUCACIÓN PÚBLICA
SUBSECRETARÍA DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA
SUBSISTEMA DE UNIVERSIDADES TECNOLÓGICAS
COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS
ELABORÓ:
APROBÓ:
Revisión no. 0.
GRUPO DE DIRECTORES DE LA CARRERA DE
PROCESOS AGROINDUSTRIALES.
REVISÓ:
COORDINACIÓN GENERAL DE
UNIVERSIDADES TECNOLÓGICAS
FECHA DE ENTRADA
EN VIGOR:
Fecha de revisión: septiembre, 2003.
Página 1 de 1907
COMISIÓN ACADÉMICA NACIONAL DEL ÁREA
AGRO-INDUSTRIAL ALIMENTARIA.
SEPTIEMBRE 2003
F-CADI-SA-MA-11-GP-A
1
I. DIRECTORIO
DR. REYES TAMES GUERRA
SECRETARÍO DE EDUCACIÓN PÚBLICA
DR. JULIO RUBIO OCA
SUBSECRETARIO DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA
DR. ARTURO NAVA JAIMES
COORDINADOR GENERAL DE UNIVERSIDADES TECNOLÓGICAS
RECONOCIMIENTOS
ING. JAVIER TOCHIHUITL VÁZQUEZ
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. DIEGO A. GARCÍA RODRÍGUEZ
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. VICTOR MORALES GUZMÁN
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. MA. DEL ROSARIO ROSAS C.
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. ANGELINA ALONSO CAMPOS
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
T.S.U. JANET BLANCAS
UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
MATEMÁTICAS PARA INGENIEROS D.R.  20001
ESTA OBRA, SUS CARACTERÍSTICAS Y DERECHOS SON PROPIEDAD DE LA: COORDINACIÓN GENERAL DE
UNIVERSIDADES TECNOLÓGICAS (CGUT) FRANCISCO PETRARCA No. 321, COL. CHAPULTEPEC MORALES,
MÉXICO D.F.
LOS DERECHOS DE PUBLICACIÓN PERTENECEN A LA CGUT. QUEDA PROHIBIDA SU REPRODUCCIÓN PARCIAL
O TOTAL POR CUALQUIER MEDIO, SIN AUTORIZACIÓN PREVIA Y POR ESCRITO DEL TITULAR DE LOS
DERECHOS.
ISBN (EN TRÁMITE)
IMPRESO EN MÉXICO.
2
ÍNDICE
#
CONTENIDO
PÁGINA
I.
DIRECTORIO Y RECONOCIMIENTOS
2
II.
ÍNDICE
3
III.
INTRODUCCIÓN DE LA ASIGNATURA
4
IV.
UNIDADES TEMÁTICAS
UNIDAD I.
UNIDAD II.
UNIDAD III.
UNIDAD IV.
UNIDAD V.
UNIDAD VI.
UNIDAD VII.
INTRODUCCIÓN
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
MEDIDAS DESCRIPTIVAS
MODELOS PROBABILÍSTICOS
PRUEBAS DE HIPÓTESIS
ANÁLISIS DE LA VARIANZA
REGRESIÓN LINEAL
5
51
72
95
111
130
148
V.
REFERENCIAS
177
VI.
GLOSARIO
177
VII.
ANEXOS
178
Ejercicios
3
III. INTRODUCCIÓN DE LA ASIGNATURA
Dentro de las asignaturas que corresponden al Área de Ciencias Básicas Aplicadas para la formación de
Técnico Superior Universitario en Procesos Agroindustriales encontramos la de Matemáticas para
ingenieros. Dicha asignatura tiene el objetivo de: aplicar herramientas estadísticas en el análisis de
información que se genera de mediciones de procesos alimentarios, para proponer soluciones en
problemas de control de calidad e interpretar resultados de experimentos realizados, para formular
conclusiones con nivel de escala probable.
El programa que comprende está asignatura esta formada por siete unidades. La primera corresponde a
una introducción a la Probabilidad, la segunda a la Organización y presentación de datos, la tercera a
Medidas descriptivas, la cuarta a Modelos probabilísticos, la quinta a Pruebas de hipótesis, la sexta a
Análisis de la varianza y la séptima a Regresión lineal.
La asignatura de Matemáticas para ingenieros tiene como finalidad el estudio de la Probabilidad y
Estadística, así como sus aplicaciones a la resolución de problemas directamente ligados con la carrera
de Procesos Agroindustriales, los cuales están enfocados hacia el conocimiento de la estadística
propiamente que se utiliza en las empresas. Considerando que las herramientas del control estadístico
del proceso para la toma de decisiones son conocimientos fundamentales para el futuro Técnico
Superior Universitario.
4
CAPITULO 1
INTRODUCCIÓN A LA PROBABILIDAD
INTRODUCCIÓN
El alumno abordará en esta unidad temática los conceptos de probabilidad, aplicándolo al
experimento aleatorio y espacio muestral. Conocerá y distinguirá una población de datos,
determinando su muestra, ordenando los datos, tabulándolos y graficando estos datos para su
interpretación; estas herramientas estadísticas apoyaran a su formación, ya que podrá ordenar e
interpretar un conjunto de datos.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
1. - Ilustrar el concepto de experimento aleatorio con el del espacio muestral.
1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral.
Página
7
7
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1 Distinguir el concepto de experimento aleatorio con el del espacio muestral.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Definir el concepto de población y muestra
2.1 Distinguir el concepto de población y muestra.
16
16
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1. Usar el concepto de población y muestra
OBJETIVO Y CRITERIOS DE APRENDIZAJE
3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa.
3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
3.1.1. Utilizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.
4.1 Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia
relativa...
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Emplear la fórmula de probabilidad condicional en problemas del ámbito
profesional donde la ocurrencia de un evento dependa de otro
OBJETIVO Y CRITERIOS DE APRENDIZAJE
5. Definir el Teorema de Bayes
27
27
32
32
45
5
5.1 Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren
probabilidades subjetivas.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
5.1.1. Emplear en problemas del ámbito profesional que involucren probabilidades
subjetivas y aplicar el teorema de Bayes en su solución.
45
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral
posible.
Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de
experimentos aleatorios y/o datos de muestras
Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en
problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro.
Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que
involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución
6
TEMA 1
Objetivo de aprendizaje.
1. Ilustrar y relacionar el concepto de experimento aleatorio con el del espacio muestral.
Criterio de Aprendizaje.
1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral.
Didáctica de enseñanza.
Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.
La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver
algunos problemas relacionados con los juegos de azar.
Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el
caballero De Méré y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo
Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.
Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, se
publicaron varios documentos de este tipo. Jakob Bernouilli (1654-1705) Ars Conjectandi (publicado
en 1713 aunque escrito sobre 1690) y Auguste De Moivre (1667-1754) contribuyeron de forma
importante a este desarrollo.
En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis
matemático sobre los juegos de azar.
Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la
matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada
como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la
definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la
actualidad es parte de una teoría más amplia como es la teoría de la medida.
En estas notas, entenderemos por experimento aleatorio cualquier situación que, realizada en las
mismas condiciones, sea imposible de predecir el resultado que obtengamos.
Experimento Aleatorio: Es aquel que se realiza sin tener el conocimiento previo de los resultados que
se obtendrán del mismo.
Serán experimentos aleatorios, por ejemplo, los siguientes:




Lanzar un dado y considerar el resultado obtenido
Extraer una carta (o varias) de una baraja
Lanzar dos dados y hallar la suma de cada una de las caras obtenidas
Se lanza una moneda.
Si sale cara se extrae de una urna U 1, con una determinada composición de bolas de colores, una bola y
si sale cruz de extrae de una urna U 2, con otra determinada composición de bolas de colores, una bola.
A continuación se considera el color de la bola extraído.
7
Los tres primeros son ejemplos de experimentos aleatorios simples y el último un ejemplo de
experimento aleatorio compuesto
Se definen las siguientes operaciones con sucesos de un determinado experimento aleatorio
Unión de dos sucesos A, B es el suceso que se verifica si se verifica A o se verifica B o ambos.
La unión de los sucesos A y B la designaremos por (A o B) (cuando no haya lugar a confusión lo
expresaremos sin paréntesis es decir A o B)

Intersección de dos sucesos A, B es el suceso que se verifica si se verifica A y se verifica B. La
intersección de los sucesos A y B la designaremos por (A y B) (cuando no haya lugar a confusión lo
expresaremos sin paréntesis es decir A y B)

Diferencia de dos sucesos A, B es el suceso que se realiza cuando se realiza A y no B. La
diferencia de los sucesos A y B la designaremos por
A - B = (A y Bc )

Igualmente podemos considerar la diferencia B - A
Lanzamos un dado y consideramos los sucesos
A = {“obtener número par”} = {2, 4, 6}
B = {“obtener múltiplo de 3”} = {3, 6}
Puedes comprobar las operaciones unión, intersección y diferencias de dichos sucesos pasando el ratón
sobre los correspondientes diagramas
Unión:
{“números pares o múltiplos de 3”} = {2, 3, 4, 6}
Intersección:
{“números pares y múltiplos de 3”} = {6}
8
Diferencia B - A
{“múltiplos de 3 y no números pares”} = {3}
Diferencia A - B
{“números pares y no múltiplos de 3”} = {2, 4}
Puedes comprobar las diferencias simétricas pasando el ratón sobre el diagrama
Se lanza una moneda tres veces y se consideran los sucesos
A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}
B = {“sale alguna cara”} = {ccc, cc+, c+c, c++, +cc, +c+, ++c}
Unión
(A o B) = {“salen al menos dos cruces o sale alguna cara”} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc}
Intersección
(A y B) = {“salen al menos dos cruces y sale alguna cara”} = {c++, +c+, ++c}
Diferencias
A - B = (A y Bc) = {“salen al menos dos cruces y no sale alguna cara”}
B - A = (B y Ac) = {“sale alguna cara y no salen al menos dos cruces”}
Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas
 Sucesos incompatibles y complementarios
9
Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y
su complementario son incompatibles, es decir
(A y Ac) = Ø
Además (A o Ac) = E
Si lanzamos un dado y A es el suceso
A = {“obtener múltiplo de 3”} = {3, 6}
Entonces Ac = {“no obtener múltiplo de 3”} = {1, 2, 4, 5} por lo que
(A o Ac) = {1, 2, 3, 4, 5, 6} = E y (A y Ac) = Ø
 Dos sucesos complementarios son incompatibles, pero el recíproco no es cierto, es decir dos
sucesos incompatibles no tienen por qué ser complementarios.
Por ejemplo, los sucesos A = {“obtener múltiplo de 3”} = {3, 6} y
B = {“obtener múltiplo de 5”} = {5} son incompatibles pero no complementarios.
Dados dos sucesos A y B de un determinado experimento aleatorio que no sean incompatibles los
sucesos (A - B), (B - A) y (A y B) son incompatibles
Además podemos expresar tanto A como B como unión de dos sucesos incompatibles
A = (A - B) o (A y B)
B = (B - A) o (A y B)
También podemos expresar el suceso (A o B) como unión de tres sucesos incompatibles
(A o B) = (A - B) o (A y B) o (B - A)
 Suceso contenido en otro
10
Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos
A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}
B = {“salen dos cruces”} = {c++, +c+, ++c}
El suceso B es un subconjunto del suceso A. Si se verifica A necesariamente se verifica B. En este
sentido, diremos que el suceso B está contenido en el suceso A.
Es interesante observar en el caso anterior que se verifican las inclusiones siguientes:
(A y B) está contenido en A
(A y B) está contenido en B

Leyes de De Morgan
Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las
siguientes:
El complementario de la unión de dos sucesos es la intersección de los complementarios de dichos
sucesos
(A o B) c = Ac y Bc
1. El complementario de la intersección de dos sucesos es la unión de los complementarios de dichos
sucesos
(A y B) c = Ac o Bc
Consideremos el experimento aleatorio consistente en lanzar dos dados (o un dado dos veces) y sumar
la puntuación obtenida.
E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
El conjunto formado por todas las posibles sumas que pueden obtenerse se denomina Espacio Muestral
de dicho experimento aleatorio y suele designarse por E. Cada uno de los elementos de E es un suceso
elemental.
A partir de dicho subconjunto podemos considerar distintos subconjuntos de E.








A = {2, 4, 6, 8, 10, 12} = {“obtener suma par”}
B = {2, 5, 7, 11} = {“obtener una suma que sea número primo”}
C = {10, 11, 12} = {“obtener una suma mayor o igual que 10”}
D = {3, 6, 9, 12} = {“obtener suma múltiplo de 3”}
F = {2, 3} = {“que la suma que sea 2 ó 3”}
Ø = {“obtener una suma mayor que 15”} suceso imposible
E = {“Obtener una suma mayor o igual que 2 y menor o igual que 12”} suceso seguro
M = {7} = {“Obtener un 7”}
Entre los sucesos apuntados, existen sucesos simples (o elementales) (por ejemplo el M) y otros
sucesos compuestos constituidos por varios sucesos elementales. El conjunto de todos estos sucesos,
incluidos los sucesos seguro e imposible, se denomina Espacio de Sucesos (constituido por todos los
subconjuntos que pueden formarse a partir del espacio muestral E) que suele designarse por P (E).
11
Puede probarse que si el número de elementos de E es n, entonces P (E) tiene 2 n elementos.
A veces, suele ser útil utilizar un gráfico como el de la figura para hallar el espacio muestral de un
determinado experimento aleatorio.
El diagrama de árbol de la figura corresponde al experimento aleatorio de lanzar una moneda tres veces
(o tres monedas) y considerar el resultado obtenido.
El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas y es
E = {CCC, CC+, C + C, C++, +CC, + C +, ++C, +++}
Son sucesos de dichos experimento aleatorio
 A = {CCC, CC +, C + C, C++, +CC, +C +, ++C} = {“obtener al menos una cara”}
 B = {CC+, C + C, +CC} = {“obtener dos caras”}
 Ø = {“obtener 5 cruces”} suceso imposible
 C = {C++, + C +, ++C, +++} = {“obtener más cruces que caras”}
Se considera el experimento aleatorio consistente en lanzar una moneda. Si sale cara se extrae de una
urna que contiene bolas azules y rojas una bola y si sale cruz se extrae una bola de otra urna que
contiene bolas rojas y verdes.
El espacio muestral de dicho experimento aleatorio es
E = {(C, R), (C, A), (+,R), (+,V)}
12
El espacio de sucesos consta de 2 4 = 16 elementos que son
P (E) =
{{(C, R)}, {(C, A)}, {(+, R)}, {(+, V)}, {(C, R), (C, A)}, {(C, R), (+, R)},
{(C, R), (+, V)}, {(C, A), (+, R)}, {(C, R), (+, V)}, {(+, R), (+, V)}, {(C, R), (C, A), (+, R)},
{(C, R), (C, A), (+, V)}, {(C, R), (+, R), (+, V)}, {(C, A), (+, R), (+, V)}, Ø, E}
Experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces).
Espacio muestral del experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos
veces) y observar el resultado
Como E tiene 36 elementos el espacio de sucesos tiene 236 sucesos.
En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida sea 7” es
S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
13
En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida es número
primo” es
S = {(1,1), (1,2), (2,1), (1,4), (2,3), (3,2), (4,1), (1,6), (2,5), (3,4), (4,3), (5,2), (6,1), (5,6), (6,5)}
En el experimento aleatorio del lanzamiento de dos dados, el suceso “en los dos lanzamientos se
obtiene número primo” es
S = {(2,2), (2,3), (2,5), (3,2), (3,3), (3,5), (5,2), (5,3), (5,5),}
Complementario de un suceso A es el suceso que se verifica si no se verifica A.
El complementario de A, lo designamos por Ac y también por (no A)
En el experimento aleatorio consistente en lanzar dos dados y considerar la suma de ambos, los sucesos
{“obtener suma par”} y {“obtener suma impar”} son complementarios. También son complementarios
los sucesos {“obtener suma mayor o igual que 5”} y {“obtener suma menor que 5”}.
 En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una
cara”} y {“no obtener ninguna cara”} son complementarios.
14
El complementario del suceso A = {“en los dos lanzamientos se obtiene número primo”} (en amarillo)
es el suceso B = {“en alguno de los dos lanzamientos (o en ambos) no se obtiene número primo”} (en
verde)
Evidencia parcial
Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.
Evaluación parcial
Entrega de Ta.1
15
TEMA 2
Objetivo de aprendizaje.
2. Definir el concepto de población y muestra.
Criterio de Aprendizaje.
2.1 Distinguir el concepto de población y muestra.
Didáctica de enseñanza.
 Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar. Una
población está determinada por sus características definitorias. Por lo tanto, el conjunto de elementos
que posea esta característica se denomina población o universo. Población es la totalidad del fenómeno
a estudiar, donde las unidades de población poseen una característica común, la que se estudia y da
origen a los datos de la investigación.
 Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea representativo
de toda la población.
Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie determinada de
especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una población.
Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población
determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo
que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la
información recolectada depende en gran manera de la forma en que fue seleccionada la muestra.
Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra
representativa de la misma.
La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las
características que definen la población de la que fue extraída, lo cual nos indica que es representativa.
Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra.
Leyes del método de muestreo.
El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son:
 Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P,
y si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la
cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.
Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación entre el número de
casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son
igualmente posibles. El método de establecer la probabilidad es lo que se denomina cálculo de
probabilidad.

De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más
directamente al método de muestreo:
16
Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es
casi seguro que tenga las características del grupo más grande.

Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de
que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte
igual del mismo grupo, varíe en dirección opuesta.

Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es
representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la
primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de
esperar encontrar igual proporción en la segunda muestra.

Tipos de muestras.
Muestreo aleatorio simple: la forma más común de obtener una muestra es la selección al azar. Es
decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se
cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios.
Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son
proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su
presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el
fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la
selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio.
Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una cuota para las
diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra
debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El
muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las
categorías.
Muestreo intencionado: también recibe el nombre de sesgado. El investigador selecciona los elementos
que a su juicio son representativos, lo que exige un conocimiento previo de la población que se
investiga.
Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las
unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas.
Muestreo tipo: la muestra tipo (master simple) es una aplicación combinada y especial de los tipos de
muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la
muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el
módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada
investigación.
Para ilustrar, tomemos el siguiente ejemplo: Supóngase que se tienen que estudiar las edades una
población de radioescuchas, por ser tan grande la cantidad de ellos, solamente se encuestan a 350 de
ellos, los cuales en este caso serán la muestra de dicha población.
17
Las muestras representativas de su población son aquellas que poseen las mismas características de la
población que se desea estudiar.
Las poblaciones pueden ser finitas o infinitas
Poblaciones infinitas: Todos los juegos o fenómenos cuyos resultados están indeterminados
cuantitativamente ó aquellas poblaciones que por su gran número de elementos, resulta prácticamente
imposible trabajar con todos ellos.
Poblaciones finitas: Todos los juegos o fenómenos cuyos resultados están determinados
cuantitativamente, ya que se pueden conocer cantidades específicas.
Función: Es establecer una relación entre dos elementos distintos, como son población y tiempo, con
base en esto podemos decir que la población esta en función del tiempo: p= f (t), también recibe el
nombre de función explícita, y consta de una variable independiente (t), y una variable
dependiente(p).Así podemos decir que B= a una función implícita ya que consta de dos variables
independientes (p,t), esto quiere decir: que B esta en función del paso del tiempo, es decir : B=f(p.t).
Gráfica: Una gráfica es una representación de la relación entre variables, muchos tipos de gráficos
aparecen en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la
de representar los valores tabulados obtenidos de los muestreos o los datos del total de la población.
Constante: Un elemento constante es aquel que durante un intervalo definido siempre va a valer lo
mismo, conservando sus características.
Variable: Es un elemento que durante un intervalo definido se va a comportar de distintas formas. Las
variables que se manejan en estadística moderna son aleatorias.
Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en
el espacio muestral de un experimento aleatorio.
Existen Variables continuas y Variables discretas.
Variable Continua: Es un rango que puede concebirse como un continuo de valores.
Variables discretas: Son aquellas que toman determinado valor exacto como: El No. De hijos de una
familia.
Ecuación: Las ecuaciones son enunciados del tipo A = B donde A = miembro ó lado izquierdo, y B =
miembro derecho al cual se le pueden hacer una serie de operaciones.
Filas de datos: Consiste en datos que no han sido ordenados y que simplemente han sido tomados
como tal. Un ejemplo sería: Estatura de los estudiantes, que posteriormente se agrupan
numéricamente.
Ordenación: Consiste en ordenar datos en forma creciente y decreciente y la diferencia entre el mayor
y el menor de los datos recibe el nombre de rango.
Distribución de frecuencia:
18
Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el
número de individuos que pertenecen a cada clase llamado frecuencia de clase.
Una disposición tabular de los datos por clases junto con las frecuencias correspondientes de clase se
llama distribuidores de frecuencia o tablas de frecuencia.
Tipos de intervalos: Un intervalo de clase que, al menos en teoría carece de Limite Superior o Limite
Inferior indicado. Se llama intervalo de Clase Abierto, ejemplo: refiriéndonos a edades de 65 años o
más.
Muestras con remplazamiento y sin remplazamiento
Supóngase que f(x) es una población, donde X1, X2, X3... Xn son las muestras. Se dice que es una
muestra X1 sin remplazamiento, si X1 se analiza sin regresarla a la población, si por el contrario se
analiza la muestra y se regresa a la población antes de realizar cualquier otro experimento, será una
muestra con remplazamiento.
Ejemplo 1)
Supóngase que se tienen 12 canicas
4 ROJAS
4 VERDES
4 NEGRAS
¿Qué probabilidad existe de extraer una canica roja, con remplazamiento y sin remplazamiento?
a) Con remplazamiento:
4 / 12
b) Sin remplazamiento:
4 / 11
Variables aleatorias ó muestras aleatorias
Suponga una población f(x) donde X1, X2, X3,...,Xn son las muestras.
X1
X2
X3
X4
Xn
Se llama muestreo sin reemplazo cuando de una población tomamos X muestras sin devolverlas.
Se llama muestreo con reemplazo cuando una población f ( x ) toma una o varias muestras ingresándola
a la población.
Suponga una población f( x ) donde f( x ) son 1000 resistencias de diferentes valores, si tomamos de
muestras 10 resistencias las analizamos y posteriormente las regresamos estamos hablando de muestras
con remplazamiento, esto sería un ejemplo de población infinita que resulta de una población finita.
Muestras Aleatorias:
Lógicamente la confiabilidad de las conclusiones extraídas concernientes a una población depende de
si la población ha sido escogida correctamente de tal modo de que represente la población lo
19
suficientemente bien, uno de los problemas importantes de la diferencia estadística es como recoger
una muestra.
Una forma de hacer esto para poblaciones finitas es asegurarse de que cada miembro de la población
tenga igual oportunidad de encontrarse en la muestra lo cual se conoce como muestra Aleatoria.
Ejemplos de Población, muestra y conceptos
Ejemplo 1:
Determine si se trata de población finita o infinita:
a) Población de libros de la biblioteca de la UT.
Población finita, porque el número de libros se puede contar.
b) Población de varones de México entre 18 y 22 años.
La población es muy grande pero se puede contar por lo tanto es finita. Para contabilizar el número de
varones entre 18 y 22 años se puede recurrir al INEGI, que es la oficina de censo de la población y la
vivienda y se podría obtener la información requerida.
c) Población de todas las personas que podrían tomar aspirinas.
La población es infinita.
d) Población de todos los focos de 40 watts que serán producidos por la compañía Sylvania.
La población es infinita, no puede predecirse cual será la producción.
Ejemplo 2:
a) Escribe mínimo 3 ejemplos de variables cualitativas o atributivas (VA), de variables cuantitativas
continuas (VCC), y variables cuantitativas discretas (VCD):
VA ===> Personalidad, carácter, paciencia, I.D. de cada alumno (aunque es un número entero es
atributo de una persona), número de empleado, RFC.
VCC ===> Edad, peso, altura, estatura, temperatura, calificaciones, promedio, medida de inteligencia.
VCD ===> Hijos, propiedades, 1 año, número de parientes, número de producción de autos, número de
alumnos, número de calculadoras vendidas, carreras, universidades, unidades de las materias
b) Una muestra que consta de 4 personas en un gimnasio fue cuestionada sobre "el color de short que
gustaba vestir para hacer ejercicio", la "marca" y la "talla" que usa. Los datos recolectados fueron:
Short de color rojo, verde, negro y azul. Estos datos fueron reescritos con clave:
Verde = 2, lila = 3 y azul = 3, rojo = 4
Las tallas fueron: 38, 32, 36, 34
Las marcas fueron: Cristian Dyor, Guess, Love y Patito respectivamente.
20
Detectar las variables, el promedio de cada variable y el tipo de variable.
Solución:
P1) Se detectan las variable
V1 = Color del short
V2 = Marca
V3 = Talla
P2) La V1 (Color del short) es cualitativa multinomial.
P3) Promedio
A pesar de que los datos fueron reescritos como 1, 2, 3, 4, no tendría sentido encontrar el promedio de
la muestra sumando y dividiendo entre 4: (verde + lila + azul + rojo)/4 o como (1 + 2 + 3 + 4)/4. Esto
último a pesar de ser un número sigue siendo variable cualitativa y el resultado del promedio no tiene
sentido.
P4) La V2 (Marca) es cualitativa multinomial.
P5) Promedio. Obtener el promedio de las marcas no tiene sentido.
P6) La V3 (Talla) es cuantitativa discreta.
P7) Promedio. (38 + 32 + 36 + 34)/4 = 35
Ejemplo 3:
a) Un fabricante de medicamentos está interesado en la proporción de personas que padecen
hipertensión (presión arterial elevada) cuya condición pueda ser controlada por un nuevo producto
desarrollado por la empresa. Se condujo un estudio en el que participaron 5000 personas que padecen
de hipertensión, y se encontró que 80% de las personas pueden controlar su hipertensión con el
medicamento. Suponiendo que las 5000 personas son representativas del grupo de hipertensión,
conteste las siguientes preguntas:
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés
4) Identifique la estadística y proporcione su valor
5) ¿Se conoce el valor del parámetro?
Solución:
1) ¿Cuál es la población? Todas las personas que padecen hipertensión (presión arterial elevada), cuya
presión pueda ser controlada por un nuevo producto desarrollado por la empresa.
2) ¿Cuál es la muestra? Un estudio de 5000 personas que padecen de hipertensión.
21
3) Identifique el parámetro de interés. La proporción de la población que padecen hipertensión y que
puede ser controlada por un nuevo producto desarrollado por la empresa. Dicho de otra manera, es la
proporción de la población para la que es eficaz el medicamento.
4) Identifique la estadística y proporcione su valor. La proporción de la población para la que es eficaz
el medicamento es del 80%.
5) ¿Se conoce el valor del parámetro? No se conoce y difícilmente se puede encontrar.
b) Un comunicólogo desea calcular el "rating" del noticiario de "Joaquín López Doriga". Se condujo un
estudio en el que participaron 1000 televidentes, y se encontró que el 60% de las personas ven el
noticiario. Suponiendo que las 1000 personas son representativas del grupo de televidentes, conteste las
siguientes preguntas:
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés
4) Identifique la estadística y proporcione su valor
Solución:
1) ¿Cuál es la población? Todos los televidentes.
2) ¿Cuál es la muestra? Un estudio de 1000 televidentes.
3) Identifique el parámetro de interés. El "rating" del noticiario de” Joaquín López Doriga". O la
proporción de la población que ve el noticiario de” Joaquín López Doriga".
4) Identifique la estadística y proporcione su valor. La proporción de la población que ve el noticiario
de” Joaquín López Doriga" es del 60%.
c) Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la
siguiente información de cada pieza:
A: Defectuosa o no defectuosa
B: El número de identificación del trabajador que ensambló la pieza
C: El peso de la pieza
1) ¿Cuál es la población?
2) La población ¿es finita o infinita?
3) ¿Cuál es la muestra?
4) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):
Solución:
1) ¿Cuál es la población? Todas las piezas ensambladas de una línea de montaje.
22
2) La población ¿es finita o infinita? Infinita.
3) ¿Cuál es la muestra? Las piezas seleccionadas y ensambladas de una línea de montaje.
4) Clasifique las respuestas para cada una de las tres variables como variables cualitativas o atributivas
(VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):
A: Defectuosa o no defectuosa. VA. Variable atributiva binomial.
B: El número de identificación del trabajador que ensambló la pieza. VA. Variable atributiva
Multinomial.
C: El peso de la pieza. VCC.
d) Se hizo un estudio con 500 estudiantes de la UDLA y se registro la siguiente información de cada
uno:
A: Número de identificación (ID)
B: Edad
C: Estatura
D: Asiste "Si" o "No" a discotecas los jueves en la noche
Suponiendo que los 500 estudiantes son representativos de este estudio, se encontró que el 70 % asiste
a discotecas los jueves en la noche. Conteste las siguientes preguntas
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés.
4) Identifique la estadística y proporcione su valor.
5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).
Solución:
1) ¿Cuál es la población?
Todos los estudiantes de la UT.
2) ¿Cuál es la muestra?
500 Número de estudiantes de la UT.
3) Identifique el parámetro de interés.
La proporción de la población que asiste a una discoteca.
4) Identifique la estadística y proporcione su valor.
La proporción de la población que asiste a una discoteca cuyo porcentaje es del 70%.
5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).
A: Número de identificación (ID). VA. Variable atributiva Multinomial.
23
B: Edad. VCC
C: Estatura. VCC
D: Asiste "Si" o "No" a discotecas los jueves en la noche. Variable atributiva Binomial.
Número de estudiantes de la UT que va a las discotecas los jueves en la noche.
Al contabilizar las respuestas "Si" o "No" asiste a discotecas los jueves en la noche, se convierte en el
número de estudiantes que va las discotecas. VCD
e) Un estudio está interesado en determinar algo sobre el promedio del valor en $ de las computadoras
que pertenecen al cuerpo docente de la UT. Diga:
1) ¿Cuál es la población?
2) La población es ¿finita o infinita?
3) Dar una muestra
4) ¿Cuál es la variable?
5) ¿Que tipo de variable es la variable?
6) Dar un dato
7) Dar todos los datos de la muestra
8) ¿Cuál es el experimento?
9) ¿Cuál es el parámetro?
10) ¿Cuál es la estadística que se encuentra?
Solución:
1) ¿Cuál es la población?
Colección de todas las computadoras que pertenecen a todos los miembros del cuerpo docente de la
universidad.
2) La población es ¿finita o infinita?
El número de profesores de la UT puede contarse, por lo que se trata de una población finita.
3) Dar una muestra
Cualquier subconjunto de esa población. Por ejemplo, todas las computadoras que pertenecen a los
profesores del departamento de Ingeniería en Sistemas Computacionales.
4) ¿Cuál es la variable?
"El valor en $ de cada computadora en particular"
5) ¿Que tipo de variable es la variable?
Variable cuantitativa continua (VCC)
6) Dar un dato
Por ejemplo la computadora de la "Doctora Pilar Gómez" que está valuada en $15,000.
7) Dar todos los datos de la muestra
9 personas constituyen el departamento de Ingeniería en Sistemas Computacionales, cuyas
computadoras valen:
$15000, $20000, $18000, $35000, $22000, $16000, $30000, $25000, $8000
8) ¿Cuál es el experimento?
24
Los métodos aplicados para seleccionar las computadoras que integran la muestra y determinar el valor
de cada computadora de la muestra. El método aplicado fue preguntando a cada miembro del
departamento. Otra forma de realizarlo sería preguntando por medio de un memorándum o por medio
de un e-mail.
9) ¿Cuál es el parámetro?
Es sobre el que se está buscando información, es decir, el promedio del valor de todas las
computadoras de la población:
prom = (15000 + 20000 + 18000 + 35000 + 22000 + 16000 + 30000 + 25000 + 8000)/9 =
prom = $21,000
10) ¿Cuál es la estadística que se encuentra?
Es el valor promedio de todas las computadoras de la muestra
f) La siguiente tabla representa las características de todos los empleados de tiempo completo de la
fábrica de Shampoo "Patito" al 1o. de enero del año en curso.
No. de Empleados Color Sexo Puesto
empleado
ojos
Años de Salario
Servicio Anual
en $
1
Ana
azul
M
Ingeniero
2
2
Miguel
café
H
Comunicólogo 10
70000
3
Andrea
negro M
Mecánico
23
65000
4
Jorge
negro H
Secretaria
5
20000
5
Eva
azul
Obrera
8
18000
6
Alejandro verde H
Vigilante
10
14000
7
Teresa
negro M
Obrera
2
18000
8
Susana
café
Conserje
7
12000
M
M
70000
Diga:
1) ¿Cuál es la población?
2) La población es ¿finita o infinita?
3) Dar una muestra
4) ¿Cuál es la(s) variable(s)?
5) ¿Que tipo de variable(s) es (son)?
6) Dar un dato
7) Dar todos los datos de una muestra
Solución:
1) ¿Cuál es la población?
Es posible obtener en este ejemplo varias poblaciones, dado que hay 6 variables (los encabezados de
las columnas), esta tabla contiene 6 poblaciones. Las poblaciones son:
Población de empleados por Número de empleado , la población de empleados por Color ojos, la
población de empleados por Sexo, la población de empleados por Puesto, la población de empleados
por Años de Servicio y la población de empleados por Salario Anual.
25
2) La población es ¿finita o infinita?
Todas las poblaciones constan de 8 empleados por lo que es finita.
3) Dar una muestra
Los últimos 3 salarios de la población de empleados por Salario Anual.
4) ¿Cuál es la(s) variable(s)?
Los encabezados de las columnas 1 y de la 2 a la 6 muestran algunas características de las unidades
elementales (personas) que son precisamente las variables: número de empleado, color de ojos, sexo,
puesto, Años de Servicio y Salario Anual.
5) ¿Que tipo de variable(s) es (son)?
Variables Cualitativas: Número de empleado, color de ojos, sexo, puesto.
Variables Cualitativas Binomial: sexo
Variables Cualitativas Multinomiales: Número de empleado, color de ojos, puesto.
Variables Cuantitativas: Años de Servicio y Salario Anual.
Variables Cuantitativas Discretas: No hay.
Variables Cuantitativas Continuas: Años de Servicio y Salario Anual.
6) Dar un dato
Sueldo anual = $65000
7) Dar todos los datos de una muestra
Los últimos 3 salarios de la población de empleados por Salario Anual, son:
$1400, $18000, $12000
26
TEMA 3
Objetivo de aprendizaje.
3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa.
Criterio de Aprendizaje.
3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa
Didáctica de enseñanza.
Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o
datos de muestras
Supóngase un experimento cualquiera, por ejemplo, el número dos en el lanzamiento de un dado. El
conjunto de todos los resultados posibles se llama universo o espacio de la muestra, en este caso, los
números de 1 a 6 en el lanzamiento del dado en cuestión.
Usualmente se utiliza el concepto de frecuencia para ilustrar el concepto de probabilidad. Supóngase
que se estudian n resultados de un experimento, de los cuales m se consideran ocurrencias exitosas de
un resultado deseado, E y P(E) denota la probabilidad de ocurrencia de dicho resultado; la relación
entre el número de resultados exitosos m y el número de resultados posibles n, es una medida
aproximada de la probabilidad de ese resultado, es decir:
Esto es rigurosamente cierto cuando n es muy grande. Más formalmente, se deberá escribir así:
Donde:
P(E): Probabilidad que el resultado E ocurra.
E: Resultado que interesa analizar.
M: Número de veces que ocurre E.
n: Número de veces que se ejecuta el experimento.
Por ejemplo, si se desea saber cuál es la probabilidad de ocurrencia de que aparezca el número 2 en la
cara superior cuando se lanza un dado, se podrían hacer lanzamientos seguidos y anotar cuántas veces
aparece cada número, en particular el 2. Si esto se repite varias veces, entonces la relación entre el
número de veces que apareció el 2 y el número de lanzamientos será un estimativo de la probabilidad.
Esta frecuencia relativa tiende a un número; en el caso de un dado que no esté cargado, esta frecuencia
tiende a 1/6.
Una variable aleatoria está definida por una función que asigna un valor de dicha variable aleatoria a
cada punto del universo. Por ejemplo, la variable aleatoria puede ser el valor que aparezca en la cara
superior del dado, o el cuadrado de este valor, etc. En este ejemplo, E=2, m es el número de veces que
aparece el número 2 y n es el número de lanzamientos.
Propiedades básicas de la probabilidad
27
A continuación se presentan algunas propiedades básicas de la probabilidad.
1) La probabilidad de un resultado del universo es una cantidad menor o igual que uno y mayor o igual
que cero. Esto se explica porque la probabilidad está definida por la proporción entre un número de
casos “exitosos” y el número total de casos. El número de casos “exitosos” es menor que el número
total de casos.
Ejercicio
Lanzar una moneda 50 veces. Construir y completar en la hoja de cálculo la siguiente tabla de ejemplo:
Construir una gráfica de los resultados con n en las abcisas y m/n en las ordenadas, como se ilustra a
continuación.
FRECUENCIA RELATIVA ACUMULADA DEL LANZAMIENTO DE UNA MONEDA
2) La probabilidad de un resultado que no puede ocurrir, o sea que no pertenece al universo, es cero.
3) La probabilidad del universo es uno. Es decir, la probabilidad de que ocurra alguno de los resultados
de todo el conjunto posible de ellos es P(E1+E2+...+Em) y es igual a 1, donde (E1,E2,...,Em), son
todos los resultados posibles, mutuamente excluyentes y exhaustivos del universo.
Nota: Se dice que unos resultados son mutuamente excluyentes cuando la ocurrencia de cualquiera de
ellos elimina la ocurrencia de cualquier otro.
Todos los resultados posibles mi suman n, o sea:
28
m1+m2+m3+...mk = n
(3)
Si esta ecuación se divide por n, entonces la suma de las frecuencias relativas es igual a 1.
m1/n+m2/n+m3/n+...mk/n = n/n = 1
Así pues en el límite:
(4)
P(E1)+P(E2)+P(E3)+...P(Ek) = 1
(5)
4) Si E y F son resultados mutuamente excluyentes, o sea que sólo uno de ellos puede ocurrir,
entonces la probabilidad de que ocurra E o F es P (E+F) = P (E) + P(F). Nuevamente, en el
lanzamiento de un dado de seis caras numeradas de 1 a 6, sólo un número aparecerá en la cara superior,
por lo tanto, los resultados (E2) y (E6), o sea que aparezca 2 en un caso o que aparezca 6 en el otro, son
resultados mutuamente excluyentes. La probabilidad de que ocurra E2 o E6 es de 1/6+1/6 o sea, 1/3.
5) Si E y F son resultados independientes, esto es, que la ocurrencia de uno no afecta la ocurrencia del
otro, la probabilidad de que ocurran simultáneamente P(EF), es P(E) x P(F). Tomando como ejemplo
el dado de seis caras, el hecho que en el primer lanzamiento del dado aparezca un 2, no influye para
que en el segundo lanzamiento aparezca cierto número; los lanzamientos son resultados
independientes. Entonces, la probabilidad de que en el primer lanzamiento aparezca un 2 y en el
segundo aparezca un 6 será 1/6x1/6, o sea, 1/36.
NOTA: Obsérvese que cuando se trata de resultados mutuamente excluyentes y se desea saber la
probabilidad de que uno de los dos ocurra, se expresa con frases ligadas por o; en el caso de resultados
independientes y si se desea calcular la probabilidad de que ambos ocurran, las frases se ligan con y.
Estas propiedades son formales pero coinciden con las nociones intuitivas de probabilidad.
Eventos y sus probabilidades
En la realidad los hechos no son tan simples como en el ejemplo del dado. Ocurren combinaciones que
complican un poco la situación. El cálculo de sus probabilidades es más complejo.
Eventos y sus probabilidades
La realidad es compleja y ocurren combinaciones de resultados; la combinación de varios resultados
origina un evento. A través de un ejemplo se ilustrará esta idea.
Ejemplo
Supóngase que se desea analizar los resultados de una inversión $1.000 a tres años. El resultado de
cada año es la ocurrencia de un ingreso por valor de $600 o $0. Los resultados posibles son:
(NNN) = m1
(NNS) = m2
(NSN) = m3
(NSS) = m4
(SNN) = m5
(SSN) = m6
(SNS) = m7
(SSS) = m8
El orden de las letras se refiere año 1, 2 ó 3 y S indica si hay ingreso y N si no lo hay.
29
(NSS) significa un flujo de caja como este:
Y así para los demás casos. Las probabilidades de que el resultado sea cero son:
P(N)1 = ,3
P(N)2 = ,3
P(N)3 = ,3
NOTA: Se supone que los eventos son independientes entre sí. Esto significa que el resultado positivo
de un año no influye en la probabilidad de que, en los años siguientes, el resultado sea también
positivo. Esto en la realidad puede que no ocurra. Sin embargo, para efectos del análisis, se hará caso
omiso de esta consideración.
Entonces, las probabilidades asociadas a cada resultado combinado son:
Estos resultados se denominarán puntos. Los eventos serán una combinación cualquiera de puntos. Así
se puede pensar en el evento, “por lo menos un año con ingreso”, el cual incluiría los puntos m2, m3,
30
m4, m5, m6, m7 y m8, o en el evento “a lo sumo un año con ingreso cero”, el cual incluiría los puntos
m4, m6, m7 y m8.
Si la probabilidad de que ocurra el ingreso es diferente a 70%, hay que introducir los valores adecuados
en los cálculos.
La probabilidad de estos eventos será la suma de la probabilidad de los puntos. En el primer evento, la
probabilidad será de:
0,063+0,063+0,147+0,063+0,147+0,147+0,343 = 0,973
En el segundo caso de:
0,147+0,147+0,147+0,343 = 0,784
Evidencia parcial
Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o
datos de muestras
Evaluación parcial
Entrega de Ta.2
31
TEMA 4
Objetivo de aprendizaje.
4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.
Criterio de Aprendizaje.
4.1. Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.
Didáctica de enseñanza.
Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del
ámbito profesional donde la ocurrencia de un evento dependa de otro.
Probabilidad condicional
Generalmente hablando, la probabilidad condicional de un evento A dado otro evento B, denotada
P(A|B) es la probabilidad de que el evento A ocurra cuando sabemos que el evento B ocurrió. Esta es
razón por la cual se llama condicional a esta probabilidad. La probabilidad de que el evento A ocurra
está condicionada por la ocurrencia de B. Esta información adicional sobre A se incluye en el cómputo
de su probabilidad condicional cuando analizamos los resultados posibles que se pueden observar
cuando sabemos que B ha ocurrido.
Probabilidad condicional como la razón de dos áreas
En algún punto de nuestras vidas, hemos jugado tirando dardos a un tablero. Supongamos que tenemos
un tablero como el de al lado y tiramos un dardo. Usualmente, mientras más cerca del centro aterrice el
dardo más puntos anotamos. Si sabemos que el dardo aterrizó en A, ¿cuán probable es que haya
aterrizado en B?
Por simplicidad, supondremos que tenemos muy buena puntería y que el dardo siempre cae en el
tablero S. Esto significa que la probabilidad de que el dardo aterrice en el tablero es 1. Suponemos
además, que S, A, B, C se refieren a los discos completos y no tan sólo a la franja. Así S es un disco
que contiene al disco A, el que a su vez incluye el disco B. Este último incluye el disco C.
Podemos relacionar la probabilidad de que un dardo aterrice en cualquier región directamente al área
de la región. Les asignaremos probabilidades a las varias regiones en la tabla tomando la razón del área
de la región al área del tablero. Esta asignación es razonable, ya que mientras más grande es la región,
más probable debe ser que el dardo aterrice allí. Estamos considerando el área del tablero S como una
unidad contra la cual comparar las otras áreas, además, si comparamos el área de S consigo misma
obtendremos una razón de 1, por esto es razonable decir que el área de S es igual a su probabilidad, 1.
Con esta suposición, el área de cada disco es igual a la probabilidad de que el dardo caiga en el disco.
32
Denotaremos el evento que el dardo aterrice en la región S, A, B o C por el nombre de la región.
Supongamos que la razón del área de región A a S es 1/2, de la región B a S es 1/10 y de la región C a
S es 1/60. Según la asignación de probabilidad que hicimos, tenemos que P(A) = 1/2, P (B) = 1/10, P
(C) = 1/60 y P (S) = 1.
Ahora hacemos el siguiente experimento: igual que con el juego de colocar la cola al burro, nos
vendamos los ojos y lanzamos el dardo. Un juez nos dice que aterrizó en la región A. Entonces
preguntamos ¿cuál es la probabilidad de que haya aterrizado en B? Si no hacemos uso del hecho de que
el dardo aterrizó en A, contestaremos la probabilidad buscada es 1/10. Pero sabemos que el dardo
aterrizó en A, que B está contenido totalmente en A y que el área de B es una quinta parte del área de
A, entonces la respuesta correcta es 1/5, estableciendo que P (B|A) = (1/10)/(1/2) = 1/5.
Esta expresión se justifica con el siguiente argumento. Como sabemos que el dardo ha aterrizado en A,
el área de A ahora llega a ser una nueva unidad contra la cual medir otras áreas, esto explica el
denominador. El numerador corresponde al área en común de las regiones A y B. Dado el hecho que el
dardo aterrizó en A, la única manera en que el dardo puede aterrizar también en la región B es que haya
aterrizado en ambas regiones. Ahora la región B está contenida en la región A, por lo cual A∩B= B y P
(A∩B) = P (B).
Pregunta
¿Cuál es la probabilidad que el dardo haya aterrizado en A si sabemos que aterrizó en B?
Como sabemos que B está contenido totalmente en A, vemos que si el dardo aterriza en B entonces
tiene que haber aterrizado en A. Siguiendo este razonamiento tenemos:
P (A|B)= (área de A también en B)/ (área de B)= (área de B)/ (área de B)= 1.
Pregunta
Si el dardo aterrizó fuera de B, ¿cuál es la probabilidad que haya aterrizado en C?
Un tablero general de dardos
El tablero de la derecha nos presenta una situación más general. En este caso ninguna región (excepto
S) contiene totalmente cualquier otra región, pero los argumentos todavía son válidos. Supongamos que
las áreas de S, A, B y C son como antes. Supongamos ahora que el área en la intersección de las
regiones A y B es 1/ 30. Todavía podemos preguntar las mismas preguntas.
33
Para calcular P (B|A) debemos darnos cuenta de que B tiene un pedazo pequeño en común con la
región A. Este pedazo tiene área igual a 1/ 30. Si sabemos que el dardo aterrizó en A, para que haya
caído en B, debe haber aterrizado en esta pequeña región en común. La región A es nuestra unidad de
comparación. Comparamos el área en la intersección de A y B con el área de A para obtener nuestra
contestación. Así P (B|A) es igual a la proporción (1/ 30) / ( 1/2)= 1/ 15. Este resultado se puede
interpretar como el número de veces que la región en común entre A y B cabe en la región A.
La respuesta a P (A|B) no es tan fácil de hallar como antes. Sabemos ahora que el dardo aterriza en la
región B. Debemos hallar la proporción del área de la intersección de A y B al área de B. Ahora la
región B es nuestra unidad y así P (A|B) es igual a (1/30) / (1/10)= 1/3.
Un ejercicio fácil de resolver es hallar P (A|C). Como A y C son disjuntos, si el dardo aterrizó en C
sabemos que es imposible que haya aterrizado también en A, por esta razón la probabilidad buscada
debe ser cero.
Una representación relacionada
Otra forma de representar la probabilidad condicional se puede ver en el siguiente ejemplo.
Supongamos que tomamos una muestra al azar de 100 estudiantes y obtenemos los siguientes
resultados:
15 mujeres reciben ayuda económica y trabajan
45 mujeres reciben ayuda económica
20 mujeres trabajan
55 de los estudiantes son mujeres
25 estudiantes reciben ayuda económica y trabajan
60 estudiantes reciben ayuda económica
40 estudiantes trabajan
Se puede traducir estos datos en proporciones o porcentajes y representar en un diagrama de Venn tal
como a la derecha. El conjunto W representa todas las mujeres en la muestra, F el conjunto representa
los estudiantes que reciben ayuda económica y J el conjunto de estudiantes en la muestra que trabajan.
34
Nos proponemos seleccionar al azar una persona de estos 100 estudiantes en la muestra. Entonces
podemos hablar acerca de la probabilidad que la persona seleccionada es una mujer, por ejemplo. Sin
temor a confundirnos, usaremos los nombres F, J y W para denotar el evento que la persona
seleccionada recibe ayuda económica, trabaja o es una mujer, respectivamente.
Entonces P (W)= .30 + .05 + .05 + .15 = .55, por ejemplo. De este diagrama de Venn podemos
contestar rápidamente muchas preguntas que a primera vista parecen ser muy complicados, tal como,
¿qué proporción de estudiantes son mujeres que no trabajan y reciben ayuda económica? Esta pregunta
es equivalente a encontrar P (W y F y no J). La solución, .30 se encuentra en la intersección de los tres
conjuntos W, no J, F.
La probabilidad condicional se ve en situaciones donde queremos saber, por ejemplo‚ qué proporción
de estudiantes que trabajan son mujeres. Esto es equivalente a encontrar P (W | J). La proporción de
estudiantes que trabajan es .40, la proporción de mujeres que trabajan es .20. De esta manera la
proporción de mujeres de entre todos los estudiantes que trabajan‚ es .20/ .40= .50, es decir, la mitad de
los estudiantes que trabajan son mujeres. Igual a las ideas desarrolladas previamente podemos escribir
la solución como P (W | J ) = P (W y J)/ P (J) = .20/ .40 = .50.
El diagrama de Venn que representa los resultados obtenidos en la encuesta parece también un tablero
de dardos. La probabilidad de que el dardo caiga en cualquiera de esas regiones está dada por la
proporción de estudiantes representados en esa región.
Probabilidad condicional y el conteo de resultados
Lanzamos dos dados balanceados, uno rojo y el otro verde. El espacio muestral de este experimento
consta de 36 pares ordenados tal como en la tabla más abajo.
Dejemos que R y G denoten el valor observado en la cara del dado rojo y en el dado verde,
respectivamente y X la suma de los valores observados, es decir, X = R + G. Si suponemos que los
dados están balanceados, entonces los 36 resultados distintos del experimento son igualmente
probables. Por la forma como se lleva a cabo el experimento, vemos que el valor observado en un dado
no está relacionado con el valor en el otro dado, es decir. El valor obtenido en un dado es independiente
del obtenido en el otro. De estas suposiciones tenemos que P (R = r) = P (G = g) = 1/ 6 y que P (R= r,
G= g)= 1/ 36 para r, g= 1,2, ..., 6.
En esta situación muchas preguntas acerca de la probabilidad de eventos particulares se pueden reducir
a contar el número de elementos en el conjunto apropiado.
35
Espacio muestral de los resultados al tirar dos dados
Pregunta
Encontremos la probabilidad que el número de puntos en el dado rojo es menor o igual a 3: P(R 3).
Para encontrar esta probabilidad debemos contar el número de pares en la tabla para los cuales R ≤
Vemos que hay 18 de estos pares de un total de 36 pares posibles así obtenemos P (R ≤
1/2.
Pregunta
¿Cuál es la probabilidad que la suma X de los valores observados en los dos dados es menor de 6, es
decir, P (X< 6)?
El número de pares donde observamos esta situación es 10, de un total de 36 pares posibles, por eso
debemos tener P(X < 6) = P (X ≤
Supongamos estás en tu casa y un amigo te invita a jugar
un juego donde se lanzan dos dados, tal como Parchís. A ti te interesa que la suma de los puntos en los
dados sea 9. Tiras los dados, pero no miras el resultado. Tu amigo te dice que la suma de los dados es
mayor de 7. ¿Te dice algo este dato? ¿Cuáles son ahora tus oportunidades de haber obtenido 9? Si
hubiera dicho que la suma era menor de siete sabrías de seguro que perdiste.
Necesitamos calcular P ( X= 9 | X> 7). Antes de tirar los dados, sabías que la probabilidad de ganar,
P(X=9) era igual a 4/ 36. ¿Cambió esto? En la Tabla 2 están señalados todos los pares donde X > 7 y
los pares donde X = 9.
Regiones donde X > 7 y X = 9
36
Como sabemos que X > 7 el resultado observado debe estar dentro del triángulo azul. Allí hay 15 pares
distintos de los cuales cuatro son consistentes con X= 9, por esto P (X = 9| X> 7)= 4/ 15‚ esto significa
que tus oportunidades de haber ganado han aumentado.
El resultado se puede obtener de la siguiente forma. La proporción de pares donde X > 7 es 15/ 36. La
proporción de pares donde X > 7 y X = 9 es 4/ 36, siguiendo las ideas anteriores tenemos que P ( X = 9|
X > 7) = (4/36) ¸ (15/ 36) = 4/ 15. Igual que antes esta representación se asemeja a un tablero de dardos
y el resultado se obtiene al comparar el "área" de la región que representa X = 9 con el "área" de la
región que representa X > 9. De igual manera, también se asemeja a un diagrama de Venn.
Considera la probabilidad de que en el dado Rojo se observe un tres si sabemos que la suma de los
dados es 5, es decir, P (R = 3 | X= 5). De la Tabla 1 se puede ver que P (X = 5)= 4/ 36, P (R = 3)= 6/ 36
y P( X = 5 y R = 3) = 1/36. La suma X es igual a cinco sólo cuando se observa uno de los cuatro pares:
(1,4), (2,3), (3,2), (4,1). De esos, sólo uno es compatible con que el dado rojo sea igual a 3, por esta
razón, P (R = 3| X= 5)= 1/ 4. Este resultado implica que el evento {R = 3} afecta la probabilidad de que
el evento {X = 5} ocurra. Antes de hacer el experimento, la probabilidad de observar {R=3} es 1/6,
pero ahora sabemos que {X=5} ocurrió y por lo tanto la probabilidad de observar {R=3} es ahora 1/4.
Pregunta
¿Qué hubiera pasado si el evento que condiciona hubiera sido X= 7?
De la tabla se puede ver que P (R = 3 | X = 7) = 1/6 = P (R = 3). Es decir, el saber que {X=7} ocurrió
no nos ofrece información alguna sobre la probabilidad de que {R=3} ocurra.
Probabilidad condicional y árboles
Otra manera natural y útil de estudiar probabilidad condicional es por medio de una estructura de árbol.
Esta forma de visualizar el experimento es particularmente pertinente cuando éste se ejecuta en etapas.
Toma por ejemplo el experimento de seleccionar a la vez dos canicas al azar de una caja que contiene 2
rojas y 3 azules. Este experimento es equivalente al de seleccionar al azar una canica, y entonces, sin
reemplazar la primera, seleccionar al azar otra canica. Este proceso se puede visualizar fácilmente por
medio de un árbol.
En cada nodo del árbol representamos el número de canicas rojas y azules que quedan en la caja. Las
ramas que emanan de cada nodo representan los dos resultados posibles que se pueden obtener cuando
se selecciona una canica al azar: rojo o azul. Cada rama es rotulada por el resultado obtenido y por la
probabilidad condicional de observar ese resultado. Los nodos al final representan los estados finales
posibles que podemos obtener como resultado del experimento. Estos nodos finales se llaman hojas.
37
Diagrama de árbol que ilustra el experimento de seleccionar dos canicas de una caja
Pregunta
¿Cuál es la probabilidad que la segunda canica seleccionada sea roja dado que la primera es azul?
Si la primera canica fue azul, ahora quedan en la caja dos canicas rojas y dos azules. De ahí
seleccionamos otra canica. La probabilidad de que una canica seleccionada de esa caja sea roja es 2/4.
Para facilitar el trabajo denotamos el evento de que la primera canica seleccionada es roja por R1 y el
evento de que la segunda sea roja por R2. Hacemos lo propio para las canicas azules. Esta
representación es útil para encontrar probabilidades conjuntas y marginales.
Por ejemplo, la probabilidad que la primera canica sea roja y la segunda azul, denotada P (R1 y B2) es
el producto de las probabilidades que rotulan el camino de la raíz del árbol y que son consistentes con
los resultados R1 y B2. Entonces P (R1 y B2) = 2/5 x 3/4 = 6/20.
Si nos interesamos por la probabilidad marginal de que la segunda canica sea roja, P(R2), tenemos que
darnos cuenta de que hay dos caminos posibles en que la segunda canica es roja. Estos dos caminos
dependen del resultado que se observó cuando seleccionamos la primera canica, que pudo haber sido
rojo o azul. Así observamos una canica roja en la segunda selección cuando cualquiera de los dos
eventos conjuntos (B1 y R2) ó (R1 y R2) ocurren. Estos son eventos son disjuntos por lo cual P ( R2 )
= P (B1 y R2) + P (R1 y R2) = 6/20+ 2/20 = 8/20.
Los árboles son especialmente útiles para encontrar probabilidades condicionales tal como P( R1 | B2 ).
Esta probabilidad se puede entender si pensamos en un experimento donde escogemos una canica al
azar, sin mirarla, la escondemos y luego seleccionamos al azar otra canica. Si la segunda canica
seleccionada es azul, ¿cuál es la probabilidad que la canica que escogimos primero era roja?
Una forma de contestar esta pregunta es usando la Regla de Bayes, que aún no hemos estudiado. Otra
forma es la siguiente. Imaginemos que antes de comenzar el experimento quitamos una canica azul.
Esa será la canica azul que escogeremos como segunda selección, la hemos reservado de antemano.
Ahora, en esta caja imaginaria hay 2 canicas rojas y 2 azules, por esta razón la probabilidad P (R1 | B2)
debe ser igual a (número de canicas rojas) / (número total de canicas) = 2/4.
Probabilidad condicional en general
Estos ejemplos motivan la definición matemática de probabilidad condicional de que un evento A
ocurra cuando sabemos que el evento B ocurrió como:
Pregunta
Verifica que la medida P( • | B) satisface los axiomas de probabilidad, es decir, si B es un evento fijo
en el espacio muestral S, entonces P( • | B) es una medida de probabilidad.
Con la representación del árbol vimos como obtener la probabilidad conjunta de dos eventos A, B. Por
ejemplo, vimos que para obtener la probabilidad de que la primera canica fuera roja y la segunda fuera
azul, P(R1 y B2) multiplicamos P ( B2 | R1 ) por la cantidad P (R1) a lo largo de las ramas apropiadas
38
del árbol. Esta operación se justifica ahora por nuestra definición de probabilidad condicional. Si A, B
son dos eventos cualquiera en un espacio muestral S, tenemos la regla de multiplicación.
Teorema 1 (Regla de multiplicación)
Si A , B son dos eventos cualquiera en un espacio muestral S donde P(B) > 0, tenemos P(A y B) = P(A
| B) P(B).
Prueba
Usa la definición de probabilidad condicional.
Ejemplo 1
Tienes los cuatro ases de la baraja en tus manos {A♠, A♣, A♥, A♦}. Sabemos que dos de esas barajas
son rojas y las otras dos son de color negro. Sin mirar, un amigo selecciona una baraja primero luego
de las restantes tres selecciona una segunda baraja. Queremos encontrar la probabilidad del evento que
ambas barajas seleccionadas sean rojas, {A♥, A♦}. La única forma en que ambas barajas serán rojas es
que la primera sea roja y dado que la primera fue roja, la segunda debe ser roja también. La
probabilidad de que la primera sea roja es 2/4. Si la primera fue roja, la probabilidad de que la segunda
sea roja es entonces 1/3. Por lo tanto P(ambas barajas son rojas)=2/4 ´ 1/3 = 2/12.
Pregunta
Enumera el espacio muestral de este experimento. ¿Cuál representación sería más útil? Expresa el
problema del Ejemplo 1 en forma de símbolos, usando la regla de multiplicación.
Ejemplo 2
El almacén de la UT recibe 100 togas para su graduación. El fabricante había llamado a la escuela para
anticiparle que entre esas 100 togas hay 10 que son de un tamaño equivocado, muy pequeñas para
estudiantes de escuela superior. Seleccionamos dos togas al azar. ¿Cuál es la probabilidad de que
ambas sean muy pequeñas?
Seguimos el mismo argumento de arriba para resolver este ejercicio. La probabilidad de que la primera
seleccionada sea muy pequeña es 10/100. Una vez seleccionada la primera toga pequeña,
seleccionamos la siguiente toga de las restantes 99, de las cuales ahora 9 son muy pequeñas. Así, la
probabilidad de que ambas sean muy pequeñas es 10/100 ´ 9/99.
¿Qué tal si seleccionamos 3 togas? ¿Cuál es la probabilidad de que las tres sean muy pequeñas?
Podemos representar este experimento con un árbol que tiene 8 ramas (¿cómo?). Esto nos permite
extender el argumento de antes. En este caso la probabilidad deseada es 10/100 ´ 9/99 ´ 8/98.
Esta situación facilita el generalizar la regla de multiplicación. Para facilitar la discusión representemos
por T1 el evento de que la primera toga sea muy pequeña, por T2 el evento de que la segunda sea muy
pequeña y por T3 el evento de que la tercera toga sea muy pequeña. Vemos que 10/100 es la
probabilidad de que la primera toga sea pequeña, es decir P( T1 ). El valor 9/99 representa la
probabilidad de que la segunda sea pequeña si la primera fue pequeña, P( T2 | T1 ). El valor 8/98 es un
poco más complicado. Para obtener la tercera toga pequeña en sucesión, debimos haber seleccionado la
primera y la segunda togas pequeñas, así, 8/98 es el resultado de calcular P( T3 | T1 y T2 ).
La probabilidad de que las tres togas sean pequeñas es entonces P( T1 y T2 y T3 ) = P( T1 ) P( T2 | T1)
P( T3 | T1 y T2 ). Este resultado se puede escribir ahora como un teorema.
39
Teorema 2
Sean A, B, C eventos cualquiera en un espacio muestral S tal que P(A) > 0 y P(A∩B) > 0. Entonces P(
A∩B∩C ) = P(A) P(A | B) P(C | A∩B).
Prueba.
P( A∩B∩C ) = P( (A∩B)∩C ) = P( C | A∩B) P(A∩B), usando la regla de multiplicación para los
eventos C y A∩B. Usamos nuevamente esa regla para calcular P( A∩B ) = P(A | B) P(B) y sustituimos
arriba para obtener el resultado.
Pregunta
Usa inducción matemática para generalizar esta regla para n eventos.
40
Práctica 1
Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito
profesional donde la ocurrencia de un evento dependa de otro.
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
1. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica
seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
d. Ilustra los eventos de arriba en el árbol que representa el experimento y en un diagrama de
Venn.
e. Encuentra la probabilidad de que la canica seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
2. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color y devuélvela a la caja. Selecciona otra canica y anota su
color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que la primera canica seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
d. Usa la notación y operaciones de conjuntos para representar el evento de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la segunda canica sea blanca si la primera fue negra.
v. la primera canica sea blanca si la segunda no fue blanca.
vi. la segunda canica es blanca.
e. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas selecionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica es blanca y la segunda es negra,
41
v. la segunda canica sea blanca si la primera fue negra.
vi. la primera canica sea blanca si la segunda no fue blanca.
f. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
g. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
3. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color, esta vez no la devuelvas a la caja. Selecciona otra canica
y anota su color.
a. Enumera el espacio muestral.
b. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
v. la primera canica es blanca y la segunda es negra.
vi. la segunda canica sea blanca si la primera fue negra.
vii. la primera canica sea blanca si la segunda no fue blanca.
viii. la segunda canica es blanca.
c. ¿En qué se distingue este experimento del efectuado en el problema número 2?
d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
4. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del
mismo color de la canica seleccionada. Selecciona otra canica y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
42
v. la primera canica es blanca y la segunda es negra.
vi. la segunda canica sea blanca si la primera fue negra.
vii. la primera canica sea blanca si la segunda no fue blanca.
viii. la segunda canica sea negra.
d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
5. Considera una caja con seis canicas. Dos de las canicas son blancas, una es roja y las restantes son
negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas
del mismo color de la canica seleccionada. Selecciona otra canica y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean rojas.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
v. la primera canica es blanca y la segunda es roja.
vi. la segunda canica sea roja si la primera fue roja.
vii. la primera canica sea negra si la segunda no fue blanca.
viii. las dos canicas sean de colores distintos.
ix. las dos canicas sean del mismo color.
x. la segunda canica sea negra.
d. ¿Es el evento de que la primera canica sea roja independiente del evento de que la segunda
canica sea blanca? ¿Son estos eventos mutuamente excluyentes? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
6. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. A la
misma vez, selecciona dos canicas al azar y anota sus colores.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Usa la notación y operaciones de conjuntos para representar el evento de que las canicas
seleccionadas:
i. ambas sean negras.
ii. ninguna sea negra.
iii. sean de colores distintos.
d. Ilustra los eventos de arriba en el árbol que representa el experimento.
e. Encuentra la probabilidad de que las canicas seleccionadas:
i. ambas sean negras.
ii. ninguna sea blanca.
43
iii. sean de colores distintos.
f. ¿Tiene alguna relación este problema con el número 3 arriba? Explica.
Hacemos un experimento con dos cajas. La caja A tiene siete canicas. En esta caja, dos de las canicas
son blancas, tres son rojas y dos son negras. La caja B tiene seis canicas. Cuatro de las canicas en B son
rojas y dos son negras. Se tira un dado para decidir de cuál caja se selecciona una canica al azar. Si se
observa el evento {1,2,3,4} se selecciona una canica de la caja A. En el caso de observar el evento
{5,6} se selecciona al azar una canica de la caja B.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica
seleccionada:
i. sea negra.
ii. no sea roja.
iii. sea negra ó blanca.
iv. provenga de la caja A
v. sea roja y venga de la caja B.
vi. sea blanca y venga de la caja B.
d. Ilustra los eventos de arriba en el árbol que representa el experimento.
e. Encuentra la probabilidad de que la canica seleccionada:
i. sea negra.
ii. no sea roja.
iii. sea negra ó blanca.
iv. provenga de la caja A
v. sea roja y venga de la caja B.
vi. sea blanca y venga de la caja A.
vii. sea negra dado que viene de la caja B.
viii. sea blanca dado que viene de la caja B.
ix. haya provenido de la caja B dado que es blanca.
x. haya provenido de la caja A dado que es roja.
f. ¿Puedes generalizar tus resultados en ix y x? Explica.
44
TEMA 5
Objetivo de aprendizaje.
5. Definir el Teorema de Bayes.
Criterio de Aprendizaje.
5.1. Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades
subjetivas.
Didáctica de enseñanza.
Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren
probabilidades subjetivas y aplicar el Teorema de Bayes en su solución
Un problema que nos sirve de introducción
En el distrito universitario de Jauja los estudiantes se distribuyen entre las tres carreras que pueden
cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía. El
porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%. Elegido un
alumno al azar determinar la probabilidad de que haya acabado los estudios.
Como Sea T el suceso "finalizar los estudios".
Como
E = A1 o A2 o A3
T = (T y E) = T y (A1 o A2 o A3) =
= (T y A1) o (T y A2) o (T y A3)
Resulta
p(T) = p(T y A1) + p(T y A2) + (T y A3)
Y por tanto
p(T) =
= p(A1) × p(T/A1) +
+ p(A2) × p(T/A2) +
+ p(A3) × p(T/A3)
Vemos todo esto mediante un diagrama de flujo y calculamos la probabilidad de que un alumno elegido
al azar haya terminado los estudios.
Si A1, A2, y A3 son, respectivamente, los sucesos "estudiar arquitectura", "estudiar medicina" y
"estudiar economía" resulta
p(Ai) = 1
Y los sucesos A1, A2, y A3 son incompatibles (no existen estudiantes que cursen dos carreras).
Además
45
E = A1 o A2 o A3
En estas condiciones podemos aplicar el razonamiento de la columna de la izquierda.
A partir del razonamiento anterior podemos enunciar el siguiente teorema que es conocido como
teorema de la probabilidad total
Si los sucesos A1, A2, A3 ... An son una partición (
) del espacio
Muestral E y T un suceso de S, entonces
Otro ejemplo y una pregunta
46
La fábrica de enlatados PI S.A. produce 5000 envases diarios. La máquina A produce 3000 de estos
envases, de los que el 2% son defectuosos y la máquina B produce los 2000 restantes de los que se sabe
que el 4% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso.
Si D es el suceso "seleccionar un envase defectuoso" y (no D) = "seleccionar un envase no defectuoso",
el diagrama siguiente nos muestra el camino
Aplicando el teorema anterior resulta:
p(D) = p(A y D) + p(B y D) = p(A) × p(D/A) + p(B) × p(D/B) = 0,028
Y ahora la pregunta ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de
la máquina A? ¿Y de la B?
Es decir, sabemos que la botella seleccionada es defectuosa
La respuesta a dicha cuestión viene dada por la denominada fórmula de Bayes
Probabilidad de que provenga de la máquina A
Calculamos la probabilidad p(A/D) es decir, la probabilidad de que provenga de la máquina A en el
supuesto que el envase es defectuoso:
Probabilidad de que provenga de la máquina B
Calculamos la probabilidad p(B/D) es decir, la probabilidad de que provenga de la máquina B en el
supuesto que el envase es defectuoso:
Las expresiones
47
Son las de la "fórmula de Bayes" para cada uno de las preguntas formuladas. Estas expresiones pueden
generalizarse fácilmente para un conjunto finito de sucesos con las condiciones indicadas.
Podemos hacernos ahora varias preguntas que son fáciles de contestar. Por ejemplo:
 ¿Si el envase no es defectuoso, qué probabilidad hay de que provenga de la máquina A?. ¿Y de la
B?.
O bien, teniendo en cuenta el primer ejercicio, ¿si un alumno seleccionado ha finalizado la carrera, qué
probabilidad hay que haya estudiado arquitectura?. ¿Y medicina?
Y además ya estamos en condiciones de resolver el problema enunciado en la portada.
Thomas Bayes nació en Londres, Inglaterra. Su padre fue ministro presbiteriano. Posiblemente De
Moivre fue su maestro particular, pues se sabe que por ese entonces ejercía como profesor en Londres.
Bayes fue ordenado ministro presbiteriano y muere en 1761. Sus restos descansan en el cementerio
londinense de Bunhill Fields. La traducción de la inscripción en su tumba es
Reverendo Thomas Bayes.
Hijo de los conocidos Joshua y Ann Bayes. 7 de abril de 1761. En reconocimiento al importante trabajo
que realizó Thomas Bayes en probabilidad. Su tumba fue restaurada en 1969 con donativos de
estadísticos de todo el mundo.
Miembro de la Royal Society desde 1742, Bayes fue uno de los primeros en utilizar la probabilidad
inductivamente y establecer una base matemática para la inferencia probabilística. Publicó los trabajos:
Divine Providence and Government Is the Happiness of His Creatures (1731) An Introduction to the
Doctrine of Fluxions, and a Defence of The Analyst (1736)
En 1763, dos años después de su muerte, se publica Essay Towards Solving a Problem in the Doctrine
of Chances, en el que trataba el problema de las causas a través de los efectos observados, y donde se
enuncia el teorema que lleva su nombre. El trabajo fue entregado a la Royal Society por Richard Price
y es la base de la técnica bayesiana.
48
En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y sin mirarla, se guarda. A
continuación se vuelve a sacar otra bola que es verde. ¿Cuál es la probabilidad de que la primera haya
sido verde?. Y si la segunda hubiera sido azul, ¿cuál es la probabilidad de que la primera sea verde?.
¿Y azul?.
Un diagrama nos aclara la situación
En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y análogamente los
restantes (A1 y V2), (V1 y A2), (V1 y V2).
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido verde)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido azul)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido azul)
Aplicamos el teorema de Bayes y resulta:
49
Práctica 2
Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades
subjetivas y aplicar el Teorema de Bayes en su solución
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
1) Los alumnos de la Universidad Tecnológica, proceden de 3 localidades A, B y C, siendo un 20% de
A, un 30% de B y el resto de C. El 80% de los alumnos de A cursa 1º cuatrimestre y el resto 4º. El 50%
de los alumnos de B cursa 1º cuatrimestre y el resto 4º. El 60% de los alumnos de C cursa 1º
cuatrimestre y el resto 4º.
(a) Seleccionado, al azar, un alumno la Universidad Tecnológica, ¿cuál es la probabilidad de que
sea de 4º?
(b) Si elegimos, al azar, un alumno la Universidad Tecnológica y éste es un alumno de 1º, ¿cuál
es la probabilidad de que proceda de la localidad B?
2) Según la estadística de los resultados en las Prueba de Acceso en una provincia andaluza, en
septiembre de 2001, el número de alumnas presentadas es de 840, de las que han aprobado un 70%,
mientras que el número de alumnos presentados es 668, habiendo aprobado un 75% de estos.
(a) Elegida, al azar, una persona presentada a las Pruebas, ¿cuál es la probabilidad de que haya
aprobado?
(b) Sabiendo que una persona ha aprobado, ¿cuál es la probabilidad de que sea varón?
50
CAPITULO 2
ORGANIZACIÓN Y PRESENTACIÓN DE
DATOS
INTRODUCCIÓN
El propósito de la presente unidad es que el alumno adquiera la habilidad para ordenar y tabular
datos, construyendo con ellos diversas gráficas que le permitirán calcular sus medidas de
tendencia central y dispersión, así como utilizar los fundamentos matemáticos de probabilidad
para resolver algunos problemas de Procesos Agroindustriales que se presentan en las empresas.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
1- . Reconocer los métodos tabulares de presentación de datos.
1.1. . Ilustrar y describir tablas de frecuencias relativas y absolutas.
1.2. . Ilustrar y describir tablas para representar dos conjuntos de datos.
Página
52
52
52
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Utilizar las tablas de frecuencias relativas y absolutas, de datos.
1.2.1. Utilizar tablas para representar dos conjuntos de datos.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Diferenciar los métodos gráficos empleados para organizar datos
2.1. Ilustrar los métodos gráficos empleados para organizar datos.
60
60
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1 Utilizar métodos gráficos empleados para organizar datos.
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y
absolutas de datos, así como también tablas para representar dos conjuntos de datos.
Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y
polígonos de frecuencias.
59
70
51
TEMA 1
Objetivo de aprendizaje.
1. Reconocer los métodos tabulares de presentación de datos.
Criterio de Aprendizaje.
1.1. Ilustrar y describir tablas de frecuencias relativas y absolutas.
1.2. Ilustrar y describir tablas para representar dos conjuntos de datos.
Didáctica de enseñanza.
Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así
como también tablas para representar dos conjuntos de datos.
Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas
modalidades han sido agrupadas en un número k de clases, que denotamos mediante
Para cada una de las clases ci,
.
, introducimos las siguientes magnitudes:
Frecuencia absoluta
De la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase.
Frecuencia relativa
De la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de
observaciones, es decir
Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por 100%
representa el porcentaje de la población que comprende esa clase.
Frecuencia absoluta acumulada
Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la
población cuya modalidad es inferior o equivalente a la modalidad ci:
Frecuencia relativa acumulada
Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos
de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci,
es decir,
Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que
52
O lo que es lo mismo,
Frecuencia absoluta (ni): Número de elementos que presentan la clase xi.
Frecuencia relativa:
.
Frecuencia absoluta acumulada:
.
Frecuencia relativa acumulada:
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes
a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de
frecuencias. Su forma general es la siguiente:
Modali.
Frec. Abs.
Frec. Rel.
Frec. Abs. Acumu.
Frec. Rel. Acumu.
C
ni
fi
Ni
Fi
c1
n1
...
...
cj
nj
...
...
ck
nk
n
N1 = n1
...
...
...
...
...
...
Nk = n
Fk = 1
1
Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li-1 -- li
ni fi
Ni
53
0 -- 10
60 f1
10 -- 20
n2 0,4 N2
20 -- 30
30 f3
30 -- 100
n4 0,1 N4
100 -- 200 n5 f5
60
170
200
n
Solución:
Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n=200.
Como N3=170 y n3=30, entonces
N2=N3-n3=170-30=140.
Además al ser n1=60, tenemos que
n2=N2-n1=140-60=80.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa
correspondiente:
Así:
N4=n4+N3=20+170 =190.
Este último cálculo nos permite obtener
n5=N5-N4=200-190=10.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
Escribimos entonces la tabla completa:
li-1 -- li
ni
fi
Ni
0 -- 10
60
0,3
60
10 -- 20
80
0,4
140
20 -- 30
30
0,15 170
30 -- 100
20
0,1
100 -- 200 10
190
0,05 200
200
54
Elección de las clases
En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de
variable que estudiemos:
 Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal;
 En el caso de variables cuantitativas, existen dos posibilidades:
Si la variable es discreta, las clases serán valores numéricos
;
Si la variable es continua las clases vendrán definidas mediante lo que denominamos
intervalos. En este caso, las modalidades que contiene una clase son todos los valores numéricos
posibles contenidos en el intervalo, el cual viene normalmente definido de la forma
o
o
O bien
En estos casos llamaremos amplitud del intervalo a las cantidades
ai = li-li-1
Y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado, tomamos como marca
de clase al punto más representativo, es decir al punto medio del intervalo,
La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus
puntos. Por ello hemos tomado como representante, el punto medio del mismo. Esto está plenamente
justificado si recordamos que cuando se mide una variable continua como el peso, la cantidad con
cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una
medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el
centro.
En el caso de variables continuas, la forma de la tabla estadística es la siguiente:
Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum.
C
ni
l0 -- l1
c1
n1
...
...
...
lj-1 -- lj cj
nj
...
...
...
lk-1 -- lk ck
nk
n
fi
...
...
Ni
Fi
N1 = n1
F1 = f1
...
...
Nj= Nj-1+nj
Fj = Fj-1 + fj
...
...
Nk=n
Fk =1
1
55
Elección de intervalos para variables continuas
A la hora de seleccionar los intervalos para las variables continuas, se plantean varios problemas como
son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos
para un intervalo sea
El primer intervalo, l0 -- l1, podemos a cerrarlo en el extremo inferior para no excluir la observación
más pequeña, l0
Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado
izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos.
El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos un k que
nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros
tomaremos una de los siguientes valores aproximados:
Por ejemplo si el número de observaciones que tenemos es n=100, un buen criterio es agrupar las
intervalos. Sin embargo si tenemos n=1.000.000, será mas razonable
observaciones en
elegir
intervalos, que
.
La amplitud de cada intervalo
ai = li -li-1
Suele tomarse constante, considerando la observación más pequeña y más grande de la población
(respectivamente
y
) para calcular la amplitud total, A, de la población
A= lk - l0
de forma que la amplitud de cada intervalo sea:
Así la división en intervalos podría hacerse tomando:
56
Observación
Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos
(ej. a=10,325467). En este caso, es recomendable variar simétricamente los extremos,
, de forma que se tenga que a es un número más simple (ej. a=10).
Recorrido:
Amplitud: ai= li - li-1
Marca de clase:
Frecuencias rectificadas:
;
Ejemplo
Sobre un grupo de n=21 personas se realizan las siguientes observaciones de sus pesos, medidos en
kilogramos:
58 42 51 54 40 39 49
56 58 57 59 63 58 66
70 72 71 69 70 68 64
Agrupar los datos en una tabla estadística.
Solución:
En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es
una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una
tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva
a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos
el criterio de utilizar
intervalos (no son demasiadas las observaciones). En este punto
podemos tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por
ejemplo, vamos a tomar k=5.
Lo siguiente es determinar la longitud de cada intervalo, ai
. Lo más cómodo es tomar la
misma longitud en todos los intervalos, ai=a (aunque esto no tiene por qué ser necesariamente así),
donde
57
Entonces tomaremos k=5 intervalos de longitud a=6,6comenzando por l0=xmin=39 y terminando en
l5=33:
Intervalos M. clase f.a.
li-1 -- li
f.r.
f.a.a.
ci
ni
fi
42,3
3
0,1428 3
0,1428
i=2 45,6 -- 52,2 48,9
2
0,0952 5
0,2381
i=3 52,2 -- 58,8 55,5
6
0,2857 11
0,5238
i=4 58,8 -- 65,4 62,1
3
0,1428 14
0,6667
i=5 65,4 -- 72
7
0,3333 21
i=1 39 -- 45,6
68,7
Ni
f.r.a.
Fi
21
Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más
simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l0 y l5 no es muy
estricta podemos hacer la siguiente elección:
ya que así la tabla estadística no contiene decimales en la expresión de los intervalos, y el exceso d,
cometido al ampliar el rango de las observaciones desde A hasta A', se reparte del mismo modo a los
lados de las observaciones menores y mayores:
Intervalos M. clase f.a.
li-1 -- li
f.r.
f.a.a.
Ni
f.r.a.
ci
ni
fi
Fi
i=1 38 -- 45
41,5
3
0,1428 3
0,1428
i=2 45 -- 52
48,5
2
0,0952 5
0,2381
i=3 52 -- 59
55,5
7
0,3333 12
0,5714
i=4 59 -- 66
62,5
3
0,1428 15
0,7143
i=5 66 -- 73
69,5
6
0,2857 21
21
58
Evidencia parcial
Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así
como también tablas para representar dos conjuntos de datos.
Evaluación parcial
Entrega de Ta.3
59
TEMA 2
Objetivo de aprendizaje.
2. Diferenciar los métodos gráficos empleados para organizar datos.
Criterio de Aprendizaje.
2.1. Ilustrar los métodos gráficos empleados para organizar datos.
Didáctica de enseñanza.
Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de
frecuencias.
Gráficos para variables cualitativas
Los gráficos más usuales para representar variables de tipo nominal son los siguientes:
Diagramas de barras:
En la siguiendo la figura, representamos en el eje de ordenadas las modalidades y en abscisas las
frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar
varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura posterior.
Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias
relativas, ya que en otro caso podrían resultar engañosas.
Figura: Diagrama de barras para una variable cualitativa.
Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha
de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias
relativas).
60
Diagramas de sectores
Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde
un arco de círculo proporcional a su frecuencia absoluta o relativa .
Figura: Diagrama de sectores.
El arco de cada porción se calcula usando la regla de tres:
Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es
aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los
anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama
semicircular, al igual que en la figura anterior. Sean
los tamaños respectivos de las 2
poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con
otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación
entre las áreas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es
decir:
61
Figura: Diagrama de sectores para comparar dos poblaciones
Pictogramas
Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable.
Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la siguiente
figura.
Figura: Pictograma. Las áreas son proporcionales a las
frecuencias.
El escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la
frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de
62
comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una
explicación compleja.
Gráficos para variables cuantitativas
Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para
realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas diferenciales:
Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el
número o porcentaje de elementos que presenta una modalidad dada.
Diagramas integrales:
Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o
igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos
crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.
Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a
continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así
como los nombres específicos que reciben.
Gráficos para variables discretas
Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos
hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que
toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable,
forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente
están representados en la figura del ejercicio siguiente.
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniéndose los
siguientes resultados:
Representar gráficamente el resultado.
Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las
modalidades:
Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura
Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama
integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada
punto del eje de abcisas.
63
xi
ni
fi
0
1
1/8 1 1/8
1
3
3/8 4 4/8
2
3
3/8 7 7/8
3
1
1/8 8 8/8
n=8
Ni Fi
1
Ejemplo
Clasificadas 12 familias por su número de hijos se obtuvo:
Número de hijos (xi) 1 2 3 4
Frecuencias (ni)
1 3 5 3
Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama
acumulativo creciente.
Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:
Variable F. Absolutas F. Relativas F. Acumuladas
xi
ni
fi
Ni
1
1
0,083
1
2
3
0,250
4
3
5
0,416
9
4
3
0,250
12
12
1
64
Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que
se muestra en la figura siguiente. Como puede verse es idéntico (salvo un cambio de escala en el eje de
ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las
columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información
procedente de las columnas xi y Ni.
Figura: Diagramas de frecuencias para una variable discreta
Gráficos para variables continuas
Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los
polígonos de frecuencias.
Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un
rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es
el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el
área de los mismos.
El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma,
ya que consiste en unir mediante líneas rectas los puntos del histograma que corresponden a las marcas
de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una
línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este
modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de las gráficas
sobre un intervalo son idénticas. Veanse ambas gráficas diferenciales representadas en la parte superior
de la figura siguiente.
65
El diagrama integral para una variable continua se denomina también polígono de frecuencias
acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los
intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son
proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas
es una primitiva del histograma. Véase la parte inferior de la figura siguiente, en la que se representa a
modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la
tabla siguiente:
Intervalos ci ni Ni
0 -- 2
1 2
2
2 -- 4
3 1
3
4 -- 6
5 4
7
6 -- 8
7 3
10
8 - 10
9 2
12
12
Figura: Diagramas diferenciales e integrales para una variable continua.
66
Ejemplo
La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:
Duración en horas Número de tubos
300 -- 500
50
500 -- 700
150
700 -- 1.100
275
más de 1.100
25
Total 500



Representar el histograma de frecuencias relativas y el polígono de frecuencias.
Trazar la curva de frecuencias relativas acumuladas.
Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas.
Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al
tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una
variable continua se tratase. La consecuencia es una ligera perdida de precisión.
El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser
conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una
amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas.
Antes de realizar el histograma conviene hacer una observación importante. El histograma representa
las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más
fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la
misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el
tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un
rectángulo de base doble (lo que reduce su altura a la mitad).
Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las
amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura
del histograma. Los gráficos requeridos se representan en las figuras siguientes.
Intervalos
ai
ni
300 -- 500
200 50
0,10 0,10
0,10
500 -- 700
200 150
0,30 0,30
0,40
700 -- 1.100
400 275
0,55 0,275 0,95
1.100 -- 1.300 200 25
fi
fi '
0,05 0,05
Fi
1,00
n=500
67
Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en
todos con fisalvo en el intervalo 700 -- 1.100 en el que
es doble a la de los demás.
ya que la amplitud de ese intervalo
Figura: Diagrama acumulativo de frecuencias relativas
Por otro lado, mirando la figura anterior se ve que sumando frecuencias relativas, hasta las 900 horas
de duración hay 0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el
diagrama de frecuencias acumuladas.
Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es
, redondeando, 338 tubos.
68
Tabla: Principales diagramas según el tipo de variable.
Tipo de variable Diagrama
V. Cualitativa
Barras, sectores, pictogramas
V. Discreta
Diferencial (barras)
Integral (en escalera)
V. Continua
Diferencial (histograma, polígono de frecuencias)
Integral (diagramas acumulados)
69
Práctica 3
Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias.
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
A) En el siguiente conjunto de datos, se proporcionan los diámetros de melocotones (Prunus persica L.
Batsch.) en centímetros
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5,
7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
1. Construir una distribución de frecuencia, de diámetros.
2. Encontrar las frecuencias relativas.
3. Encontrar las frecuencias acumuladas.
4. Encontrar las frecuencias relativas acumuladas.
5. Dibujar un histograma con los datos.
6. ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de
barras?
B) Una empresa maltera recibe mensualmente 50 lotes de cebada, los cuales se les mide su peso
hectolítrico (lb/bu), y se les clasifica según la siguiente tabla:
Estado
Buen estado
Aceptable
Aceptable con restricciones
Rechazo
Rango de aceptabilidad (lb/bu)
54 - 56
51 - 53
48 - 50
Todo aquel fuera de los tres rangos anteriores
Los datos obtenidos son los siguientes:
55.8, 48, 54, 50, 51, 50, 56, 58, 59, 49, 49.9, 55, 58, 60, 45, 58, 59, 52, 54, 56, 48, 49, 56, 51, 52, 48,
59, 53, 51, 50, 58, 56, 54, 57, 56, 52, 49, 46, 56, 45, 49, 58, 59, 52, 56, 54, 52, 57, 49, 56
1. Construir una distribución de frecuencia.
2. Encontrar las frecuencias relativas.
3. Encontrar las frecuencias acumuladas.
4. Encontrar las frecuencias relativas acumuladas.
70
5. Elige y elabora un gráfico con los datos, que ayuden a interpretar los el conjunto de datos.
6.- ¿Cuáles son las ventajas de realizar gráficos de un conjunto de datos?
71
CAPITULO 3
MEDIDAS DESCRIPTIVAS
INTRODUCCIÓN
En este capítulo se abordarán las medidas de tendencia central, que se conocen como medidas de
posición, se refieren al punto medio de una distribución. Generalmente el objetivo principal de
las medidas de tendencia central es describir las características típicas de conjuntos de datos y,
como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama
medidas de tendencia central porque la acumulación más alta de datos se encuentra en los
valores intermedios. Las medidas de tendencia central más comunes son: La media aritmética
(comúnmente conocida como media o promedio); la mediana: la cual es el puntaje que es ubica
en el centro de una distribución; la moda (que es el puntaje que se presenta con mayor frecuencia
en una distribución); entre otras.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
Página
1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y
moda.
1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de
datos.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Calcular y obtener la media aritmética, mediana y moda de un conjunto de
datos.
74
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media,
varianza, desviación Estándar y coeficiente de variación.
2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación
Estándar y coeficiente de variación de una muestra de datos y de una tabla de
frecuencias.
2.1.1. Calcular y obtener de una muestra de datos y de una tabla de frecuencias:
amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de
variación.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de
dispersión
3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a
su naturaleza.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
3.1.1. Aplicar las medidas de tendencia central de un conjunto de datos de acuerdo a
su naturaleza.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
4. Definir el concepto de covarianza y correlación
4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y
74
79
79
84
84
87
87
72
determinar si las dos están relacionadas.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Calcular y obtener la covarianza y correlación de dos muestras de datos y
determinar si las dos están relacionadas.
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o
rango, desviación media, varianza, desviación Estándar y coeficiente de
variación
Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda;
elaborar tabla de frecuencias y obtener: rango, desviación media, desviación
estándar, varianza y coeficiente de variación.
Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos.
78
83
86
92
73
TEMA 1
Objetivo de aprendizaje.
1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda.
Criterio de Aprendizaje.
1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos.
Didáctica de enseñanza.
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.
Media aritmética
Es el promedio más comúnmente usado, este puede ser simple o ponderado.
La media aritmética simple esta dada por la formula Σ X/n y que significa: la suma de todos los valores
y el resultado se divide entre el número de observaciones; y que además el valor de la media representa
un valor con respecto a toda la información.
Una muestra de una población consiste en n observaciones, con una media de x. Las medidas que
calculamos para una muestra se conocen como estadística.
La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo
que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza
con μ. El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo
general, en estadística se utilizan letras del alfabeto latino para simbolizar la información sobre las
muestras y letras del griego para referirnos a la información sobre poblaciones.
Por ejemplo:
Media de una serie de datos.
10, 13, 10, 13, 14, 10, 13, 10, 15
Media de la población:
μ = ∑x / N
Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de
datos como datos no agrupados.
Media Aritmética Ponderada o media de datos agrupados
Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar
"pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.
74
Una distribución de frecuencias consta de datos agrupados en clases. Cada valor de una observación
cae dentro de alguna de las clases. No sabemos el valor individual de cada observación. A partir de la
información de la tabla, podemos calcular fácilmente una estimación del valor de la media de estos
datos agrupados.
Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio de cada
clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades.
Después, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase,
sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la
muestra.
.μ= ∑ (f x) / n
f = frecuencia de observaciones de cada clase
x= punto medio de cada clase de la muestra
n = número de observaciones de la muestra
En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada
uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos,
se obtendrá la misma suma que si se hubieran sumado uno por uno
Sin ponderar
Cálculo ponderado
Número x
Número x
Frecuencia
Producto (fx)
10
10
4
40
13
13
3
39
14
14
1
14
15
15
1
15
9
108
Suma = 52
52/4 = 13
108/9 = 12
Mediana
La mediana es un solo valor calculado a partir del conjunto de datos que mide la observación central de
éstos. Esta sola observación es la más central o la que está más en medio en el conjunto de números.
La mitad de los elementos están por encima de este punto y la otra mitad está por debajo.
Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o
ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el
arreglo es la mediana. Si hay un número par de observaciones, la mediana es el promedio de los dos
elementos de en medio.
Mediana = (n + 1) / 2
A continuación se muestran los criterios para construir la mediana:
75

Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera
de los dos criterios conduce al mismo resultado.
 Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato.
 Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que
existen dos valores medios, en tal caso, la mediana es el promedio de los valores.
Algunas propiedades de la mediana son:
1.- Es única.
2.- Es simple.
3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.
Por ejemplo:
Dados los siguientes datos:
1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3
Para la obtención de la mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo
que, se tiene:
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,
Se observa que el número de datos es igual a 15 datos, siendo el número de datos impar se elige el dato
que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.
Ejemplo 2.
3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5
Se observa que el número de datos es par, por los que se promedian los dos valores centrales es decir
el 5 y el 16 y el valor obtenido será la mediana del conjunto de datos.
Mediana a partir de datos agrupados:
1. Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2).
2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más
central.
3. Determinar el número de elementos de la clase y la localización de la clase que contiene al
elemento mediano.
4. Determinar el ancho de cada paso para pasar de una observación a otra en la clase mediana,
dividiendo el intervalo de cada clase entre el número de elementos contenido en la clase.
5. Determinar el número de pasos que hay desde el límite inferior de la clase mediana hasta el
elemento correspondiente a la mediana.
6. Calcular el valor estimado del elemento mediano multiplicando el número de pasos que se
necesitan para llegar a la observación mediana por el ancho de cada paso. Al producto sumarle el valor
del límite inferior de la clase mediana.
7. Si existe un número par de observaciones en la distribución, tomar el promedio de los valores
obtenidos para el elemento mediano calculados en el paso número 6.
Un método más sencillo:
76
Med = {[(n + 1) / 2 – (F + 1)] / fm} w + Lm
Donde:
n = número total de elementos de la distribución
F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana
fm = frecuencia de la clase mediana
w = ancho de intervalo de clase
Lm = límite inferior del intervalo de clase mediano
Moda
La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con
mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda para un
conjunto de datos. La notación más frecuente es la siguiente: Mo . Esta medida se puede aparecer tanto
para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la
muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato
repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia, en
dicho caso se dice que la muestra es amodal.
La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana,
pues en realidad no se calcula mediante algún proceso aritmético ordinario. La moda es aquel valor que
más se repite en el conjunto de datos.
En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el
valor más frecuente del conjunto de datos. Es por esta razón que rara vez se utiliza la moda de un
conjunto de datos no agrupados como medida de tendencia central.
Por esta razón, siempre que se utiliza la moda como medida de tendencia central de un conjunto de
datos, debemos calcular la moda de datos agrupados (buscar la clase modal).
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a).- 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3
La moda de este conjunto de datos es igual a 3 y si considera unimodal
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo que
la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.
Moda de datos agrupados:
Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos poner que la
moda está localizada en la clase que contiene el mayor número de elementos, es decir, en la clase que
tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:
77
Mo = Lmo + [d1 / (d1 + d2 )] w
Lmo = límite inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por
debajo de ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por
encima de ella.
w = ancho del intervalo de la clase modal.
Evidencia parcial
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.
Evaluación parcial
Entrega de Ta.4
78
TEMA 2
Objetivo de aprendizaje.
2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza,
desviación Estándar y coeficiente de variación.
Criterio de Aprendizaje.
2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y
coeficiente de variación de una muestra de datos y de una tabla de frecuencias.
Didáctica de enseñanza.
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación
media, varianza, desviación Estándar y coeficiente de variación
Las medidas de tendencia central son de un gran valor representativo para una masa de observaciones.
Pero el valor de esas medidas dependerá de cuan variable sea la masa de información. Por eso se
establecen medidas que tratan de explicar la dispersión de los datos y son: la desviación estándar, el
coeficiente de variación, el error estándar y los límites de confianza. Una medida de dispersión
conveniente deberá tomar en consideración todos los datos de la serie sopesando cada dato por su
distancia al centro de la distribución.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan
una parte de la información que necesitamos acerca de las características de los datos. Para aumentar
nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o
variabilidad.
La dispersión es importante porque:
1. Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia
central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa
de los datos.
2. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces
de distinguir que presentan esa dispersión antes de abordar esos problemas.
3. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones
más grandes.
Rango
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el
valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades
son las mismas que las de la variable, aunque posee varios inconvenientes:
 No utiliza todas las observaciones (sólo dos de ellas);
 Se puede ver muy afectada por alguna observación extrema;
 El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca
disminuye.
79
Desviación media
Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la
variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces
Si los datos están agrupados en una tabla estadística es más sencillo usar la relación
Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente:
Desde el punto de vista geométrico, la distancia que induce la desviación media en el espacio de
observaciones no es la natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto
hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la población.
Varianza
Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado entre la
media y cada elemento de la población entre el número total de observaciones de dicha población.
=  (x - μ)2 / N
= varianza de la población.
x = elemento u observación.
μ = media de la población.
N = número total de elementos de la población.
Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son
intuitivamente claras o fáciles de interpretar. Por esta razón, tenemos que hacer un cambio significativo
en la varianza para calcular una medida útil de la desviación, que sea menos confusa. Esta medida se
conoce como la desviación estándar, y es la raíz cuadrada de la varianza. La desviación estándar,
entonces, está en las mismas unidades que los datos originales.
La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media
aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de
cualquier otro valor que no sea la media aritmética.
Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la
manera de simbolizarla es
.
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
80
La varianza es una medida primaria de variabilidad utilizada en varias pruebas estadísticas. Su cálculo
es simplemente elevar al cuadrado la desviación estándar.
Desviación estándar
La desviación estándar es la medida de dispersión mas usada en estadística, tanto en aspectos
descriptivos como analíticos. En su forma conceptual, la desviación estándar se define así:
Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores
absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es
la concentración o dispersión alrededor de la media.
Desviación estándar para datos sin agrupar
Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las
desviaciones de la media.
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que
todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el
nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula:
La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con
escalas de intervalos o razones.
A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su
media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende
entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es
decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogéneo” que si el
valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y
a mayor dispersión, menor homogeneidad.
La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuando tomamos la
raíz cuadrada de la varianza para calcular la desviación estándar, los estadísticos solamente consideran
la raíz cuadrada positiva.
La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están
localizados los valores de una distribución de frecuencias con relación a la media. El teorema de
Chebyshev dice que no importa qué forma tenga la distribución, al menos 75% de los valores caen
81
dentro de + 2 desviaciones estándar a partir de la media de la distribución, y al menos 89% de los
valores caen dentro de + 3 desviaciones estándar a partir de la media.
Con más precisión:
 Aproximadamente 68% de los valores de la población cae dentro de + 1 desviación estándar a
partir de la media.
 Aproximadamente 95% de los valores estará dentro de + 2 desviaciones estándar a partir de la
media.
 Aproximadamente 99% de los valores estará en el intervalo que va desde tres desviaciones
estándar por debajo de la media hasta tres desviaciones estándar por arriba de la media.
Resultado estándar:
La desviación estándar es también útil para describir qué tan lejos las observaciones individuales de
una distribución de frecuencias se apartan de la media de la distribución. Una medida que se conoce
como resultado estándar nos da el número de desviaciones estándar que una observación en particular
ocupa por debajo o por encima de la media:
Resultado estándar = (x - μ ) /s
Cálculo de la varianza y la desviación estándar utilizando datos agrupados:
=  f(x -  )2 / N
= varianza de la población.
x = punto medio de cada una de las clases.
 = media de la población.
N = número total de elementos de la población.
f = frecuencia de cada una de las clases.
Desviación estándar de una muestra:
Para calcular la varianza y la desviación estándar de una muestra, utilizamos las mismas fórmulas,
sustituyendo  por
y N con n – 1.
s2 =  (x -
)2 / (n – 1)
¿Por qué utilizamos n – 1 como denominador en lugar de N? Los especialistas en estadística pueden
demostrar que si tomamos muchas muestras de una población dada, si encontramos la varianza de la
muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el
valor de la varianza de la población, a menos que tomemos n – 1 como denominador de los cálculos.
Coeficiente de variación
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que
corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de
82
variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente
sirve para comparar las dispersiones de variables correspondientes a escalas de razón.
Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado
coeficiente de variación.
El coeficiente de variación es una medida relativa de dispersión que nos permite hacer comparaciones
de diferentes grupos con diferentes unidades de medida o diferentes magnitudes y obtener mejores
conclusiones.
Evidencia parcial
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación
media, varianza, desviación Estándar y coeficiente de variación
Evaluación parcial
Entrega de Ta.5
83
TEMA 3
Objetivo de aprendizaje.
3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión
Criterio de Aprendizaje.
3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza
Didáctica de enseñanza.
Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de
frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de
variación.
Ventajas y desventajas de la media aritmética.
La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo,
tiene importantes ventajas:
Se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro.
1. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es única debido a
que cada conjunto de datos posee una y sólo una media.
2. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios
conjuntos de datos.
Desventajas:
1. Puede verse afectada por valores extremos que no son representativos del resto de los datos.
2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro
cálculo.
3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo
abierto, ya sea en el inferior o en el superior de la escala.
La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupo homogéneo.
Ventajas y desventajas de la mediana:
Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fácil
de entender y se puede calcular a partir de cualquier tipo de datos – incluso a partir de datos agrupados
con clases de extremo abierto – a menos que la mediana entre en una clase de extremo abierto.
Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar
de números.
Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que
utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar los datos antes
de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos
que contenga un gran número de elementos. Por consiguiente, si deseamos utilizar una estadística de
muestra para estimar un parámetro de población, la media es más fácil de usar que la mediana.
84
Ventajas y desventajas de la moda:
La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto
cualitativos como cuantitativos.
También, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos.
Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente
del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan grandes o
qué tan pequeños sean los valores del conjunto de datos, e independientemente de cuál sea su
dispersión.
La podemos utilizar aun cuando una o más clases sean de extremo abierto.
Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se
presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta
el mismo número de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o más
modas, resultan difíciles de interpretar y comparar.
Comparación entre la media, la mediana y la moda.
Cuando trabajamos un problema de estadística, debemos decidir si vamos a utilizar la media, la
mediana o la moda como medidas de tendencia central. Las distribuciones simétricas que sólo
contienen una moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales
casos, no es necesario escoger la medida de tendencia central, pues ya está hecha la selección.
En una distribución positivamente sesgada (es decir, sesgada hacia la derecha), la moda todavía se
encuentra en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la
media se encuentra todavía más a la derecha de la moda y la mediana.
En una distribución negativamente sesgada, la moda sigue siendo el punto más alto de la distribución,
la mediana está hacia la izquierda de ella y la media se encuentra todavía más a la izquierda de la moda
y la mediana.
Cuando la población está sesgada negativa o positivamente, con frecuencia la mediana resulta ser la
mejor medida de posición, debido a que siempre está entre la moda y la media. La mediana no se ve
altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
La selección de la media, la mediana o la moda, en ocasiones, depende de la práctica común de una
industria en particular (salario medio de los obreros, precio mediano de una casa, familia modal para el
diseño de automóviles).
85
Práctica 4
En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de
frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de
variación.
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
1. Encuentre la media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango,
desviación media, desviación estándar, varianza y coeficiente de variación; de los siguientes conjuntos
de datos:
a) 3, 4, 4, 6, 6, 6, 8, 8, 12
b) 8, 40, 48, 62, 65, 65, 80, 83, 92
c) 27
25
30
33
25
34
34
27
30
30
32
31
26
31
29
30
32
30
33
32
d) Se evalúa la calidad de mermelada de guayaba, según los expertos el mínimo puntaje para que una
mermelada fuese considerada de buena calidad era si calificaba con 169.5 puntos de 190 posibles
evalué los siguientes datos de 60 muestras analizadas.
161
168
170
172
177
161
168
170
172
177
162
169
170
172
178
162
169
171
172
180
165
169
171
172
180
165
169
171
172
181
165
169
171
175
181
165
169
171
175
185
165
170
171
175
185
165
170
171
175
185
166
170
171
176
189
166
170
172
176
189
86
TEMA 4
Objetivo de aprendizaje.
4. Definir el concepto de covarianza y correlación
Criterio de Aprendizaje.
4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y determinar si las dos
están relacionadas.
Didáctica de enseñanza.
Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos.
Si observamos con atención los términos
vemos que las cantidades
La covarianza
y
van al cuadrado y por tanto no pueden ser negativas.
, es una manera de generalizar la varianza y se define como:
Como se ve, la fórmula es muy parecida a las de las varianzas. Es sencillo comprobar que se verifica la
siguiente expresión de
, más útil en la práctica:
Proposición
Si las observaciones no están ordenadas en una tabla de doble entrada, entonces se tiene que
87
o lo que es lo mismo
Ejemplo
Se han clasificado 100 familias según el número de hijos varones ( ) o hembras (
siguiente:
0
1
2
3
4
0
4
6
9
4
1
1
5
10
7
4
2
2
7
8
5
3
1
3
5
5
3
2
1
4
2
3
2
1
0
), en la tabla
1. Hallar las medias, varianzas y desviaciones típicas marginales.
2. ¿Qué número medio de hijas hay en aquellas familias que tienen 2 hijos?
3. ¿Qué número medio de hijos varones hay en aquellas familias que no tienen hijas?
4. ¿Qué número medio de hijos varones tienen aquellas familias que a lo sumo tienen 2 hijas?
5. Hallar la covarianza
Solución:
En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y
construimos la tabla con las frecuencias marginales, y con otras cantidades que nos son útiles en el
cálculo de medias y varianzas:
88
y1 y2 y3
y4
y5
0
1
2
3
4
4
6
9
4
1
24
0
0
0
5
10 7
4
2
28
28
28
44
7
8
5
3
1
24
48
96
62
5
5
3
2
1
16
48
144
63
2
3
2
1
0
8
32
128
40
23 32 26
14
5
100 156
396
209
0
32 52
42
20 146
0
32 104 126 80 342
de este modo, las medias marginales son
Calculamos después las varianzas marginales
que nos dan directamente las desviaciones típicas marginales,
El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución
condicionada de
89
n3j n3j yj
7
0
8
8
5
10
3
9
1
4
24 31
Del mismo modo, el número medio de hijos varones de las familias sin hijas, se calcula con la
distribución condicionada
ni1 ni1 xi
4
0
5
5
7
14
5
15
2
8
23 42
El número medio de hijos varones en las familias que a lo sumo tienen dos hijas, se calcula usando las
marginales de la tabla obtenida a partir de las columnas y1, y2 e y3
90
ni1 ni2 ni3 ni1+ni2+ni3 (ni1+ni2+ni3) xi
4
6
9
19
19
5
10 7
22
22
7
8
5
20
40
5
5
3
13
39
2
3
2
7
28
81
129
La covarianza es:
91
Práctica 5 Calcular y obtener covarianza y correlación de un conjunto de datos.
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
1) Las siguientes notas, son las calificaciones de 25 alumnos en las asignaturas de Matemáticas y
Termodinámica:
B 4
5
5
5
6
6
7
7
7
7
7
7
7
8
8
8
8
8
8
9
9
9
9
9
Q 3
5
5
6
7
7
7
7
7
7
8
8
8
7
7
8
8
8
8
8
8
8
1
0
1
0
1
0
1
0
a) Obtener la tabla de frecuencias conjunta.
b) ¿Qué proporción de alumnos obtienen más de un cinco en ambas asignaturas? ¿Qué proporción
de alumnos obtienen más de un cinco en Matemáticas? ¿Y en Termodinámica?
c) ¿Son independientes las calificaciones en Termodinámica y en Matemáticas?
d) Representa gráficamente, comenta el resultado.
e) Hallar el coeficiente de correlación.
2) Para realizar un estudio sobre la utilización de una impresora en un determinado departamento se
midió en un día los minutos transcurridos entre las sucesivas utilizaciones (X) y el número de páginas
impresas (Y), obteniéndose los siguientes resultados:
X
Y
X
Y
9
3
9
12
9
8
9
20
4
3
10
8
6
8
9
20
8
3
15
8
9
8
10
8
7
8
12
20
6
8
12
8
9
3
10
8
9
8
10
12
9
12
12
8
8
12
10
20
8
8
10
20
9
8
12
3
8
8
12
3
9
12
10
20
a) Escribir la distribución de frecuencias conjunta. ¿Cuál es el porcentaje de veces que transcurre
más de nueve minutos desde la anterior utilización y se imprimen menos de doce páginas? ¿Cuántas
veces se imprimen menos de doce páginas y transcurren nueve minutos desde la anterior utilización?
b) Frecuencias marginales. ¿Cuántas veces se imprimen como mucho doce páginas? ¿Cuántas
páginas como máximo se imprimen en el 80% de las ocasiones?
c) Hallar la distribución de frecuencias del número de páginas impresas condicionada a que han
transcurrido nueve minutos entre sucesivas utilizaciones.
d) Dibujar el diagrama de dispersión.
3) De la distribución bidimensional (xi,yi,nij) se sabe que para 100 observaciones:
 x i n i .  50
 y j n. j
 1000
 x i y j n ij
 6000
ij
a)
¿Cuánto vale la covarianza entre X e Y?
b)
¿Y la covarianza de (U,Z), si se tiene que X=
3U  4
2
y
Y
2Z  3
2
92
4) Las estaturas y pesos de los 50 niños nacidos en una maternidad durante una semana fueron los
siguientes:
E
P
50
3.1
51
4.2
50
3.2
51
4.3
52
4
51
4.1
50
3.3
51
4.4
53
4.5
51
3.9
50
3.9
50
3
52
3.7
51
3.7
51
3.6
53
4.1
49
3.4
48
2.9
52
4.2
51
3.3
50
3.8
52
3.5
48
2.7
49
3.8
51
3.8
50
3.4
52
3.6
50
3.6
52
3.6
52
3.9
51
3.4
53
4.4
49
3
54
4.6
52
4.3
50
3.8
50
3.5
50
3.3
52
4.1
51
3.6
52
4.2
51
3.5
51
3.1
51
4.2
52
4.0
51
4
51
3.3
49
3.1
52
3.8
51
3.7
a)
b)
Constrúyase una tabla de doble entrada, agrupando los pesos en intervalos de 0.5 kg.
¿Es la estatura independiente del peso?
5) En el examen de una asignatura que consta de parte teórica y parte práctica, las calificaciones de
nueve alumnos fueron:
Teoría 5 7 6 9 3 1 2 4 6
Prácti 6 5 8 6 4 2 1 3 7
ca
Calcular la covarianza y el coeficiente de correlación lineal. Dibujar la nube de puntos. Comentar los
resultados.
6) Se desea investigar el ganado caprino y el ganado ovino de un país. En la tabla de doble entrada
adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas
aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del número de
cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las explotaciones.
X\
Y
0
1
2
3
4
0
1
2
3
4
4
5
7
5
2
6
10
8
5
3
9
7
5
3
2
4
4
3
2
1
1
2
1
1
0
a) Hallar las medias, varianzas y desviaciones típicas marginales.
b) Hallar el número medio de ovejas condicionado a que en la explotación hay 2000 cabras.
c) Hallar el número medio de cabras que tienen aquellas explotaciones que sabemos que no tienen
ovejas.
d) Hallar la covarianza y el coeficiente de correlación entre ambas variables.
93
7) Se realiza una prueba a 20 aspirantes a un puesto de grabador consistente en un dictado con cierto
tiempo de duración (en minutos, que será variable para cada aspirante) y luego contar el número de
errores cometidos al transcribirlo a un ordenador. Los resultados fueron:
Tº 7
Er 8
r
6
7
5
6
4
6
5
7
8 7
10 9
8
9
9 6
10 8
5
6
8 6
10 8
8
9
7
8
8
8
7
7
6
8
6
6
9
8
a) Construir la tabla de correlación.
b) Para la variable tiempo calcular: media, mediana, moda, recorrido, recorrido intercuartílico y
coeficiente de variación.
c) Covarianza.
d) Número medio de errores de los aspirantes sometidos a un dictado de 6 minutos.
e) Porcentaje de aspirantes que cometen menos de 8 errores de entre los que son sometidos a un
dictado de más de 6 minutos.
8) La siguiente tabla muestra la talla de calzado y los pesos de 55 estudiantes:
39 40 40 40 41 41 41 41 42 42 42 42 43 43 44
Talla
55 60 65 70 60 65 70 85 65 70 75 80 65 75 85
Peso
Nºestudi 1 3 3 4 3 4 6 1 8 8 7 2 2 1 2
a.
a) Calcular la tabla de doble entrada de la distribución conjunta (tabla de correlación).
b) Calcula la distribución del peso condicionado a una talla de 42. Para esta distribución
condicionada calcula: mediana, tercer cuartil y nonagésimo percentil.
c) ¿Son independientes el peso y la talla de calzado?
d) Determina la covarianza.
9) Se trató a 5 enfermos de hepatitis con un mismo fármaco, variando el tratamiento en las cantidades
diarias suministradas. Medido el número de días que cada enfermo tardó en sanar, se tiene:
mg.
de 10 20 30 40 50
fármaco
Días
en 200 180 150 120 100
sanar
Calcular la covarianza entre estas dos variables.
94
CAPITULO 4
MODELOS PROBABILÍSTICOS
INTRODUCCIÓN
Probabilidad, rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso. La probabilidad está basada en el estudio de la
combinatoria y es fundamento necesario de la estadística.
La definición de variable aleatoria permite el uso de un lenguaje común que ayuda a entender de
una forma sistemática los experimentos aleatorios. En la medida en que se analizan distintos
tipos de experimentos aleatorios se comienza a notar que el comportamiento de muchos de ellos
es bastante similar entre sí. Comienzan a repetirse características de una variable aleatoria a
otra lo que conlleva a continuar la sistematización del análisis al verificar esas características
comunes. Este análisis lleva a definir modelos probabilísticos particulares que permiten explicar
fenómenos aleatorios que tienen un comportamiento similar entre sí.
Un modelo es una simplificación de la realidad. Un modelo probabilístico es un modelo
matemático que describe el comportamiento de una variable aleatoria. Es una función que
depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una
población en particular y que se denominan parámetros del modelo.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
Página
1. Definir los conceptos de variable aleatoria, parámetros función y distribución de
probabilidades.
1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de
probabilidades.
97
97
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Diferenciar los conceptos de variable aleatoria, parámetros función y
distribución de probabilidades.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Definir las variables aleatorias continuas y discretas.
2.1. Ilustrar las variables aleatorias continuas y discretas.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1. Diferenciar las variables aleatorias continuas y discretas.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial,
hipergeométrica y Poisson.
3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
3.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de esas
distribuciones discretas un conjunto de datos
97
97
102
102
95
OBJETIVO Y CRITERIOS DE APRENDIZAJE
4. Describir las consideraciones para elegir un modelo probabilístico discreto
4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un
conjunto de datos.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Analizar el modelo probabilístico discreto seleccionado para un conjunto de
datos.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de
student y F.
5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la
ocurrencia de un evento.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
5.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de distribuciones
continuas, la probabilidad de la ocurrencia de un evento.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
6. Describir las circunstancias en que se elige un modelo probabilístico continuo.
6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un
conjunto de datos.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
6.1.1. Analizar el modelo probabilístico continuo de acuerdo a la naturaleza de un
conjunto de datos.
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta.6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.
Ta.7 Solución de ejercicio
Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar
contenga del ejercicio dado.
102
102
108
108
108
108
101
107
110
96
TEMA 1
Objetivo de aprendizaje.
1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.
Criterio de Aprendizaje.
1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.
Didáctica de enseñanza.
TEMA 2
Objetivo de aprendizaje.
2. Definir las variables aleatorias continuas y discretas.
Criterio de Aprendizaje.
2.1. Ilustrar las variables aleatorias continuas y discretas.
Didáctica de enseñanza.
Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.
El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual
probabilidad de ocurrencia.
El modelo uniforme continuo es una variable aleatoria donde la probabilidad de que un evento ocurra
en un intervalo de ancho t es proporcional a ese intervalo.
La variable aleatoria se define al asignar a cada evento elemental un número entero. La numeración de
los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales
asociados al experimento aleatorio.
En la presente unidad se pretende que el alumno adquiera la habilidad del manejo de las anteriores
herramientas estadísticas.
Variable Aleatoria:
Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de
un experimento aleatorio.
Una variable aleatoria es el resultado numérico de un experimento aleatorio. Por ejemplo, podemos
considerar X el número resultante de tirar un dado; o podemos tirar 6 dados y tomar X como la suma de
los seis valores resultantes. La distribución de una variable aleatoria es la colección de posibles
resultados con sus probabilidades asociadas. Esto puede ser descrito por una tabla, una formula, o un
histograma de probabilidades
Si repetimos un experimento muchas veces, podremos calcular el histograma de frecuencias, el cual es
un grafico de barra que muestra el número de veces que cada valor de X fue observado. Esto debería
darnos una aproximación del histograma de probabilidades.
Ejemplo.
97
Probabilidades para n Dados.
Supongamos que tiramos seis n dados regulares balanceados. Si X es la suma de los valores que
aparecen en los n dados, Que son las probabilidades asociadas a cada valor de X dentro de los posibles
valores de X = n , ... , 6n?
En el caso de n=1, esas posibilidades son todas 1/6. Para dos dados, es más fácil considerar una tabla
con los posibles resultados:
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Ahora, podemos considerar la suma asociada a esos resultados:
2345 6 7
3456 7 8
4567 8 9
5 6 7 8 9 10
6 7 8 9 10 11
7 8 9 10 11 12
Como hay 36 resultados posibles, todos igualmente probables, podemos ver que las probabilidades son:
X frecuencia P(X)
2
1
1/36
3
2
2/36
4
3
3/36
5
4
4/36
6
5
5/36
7
6
6/36
8
5
5/36
9
4
4/36
10 3
3/36
11 2
2/36
12 1
1/36
Si hubiera más de dos dados, hacer tablas como las anteriores es difícil. El número de posibles
resultados seria 6n, sin embargo basta contar el número de veces que cada suma se da entre los 6n
98
posibles resultados para calcular la probabilidad de cada suma. Esto es fácil de hacer si consideramos la
función generadora para el número de veces que cada suma aparece:
f(x) = (x + x2 + x3 + x4 + x 5+x6)n
Por Ejemplo, para n=2 se tiene que:
(x + x2 + x3 + x4 + x 5+x6)2= x 2+2x3+3x4+4x5+5x6+6x7+5x8+4x9+3x10+2x11+x12
El coeficiente de xn es el número de veces que la i-ésima suma se da.
Ejercicio.
Probabilidades para n mondas con dos caras águila o sol que son definidas por valor 1 y 2
respectivamente. Supongamos que tiramos cinco n monedas. Si X es la suma de los valores que
aparecen en los n monedas, Que son las probabilidades asociadas a cada valor de X dentro de los
posibles valores de X = n, ... , 5n?
En el caso de n =2, esas posibilidades son todas 1/5. Considere una tabla con los posibles resultados.
Determine la posibilidad de que se obtenga la suma asociada a esos resultados y determine las
propiedades del cada evento.
Variable Aleatoria:
Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de
un experimento aleatorio.
Existen Variables continuas y Variables discretas.
Variables discretas:
Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia.
Variable Continua:
Es un rango que puede concebirse como un continuo de valores.
Parámetros: cantidades que aparecen en la formulación de un modelo, relacionadas con las
propiedades de la variable aleatoria en estudio.
Modelo o distribución de probabilidades: función que distribuye probabilidades entre los valores de
una variable aleatoria.
Variables aleatorias continuas y discretas.
99
Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio
muestral de un experimento aleatorio.
Las variables aleatorias se denotan con una letra mayúscula, tal como X , y con una letra minúscula,
como x , el valor posible de X . El conjunto de los posibles valores de la variable aleatoria X recibe el
nombre de rango de X .
Una variable aleatoria discreta es una variable aleatoria con un rango finito.
Ejemplo:
Se evalúa un nuevo proceso para la fabricación de partes moldeadas en plástico en términos de la
coloración y reducción de tamaño. Una de las primeras corridas del proceso proporciona la información
para el espacio muestral y las probabilidades que aparecen en la siguiente tabla:
Coloración
aprobado
aprobado
inaceptable
inaceptable
Reducción de tamaño
aprobado
inaceptable
aprobado
inaceptable
Probabilidad
0.64
0.16
0.16
0.04
Supóngase que el interés recae en resumir los resultados de este experimento aleatorio con el número
de características (de coloración y reducción de tamaño) que son aprobadas. Por lo cual, se define una
variable aleatoria, X , para ser igual al número de características aprobadas.
La cuarta columna de la siguiente tabla, contiene los valores de X asignados a cada resultado del
experimento. Por ejemplo al resultado (aprobado, aprobado) se le ha asignado x  2 .
Coloración
aprobado
aprobado
inaceptable
inaceptable
Reducción de tamaño
aprobado
inaceptable
aprobado
inaceptable
Probabilidad
0.64
0.16
0.16
0.04
x
2
1
1
0
En todos los procesos productivos las características del producto deben ser medidas para asegura que
el producto cuenta con las características especificadas en su diseño. En la práctica pueden presentarse
pequeñas variaciones en las longitudes medidas, por muchas causas, tales como vibraciones,
fluctuaciones de temperatura, diferencias entre quienes toman las mediciones, calibraciones, desgaste
en la herramienta de corte, desgaste en los cojinetes y cambios en la materia prima. Incluso el
procedimiento de medición puede producir variaciones en los resultados finales.
En estos tipos de experimentos, las mediciones de interés la corriente en el alambre de cobre, la
longitud de una parte maquinada puede representarse con una variable aleatoria. Es razonable modelar
el rango de los avalores posibles de la variable aleatoria con un intervalo (finito o infinito) de números
reales. Por ejemplo, para la longitud de una parte maquinada, este modelo permite que las mediciones
del experimento produzcan cualquier valor dentro de un intervalo de números reales. Dado que el rango
es cualquier valor en el intervalo, el modelo es adecuado para cualquier precisión utilizada al efectuar
las mediciones. Sin embargo, como el número de valores posibles de la variable aleatoria X es infinito
no contable, X tiene una distribución muy diferente de las de las variables aleatorias discretas
estudiadas en el capítulo anterior. El rango de X incluye todos los valores contenidos en un intervalo
100
de números reales; esto es, el rango de X puede concebirse como un continuo de valores. En
consecuencia, se tiene la siguiente definición.
Evidencia parcial
Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.
Evaluación parcial
Entrega de Ta.6
101
TEMA 3
Objetivo de aprendizaje.
3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica
y Poisson.
Criterio de Aprendizaje.
3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos.
Didáctica de enseñanza.
TEMA 4
Objetivo de aprendizaje.
4. Describir las consideraciones para elegir un modelo probabilístico discreto
Criterio de Aprendizaje.
4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos.
Didáctica de enseñanza.
Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el
ejercicio dado.
Modelo Uniforme.
Al analizar un experimento aleatorio en el cual el espacio muestral es un conjunto discreto y finito y
utilizar la definición clásica de probabilidades para el proceso de asignación de probabilidades a los
eventos elementales, se concluye que todos ellos tienen igual probabilidad dada por el inverso del
número de eventos elementales. Esta es la base de la definición de un modelo uniforme discreto.
El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual
probabilidad de ocurrencia. La numeración de los posibles valores de la variable se inicia en uno y
termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio. La regla de
asignación se indica en la siguiente ecuación.
…1
El modelo uniforme discreto se denotará como UD(n). La asignación de probabilidades de cada valor
de la variable está dada por la ecuación.
…2
Como consecuencia de la Ecuación 2, la función de distribución acumulativa de probabilidades, la
función de densidad de probabilidades y la función de probabilidad vienen dadas por las ecuaciones 3,
4 y 5, respectivamente.
102
…3
…4
…5
La siguiente tabla muestra los valores esperados más importantes correspondientes al modelo uniforme
discreto.
Valores Esperados más Importantes para el Modelo Uniforme Discreto.
Ejercicio: Considere el experimento aleatorio de lanzar una moneda honesta. Si al resultado ‘sello’ se
le asigna el valor uno y al resultado ‘cara’ se le asigna el valor dos entonces la variable aleatoria
definida se corresponde con el modelo uniforme discreto n = 2.
Ejercicio: Considere la variable aleatoria definida para el experimento aleatorio de lanzar un dado
honesto. Esta variable corresponde al modelo uniforme discreto con n = 6.
Distribución binomial.
Un proceso de manufacturas electrónicas produce miles de diodos diariamente. En promedio, el 1% de
estos diodos no se apega a las especificaciones. Cada hora, un inspector selecciona una muestra
aleatoria de 50 diodos y los clasifica como conformes o disconformes. Sea x la variable aleatoria que
representa el número de piezas con disconformidad en la muestra; entonces la distribución de
probabilidad de x es:
 n
n x
p x     p x 1  p 
 x
x  0,1,2...n
103
 50 
x
50 x
p x    0.01 0.99
x
x  0,1,2...50
 50 
50!
Donde   
que es el número de combinaciones de 50 partes tomadas x cada vez. Esta
 x  x!50  x !
es una distribución discreta, ya que el número observado de disconformidades es x  0,1,2...50 y se
denomina distribución binómica o binomial.
Podemos calcular la probabilidad de encontrar a lo más una pieza disconforme en la pieza:
p x  1  p x  0   p x  1
 p0  p1
1
 50 
x
50 x
   0.01 0.99 
x 0  x 
50!
0.9950 0.010  50! 0.011 0.9949

0!50!
1!49!
 0.6050  0.3056  0.9106
 91.06% De encontrar 1 o no encontrar ninguna.
Distribución Exponencial
La variable aleatoria X que es igual a la distancia entre ocurrencias sucesivas de un proceso Poisson
con media   0 , tiene una distribución exponencial con parámetro  . La función de densidad de
probabilidad de X es:
f x  x;      x , Para 0  x  
La distribución exponencial obtiene su nombre de la función exponencial que aparece en la función de
densidad de probabilidad. Para cualquier valor de la distribución exponencial tiene mucho sesgo. Los
resultados siguientes se obtienen con facilidad y la deducción de éstos se deja como ejercicio.
Si la variable aleatoria X tiene una distribución exponencial con parámetro  , entonces
1
1
EX   Y V  X   2


Ejemplo:
La vida útil de un foco es una variable exponencial con un promedio de 500 hrs. Calcula la
probabilidad de que la vida de un foco cualquiera:
104
a) Este entre 400 y 700 hrs.
1
1




F 700  1  e

1
700
500
F 400  1  e

1
 400
500

1
500
 0.7534
 0.5506
p400  x  700  F 700  F 400  0.7534  0.5506  0.2028
La probabilidad de que el foco dure entre 400 y 700 hrs. Es de 20.28%
b) Sea menor que el promedio.

1
500
px  500) 
500
 e
x
dx
0
1
1

500  

0  

 1  e 500   1  e 500 

 

=0.6321-0
=0.6321
Ejercicio
La vida de anaquel de producto enlatado es exponencial en funciona al tratamiento térmico que se
aplique en el proceso. La vida de anaquel es una variable exponencial con un promedio de 520 días.
Calcula la probabilidad de que la vida de anaquel de cualquier producto enlatado:
1. Que se ubique entre 450 y 800 días.
2. Que sea menor que el promedio.
La probabilidad de que un foco dure menos que el promedio (500 hrs. ) es de 63.21%
Distribución de Poisson
Una aplicación clásica de la distribución de Poisson en el control de calidad es como un modelo del
número de defectos o disconformidades que ocurren en una unidad del producto por ejemplo,
supóngase que el número de defectos por unidad en las conexiones de conductores en un dispositivo
electrónico de semiconductores tiene distribución de Poisson, con parámetro  = 4 (o sea 4 defectos en
promedio cada unidad). Entonces, la probabilidad de que uno de estos dispositivos seleccionados al
azar contenga 2 defectos o menos (incluso ninguno) es:
105
px  2  p0  p1  p2
p x  
 
p0 
e  x
x  0,1,2....
x!
2 
e   4 0
 0.0183156
0!
x
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
.
.
.
P(x)
0.0183
0.0733
0.1465
0.1954
0.1954
0.1563
0.1042
0.0595
0.0298
0.0132
0.0053
0.0019
0.0006
0.0002
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
Resultado .2381
Existe 23.81% de probabilidad de encontrar dos, uno o ninguno.
106
Práctica 6
Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio
dado.
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
En una agroindustria seleccionadora de manzana se aplico el control de calidad es como un modelo del
número de defectos o disconformidades que ocurren en una unidad del empaque, supóngase que el
número de defectos por caja tiene distribución de Poisson, con parámetro  = 2 (o sea 2 defectos en
promedio cada unidad).
1. Determine la probabilidad de que uno de estos dispositivos seleccionados al azar contenga 2.
107
TEMA 5
Objetivo de aprendizaje.
5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F.
Criterio de Aprendizaje.
5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento.
Didáctica de enseñanza.
TEMA 6
Objetivo de aprendizaje.
6. Describir las circunstancias en que se elige un modelo probabilístico continuo.
Criterio de Aprendizaje.
6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos.
Didáctica de enseñanza.
Ta.7 Solución de ejercicio
Distribución Normal
Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución
normal. Esta distribución puede obtenerse al considerar el modelo básico de una variable aleatoria
binomial cuando el número de ensayos se vuelve cada vez más grande. Este fue el enfoque original
seguido por De Moivre en 1733. Desafortunadamente, su trabajo se perdió por algún tiempo, y Karl
Gauus Desarrolló, de manera independiente, la distribución normal casi cien años después. Aunque
más tarde se dio crédito a De Moivre, la distribución normal también se conoce como distribución
Gaussiana.
Una variable aleatoria X con función de densidad de probabilidad normal:
1  x 

 
2
 
1
f x  
e 2
 2
  x  
Ejemplo.
La resistencia a la tensión del papel utilizado en la fabricación de bolsas para las compras es una
característica de calidad importante, se sabe que la resistencia (x) tiene distribución normal, con media
  40 lb
(psi, del inglés poud per square inch) y desviación estándar   2 lb
, lo que se
p lg 2
p lg 2


x  N 40,2 2 . El comprador de las bolsas necesita una resistencia de por lo menos
35 lbs p lg 2 . La probabilidad de que una bolsa producida con este papel satisfaga o exceda esta
especificación es px  35. Nótese que
denota por
108
px  35  1  px  35
Para evaluar esta probabilidad a partir de las tablas de distribución estándar hay que estandarizar el
punto 35 y se encuentra que:
x   35  40 

px  35  p  z 



2 

 pz  2.5
  25
 0.0062
Por consiguiente la probabilidad buscada es px  35  1  px  35  1  .0062  0.9938
La probabilidad de que una bolsa exceda las 35 lbs
p lg 2
es de 99.38%
Ejercicio.
Un parámetro a evaluar como control de calidad en los empaque de manzana Red Deliciuos la textura.
Mediante un penetrómetro se sabe que la resistencia (x) tiene distribución normal, con media
  40 lb
(psi, del inglés poud per square inch) y desviación estándar   2 lb
, lo que se
p lg 2
p lg 2


denota por x  N 40,2 2 . El comprador de manzana necesita una resistencia de por lo menos 38
lb/plg2. Determine la probabilidad de que una manzana empacada satisfaga o exceda esta
especificación.
Distribución T-Student
Supóngase que se toma una muestra de una población normal con media  y varianza  2 . Si X es el
promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución de
Z   X    /  / n es una distribución normal estándar. Supóngase que la varianza de la población
 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza  por S? La
distribución t proporciona la respuesta a esta pregunta.


Sea <Z una variable aleatoria con distribución N(0,1) y V una variable aleatoria jicuadrada con k
grados de libertad. Si Z y V son independientes, entonces la variable aleatoria
T
Z
V /K
Tiene la función de densidad de probabilidad
109
f x  
T k  1 / 2
1

kk / 2 x 2 / k  1 k 1 / 2

 
  x  
y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como t k .
La media y la varianza de la distribución t son  = 0 y  2  k / k  2 para que k>2, respectivamente.
Ejemplo:
Un químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos
por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. Si el valor t
calculado cae entre  t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de
una muestra que tiene una media x  518 gramos por milímetro y una desviación estándar muestral
s  40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
De las tablas se extrae el valor t 0.05  1.711 para 24 grados de libertad. Por tanto, el fabricante queda
satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711. Si
  500 , entonces,
t
518  500
 2.25
40 / 25
un valor muy por arriba de 1.771. La probabilidad de obtener un valor t , con v  24 , igual o mayor
que 2.25 es aproximadamente 0.02. Si   500 , el valor de t calculado de la muestra sería más
razonable. De aquí que es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.
Ta.7 Solución de ejercicio
En una agroindustria de lácteos se realiza un análisis de acidez a leche caliente (recién ordeñada). El
resultado arroja una acidez expresada en º Dornikc superior a 18. Lo que indica que la materia prima
esta altamente contaminada y disminuirán en medida correctiva el precio a los productores. Para
verificar esta afirmación los productores muestrea 25 lotes cada mes. Si el valor t calculado cae entre
 t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene
una media 19 º D y una desviación estándar muestra 3 2 º D. ¿ A que conclusión llegaría si la
distribución de acidez es aproximadamente normal?
110
CAPITULO 5
PRUEBAS DE HIPÓTESIS
INTRODUCCIÓN
A menudo, el problema que enfrenta el científico o el ingeniero no es tanto la estimación de un
parámetro poblacional, sino más bien la formación de un procedimiento de decisión que se base
en los datos que pueda producir una conclusión acerca de algún sistema científico. Por ejemplo,
un investigador médico puede decidir sobre la base de evidencia experimental si beber café
aumenta el riego de cáncer en humanos; un ingeniero puede tener que decidir sobre la base de
datos muestrales si hay una diferencia entre la precisión de dos tipos de medidores; o un
sociólogo puede desear reunir los datos apropiados que le permitan decidir si el tipo sanguíneo de
una persona y el color de los ojos son variables independientes. En cada uno de estos casos el
científico o el ingeniero postula o conjetura algo acerca de un sistema. Además, cada uno debe
incluir el uso de datos experimentales y la toma de decisiones basadas en éstos. De manera
formal, en cada caso, la conjetura se puede poner en forma de hipótesis estadística. Los
procedimientos que conducen a la aceptación o rechazo de hipótesis estadísticas como éstas
comprenden un área principal de la inferencia estadística y son los que y trataremos en la
presente unidad.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
Página
1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y
dos colas.
1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de
contrastabilidad.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Diferenciar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de
contrastabilidad.
113
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una
hipótesis.
2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar
una hipótesis
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1. Diferenciar los errores tipo I y II que se pueden presentar al aceptar o
rechazar una hipótesis.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una
distribución normal y los casos en los que se emplea esta prueba.
3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como
el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los
resultados.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
113
113
113
118
118
111
3.1.1. Aplicar pruebas de hipótesis sobre la media de una muestra de datos, así como
el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los
resultados.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de
una distribución normal y los casos en que se emplea esta prueba.
4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de
una distribución normal y los casos en que se emplea esta prueba.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Aplicar el procedimiento para realizar prueba de hipótesis sobre la varianza de
una distribución normal y los casos en que se emplea esta prueba.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de
datos de una distribución binomial y los casos en que se emplea esta prueba.
5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de
datos de una distribución binomial y los casos en que se emplea esta prueba.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
5.1.1. Aplicar el procedimiento de la prueba de hipótesis sobre p de una muestra de
datos de una distribución binomial y los casos en que se emplea esta prueba.
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de
control estadístico en alguna agroindustria. Además considere las opciones de error
tipo I y error tipo II.
Ta.9 Realizar el ejercicio, probando la hipótesis.
In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de
calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la
varianza de una distribución normal
Pa.7 Elaborar ejercicios sobre prueba de hipótesis p
123
123
126
126
117
122
125
129
112
TEMA 1
Objetivo de aprendizaje.
1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas.
Criterio de Aprendizaje.
1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad.
Didáctica de enseñanza.
TEMA 2
Objetivo de aprendizaje.
2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis.
Criterio de Aprendizaje.
2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis
Didáctica de enseñanza.
Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en
alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.
Pruebas de hipótesis.
Primero, definamos con precisión que entendemos por hipótesis estadística.
Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones.
La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certidumbre a menos que
examinemos toda la población. Esto, por supuesto, sería poco práctico en la mayoría de las situaciones.
En su lugar, tomamos una muestra aleatoria de la población de interés y utilizamos los datos
contenidos en esta muestra para proporcionar evidencia que apoye o no a la hipótesis. La evidencia de
la muestra que es inconsistente con la hipótesis que se establece conduce al rechazo de ésta, mientras
que la evidencia que la apoya conduce a su aceptación.
Debe quedar claro al estudioso de la materia que el diseño de un procedimiento de decisión se debe
hacer con la idea en mente de la probabilidad de una conclusión errónea. Por ejemplo, suponga que la
conjetura (hipótesis) que postula el técnico es que la fracción p de defectuosos en cierto proceso es
0.10. El experimento es la observación de una muestra aleatoria del producto en cuestión. Suponga que
se prueban 100 artículos y se encuentra que 12 están defectuosos. Es razonable concluir que esta
evidencia no rechaza la condición p  0.10 , y por ello puede conducir a la aceptación de la hipótesis.
Sin embargo, tampoco rechaza p  12 o incluso p  15 . Como resultado, el lector se debe
acostumbrar a comprender que la aceptación de una hipótesis simplemente implica que los datos no
dan suficiente evidencia para rechazarla. Por otro lado, el rechazo implica que la evidencia muestral la
refuta. Puesto de otra forma, el rechazo significa que hay una pequeña probabilidad de obtener la
información muestral observada cuando, de hecho, la hipótesis es verdadera. Por ejemplo, en nuestra
hipótesis de proporción de defectuosos, una muestra de100 que revela 20 artículos defectuosos es
ciertamente evidencia de rechazo. ¿Por qué? Si, en realidad, p  0.10 , la probabilidad de obtener 20 o
más defectuosos es aproximadamente 0.0035. Con el pequeño riesgo resultante de una conclusión
113
errónea, parecería seguro rechazar la hipótesis de que p  0.10 . En otras palabras, el rechazo de una
hipótesis tiende a casi “excluir” la hipótesis. Por otro lado, es muy importante enfatizar que la
aceptación o, más bien, la falla al rechazo no excluyen otras posibilidades. Como resultado, el analista
de los datos establece una conclusión firme cuando se rechaza una hipótesis.
El planteamiento formal de una hipótesis a menudo está influido por la estructura de la probabilidad de
una conclusión errónea. Si el científico se interesa en apoyar con fuerza una opinión, desea llegar a la
opinión en la forma de rechazo de una hipótesis. Si el investigador médico desea mostrar fuerte
evidencia a favor de la opinión de que beber café aumenta el riesgo de contraer cáncer , la hipótesis a
aprobar debe ser de la forma “ no hay aumento en el riesgo de contraer cáncer como producto de beber
café”. Como resultado, la opinión se alcanza por medio de un rechazo. De manera similar, para apoyar
la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero prueba la hipótesis de
que no hay diferencia en la precisión de los dos tipos de medidor.
Hipótesis nula y alternativa
La estructura de la prueba de hipótesis se formulará con el uso del término hipótesis nula. Éste se
refiere a cualquier hipótesis que deseamos probar y se denota con H 0 conduce a la aceptación de una
hipótesis alternativa, que se denota con H 1 . Una hipótesis nula con respecto a un parámetro
poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro, mientras
que la hipótesis alternativa permite la posibilidad de varios valores. De aquí, si H 0 es la hipótesis nula
p  0.5 para una población binominal, la hipótesis alternativa H 1 sería una de las siguientes:
p  0.5,
p  0.5,
O,
p  0.5.
Pruebas de Hipótesis
Hipótesis
Afirmación acerca de los parámetros de la población.
Hipótesis nula
Es una afirmación acerca de los valores de uno o más parámetros de la población. Se pone a prueba
usando la evidencia muestral.
Establece que la diferencia entre el parámetro poblacional y el
estadístico muestral se debe a la variación aleatoria del muestreo. Se denota por H0.
Hipótesis Alterna o alternativa
Es la afirmación sobre los parámetros de la población que es cierta si la hipótesis nula es falsa
(rechazada). Se denota por H1.
Región de rechazo
114
También llamada región crítica. Es el rango de valores de un estadístico muestral que conducirá al
rechazo de la hipótesis nula, bajo el nivel de significancia dado.
Error de tipo I
Se incurre en este error cuando incorrectamente se rechaza la hipótesis nula. Denotamos por  la
probabilidad de que se cometa un error de tipo I.
Error de tipo II
Se incurre en este error cuando incorrectamente no se rechaza la hipótesis nula. Denotamos por  la
probabilidad de que se cometa un error de tipo II.
Colas
Una prueba de una cola es una en la que la hipótesis alternativa indica una dirección. Una prueba de
dos colas es aquella en la que la hipótesis alternativa no especifica dirección.
Prueba de Hipótesis:
1. Se Especifica H0 y H1, y un nivel aceptable de  (Nivel de significancia de una prueba de Hipótesis).
2. Se define un estadístico muestral (estadístico de prueba) y la región de rechazo para la hipótesis nula
(regla de decisión).
3. Se recogen los datos de la muestra y se calcula el estadístico de prueba.
4. Se decide rechazar o no rechazar la hipótesis nula.
5. Interpretar los resultados en el marco del problema.
Estadístico de prueba
Es un estadístico de la muestra cuya distribución muestral puede ser especificada para la hipótesis nula
o para la hipótesis alternativa, aunque para la hipótesis alternativa esto pueda ser bastante complejo.
Después de especificar el nivel de significancia , la distribución muestral de este estadístico de prueba
puede usarse para definir la región de rechazo.
115
Ejemplo:
Según la FEDEFUT, el peso promedio de un jugador nuevo de la Liga Nacional de Fútbol es de 168.
Ahora, la nutricionista del equipo XYZ piensa que el peso promedio del equipo XYZ es diferente que
168. Como se están haciendo reclutamientos, escoge una muestra aleatoria del peso de 40 candidatos.
Asuma que  = 23
H0:  = 168
H1:   168
Nivel de significancia (probabilidad de rechazar la hipótesis nula cuando esta es cierta): 0.05.
La media y la desviación estándar de la muestra
El estadístico de prueba es la media muestral. Entonces rechazaríamos la hipótesis nula, si el promedio
muestral es mayor que un valor C1 o menor que un valor C2, para un nivel de significancia del 5%.
Si H0 es verdadera, entonces la media muestral tiene una distribución normal con media  igual a 168
y una desviación estándar
, donde  es la desviación estándar de la población.
Siendo simétrica la curva normal,
Se tiene que Z1 = 1.96 y Z2 =  1.96, entonces C1 = 175.13 y C2 =
160.87
116
Si no conociéramos , utilizamos la distribución t de 40 - 1 grados de libertad.
TINV(0.025, 39) = 2.3315
C1 = 177.2161
C2 = 158.78
Conclusión: no se rechaza la hipótesis nula.
En general, la hipótesis nula se construye para ser la hipótesis que siendo cierta, ninguna decisión
concerniente a un cambio se hará (cambio nulo). Rechazar la hipótesis nula significa tomar decisiones
que conllevan un cambio, y por lo tanto, representaran un costo. En este sentido, incurrir en un error de
tipo I conlleva una mayor preocupación.
La hipótesis alternativa describe condiciones para las cuales algo debe hacerse. Es la hipótesis de
investigación o acción. En un ambiente de investigación o experimental, la hipótesis alternativa es la
que queremos establecer, al rechazar la hipótesis nula, con un nivel suficientemente bajo de
significancia tal que es improbable que la nueva hipótesis sea erróneamente aceptada.
Es importante entonces el especificar un nivel adecuado de significancia. Cometer un error del tipo I
tiene mayores consecuencias, entonces se escoge un valor pequeño de .
0.1, 0.05, 0.01, más
comúnmente 0.05.
Hay una relación inversa entre  y . A menos de que se aumente el tamaño de la muestra, se puede
reducir  solamente aumentando. Ahora bien, conviene determinar en cada experimento cuales son
las consecuencias de cometer un error de tipo II.
Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en
alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.
117
TEMA 3
Objetivo de aprendizaje.
3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución
normal y los casos en los que se emplea esta prueba.
Criterio de Aprendizaje.
3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento
de prueba para aceptar o rechazar la hipótesis e interpretar los resultados.
Didáctica de enseñanza.
Ta.9 Realizar el ejercicio, probando la hipótesis.
Pruebas de Hipótesis sobre la Media, Varianza Conocida
En este tema se consideran pruebas de hipótesis sobre la media de una población (o la media de una
distribución de probabilidad), donde la varianza de la población es conocida.
Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene media  y
varianza  2 , con  2 conocida. El estadístico de prueba se basa en la media muestral X , por lo que
también se supondrá que la población está distribuida de manera normal o que se aplican las
condiciones del teorema del límite central. Esto significa que la distribución de X es aproximadamente
normal con media  y varianza  2 /n.
Desarrollo del procedimiento de prueba
Supóngase que se desea probar la hipótesis
H 0 :   0
H1 :    0
Donde
 0 es una constante específica. Se tiene una muestra aleatoria X 1 , X 2 ,......... X n De la
población. Puesto que X tiene una distribución aproximadamente normal con media  0 y
desviación estándar 
si la hipótesis nula es verdadera, entonces puede construirse una región
n
crítica con base en el valor calculado de la media muestral x .
Habitualmente, es más conveniente estandarizar la media muestral y utilizar una estadística de prueba
basada en la distribución normal estándar. Esto es, el procedimiento de prueba para H 0 :    0
utiliza el estadístico de prueba
Z0 
X  0

n
Si la hipótesis nula H 0 :    0 es verdadera, E  X   0  , de donde se desprende que la distribución
de Z 0 es la distribución normal estándar

denotada por N 0,1  . En consecuencia, si H 0 :    0 es
118
cierta, la probabilidad de que la estadística de prueba Z 0 caiga entre  Z
(Recuérdese que Z 
2
y Z
es 1   .
2
es el punto que corresponde al porcentaje 100 / 2 de la distribución normal
2
estándar). Nótese que la probabilidad de que la estadística de prueba Z 0 caiga en la región Z 0  Z  / 2 o
Z 0  Z / 2 cuando H 0 :    0 es verdadera, es  . Es evidente que una muestra que produce un
valor del estadístico de prueba que cae en las colas de la distribución de Z 0 será inusual si H 0 :    0
es cierta; por tanto, esto es un indicador de que H 0 es falso. En consecuencia, H 0 debe rechazarse si
Z 0  Z
Z 0  Z
2
(3)
2
(4)
Por otra parte, H 0 no puede rechazarse si
 Z / 2  Z 0  Z / 2
(5)
La ecuación 5 define la región de aceptación de H 0 , y las ecuaciones 3 y 4 definen la región crítica o
región de rechazo. La probabilidad del error tipo I para este procedimiento de prueba es  .
En general, es más fácil comprender la región crítica y el procedimiento de prueba cuando la estadística
de prueba es Z 0 más que X . Sin embargo, la misma región crítica siempre puede escribirse en
términos del valor calculado de la media muestral x . Un procedimiento idéntico al anterior es el
siguiente:
Rechazar H 0 :    0 si x  a o x  b
Donde
a   0  Z / 2 / n
b   0  Z / 2 / n
Ejemplo:
Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un
combustible sólido. Una de las características importantes de este producto es la rapidez de
combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se
sabe que la desviación estándar de esta rapidez es   2 cm./s. El experimentador decide especificar
una probabilidad para el error tipo I, o nivel de significancia, de   0.05 selecciona una muestra
aleatoria de n = 25 y obtiene una rapidez promedio muestral de combustión de x  51.3cm / s. ¿ A qué
conclusiones debe llegar?
La solución de este problema puede hallarse siguiendo el procedimiento de ocho pasos:
1. El parámetro de interés es  , la rapidez promedio de combustión.
119
2. H 0 :   50cm / s.
3. H1 :   50cm / s.
4.   0.05
5. La estadística de prueba es
Z0 
x  0
/ n
6. Rechazar H 0 si Z 0  1.96 o Z 0  1.96 . Nótese que esto es consecuencia del paso 4, donde se
especifica   0.05 , de modo que las fronteras de la región crítica son Z 0.025  1.96 y  Z 0.025  1.96
7. Cálculos: Puesto que x  51.3 y   2 ,
Z0 
51.3  50
 3.25
2 / 25
8. Conclusión: Dado que Z 0  3.25  1.96 , se rechaza H 0 :   50 con nivel de significancia de 0.05.
Planteado de manera más completa, se concluye que, con base en una muestra de 25 mediciones, la
rapidez promedio de combustión es diferente de 50 cm/s. De hecho, existe una evidencia fuerte que la
rapidez promedio de combustión es mayor que 50 cm/s.
Ejercicio
1. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano.
Deseamos contrastar con un nivel de significación de
si la altura media es diferente de 174
cm. Para ello nos basamos en un estudio en el que con una muestra de n=25 personas se obtuvo:
2. Consideramos el mismo ejercicio anterior. Comprobado que se rechaza el hecho de que la altura
media de la población sea igual a 174 cm. Realizar el contraste sobre si la altura media es menor de 174
cm.
Pruebas de Hipótesis sobre las Medias de dos Distribuciones Normales, Varianzas Desconocidas.
Ahora se considerarán pruebas de hipótesis sobre la igualdad de las medias 1 , y  2 de dos
distribuciones normales donde las varianzas  12 y  22 son desconocidas. Para probar esta hipótesis se
usará una estadística t . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de
prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el
procedimiento.
120
Ejemplo
Índices de Octano en Carretera
Formula 1
Formula 2
( con tetraetil-plomo)
(Sin plomo)
89.5
89.5
90.0
91.5
91.0
91.0
91.5
89.0
92.5
91.5
91.0
92.0
89.0
92.0
89.5
90.5
91.0
90.0
92.0
91.0
Se desea probar la hipótesis de que el índice octánico medio de la formulación 1 (con plomo) es igual
al índice de octano medio para la formulación 2; o sea,
H 0 : 1   2
H1 : 1   2
Rechazar H 0 si t 0  t / 2,v
n1  10
n 2  10
x1  90.7
x 2  90.8
S1  1.16
S 2  1.03
S  1.34
S 22  1.07
2
1
Sp 
Sp 
n1  1S12  n2  1S 22
n1  n2  2
10  11.34  10  11.03
10  10  2
V  n1  n2  2
V  10  10  2  18
S p  1.09
t0 
x1  x 2
1
1
Sp

n1 n2
121
t0 
90.7  90.8
 0.21
1
1
1.09

10 10
Usando   0.01 tenemos t 0.01 / 2,18
t 0.005,18  2.878
0.21  2.878
La decisión es aceptar H 0
Ejercicio
Establecer las pruebas de hipótesis sobre la igualdad de las medias 1 , y  2 de dos distribuciones
normales donde las varianzas  12 y  22 son desconocidas. Para probar esta hipótesis se usará una
estadística t . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero
los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento.
Ta.9 Realizar el ejercicio, probando la hipótesis.
Presencia de Plomo en la leche
Leche de la laguna
Leche del Valle del
(ppm)
Mezquital
(ppm)
0.0895
0.0895
0.090
0.0915
0.091
0.0910
0.095
0.0890
0.0925
0.0915
0.0910
0.092
0.0890
0.092
0.0895
0.0905
0.0910
0.090
0.0920
0.091
Se desea probar la hipótesis de que el contenido de plomo entre los productos originados de la laguna y
del Valle del Mezquital es diferente.
H 0 : 1   2
H1 : 1   2
122
TEMA 4
Objetivo de aprendizaje.
4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución
normal y los casos en que se emplea esta prueba.
Criterio de Aprendizaje.
4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución
normal y los casos en que se emplea esta prueba.
Didáctica de enseñanza.
In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la
agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal
Pruebas de Hipótesis sobre la Varianza
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. En
esta sección se presentan dos procedimientos; uno se basa en la hipótesis de que la población es
normal, mientras que el otro es una prueba para una muestra grande que no requiere la suposición de
normalidad.
Procedimientos de Prueba para una Población Normal
Supóngase que se desea probar la hipótesis de que la varianza de una población normal  2 es igual a
un valor específico, por ejemplo,  02 . Sea X 1 , X 2 ,.... X n una muestra aleatoria de n observaciones
tomadas de esta población. Para probar.
H 0 :  2   02
H 1 :  2   02
(1)
Se utiliza el estadístico de prueba
X 02 
n  1S 2
 02
(2
)
Donde S 2 es la varianza muestral. Ahora, si H 0 :  2   02 es verdadera, entonces el estadístico de
prueba X 02 sigue una distribución ji-cuadrada con n  1 grados de libertad. Por consiguiente, se calcula
el valor de la estadística de prueba X 02 , y la hipótesis H 0 :  2   02 debe rechazarse si
X 02  X 2 / 2,n1
(3)
O si
X 02  X 12 / 2,n1
(4)
123
Donde X 2 / 2,n1 y X 12 / 2,n1 son los puntos que corresponden a los porcentajes 100 / 2 inferior y
superior de la distribución ji-cuadrada con n  1 grados de libertad, respectivamente.
El mismo estadístico de prueba se utiliza para hipótesis alternativas unilaterales. Para la hipótesis
unilateral.
H 0 :  2   02
H1 :   
2
2
0
(5
)
Se rechaza H 0 si
X 02  X 2,n1
(6)
Para la hipótesis unilateral
H 0 :  2   02
H 1 :  2   02
(7
)
Se rechaza H 0 si
X 02  X 12 ,n1
(8
)
Ejemplo:
Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para
llenar las botellas. De manera específica, es deseable que la desviación estándar  del proceso de
llenado sea menor que 0.5 onzas de líquido; de otro modo, existe un porcentaje mayor del deseable de
botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado
es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza
muestral s 2  0.0153 (Onzas de fluido) 2 . Si la varianza del volumen de llenado es mayor que 0.01
(onzas de fluido) 2 , entonces existe una proporción inaceptable de botellas que serán llenadas con una
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene
un problema con el llenado de las botellas? Utilícese   0.05 .
Al utilizar el procedimiento de ocho pasos se tiene lo siguiente:
1. El parámetro de interés es la varianza de la población s 2 .
2. H 0 :  2  0.01
3. H 0 :  2  0.01
4.   0.05
5. El estadístico de prueba es
X 02 
n  1s 2
 02
124
6. Se rechaza H 0 si X 02  X 02.05,19  30.14
7. Cálculos:
190.0153
 29.07
0.01
8. Conclusiones: Puesto que X 02  29.07  X 02.05,19  30.14 , se concluye que no hay ninguna evidencia
X 02 
fuerte de que la varianza del volumen de llenado sea mayor que 0.01 (onzas de fluido) 2
In.1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la
agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal
125
TEMA 5
Objetivo de aprendizaje.
5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una
distribución binomial y los casos en que se emplea esta prueba.
Criterio de Aprendizaje.
5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una
distribución binomial y los casos en que se emplea esta prueba.
Didáctica de enseñanza.
Pa.7 Elaborar ejercicios sobre prueba de hipótesis p
Prueba de hipótesis sobre una distribución binomial.
Existen muchas formas de ejemplificar la probabilidad de que ocurra un evento y su aplicación en un
modelo binomial. Por ejemplo, cuando un grupo de productos se elabora en forma independiente y se
evalúa de acuerdo a su conformación como articulo defectuoso y no defectuoso; o cuando se hace una
prueba de preferencia entre el producto para ver si agrada o no al consumidor. La comparación entre la
conformación probable entre estas dos clases hace posible seleccionar o inferir cual es la tendencia
proporcional..
La distribución binomial.
Esta distribución describe una variedad de procesos y describe datos discretos, no continuos, que son
resultado de un experimento conocido como proceso de Bernoulli.
Prueba de hipótesis sobre p de una muestra de datos de una distribución binomial.
Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones, en la que
estudiamos una variable de tipo dicotómico (Bernoulli):
Si X1 y X2 contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una de ellas
se distribuye como una variable aleatoria binomial:
De modo que los estimadores de las proporciones en cada población tienen distribuciones que de un
modo aproximado son normales (cuando n1 y n2 son bastante grandes)
126
El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada población
es una cantidad conocida
Si H0 fuese cierta se tendría que
Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus estimadores, lo que da
lugar a un error que es pequeño cuando los tamaños muestrales son importantes:
Contraste bilateral
El contraste bilateral sobre la diferencia de proporciones es
Entonces se define
Y se rechaza la hipótesis nula si
o si
Contrastes unilaterales
En el contraste
127
Se rechazará H0 si
Se rechaza H0 si
. Para el test contrario
.
Ejemplo
El gerente de ventas de una empresa agroindustrial asegura que la venta del producto depende del color
que se use en el empaque. Con el propósito de evaluar a la anterior consideración se estableció un
experimento donde 25 amas de casa elegidas aleatoriamente en forma independiente seleccionaron a su
agrado una muestra del producto en comparación: empaque color rojo y empaque color azul.
Solución:
Los resultados indicaron que las amas de casa prefirieron el producto con empaque azul. Al esperar
que el color del empaque no influye en la selección del producto se espera una conformación de
proporcionalidad igual al 50 % ( P = (0.5 y q =0.5 ). a un nivel de significancia =0.05.
Ho: P = 0.5
Ha: P  0.5
Ahora bien, si se tiene que n = 25 y T = 18 y el nivel de significancia es =0.05., al región crítica se
considera /2=0.025
P1= 18/25= 0.72
P2=7/25 = 0.28
 = 0.72-0.28= 0.44
Z calculada = 0.0432 por lo tanto se concluye que la
128
Práctica 7
Elaborar ejercicios sobre prueba de hipótesis p
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
En todos los problemas que siguen a continuación, se supone que las muestras han sido elegidas de
modo independiente, y que las cantidades cuantitativas que se miden, se distribuyen de modo
gaussiano. En temas posteriores se verá cómo contrastar si estas premisas pueden ser aceptadas o no al
examinar las muestras.
Ejercicio 1.
El calcio se presenta normalmente en la sangre de los mamíferos en concentraciones de alrededor de 6
mg por cada 100 ml del total de sangre. La desviación típica normal de ésta variable es 1 mg de calcio
por cada 100 ml del volumen total de sangre. Una variabilidad mayor a ésta puede ocasionar graves
trastornos en la coagulación de la sangre. Una serie de nueve pruebas sobre un paciente revelaron una
media muestral de 6,2 mg de calcio por 100 ml del volumen total de sangre, y una desviación típica
muestral de 2 mg de calcio por cada 100 ml de sangre. ¿Hay alguna evidencia, para un nivel α=0.05, de
que el nivel medio de calcio para este paciente sea más alto del normal?
Ejercicio 2.
El número de accidentes mortales en una ciudad es, en promedio, de 12 mensuales. Tras una campaña
de señalización y adecentamiento de las vías urbanas se contabilizaron en 6 meses sucesivos 8, 11, 9, 7,
10, 9 accidentes mortales. ¿Fue efectiva la campaña?
Ejercicio 3.
El promedio de las puntuaciones de un número elevado de alumnos de Bioestadística es de 6,50. Un
determinado año se examinaron 50 alumnos con resultados promedio de 7,25 y desviación típica de 1.
¿Variaron las calificaciones?
Ejercicio 4.
El peso medio de mujeres de 30 a 40 años es de 53 kg. Un estudio realizado en 16 mujeres de tales
edades que siguen una dieta vegetariana da
y
. ¿Modifica la dieta el peso medio?
Ejercicio 5.
Una población infantil se dice que es susceptible de recibir una campaña de educación e higiene si su
porcentaje de niños con dientes cariados es superior al 15%. Una población con 12.637 niños, ¿debe
hacerse la campaña si de 387 de ellos 70 tenían algún diente cariado?
129
CAPITULO 6
ANÁLISIS DE LA VARIANZA
INTRODUCCIÓN
El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más
medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto
utilizar repetidamente el contraste basado en la t de Student.
El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método
que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de
experimentos y, de alguna manera, es la base del análisis multivariante.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
Página
1. Analizar las causas del error experimental durante las mediciones.
1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos
de texto.
132
132
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Utilizar un modelo lineal a partir de mediciones experimentales o datos de texto
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Reconocer las fuentes de variación, describir el procedimiento del análisis de
varianza y explicar el concepto de grado de libertad.
2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de
varianza y el concepto de grado de libertad.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1. Utilizar las fuentes de variación, el procedimiento del análisis de varianza y el
concepto de grado de libertad.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones.
3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad
experimental y número de repeticiones.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
3.1.1. Emplear en un conjunto de datos el tamaño de muestra, la unidad
experimental y número de repeticiones..
OBJETIVO Y CRITERIOS DE APRENDIZAJE
4. Identificar de acuerdo a la estructura de los datos, el experimento completamente
al azar, el experimento en bloques al azar y el experimento factorial.
4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento
completamente al azar, el experimento en bloques al azar y el experimento factorial.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Emplear de acuerdo a la estructura de los datos, el experimento completamente
134
134
136
136
136
136
130
al azar, el experimento en bloques al azar y el experimento factorial.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos.
5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de
experimentos.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
5.1.1. Determinar el procedimiento del análisis de varianza para ese tipo de
experimentos.
DEMOSTRACIÓN DE HABILIDADES FINALES
Pa.8 Análisis de varianza (ANOVA)
136
136
146
131
TEMA 1
Objetivo de aprendizaje.
1. Analizar las causas del error experimental durante las mediciones.
Criterio de Aprendizaje.
1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto.
Didáctica de enseñanza.
Modelo Matemático Lineal
Causas del error experimental
Al conducir un experimento una persona encuentra uno o más de tres tipos generales de errores: error
humano, error sistemático, y error al azar.
Error humano (un error) ocurre cuando el experimentador, incurre en una equivocación. Los ejemplos
serían cuando se instala un experimento incorrectamente, cuando se lee mal un instrumento, o cuando
se incurre en una equivocación en un cálculo.
Error sistemático, es un error inherente en el experimento instalado que hace sesgar a los resultados
en la misma dirección, es decir, siempre demasiado grande o siempre demasiado pequeño. Algunos
errores sistemáticos pueden ser corregidos fácilmente. Por ejemplo, si un equilibrio lee 0,25 g cuando
no hay masa en ella, esto introduciría un error sistemático a cada medida, todo sería demasiado grande
por 0,25 g. Esto puede ser corregido poniendo a cero el equilibrio.
Todos los experimentos tienen error al azar, que ocurre porque ninguna medición no se puede hacer
con precisión infinita. Los errores al azar harán una serie de medidas demasiado grande y a veces
demasiado pequeña. Un ejemplo del error al azar podía ser al hacer sincronizaciones con un
cronómetro. Usted puede parar a veces el reloj demasiado pronto, o a veces demasiado tarde. Cualquier
caso introduce error al azar en sus medidas. (nota que cuando un ser humano está implicado en el
proceso real de la medida, el/ella puede introducir el error experimental válido que no está dentro de la
definición del error humano. Su tiempo de reacción finito no es un error; es una limitación de una
porción del proceso experimental, del ser humano haciendo la medida.) El error al azar puede ser
reducido haciendo un promedio de varias mediciones.
Análisis del error
Una forma para analizar error experimental con un % del cálculo del error. El % del error es útil
cuando se tiene un solo resultado experimental que se desee comparar con un valor estándar, o cuando
se tienen dos valores experimentales obtenidos por diversos medios que se deseen comparar.
El % del error se calcula según la fórmula siguiente.
expt.# - std. #
% error =
x 100 %
std. #
"expt. #" es su valor experimental, y el "std. #" es el valor del standard o del referente. Usando esta
fórmula, un resultado positivo indica que su resultado fuera más grande que el estándar, mientras que
un resultado negativo implica un resultado experimental más pequeño que el estándar. Mientras que %
132
del error le dice el tamaño relativo de su error, no le da ninguna pista en cuanto al tipo de ese error
(error al azar o error sistemático)).
En ciertos casos uno puede utilizar una cantidad estadística llamada la desviación de estándar ,
denotada generalmente por la sigma griega minúscula de la letra, σ , o la abreviatura std.,
Podemos resumir:
- % pequeños del error, dentro de uno o de dos σ estándar:, principalmente al azar.
- % pequeños del error, no dentro de dos o de tres σ estándar: principalmente sistemático.
- % grandes del error, dentro de uno o de dos σ estándar: grande, principalmente errores del random.
- % grandes del error, no dentro de dos o de tres σ estándar: principalmente sistemático.
133
TEMA 2
Objetivo de aprendizaje.
2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el
concepto de grado de libertad.
Criterio de Aprendizaje.
2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el
concepto de grado de libertad.
Didáctica de enseñanza.
Análisis de varianza del modelo lineal
De acuerdo con la hipótesis nula, según la cual se supone que las medidas poblacionales de los tres
grupos son iguales, se puede obtener una medición de la variación total o suma de los cuadrados,
sumando las diferencias elevadas al cuadrado entre cada observación y una medida global X sobre la
base de todas las observaciones. La variación total se calcularía como:
__
Supóngase que el gerente de producción de una planta en la cual se fabrica y envasa cereal en cajas de
368 gramos, considera sustituir una máquina antigua que afecta directamente la producción. Es más
supóngase que tres productores le han permitido usar sus equipos para efectuar pruebas , y cuyos
precios de compra y contratos de mantenimientos son totalmente iguales . Para tomar la decisión de
compra , el gerente de producción decide llevar a cabo un experimento para determinar las diferentas
más importantes entre las tres macas de equipo en el tiempo promedio (en segundos) que necesitan los
obreros para su producción. Se asignan en forma aleatoria 15 operarios con experiencia, capacidad y
edades similares, para recibir adiestramiento en una de las tres máquinas de modo que cada máquina
tenga cinco operadores. Después de una capacitación adecuada , suficiente y practica, el gerente de
producción mide el tiempo que necesitan los operadores para trabajar con sus equipos respectivos.
En la siguiente tabla se presentan los resultados de este experimento.
MÁQUINA
Media
1
25.40
26.31
24.10
23.74
25.10
24.93
2
23.40
21.80
23.50
22.75
21.60
22.61
3
20.00
22.20
19.75
20.60
20.40
20.59
Se expresa la hipótesis nula y alternativa en la forma siguiente:
H0: 1 = 2 =3 = ...= c
Todas las medias son iguales
H1: No todas las medias son iguales
Para el caso del ejemplo las hipótesis nula y alternativa serian:
H0: 1 = 2 =3 = ...= c
Todas las máquinas son iguales
134
H1: No todas las máquinas son iguales
En la tabla se observa que existen diferencias en las medias maestrales para las tres máquinas. La
pregunta es si estos datos son lo suficientemente diferentes para que el gerente de producción llegue a
la conclusión de que los promedios poblacionales no son todos iguales.
Grados de libertad
Para calcular s2 se necesita conocer primero la media. Por consiguiente se puede decir que solo n-1
de los valores de muestra están “libres” para variar. Es decir , hay n-1 grados de libertad.
135
TEMA 3
Objetivo de aprendizaje.
3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones.
Criterio de Aprendizaje.
3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y
número de repeticiones.
Didáctica de enseñanza.
TEMA 4
Objetivo de aprendizaje.
4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el
experimento en bloques al azar y el experimento factorial.
Criterio de Aprendizaje.
4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el
experimento en bloques al azar y el experimento factorial.
Didáctica de enseñanza.
TEMA 5
Objetivo de aprendizaje.
5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos.
Criterio de Aprendizaje.
5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos.
Didáctica de enseñanza.
Pa.8 Análisis de varianza (ANOVA)
Diseño de experimentos
Los experimentos son usados por los investigadores en todas las áreas de la ciencia ya se para describir
algo acerca de un proceso en particular o para comparar el efecto de varias condiciones sobre algún
fenómeno.
Para el diseño y análisis de experimentos se requiere que toda persona involucrada en el experimento
tenga una idea clara de lo que exactamente se será estudiado , como serán colectados los datos y al
menos una idea cualitativa de cómo serán analizados los datos.
A continuación se describe una generalización del procedimiento recomendado para el diseño de
experimentos:
1. Establecimiento del problema y objetivos. Un claro establecimiento del problema frecuentemente
contribuye a un buen entendimiento del fenómeno y a la solución final del problema. Es necesario
desarrollar todas las ideas acerca de los objetivos del experimento.
136
2. Selección de factores y niveles el experimento debe seleccionar el factor o los factores (variable o
variables independientes) que serán investigados en el experimento. También se deberá seleccionar los
valores o niveles del factor o factores que se usaran en el experimento y que definen los tratamientos.
Al definir los tratamientos se esta definiendo al denominado especio de exploración o región de
exploración.
3. Definir a la unidad experimental. La unidad experimental es aquella subdivisión menor del material
experimental y que puede definir un tratamiento diferente. Para la selección de las unidades
experimentales debe tomarse en cuenta el especto práctico, no puede considerarse representativo el uso
de una planta para comparar dosis de fertilizante. En el aspecto estadístico debe tomarse en cuenta el
tamaño de la unidad experimental y el número de repeticiones para la precisión del experimento. Se
entiende por número de repeticiones al número de unidades experimentales que se repiten con el
mismo tratamiento.
4. Definir las observaciones o mediciones. En general selección de variables respuesta.
5. Elección del diseño experimental. El diseño experimental es la forma de asignar los tratamientos o
las unidades experimentales, esto determina un modelo o un análisis a seguir. El experimentador debe
determinar la diferencia en la respuesta verdadera que desea detectar, así como la magnitud de riesgo
que esta dispuesto a tolerar , con lo cual un tamaño de muestra apropiado puede ser seleccionado.
También debe determinar el orden en el cual los datos deberán ser recolectados y el método de
aleatorización que será empleado.
Generalmente en diseños experimentales las ideas centrales guían a la elección de aleatorización y
bloqueo.
El bloqueo es la inclusión en el diseño de algunos factores que aunque no son de interés, si pueden ser
causa de una fuerte variación en las unidades experimentales y que no pueden mantenerse constantes
para todas las unidades experimentales del experimento. Un bloque es un grupo de unidades
experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos
diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros
factores aleatorios.
Se llama bloque completo a un grupo de unidades experimentales que contienen todos los tratamientos
del experimento y bloque incompleto si contiene solo una parte de todos los tratamientos. Para el caso
de dos tratamientos , los bloques completos son parejas de unidades experimentales semejantes y se les
denomina observaciones apareadas.
La aleatorización es un medio de impartir insesgamiento a los estimadores, a pesar de tener unidades
experimentales heterogéneas, es decir que todos los factores no estudiados, ni controlados
explícitamente en el modelo y que causan variación las unidades experimentales, son “controlados”
por la aleatorización.
6. Determinar el número de repeticiones. Las repeticiones son las veces que se reproduce cada
tratamiento en la unidad experimental. Las repeticiones permiten obtener una estimación de la varianza
del error experimental e incrementan la precisión del experimento ya que de hecho son el tamaño de
muestra de cada una de las poblaciones estudiadas.
137
7. Proyecto de resultados y análisis. Estos aspectos deben determinarse antes de efectuar el
experimento , para que puedan señalarse cuales son las suposiciones básicas del modelo y determinar
si el experimento cumple satisfactoriamente tales suposiciones.
8. Efectuar el experimento y colección de datos. Debe tenerse cuidado en a especificación de los
pasos prácticos a seguir y tener formas especialmente diseñadas para capta las observaciones.
9. Efectuar el análisis estadístico. Para este análisis existen programas de computadora , pero deben
complementase con graficas, cuadros o lagunas rutinas de calculo extra que sean fácilmente
explicables.
Obtención de conclusiones. Si el experimentador o investigador tiene poco conocimiento de la
estadística, entonces debe ser auxiliado por un estadístico para la interpretación de los análisis
El modelo.
Las observaciones pueden expresarse en general mediante el siguiente modelo estadístico lineal:
Yij = +i + εij
i = 1,2,...t
j= 1,2,...n
Que es el diseño estadístico completamente aleatorizado y donde:
Yij : es la i-ésima observación tomada bajo el tratamiento i-ésimo.
μ: Es el parámetro común a todos los tratamientos (media general)
I : Es el parámetro del i-ésimo tratamiento denominado “ efecto del i-ésimo tratamiento”.
εij = Es el componente de error aleatorio ocasionado por todos los factores no constantes en cada una
de las poblaciones estudiadas.
t: es el número de tratamientos (poblaciones)
n: Es el número de observaciones o tamaño de muestra de la i-ésima población.
El interés por desarrollar el análisis de varianza radica en que se desea probar la hipótesis sobre la
igualdad de los efectos de los tratamientos, es decir:
Ho: 1 =2=3 ...=t
Ha: 1≠ j para al menos i ≠ j
vs
Si Ho es cierta entonces cada observación puede ser representada como:
Yij =  + εij
El procedimiento del análisis de varianza se resume en el cuadro siguiente:
F.V
G.L
SC
CM
F0
138
TRATAMIENTOS
t-1
SCTr
CMTr=SCTr/(t-¡)
ERROR
nt-t
SCE
CME= SCE/(nt-t)
TOTAL
nt-1
SCT
CMTr/CME
La suma de cuadrados puede obtenerse como sigue:
t
n
t
SCT =  (Yij  Y ..) 2  
i 1 j 1
i 1
n
Yij 
2
j 1
2
Y..
nt
Yi .2 Y..2
SCTr = n (Yi  Y ..)  
.

nt
i 1
i 1 n
t
t
2
SCE = SCT – SCTr
Diseño experimental completamente aleatorizado
Es el diseño experimental más sencillo, y se origina por la asignación aleatoria de los tratamientos a un
conjunto de unidades experimentales previamente establecidas. En este diseño pueden probarse
cualquier número de tratamientos resultando deseable, aunque no esencial, asignar al mismo número de
unidades experimentales a cada tratamiento.
Es un diseño experimental de mucha utilidad en todos los campos de la ciencia, siempre y cuando se
consiga homogeneidad del material experimental y del sitio donde se vaya a desarrollar el experimento.
Se podrían enumerar una serie de ventajas y desventajas del diseño:
Ventajas:
1.- Tanto la planificación como el análisis son los más simples si se les compara con los otros diseños
conocidos.
2.- Produce el máximo número de grados de libertad para el error, lo que es muy útil en pequeños
ensayos.
3.- Cuando existe un número desigual de replicaciones por tratamientos, no es causa de complicaciones
en el análisis estadístico.
4.- Es de fácil manejo tanto en el campo como en el laboratorio.
Desventajas:
1.- Solo puede usarse con material experimental muy homogéneo.
2.- Su utilidad es restringida en los experimentos de campo, debido a la heterogeneidad del suelo, que
puede ser muy grande. Para evitar que la misma enmascare los resultados del experimento, debe
recurrirse a diseños muy eficientes.
139
3.- Presenta desventajas cuando el material no es homogéneo, ya que no se puede aumentar mucho el
tamaño del experimento, debido a que esto motiva variaciones muy altas, que enmascaran el efecto del
tratamiento.
En cuanto al número de observaciones para cada tratamiento o factor, se determina en base a los costos
y a la potencia de la prueba.
Seguidamente se presenta con un ejemplo, los pasos a seguir para la realización del análisis en este tipo
de diseño, donde se incluyen: modelo lineal aditivo, supuestos, hipótesis a probar.
En el presente cuadro se muestran los resultados (área intestinal en dmª), en un ensayo donde se prueba
el efecto de 4 desparasitantes en cerdos estabulados.
Desparasitantes
OBS(n)
1
2
3
4
5
6
7
8
total
1
4.87
4.60
1.33
5.58
5.88
2.81
4.10
5.63
34.84
2
3.30
2.25
5.85
6.16
8.35
5.93
1.50
5.85
38.19
3
6.80
5.70
4.62
3.80
2.75
4.93
4.93
3.80
37.33
4
1.28
3.88
5.00
3.25
1.56
4.25
4.46
5.53
29.21
139.53
n= número de observaciones por desparasitantes = 8
N= número total de observaciones = 32
Modelo lineal:
Yij    i  ij
Yij: observación j-ésima del i-ésimo tratamiento.
μ: media general
i:
efecto del i-ésimo tratamiento
εij: error experimental de la j-ésima observación en el i-ésimo tratamiento.
i=1,2,...,t
j=1,2,...,n
140
MODELO I
MODELO II
t
 i  0
2 i ~ NID(0, 2 )
i 1
ij ~ NID(0, 2 )
ij ~ NID(0, 2 )
Hipótesis:
MODELO I
MODELO II
Ho: i  0
Ho :
Ha : i  0
Ha :
2
 i  0
2
 i  0
El modelo I se utiliza para tratamientos fijos como el caso del ejemplo, el modelo II, se aplica para
aquellos tratamientos elegidos al azar.
Esquema del análisis de varianza:
F. V.
G .L
TRATAMIENTOS t  1
t
SC
CMI
2
t Yi .

 FC
i 1 n
2
  n
ERROR
t ( n  1) diferencia
TOTAL
nt  1
CMII
 i
2
2
  n  i
t 1
2

2

t n
2
  Yij  FC
i 1 j 1
n
(   Yij ) 2
FC 
i 1 j 1
n. t
2
2
2
2
2
 38 .19  37 .33  29 .21
34
.
80
139
.
53
SCtrat 

 6. 139
8
32
Suma de cuadrados totales:
2
2 139 .53
SCtot  4 .87  4 .60  .......  4 .46  5.53 
 92 . 596
32
2
2
2
141
Suma de cuadrados del error experimental
SCEE  SCtot  SCtrat  86 . 457
Cuadrados medio del tratamiento
CMtrat 
SCtrat
t 1
 2 . 0463
Cuadrado medio del error experimental:
CMEE 
SCEE
t ( n  1)
 3. 0877
Análisis de Varianza:
F DE V
Tratamientos
Error
Total
G DE L
3
28
31
SC
6.139
86.457
CM
2.0463
3.0877
F0
0.662
Prueba de hipótesis:
FC 
CMtrat
 0. 662
CMEE
Fteorico
2
 2  n   ( t  1)
 2
Para probar la hipótesis compare el F calculado (0,662) con el F tabulado , este se encuentra en la tabla
de "F", con los grados de libertad del numerador (tratamiento) y los grados de libertad del denominador
(error experimental), y con un nivel de significación o probabilidad de cometer error tipo I ().
Ftab,5% = 2.95
Ftab, 1% = 4,57
Fcal = 0.662
De acuerdo a la no significación de F, se acepta la Ho: i=0, es decir, no hay diferencia entre los
tratamientos (desparasitantes) estudiados; las áreas intestinales promedios correspondientes a los cerdos
criados estabulados tratados con 4 desparasitantes, fueron estadísticamente iguales.
Experimento en bloques al azar
En muchos problemas experimentales es necesario diseñar el experimento de tal manera que la
variabilidad debida a fuentes extrañas pueda ser controlada sistemáticamente. El remover la
142
variabilidad de factores extraños nos permite reducir el error experimental. Un diseño que nos permite
tal situación es el denominada “diseño en bloques al azar”. Es una técnica de bloqueo de variación en
el material experimental, bloqueo que puede ser en el tiempo o en el espacio. El diseño consiste en
incluir en el modelo, algunos factores que aunque no son de interés, se reconoce que pueden causar una
fuente de variación en las unidades experimentales del experimento. Así un bloque es un grupo de
unidades experimentales que son más o menos homogéneas, de modo que la asignación de
tratamientos diferentes a dichas unidades produzca en las observaciones un efecto más fácil de
distinguir de otros factores aleatorios.
La estructura de los datos de este diseño es como sigue:
BLOQUE 1
BLOQUE 2
BLOQUE b
Y11
Y21
Y31
Y12
Y22
Y32
Y1b
Y2b
Y3b
.
.
.
.
.
.
.
.
.
Yt1
Yt2
Ytb
El modelo estadístico para este diseño es:
Yij = +I +βj + εij
i= 1,2,...,t;
j= 1,2,...,b;
El procedimiento para un análisis de varianza para este modelo es el siguiente:
F.V
G.L
SC
CM
F0
TRATAMIENTOS t-1
SCTr
CMTr=SCTr/(t-1)
CMTr/CME
BLOQUES
b-1
SCBlo CMBlo = SCBLo/b-1
ERROR
(t-1)(b-1) SCE
TOTAL
tb-1
CME= SCE/(t-1)(b-1)
SCT
La suma de cuadrados puede obtenerse como sigue:
t
SCT = 
i 1
b
 Yij 
j 1
2
2
Y..
tb
Yi .2 Y..2
SCTr = 

tb
i 1 b
t
Yi .2 Y..2
SCBlo= 

tb
i 1 t
b
143
SCE = SCT – SCTr – SCBlo
Experimento factorial
Muchos experimentos requieren del estudio de los efectos de dos o más factores, los experimentos
factoriales son los diseños más eficientes para este tipo de análisis. Se entiende por experimento
factorial aquel donde en cada ensayo o repetición completa del experimento se investigan todas las
posibles combinaciones de los niveles de los factores considerados. Por ejemplo, si se tienen 2 niveles
del factor 1 y 3del factor 2, entonces cada repetición o ensayo contiene todas las 2x3 =6
combinaciones.
En algunos tratamientos puede encontrarse que las diferencias en respuesta entre los niveles de un
factor no es la misma en todos los niveles de otros. Cuando esto ocurre entonces existe una interacción
entre los factores. Por ejemplo, considérese un factor a y un factor b como se muestra en el siguiente
cuadro:
b0
b1
a0
a0b0 = 20
a0b1 = 40
a1
a1b0 = 50
a1b1 = 12
Al primer nivel del factor b, el efecto simple del factor a es A= (a1b0)-(a0b0) = 50-20 = 30 y el efecto
simple del factor a al segundo nivel del factor b es A = (a1b1)-(a0b1) = 12-40= -28. Entonces el efecto
de a depende del nivel seleccionado para el factor b , entonces se dice que existe interacción entre los
factores a y b. Lo anterior se ilustra gráficamente como sigue:
60
A
b0
b1
50
b1
b1
40
Respuesta
B
b1
b1
30
b0
20
b0
b1
10
0
a0
a0
a1
a1
Figura. Experimento factorial sin interacción (A) y experimento factorial con interacción (B)
Graficas de este tipo son útiles en la interpretación de las interacciones significativas y en los informes
de resultados para personas con poco o ningún entrenamiento estadístico, pero no pueden usarse como
única técnica de análisis.
El procedimiento para el análisis de varianza de este experimento se resume en el siguiente cuadro.
F.V
G.L
SC
CM
F0
144
TRATAMIENTO (A) a-1
SCA
CMA=SCA/(a-1)
CMA/CME
TRATAMIENTO (B) b-1
SCB
CMB = SCB/(b-1)
CMB/CME
INTERACCIÓN (AB) (a-1)(b-1) SCAB CMAB = SCAB/(a-1)(b-1) CMAB/CME
ERROR
ab.(n-1)
SCE
TOTAL
abn-1
SCT
CME= SCE/(t-1)(abn-1)
La suma de cuadrados puede obtenerse como sigue:
2
a
b
n
Y...
2
SCT =  Yijk 
abn
i
j
k
a
SCA= 
i
2
Yi..
Y2
 ...
bn abn
Y. 2j .
Y...2

SCB= 
abn
j an
b
SCAB = SC (Subtotales) – SCA- SCB
SC =
a
b
i
j

2
Y...2

n
abn
Yij.
SCE = SCT – SCA – SCB - SCAB
145
Práctica 8
Análisis de varianza (ANOVA)
1. Determinar si el color del envase de un producto influye en las ventas del artículo. Se estableció un
diseño experimental donde se evalúo el envase en tres colores: Rojo, Azul y Amarillo, y observaron las
ventas en cada presentación. Obteniéndose los siguientes resultados.
Color
Ventas $
Azul
400
Azul
250
Azul
550
Azul
600
Azul
550
Rojo
300
Rojo
200
Rojo
450
Rojo
500
Rojo
500
Amarillo
480
Amarillo
220
Amarillo
360
Amarillo
400
Amarillo
650
2. En un sistema Regional de Control de Calidad, con 15 laboratorios afiliados se quiere investigar las
fluctuaciones entre 3 diferentes maneras de medir RGR (Recuento de Glóbulos Rojos). La primera
forma es usando equipos automatizados de recuento, o contadores hematológicos, tales como el
Technicon H301 y similares. De entre todos los afiliados que usen ese método se eligen cinco de ellos
al azar para conformar el Grupo 1. La segunda manera es usando el método microhematocrito y para
ello, se eligen al azar, otros cinco afiliados que usan tal método para conformar el Grupo 2. Finalmente,
el Grupo 3 se conforma con otros cinco laboratorios seleccionados al azar, de entre los que usan otros
métodos, como por ejemplo el macrohematocrito, recuento en cámara, etc. Los 15 laboratorios siguen
un programa de Control de Calidad interno y se suponen calibrados. Se envía a cada laboratorio una
muestra ciega, con una sangre calibrada en el laboratorio de referencia de:
gl/ml.
Valores de RGR expresados en 106 gl/ml
146
3. Para controlar la influencia del factor humano en las mediciones clínicas se debe hacer medir lo
mismo a varios operadores diferentes. Así, se pueden comparar los valores medidos por cada uno, entre
sí, con un modelo de Anova. En el ejercicio siguiente se usa un modelo de un factor para ilustrar el
método, sin embargo, cuanto más factores se tomen en cuenta, mejor será la sensibilidad del modelo
estadístico para detectar las diferencias.
Registro 1.
Registro 2.
Registro 3.
147
CAPITULO 7
REGRESIÓN LINEAL
INTRODUCCIÓN
Una respuesta a la pregunta típica que hace cualquier estudiante que se enfrenta a las
dificultades del razonamiento matemático, ¿ para que me sirven las matemáticas?, se plantea
aquí como una muestra de la matemática aplicada en aspectos tangibles y cotidianos como la
estadística y la matemática financiera.
Pero también en aspectos no tan tangibles como lo son los temas de potenciación,
radiación, fracciones y ecuaciones trigonométricas que sirven de apoyo para otros temas como el
cálculo diferencial e integral, el cual tiene una aplicación más directa., con estos elementos el
estudiante de la Carrera de Procesos Agroindustriales se beneficia porque complementa su
formación básica en matemáticas.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
Página
1. Analizar la importancia de los usos de la regresión lineal simple.
1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal
simple en el ámbito profesional.
149
149
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Practicar y utilizar la regresión lineal simple en el ámbito profesional.
OBJETIVO Y CRITERIOS DE APRENDIZAJE
2. Expresar las ecuaciones para estimar los parámetros de regresión lineal,
definiendo el coeficiente de correlación R2 y relacionarlo con la precisión de la recta
estimada.
2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la
recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
2.1.1. Emplear las ecuaciones de mínimos cuadrados en la estimación de la recta e
interpretar los parámetros de la regresión y el coeficiente de correlación R2.
DEMOSTRACIÓN DE HABILIDADES FINALES
Pa.9 Regresión lineal
161
161
175
148
TEMA 1
Objetivo de aprendizaje.
1. Analizar la importancia de los usos de la regresión lineal simple.
Criterio de Aprendizaje.
1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el
ámbito profesional.
Didáctica de enseñanza.
Modelo regresión lineal
Con este tipo de regresiones nos conformamos con encontrar relaciones funcionales de tipo lineal, es
decir, buscamos cantidades a y b tales que se pueda escribir
Con el menor error posible entre
De forma que
e Y, o bien
sea una variable que toma valores próximos a cero.
Obsérvese que la relación explica cosas como que si X varía en 1 unidad, varía la cantidad b. Por
tanto:
 Si b>0, las dos variables aumentan o disminuyen a la vez;
 Si b<0, cuando una variable aumenta, la otra disminuye.
Por tanto, en el caso de las variables peso y altura lo lógico será encontrar que b>0.
El problema que se plantea es entonces el de cómo calcular las cantidades a y b a partir de un conjunto
de n observaciones
De forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son
de forma esquemática, las que siguen:
1. Dadas dos variables X, Y, sobre las que definimos
Medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre
los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen los
errores):
149
2. Una aproximación
de Y, se define a partir de dos cantidades a y b. Vamos a calcular
aquellas que minimizan la función
3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier
problema.
Regresión de Y sobre X
Para calcular la recta de regresión de Y sobre X nos basamos en la figura.
Figura: Los errores a minimizar son las cantidades
Una vez que tenemos definido el error de aproximación mediante la relación las cantidades que lo
minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los
mínimos cuadrados):
150
La relación no es más que otra manera de escribir la relación, que se denomina ecuaciones normales.
La primera de se escribe como
Sustituyendo se tiene que
Lo que nos da las relaciones buscadas:
La cantidad b se denomina coeficiente de regresión de Y sobre X.
Regresión de X sobre Y
Las mismas conclusiones se sacan cuando intentamos hacer la regresión de X sobre Y. Para calcular la
recta de regresión de X sobre Y es totalmente incorrecto despejar de
151
Pues esto nos da la regresión de X sobre
hace aproximando X por , del modo
, que no es lo que buscamos. La regresión de X sobre Y se
Donde
Pues de este modo se minimiza, en el sentido de los mínimos cuadrados, los errores entre las cantidades
xi y las
Figura: Los errores a minimizar son las cantidades
Ejemplo
En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropométricas X y Y. Los
resultados se muestran resumidos en los siguientes estadísticos:
Obtener el modelo de regresión lineal que mejor aproxima Y en función de X. Utilizando este modelo,
calcular de modo aproximado la cantidad Y esperada cuando X=15.
Solución:
152
Lo que se busca es la recta,
que mejor aproxima los valores de Y (según el criterio de
los mínimos cuadrados) en la nube de puntos que resulta de representar en un plano (X,Y) las 1.500
observaciones. Los coeficientes de esta recta son:
Así, el modelo lineal consiste en:
Por tanto, si x=15, el modelo lineal predice un valor de Y de:
En este punto hay que preguntarse si realmente esta predicción puede considerarse fiable. Para dar una
respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación.
Propiedades de la regresión lineal
Una vez que ya tenemos perfectamente definida , (o bien
) nos preguntamos las relaciones que
hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta nos la ofrece la siguiente
proposición:
En los ajustes lineales se conservan las medias, es decir
En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables
X y Y, y sus aproximaciones y , pues sólo se mantienen en un factor de r2, es decir,
Basta probar nuestra afirmación para la variable Y, ya que para X es totalmente análogo:
153
Donde se ha utilizado la magnitud que denominamos coeficiente de correlación, r, y que ya definimos
anteriormente como
Como consecuencia de este resultado, puede decirse que la proporción de varianza explicada por la
regresión lineal es del
.
Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma varianza, pero esto no
es cierto en general. Todo lo que se puede afirmar, como sabemos, es que
Y por tanto
La cantidad que le falta a la varianza de regresión,
, para llegar hasta la varianza total de Y,
es lo que se denomina varianza residual, que no es más que la varianza de
,
, ya que
El tercer sumando se anula según las ecuaciones normales expresadas en la relación:
154
Por ello
Obsérvese que entonces la bondad del ajuste es
Para el ajuste contrario se define el error como
proporcional a 1-r2:
, y su varianza residual es también
Y el coeficiente de determinación (que sirve para determinar la bondad del ajuste de X en función de Y)
vale:
Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinación son iguales a r2, y por
tanto representan además la proporción de varianza explicada por la regresión lineal:
Por ello:

Si
viceversa).
el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y
Si
las variables X e Y no están relacionadas (linealmente al menos), por tanto no tiene
sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean ninguna
relación en el caso r=0, ya que si bien el ajuste lineal puede no ser procendente, tal vez otro tipo de
ajuste sí lo sea.

Ejemplo 1
155
De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la
siguiente información:
Calcule:
1. La recta de regresión de Y sobre X. Explique el significado de los parámetros.
2. El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación
de Y que no está explicada por el modelo lineal de regresión.
3. Si el modelo es adecuado, ¿cuál es la predicción
para x=4.
Solución:
1. En primer lugar calculamos las medias y las covarianza entre ambas variables:
Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es
b, y mide la variación de Y cuando X aumenta en una unidad:
Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X
aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, a,
tenemos:
Así, la recta de regresión de Y como función de X es:
2. El grado de bondad del ajuste lo obtenemos a partir del coeficiente de determinación:
156
Es decir, el modelo de regresión lineal explica el
tanto queda un
de la variabilidad de Y en función de la de X. Por
de variabilidad no explicada.
3. La predicción que realiza el modelo lineal de regresión para x=4 es:
Lo cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay
una razonable cantidad de variabilidad que no es explicada por el modelo.
Ejemplo 2
Se realizan 8 mediciones de textura y grado de madurez a 10 manzanas golden, obteniéndose los
siguientes resultados:
Resultado de las mediciones
textura
12 8
10 11 7
7
10 14
grado de madurez 58 42 51 54 40 39 49 56
¿Existe una relación lineal importante entre ambas variables? Calcular la recta de regresión de la
textura en función del grado de madurez y la del grado de madurez en función de la textura. Calcular la
bondad del ajuste ¿En qué medida, por término medio, varía el grado de madurez?
Solución:
Para saber si existe una relación lineal entre ambas variables se calcula el coeficiente de correlación
lineal, que vale:
Ya que
157
Por tanto el ajuste lineal es muy bueno. Se puede decir que el ángulo entre el vector formado por las
desviaciones del grado de madurez con respecto a su valor medio y el de la textura con respecto a su
valor medio, , es:
Es decir, entre esos vectores hay un buen grado de paralelismo (sólo unos 19 grados de desviación). La
recta de regresión del grado de madurez en función de la textura es:
La recta de regresión de la edad como función del peso es
Que como se puede comprobar, no resulta de despejar en la recta de regresión de Y sobre X.
La bondad del ajuste es
Por tanto podemos decir que el
de la variabilidad del grado de madurez en función de la
textura es explicada mediante la recta de regresión correspondiente. Lo mismo podemos decir en
158
cuanto a la variabilidad de la textura en función del grado de madurez. Del mismo modo puede decirse
que hay un
de varianza que no es explicada por las rectas de regresión. Por
tanto la varianza residual de la regresión del grado de madurez en función de la textura es:
Y la de la textura en función del peso:
Análisis de varianza del modelo lineal
Regresión Lineal
Un problema clásico en estadística es tratar de determinar la relación entre dos variables aleatorias X y
Y. Por ejemplo, podríamos considerar el alto y ancho de una muestra de adultos.
La regresión lineal trata de explicar esta relación con una línea recta que trata de acercarse lo mas
posible a todos los puntos de la muestra.
La regresión lineal postula que
Y= a+bX+e
Donde el "residual" e es una variable aleatoria de media cero. El coeficiente a y b son escogidos de
forma tal que la suma de los cuadrados de los residuales sea lo mas cercano a cero posible.
En multitud de ocasiones, son varias las variables que se observan en la realización de un muestreo,
existiendo entre ellas dependencias estadísticas. En tales situaciones puede plantearse el problema de
hasta qué punto el conocimiento de unas variables, llamadas explicativas, aportan información
suficiente para predecir los valores de otras denominadas de respuesta.
Dependiendo de los contextos, de las hipótesis que se consideren válidas, de la naturaleza de las
variables y del número de éstas, se utilizarían los diferentes métodos de regresión.
Regresión Simple (Recta de Regresión)
Los datos y el modelo
El problema de la regresión lineal simple entre dos variables X y Y se reduce a calcular la recta de
regresión que mejor represente su distribución conjunta. Los datos se presentan como una matriz de
dos columnas:
159
Siendo (xi, yi), con i= 1, 2, ..., n, el i-ésimo par observado.
Se pretende ajustar un modelo de la forma
yi=a xi+b+ei
Bajo las siguientes hipótesis:
1. La variable respuesta yi depende de la variable explicativa xi de forma lineal (con pendiente a y
ordenada en origen b), más un factor residual aleatorio ei.
2. Los residuos tienen distribución normal de media 0 y varianza
desconocida.
3. Estos factores aleatorios son independientes entre sí.
Nota: en el Anexo se pueden encontrar más ejercicios, además de las tablas de: Z, Ji2,
160
TEMA 2
Objetivo de aprendizaje.
2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de
correlación R2 y relacionarlo con la precisión de la recta estimada.
Criterio de Aprendizaje.
2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar
los parámetros de la regresión y el coeficiente de correlación R2.
Didáctica de enseñanza.
Pa.9 Regresión Lineal
Estimación de parámetros
Los parámetros de la recta de regresión, a y b, se calculan siguiendo el criterio de los mínimos
cuadrados, lo que lleva a los siguientes resultados:
Siendo
Y
Las medias de ambas variables estadísticas.
La varianza residual
es desconocida, siendo su estimador insesgado
El coeficiente de correlación
Definiendo el coeficiente de correlación como
,
Que sólo toma valores en el intervalo [-1, 1], nos da una idea de hasta qué punto el ajuste lineal es
razonable:
161
Si r es próximo a -1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi)
alrededor de una recta de pendiente negativa.
 Si r es próximo a 0: el ajuste no es aceptable, indicando que no existe relación lineal entre las
variables.
 Si r es próximo a +1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi)
alrededor de una recta de pendiente positiva.

Contraste de independencia
El contraste de independencia entre las variables es más objetivo que la simple observación del
coeficiente de correlación r. Así se plantea comprobar si los datos observados corroboran o no la
hipótesis nula:
H0: "la variable explicativa X no influye en la respuesta Y".
Frente a la alternativa:
H1: "la variable explicativa X influye linealmente en la respuesta Y".
Mediante el estadístico de contraste
Que se distribuye como una tn-2 de Student, se puede contrastar la hipótesis nula H0 al nivel de
significación del 5%.
Caso
Se dispone de los datos de ocho anestesias de diferente duración, efectuadas con un anestésico volátil y
del tiempo en que se restablece la conciencia suficiente como para contar hacia atrás desde un número
determinado sin error:
Duración
Duración
despertar
anestesia (min)
(min)
150
13
127
16
160
21
210
20
250
16
130
13
60
12
55
14
Se intenta probar la hipótesis de que la duración del despertar no está influida por la de la anestesia.
El coeficiente de correlación para esta muestra es de 0.562231, a medio camino entre el 0 y el 1, no
permitiendo dar una respuesta segura sobre el contraste; en cambio, el estadístico A toma un valor de
162
1.66531, del que se puede deducir que la hipótesis no puede rechazarse al nivel del 5%; en conclusión,
no hay indicios de que la duración del despertar esté linealmente relacionada con el tiempo de duración
de la anestesia. Si se hubiese rechazado la hipótesis de independencia, se podrían ajustar los datos a la
recta de ecuación
y = 0.03 x + 11.62, siendo x la duración de la anestesia e y la del despertar.
Regresión Lineal Múltiple
Los datos y el modelo
Se trata de predecir el valor de una variable respuesta (y) como función lineal de una familia de m
variables explicativas (x1, x2, ..., xm), a partir de una muestra de tamaño n cuyas observaciones se
ordenan matricialmente:
Siendo yi la i-ésima variable respuesta y xi,j la j-ésima variable explicativa asociada a la observación i.
Así las cosas, se trata de ajustar los datos a un modelo de la forma
Bajo las siguientes hipótesis:
1. Los residuos ei son normales de media 0 y varianza común desconocida
; además, estos residuos
son independientes.
2. El número de variables explicativas (m) es menor que el de observaciones (n); esta hipótesis se
conoce con el nombre de rango completo.
3. No existen relaciones lineales exactas entre las variables explicativas.
Estimación de los parámetros de regresión
El estimador del vector paramétrico es
Siendo
163
Habiéndose indicado la transposición matricial mediante el superíndice T.
Estimación de la varianza
El estimador insesgado de la varianza
expresión
, conocido con el nombre de varianza residual, tiene por
Coeficiente de determinación corregido
El coeficiente de determinación corregido, definido como
Siendo
Mide el ajuste del modelo, se interpreta como el porcentaje de variación de la variable respuesta
explicada por el modelo; así, cuanto más se acerque R2 a 100, con más confianza se podrá considerar el
modelo lineal como válido.
Contraste de regresión
El contraste de regresión es imperativo a la hora de diagnosticar y validar el modelo que se está
ajustando; consiste en decidir si realmente la variable respuesta y es función lineal de las explicativas
x1, x2, ..., xm. Formalmente, el contraste se plantea en los siguientes términos:
H0: "no existe dependencia lineal:
Frente a la alternativa:
H1: "sí existe alguna dependencia lineal:
El estadístico de contraste es
"
".
Que se distribuye como una Fm,n-m-1 de Snedecor. El contraste se realiza con un nivel de significación
del 5%.
164
Caso
En una muestra de 25 hospitales, el analista ha recogido los siguientes datos sobre el costo anual en
1988 (variable respuesta), así como sobre el personal sanitario y el número de camas durante el mismo
año.
Coste
hospitalario
1000
750
500
350
400
750
850
450
450
350
800
950
900
500
1000
365
400
525
400
400
350
500
600
550
750
800
Personal
sanitario
100
50
25
15
20
30
70
30
35
25
39
70
60
25
65
20
45
50
46
46
20
36
50
50
65
70
Número
de camas
300
150
100
70
80
100
200
90
100
75
125
260
215
95
300
75
94
108
93
93
76
129
183
145
250
275
Se quiere ajustar un modelo lineal que devuelva el coste de mantenimiento hospitalario en función del
personal sanitario y del número de camas.
En primer lugar observamos que el número de variables explicativas es 2, por lo que se necesitan
estimar tres parámetros de regresión: 222.28 para el término independiente, 1.28 para la variable
personal sanitario y 2.24 para el número de camas. La desviación típica residual y el coeficiente de
determinación corregido toman los valores 107.80 y 76.49%, respectivamente. Finalmente, el contraste
165
de regresión rechaza la hipótesis de independencia al nivel del 5%, dando a entender que no hay
indicios de que el modelo lineal
y = 222.28 + 1.28 x1 + 2.24 x2
Deba ser rechazado. Sin embargo, un análisis más detallado muestra que la inclusión de la variable
personal sanitario no aporta información relevante, de modo que al eliminarla se obtiene el modelo
y = 232.34 + 2.55 x2,
Con una desviación típica residual de 106.08 y un coeficiente de determinación de 77.23%, parámetros
de diagnóstico ligeramente mejores que los anteriores. Para comprobar estos resultados, eliminar en el
panel superior de entrada los datos centrales (100, 50, 25, 15, etc.) y volver a pulsar la barra central.
Método de mínimos cuadrados
La formula de regresión de la muestra que represéntale modelo de regresión en línea recta sería:
Ŷі =bo + b1Xі
Donde Ŷі es el valor del predicho de Y para la observación і y Xі
Estimación por mínimos cuadrados generalizados.
En un modelo de regresión lineal se supone que la matriz de varianzas-covarianzas de los errores es de
la forma
Siendo In la matriz identidad de orden n. Si no se verifica la hipótesis de homocedasticidad, o la de
independencia, o ambas, entonces la matriz de varianzas-covarianzas tiene la forma general
Siendo una matriz simétrica, definida positiva de orden n × n. En este caso, se puede calcular el
estimador de por el método de mínimos cuadrados generalizados. Este método se desarrolla en dos
etapas: en una primera etapa se transforma el modelo de regresión original
Para ello y por ser una matriz simétrica, definida positiva, existe una matriz cuadrada P tal que
Esta matriz no tiene porque ser única, pero si existe. Multiplicando por P la ecuación de regresión se
obtiene
(10.3)
Denominando
*
= P , X* = PX y
*
= P , se obtiene la ecuación de regresión
166
Y los errores del modelo verifican
Por tanto los errores son incorrelados y homocedásticos. Ahora se puede aplicar el método de mínimos
cuadrados ordinarios a estos datos transformados
Por el Teorema de Gauss-Markov, este estimador
para obtener el estimador
G
es el mejor estimador lineal insesgado. En la
práctica, la matriz P, aunque existe, es desconocida y es necesario estimarla
observaciones, obteniendo el estimador
a partir de las
A continuación se exponen dos situaciones comunes en las que se puede aplicar este método de
estimación.
Heterocedasticidad.
Si las observaciones son independientes pero heterocedásticas entonces la matriz de varianzascovarianzas viene dada por
Y la matriz P
En este caso los datos transformados son
167
Esto equivale a trabajar con el modelo transformado
Sobre este modelo se aplica ahora el método de mínimos cuadrados ordinarios. En particular, si se
trabaja con el modelo de regresión lineal se obtiene el siguiente estimador del coeficiente de regresión
Este estimador se denomina estimador por mínimos cuadrados ponderados y es un caso particular
del estimador por mínimos cuadrados generalizados. En la práctica, para utilizar este estimador hay que
calcular estimadores de los parámetros 12,..., n2 , lo que puede hacerse por uno de los siguientes
métodos:
* Suponer que la varianza se ajusta a una función
Y estimar la función g.
* Hacer grupos en las observaciones (en el orden en que se han recogido) normalmente del mismo
tamaño k y suponer que en cada grupo la varianza es constante. Entonces se estima la varianza en cada
grupo a partir de las observaciones del grupo. Una forma de conseguir esto es ajustar el modelo de
regresión por mínimos cuadrados ordinarios a las observaciones originales y a partir de los residuos de
este modelo obtener los estimadores de la varianza en cada grupo.
Observaciones dependientes.
168
Si las observaciones son homocedásticas pero dependientes entonces la matriz de varianzascovarianzas es de la forma general
En la mayoría de las situaciones la estructura de dependencia de los errores puede ajustarse a un
modelo paramétrico. Un modelo sencillo y muy utilizado es el modelo AR , (modelo autorregresivo
de orden uno). En este caso se verifica que los errores siguen la ecuación
siendo la autocorrelación de orden 1 del proceso t, por tanto,
aleatorias independientes e igualmente distribuídas.
< 1, y at es una sucesión de variables
En este caso, la matriz de varianzas-covarianzas es
La matriz P de transformación es
Y la matriz
-1
es
169
Utilizando esta matriz se obtiene el estimador por mínimos cuadrados generalizados
Nuevamente, en la práctica, -1 es desconocido y se tiene que estimar. Por la forma de la matriz -1, es
suficiente con estimar el parámetro y sustituir en la matriz. Para estimar , puede utilizarse el
siguiente procedimiento: ajustar a los datos el modelo de regresión lineal por mínimos cuadrados
ordinarios y calcular los residuos mínimo cuadráticos
A partir de estos residuos se obtiene el siguiente estimador de ,
sustituyendo por en la matriz
estimador
-1
se obtiene la matriz estimada
-1
, a partir de la cual se obtiene el
Siguiendo este procedimiento se puede obtener el siguiente estimador iterativo:
Paso 1. Se utiliza el estimador F para obtener nuevos residuos ei'.
Paso 2. De estos residuos se obtiene un nuevo estimador '.
Paso 3. Utilizando ' se calcula un nuevo estimador F'.
Se continúa el proceso de forma iterativa (volver al Paso 1) hasta obtener la convergencia del estimador
F (estimador iterativo de Cochran y Orcutt (1949)).
En este problema también se pueden considerar otros estimadores del parámetro
dependencia más complejos que dependen de un número mayor de parámetros.
o modelos de
Ejemplo
“Se desea ajustar un modelo de regresión lineal simple de diseño fijo a cien observaciones, donde los
valores de la variable explicativa son xi = i/n, i = 1,...,100 (diseño fijo equiespaciado) y los valores de la
variable respuesta vienen dados en la tabla adjunta (leídos por columnas). Analizar la hipótesis de
independencia de los residuos”.
2'4 1'4 2'3 2'1 2'9 4'5 3'5 3'6 2'3 2'5
1 3 4 1 1 2 5 3 2 9
3'1 1'4 2'5 2'1 2'6 4'1 3'0 3'6 2'4 3'1
0 9 6 3 4 4 4 4 6 5
2'6 1'8 2'5 1'8 2'5 4'1 3'3 3'4 2'3 3'2
170
1
5
5
5
3
7
4
0
1
9
1'8 1'6 2'9 2'2 2'7 3'6 3'2 3'1 2'4 3'2
7 9 5 5 5 6 1 7 1 3
1'4
7
1'0
1
2'2
8
2'4
2
2'7
2
2'8
4
2'1
5
2'8
0
2'2
9
2'8
1
2'7
0
2'5
6
3'3
1
2'7
6
3'1
6
3'4
7
2'6
9
3'2
4
2'7
0
2'0
8
1'4 1'9 2'0 3'1 3'1 2'3 3'3 3'5 2'8 2'5
8 1 8 4 9 0 9 2 0 7
1'4 2'7 2'1 3'0 3'4 3'1 3'8 3'5 3'2 3'1
7 3 0 3 3 0 4 3 9 7
1'8 1'9 2'0 3'0 3'2 3'8 4'0 3'2 3'1 2'8
5 3 3 5 2 9 7 2 4 0
1'9 1'9 1'7 3'3 4'2 3'6 3'4 2'5 2'7 2'3
1 3 0 1 4 0 5 2 8 8
Ajustando la recta de regresión por mínimos cuadrados se obtiene
Las observaciones muestrales y la recta ajustada se representan en la Figura.
Figura. Datos y recta ajustada por MCO.
171
Los residuos de este modelo presentan una clara dependencia positiva. Esto se observa en el gráfico de
residuos frente al índice
Figura Residuos MCO según índice.
En la Figura 10.3. Se representa el correlograma (f.a.s.) de los residuos del modelo y se observa que las
primeras autocorrelaciones de los residuos son muy altas. En particular, r1 = 0'758, con desviación
típica
= 0'099. Utilizando el contraste de independencia de Ljung-Box (Sección 4.7.2.) se obtiene
para m = 5 (número de retardos) que
172
Figura. F.a.s. de los residuos MCO.
En la Figura se representa el gráfico de autocorrelaciones parciales (f.a.p.) de los residuos y se observa
que la fap de orden uno es muy grande. De todo se concluye que no se acepta la hipótesis de
independencia.
Figura. F.a.p. de los residuos MCO.
De los gráficos representados en las Figuras 10.3 y 10.4 se deduce que la sucesión de errores del
modelo de regresión sigue una estructura de dependencia del tipo AR (1) con = 0'758. En base a ello
se estima la recta de regresión por mínimos cuadrados generalizados utilizando la matriz de
transformación dada anteriormente. Se obtiene el siguiente modelo de regresión
Las dos rectas de regresión obtenidas por mínimos cuadrados y por mínimos cuadrados generalizados
se representan en la Figura siguiente. En este ejemplo la diferencia entre las dos rectas estimadas es
pequeña.
173
Figura. Las dos rectas ajustadas.
174
Práctica 9
Regresión lineal
Instrucciones: resuelve correctamente los ejercicios que se enlistan.
Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.
1. Sea la matriz de covarianzas entre X y Y:
> var(datos)
X
Y
X 1.866667 1.100
Y 1.100000 1.175
Halla la correlación lineal entre ambas (rXY).
2. Sea la variable dependiente Z predicha a través de la expresión lineal aY+b, donde Y es una variable
regresora. Deduce la expresión de los estimadores de a y b por mínimos cuadrados.
3. Sean las variables X = "número de hijos" y Y = "gastos navideños". La siguiente tabla recoge las
frecuencias observadas en cierta encuesta:
Y \X
0 1 2
5
3 3 2
10
8 9 3
15
5 9 7
20
0 1 2
Da las medias y desviaciones típicas de cada variable, así como el coeficiente de correlación lineal
entre las dos.
4. Considera una regresión Y=a+bX. Se pretende predecir el comportamiento de Y para X=X0. Explica
las diferencias entre un intervalo de confianza para el valor esperado de Y y un intervalo de predicción
para Y.
5. Se quiere predecir la variable Z a partir de alguna (y sólo una) de las variables X, Y y V. ¿Cómo
decidirías cuál de las tres escoger?
6. ¿Cómo se expresa la calidad de un análisis de regresión?
7. En un proceso agroindustrial, se han considerado el factor A = "intensidad media" y B = "cantidad
de proyección". Se han observado treinta valores (ai,bi) (i=1..30). Representados gráficamente, parece
que adoptan una forma hiperbólica. Por ello, se pretende ajustar la curva AB=x+yA, siendo x y y
parámetros de la curva. ¿Cómo llevarías a cabo el análisis?
8. La siguiente tabla presenta una muestra experimental relacionada con un estudio sobre la influencia
del tiempo trascurrido desde el despertar (T) en el rendimiento en una prueba sicotécnica (R):
9.
T 2'5 2'8 3'1 3'3 3'9 4'0 4'5
R 9'6 9'9 9'8 9'9 9'2 9'1 7'8
175
Los puntos adoptan una disposición claramente parabólica. Describe un modelo matemático y un
método de análisis adecuados.
10. Un fabricante de motos pretende determinar qué factores influyen en la velocidad máxima que
pueden alcanzar sus modelos. Efectúa mediciones de la velocidad máxima que alcanzan ochenta motos,
para las cuales registra los valores de cuarenta variables continuas que piensa pueden tener relación con
aquélla: potencia, cilindrada, dimensiones, aerodinámica, etc. Propón un método para llevar a cabo el
estudio, detallando los pasos principales.
11. Da una interpretación del coeficiente de determinación.
12. En un estudio llevado a cabo en ocho ciudades de México, se obtuvo el número de autos y celulares
por cada mil habitantes:
Provincia Xicotepec Zacatlán Huahuchinango Teziutlán Acatlán Tehuacán Amozoc Zaragoza
Autos
58
84
78
81
82
102
85
102
Móviles 64
78
83
88
89
99
101
102
Discute qué proporción de la variación de la tasa de celulares por mil habitantes puede explicarse a
partir de la tasa de autos. Dato: la recta de mínimos cuadrados de "móviles" sobre "autos" es
19'83+0'81×autos, con r=0'87.
13. Relaciona el coeficiente de determinación con el contraste de regresión
176
V REFERENCIAS
 Rendón, S. Gilberto. 1997. “Muestreo, aplicación en la estimación simultánea de varios
parámetros”. Universidad Autónoma Chapingo, México.
 Rendón, S. Gilberto. 1998. “Métodos estadísticos, muestreo, diseños experimentales, estadística
no paramétrica”. Universidad Autónoma Chapingo, México.
 Tamayo, T. Mario. 1998. “El proceso de la investigación científica”
 Levin, I. Richard; Rubin S. David. 1996. “Estadística para Administradores”, Ed. Prentice Hall,
Sexta Edición
 Menderihall, William; Wackerly, Demis; . “Estadística Matemáticas”
 León T., Aurelio et al. “Antología de Matemáticas IV”, Colegio de Bachilleres del Estado de
Puebla.
Sitios de internet visitados:
 www.//ftp.metprev.uma.es
 http://ftp.medprev.uma.es/libro/html.htm
 http://www.hrc.es/bioest/Anova_1.html
 http://www.itson.mx/un/posgrado/Estadistica/Descriptiva%20,%20teoria,%20ejercicios.doc
 http://highered.mcgrawhill.com/sites/9701033612/information_center_view0/tabla_de_contenido.html
 http://www.seh-lelha.org/ancova.htm
 http://www.sportsci.org/resource/stats/ancova.html
 http://trochim.human.cornell.edu/kb/expcov.htm
 http://www.angelfire.com/emo/tomaustin/Met/guiaseismuestra.htm
 http://www.uv.es/~meliajl/Research/LibroBMDP/BMBPinde.html
 http://www3.uji.es/~mateu/ejer-tema5-d37.doc
 http://www.hrc.es/bioest/Ejemplos_histo.html
 http://www.gesell.com.ar/geselinos/egb/problema.htm
VI GLOSARIO
177
VII ANEXOS
Ejercicios y ejemplos
Concepto de variable aleatoria.
Se llama variable aleatoria a toda aplicación que asocia a cada elemento del espacio muestral de un experimento, un número
real.
Ejemplo:
Sea el experimento que consiste en lanzar tres monedas al aire. El espacio muestral será:
E  ccc, ccx, cxc, xcc, cxx, xcx, xxc, xxx
Si a cada elemento de E le hacemos corresponder, por ejemplo, el número de caras, hemos definido una variable aleatoria.
ccc  3; xcc  2; xxc  1; ccx  2
cxx  1; xxx  0; cxc  2; xcx  1
Se utilizan letras mayúsculas para designar las v.a. y sus respectivas letras minúsculas para los valores concretos de las
mismas.
Variable aleatoria discreta.
Es la que solo puede tomar determinados valores.
La variable aleatoria número de caras en el lanzamiento de tres monedas sólo puede tomar los valores 0, 1, 2 y 3. (Es
discreta).
La variable aleatoria suma de las caras superiores en el lanzamiento de dos dados puede tomar solamente los valores 2, 3, 4,
5, 6, 7, 8, 9, 10, 11 y 12. (Es también discreta)
Función de probabilidad de una v.a. discreta.
Es la aplicación que asocia a cada valor x de la v.a. X su probabilidad p.
Los valores que toma una v.a. discreta X y sus correspondientes probabilidades suelen disponerse en una tabla con dos filas
o dos columnas llamada tabla de distribución de probabilidad:
X
P( X  x i )
En toda función de probabilidad se verifica que
x1
x2
p1
p2
x3
xn
p3
p1  p 2  p3 
pn
 pn  1
Ejemplo: La v.a. “número de caras en el lanzamiento de tres monedas” tiene la siguiente función de probabilidad:
Nº de caras
f(x)= P( X
0
 xi )
1
1 3
8 8
2
3
3
8
1
8
Función de distribución de una v.a. discreta.
Sea X una v.a. cuyos valores suponemos ordenados de menor a mayor.
Se llama función de distribución de la variable X a la función que asocia a cada valor de la v.a. la probabilidad acumulada
hasta ese valor, es decir, F ( x)  p ( X  x)
Media, varianza y desviación típica de una variable aleatoria discreta.
Se llama de una v.a. discreta X, que toma los valores x1 , x 2 , x3 ........x n con probabilidades
valor de la siguiente expresión:
   xi . p i
p1 , p 2 , p3 ............ p n al
La varianza viene dada por la siguiente fórmula:
 2   xi2 . pi   2 , bien  2   ( xi   ) 2 . pi
178
La desviación típica es la raiz cuadrada de la varianza.
Ejercicio.
La distribución de probabilidad de una v.a. X viene dada por la siguiente tabla:
xi
pi
1
2
0,1
0,3
3
4
0,2
5
0,3
¿Cuánto vale p(X=3)
Calcula la media y la varianza.
Solución:
La suma de todas las probabilidades es 1, por tanto,
0,1  0,3  p( X  3)  0,2  0,3  1 luego p(X=3)=0,1
Formamos la siguiente tabla:
xi
pi
xi . p i
x i2 . p i
1
2
3
4
5
0,1
0,3
0,1
0,2
0,3
0,1
0,6
0,3
0,8
1,5
0,1
1,2
0,9
3,2
7,5
 2   xi2 . pi   2  12,9  (3,3) 2  2,01
Experimento de Bernoulli
Es un experimento que tiene las siguientes características:
1.
En cada prueba del experimento sólo son posibles dos resultados: el suceso ha llamado A llamado éxito y el suceso A
llamado fracaso.
2.
El resultado obtenido en cada prueba es independiente de los resultados anteriores.
3.
La probabilidad del suceso A es constante y no varía de unas pruebas a otras.
La distribución de probabilidad de este experimento recibe el nombre de distribución binomial de parámetros n y p
n es el número de pruebas del experimento y p es la probabilidad del éxito.
Si representamos por X la variable aleatoria binomial que representa el número de éxitos obtenidos en las n del
experimento, podemos escribir:
n r
 p .(1  p) n  r
r
 
p(obtener r éxitos )=p(X=r)= 
Esta expresión recibe el nombre de función de probabilidad de una distribución binomial o de Bernoulli.
Dado que en este tipo de experiencias los cálculos pueden ser laboriosos, se han construido unas tablas que nos
proporcionan la probabilidad de que la variable X tome distintos valores, según los distintos valores de n y r.
Media y varianza de una distribución binomial.
Media:
  n. p
Varianza:
 2  n. p.q; q  1  p
179
Desviación típica:
  n. p.q
Ejercicios resueltos.
1.- Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean varones.
Solución: Se trata de un experimento de Bernoulli donde n=4 y p=1/2
 4 3 1 1
.0.5 .0,5 
3
4
 
p(obtener 3 varones)=P(X=3)= 
Recuerda:
 4
  es un número combinatorio cuyo valor se obtiene así:
3
En general
 4  4.3.2
  
 3  3.2.1
 m  m.(m  1).( m  2)......hasta tener n factores en el numerador
m!
  

n.(n - 1).(n - 2).....3.2.1
n!.(m  n)!
n 
2.- Se tiene una moneda trucada de modo que la probabilidad de sacar cara es cuatro veces la de sacar cruz. Se lanza 6
veces la moneda. Calcula las siguientes probabilidades:
 Obtener dos veces cruz.
 Obtener a lo sumo dos veces cruz.
Solución:
Calculamos en primer lugar la probabilidad de cara y de cruz:
p(cara)+p(cruz)=1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir:
4x+x=1; 5x=1; x=0,2
Así resulta: p(cruz)=0,2 y p(cara)=0,8
Es una distribución binomial de parámetros n=6 y p=0,2
Probabilidad de obtener dos veces cruz:
6
p( X  2)   .(0,2) 2 .(0,8) 4  15.(0,04).(0,4096)  0,24
 2
Probabilidad de obtener a lo sumo dos veces cruz:
p( X  2)  p( X  0)  p( X  1)  p( X  2) 
 6
 6
6
.(0,2) 0 .(0,8) 6   .(0,2)1 .(0,8) 5   .(0.2) 2 .(0.8) 4  0,90
 0
1 
 2
= 
3.- La probabilidad de que un alumno de 1º de Bachillerato repita curso es de 0,3. Elegimos 20 alumnos al azar. ¿Cuál es la
probabilidad de que haya exactamente 4 alumnos repetidores?
Solución:
Se trata de una binomial de parámetros 20 y 0,3, es decir, B(20; 0,3)
Si X es el número de alumnos que repiten,
180
 20 
20!
p( X  4)   .0,3 4.0,716 
.0,3 4.0,716  0,13
4!.16!
4 
4.- Calcula la esperanza matemática, la varianza y la desviación típica de la variable aleatoria X, cuya función de
probabilidad viene dada por la siguiente tabla:
xi
-4
0,1
p( X  xi )
-1
0,5
2
0,3
5
0,1
Solución:
La esperanza matemática es la media:
  (4).0,1  (1).0,5  2.0,3  5.0,1  0,2
   x . pi    (4) .0,1  (1) 2 .0,5  2 2.0,3  5 2.0,1  0,2 2  5,76
2
2
i
2
2
  5,76  2,4
5.- Sea la siguiente función de probabilidad:
xi
pi
1
3
5
7
9
0,2
0,2
0,4
0,1
0,1
Escribe la función de distribución y calcula: p ( X  5) y p (3  X  7)
Solución:
xi
F(x)=P(X ≤ xi)
p ( X  5)  0,8 ;
1
3
5
7
9
0,2
0,4
0,8
0,9
1
p( X  7)  p( X  3)  p( X  5)  p( X  7) 
 0,2  0,4  0,1  0,7
181
Ejercicios propuestos.
1.- La probabilidad de que un reloj salga de fábrica defectuoso es del 4 %. Halla:
a) El número de relojes defectuosos esperados en un lote de 1000
b) La varianza y la desviación típica.
( Solución: 40 y
6,19)
2.- Una determinada raza de perros tiene 4 cachorros en cada camada. Si la probabilidad de que un cachorro sea macho es
de 0,55, se pide:
a) La probabilidad de que en una camada dos exactamente sean hembras
b) Probabilidad de que en una camada al menos dos sean hembras.
(Solución: 0,3675; 0,609 )
3.- Considera una variable aleatoria discreta X cuya distribución de probabilidad es la siguiente:
xi
1
2
3
P(X = xi)
k
0,45
k
a) Calcula el valor de k
b) Halla la función de probabilidad
c) Halla la función de distribución F.
Solución
k = 0,275.
Función de probabilidad:
xi
f(x)=P(X = xi)
1
0,275
2
0,45
3
0,275
1
0,275
2
0,725
3
1
Función de distribución:
xi
F(x)=P(X ≤ xi)
4.- Considera una variable aleatoria X cuya función de probabilidad viene dada por la siguiente tabla:
x
-25
-10
0
5
f(x)
a
2a
3a
4a
a) Deduce el valor de a.
b) Halla la función de distribución F
c) Calcula la esperanza, la varianza y la desviación típica.
Solución:
a) 0,1;
c) –2,5; 86,25; 9,29
5.- La probabilidad de que un estudiante obtenga el título de arquitecto es 0,3. Calcula la probabilidad de que un grupo de 7
estudiantes matriculados en primer curso:
a) Ninguno de los 7 finalice la carrera.
b) Finalicen los 7.
c) Al menos 2 acaben la carrera.
d) Sólo finalice uno la carrera.
Solución: 0,082; 0,00021;
0,671;
0,2471
6.- El 20 % de los tornillos de un gran lote so defectuosos. Se cogen tres tornillos al azar y se pide calcular razonadamente:
a) La probabilidad de que los tres sean defectuosos.
b) La probabilidad de que ninguno sea defectuoso.
182
c)
La probabilidad de que solamente uno sea defectuoso.
(Propuesto en Selectividad, Alicante, septiembre de 2001)
Variable aleatoria continua.
Distribución normal.
Conocimientos previos
CONCEPTO DE INTEGRAL DEFINIDA.
Para hallar el área del recinto limitado por la curva f(x), el eje de abscisas y las rectas x=a y x=b, se utiliza la siguiente
fórmula:
b
Area   f ( x)dx
a
que recibe el nombre de integral definida de f entre los límites a y b
y se lee “integral entre a y b de f(x)”.
La integración es la operación inversa de la derivación.
Por ejemplo, si
f ( x)  x n , la fórmula anterior se resuelve de la siguiente forma:
b

b
a
 x n 1 
x dx  

 n  1 a
n
Primero se sustituye la x por b y al resultado obtenido le llamaremos F(b).
Después se sustituye la x por a y al resultado obtenido le llamaremos F(a)
Finalmente restamos los resultados, es decir,

b
a
x n dx  F (b)  F (a)
Ejercicio:
3
Resuelve la siguiente integral definida:
 (x
1
2
 2 x  3)dx
Solución:
3

3
1
 x3

( x  2 x  3)dx    x 2  3x   F (3)  F (1)
3
1
2
F (3)  9  9  9  9
F (1) 
1
5
1 3  
3
3
183
luego

3
1
5
5 32
( x 2  2 x  3)dx  9  ( )  9  
3
3 3
Cuando se calculan áreas los resultados se toman en valor absoluto.
Variable aleatoria continua.
Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real. Por ejemplo, la duración de las
bombillas de una determinada marca y modelo.
En el caso de variables aleatorias continuas no tiene sentido plantearse probabilidades de resultados aislados, por ejemplo,
probabilidad de que una bombilla dure 100 horas, 22 minutos y 16 segundos. La probabilidad sería 0.
El interés de estas probabilidades está en conocer la probabilidad correspondiente a un intervalo. Dicha probabilidad se
conoce mediante una curva llamada función de densidad y suponiendo que bajo dicha curva hay un área de una unidad.
Conociendo esta curva, basta calcular el área correspondiente para conocer la probabilidad de un intervalo cualquiera.
La función de densidad de una v.a. continua cumple las siguientes condiciones:
 Sólo puede tomar valores comprendidos entre 0 y 1: 0  f ( x)  1

El área encerrada bajo la curva es igual a la unidad:



f ( x).dx  1 .
Ejercicio:
Sea f ( x) 
x
con x  0,6. Comprueba que es una función de densidad y calcula p(2  x  5)
18
Solución:
Para que sea función de densidad
x
dx tiene que valer 1. Veamos:
0 18

6
6
x
1  x2 
1  36

dx

0 18 18  2   18  2  0   1
0
6
5
x
1  x2 
1  25
p(2  x  5)  
dx      
2 18
18  2  2 18  2
5
4  21 7


2  36 12
Función de distribución.
Como en el caso de la v.a. discreta, la función de distribución proporciona la probabilidad acumulada hasta un determinado
valor de la variable, es decir, F ( x)  p ( X  x) .
Cumple las siguientes condiciones:
 Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.
 Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.
Media y varianza de una v.a. continua.
Existe cierta correspondencia entre la variable aleatoria discreta y la continua:
Variable aleatoria discreta
   xi . p i
   x pi  
2
2
i
Variable aleatoria continua
b
   x. f ( x).dx
a
2
b
 2   x 2 f ( x)dx   2
a
184
Lo que es

pasa a ser

p i pasa a ser f (x)
y lo que es
Ejercicio 1.
La función de densidad de una v.a. continua viene definida por :
2 x si 0  x  1
f ( x)  
0 en el resto
a) Halla la función de distribución.
b) Calcula la media y la varianza.
Solución:
a) La función de distribución se obtiene integrando la función de densidad, es decir,
A la izquierda de 0, su valor 0.
A la derecha de 1, su valor es 1
x
Entre 0 y 1:
F ( x)  p( X  x)   2 xdx  x 2
0

x
0
 x2
0 si x  0
 2
es decir, F ( x)  x si 0  x  1
1 para x  1

b) Cálculo de la media:
b
1
a
0
   x. f ( x).dx   x.2 x.dx 
Cálculo de la varianza:
b
1
a
0
2
3
 2   x 2 f ( x)dx   2   x 2 .2 x.dx 
4 1

9 18
Ejercicio 2.
Calcula la media, la varianza y la desviación típica de una v.a. que tiene como función de densidad:
f ( x) 
x3
con x  1,5
24
Solución:
5
b
Media:
   x. f ( x).dx  
Varianza:
a
b
x3
1 5 2
1  x 3 3x 2 
29
x.
dx 
(
x

3
x
)
dx






24
24 1
24  3
2 1
9
   x f ( x)dx    
2
2
2
a
5
5
1
x3
1 5
 29 
 29 
x
dx      ( x 3  3x 2 )dx    
1
24
24
 9 
 9 
2
2
2
1  x4
104
 29 
3

 1,28 .
  x    
24  4
81
1  9 
Desviación típica:
2
  1,28  1,13
Ejercicio 3.
185
Sea
f ( x) 
x2 1
con x  2,5 , una función de densidad.
36
a) Calcula su función de distribución.
b) Calcula p(3  x  4) .
Solución:
a)
F ( x)  p ( X  x )  
x
2


x2 1
1 x 2
1 x3
x 3  3x  2

dx 
(
x

1
)
dx

(

x
)


3
36
36 2
36
108
2
x
Su valor es cero para todos los puntos situados a la izquierda de 2
Su valor es 1 para todos los puntos situados a la derecha de 5
4
b)
p(3  x  4)  
4
3

x2 1
1 4 2
1  x3
1 x 3  3x 
17


dx 
(
x

1
)
dx


x


 



3
36
36
36  3
3  3 54
 3 36
4
Distribución normal.
Hay muchas v.a. continuas cuya función de densidad tiene forma de campana.
Ejemplos:
- La variable peso en una población de personas de la misma edad y sexo.
- La variable altura de la población citada.
- etc.
Se dice que estas variables tienen una distribución normal y la función de densidad recibe el nombre de curva normal o
campana de Gauss.
Para expresar que una v.a. continua X, tiene una distribución normal de media  y desviación típica  , escribimos
N ( ,  ) .
Representación gráfica de la función de densidad de una
distribución normal.
Distribución normal estándar.
De las infinitas distribuciones N (  ,  ) , tiene especial interés la de media 0 y desviación típica 1, es decir, N (0,1) . Esta
distribución recibe el nombre de estandar o reducida
Existen unas tablas que permiten calcular probabilidades en distribuciones normales reducidas. Por ello es aconsejable
transformar cualquier v.a. X que sigue que sigue una distribución N (  ,  ) en otra variable Z que siga una distribución
N(0,1).
El cambio de variable que es necesario hacer es el siguiente:
Z
X 

Cálculo de probabilidades en distribuciones normales reducidas.
Sea Z una variable que sigue una distribución normal N(0,1).
Vamos algunos ejemplos que nos permiten calcular determinadas probabilidades en las tablas:
a) p( Z  1,23)
La probabilidad pedida se encuentra directamente en las tablas. Basta buscar 1,2 en la columna y 0,03 en la fila. Su
intersección nos da la probabilidad.
186
b) p ( Z  1,24)
En este caso la probabilidad pedida no está en las tablas. Sin embargo, si tenemos en cuenta que el área total bajo la gráfica
ha de ser 1, deducimos de la figura que:
p( Z  1,24)  1  p( Z  1,24)  1  0,8925  0,1075 .
c)
p( Z  0,72)
Como la gráfica es simétrica respecto al eje de ordenadas, p( Z  0,72)  p( Z  0,72) y ya estamos en el caso
anterior. Comprueba que el resultado final es 0,2358.
d)
p(0,5  Z  1,76)
Observando la figura se deduce que p (0,5  Z  1,76)  p ( Z  1,76)  p ( Z  0,5)  0,9608  0,6915  0,2693
Ejercicio 4
El peso de los individuos de una población se distribuye normalmente con media de 70 Kg. y desviación típica 6 Kg. De
una población de 2000 personas, calcula cuántas tendrán un peso comprendido entre 64 y 76 Kg.
Solución:
Se trata de una distribución N(70,6)
187
76  70 
 64  70
p(64  X  76)  p
Z 
  p(1  Z  1)  p( Z  1)  p( Z  1)
6 
 6
p( Z  1)  0,8413 (directamente en las tablas)
p( Z  1)  p( Z  1)  1  p( Z  1)  1  0,8413 .
Por tanto, p(64  X  76)  0,8413  (1  0,8413)  0,8413  1  0,8413  0,6825
Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg..
Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas.
Ejercicio 5.
La duración media de un lavavajillas es de 15 años y su desviación típica 0,5. Sabiendo que su vida útil se distribuye
normalmente, halla la probabilidad de que al adquirir un lavavajillas dure más de 15 años.
Solución:
Es una distribución normal de media 15 y desviación típica 0,5, es decir, N(15; 0,5).
p( X  15)  p( Z 
15  15
)  p( Z  0)  p( Z  0)  0,5
0,5
Ejercicio 6.
La nota media de las pruebas de acceso correspondientes a los estudiantes que querían ingresar en una facultad era 5,8 y la
desviación típica 1,75. Fueron admitidos los de nota superior a 6.
a) ¿Cuál fue el porcentaje de admitidos si la distribución es normal?
b) ¿Con qué probabilidad exactamente cuatro de diez estudiantes son admitidos?
Solución:
Apartado a):
p( X  6)  p( Z 
6  5,8
)  p( Z  0,11)  1  p( Z  0,11)  1  5438  0,4562  45,62%
1,75
Apartado b):
Es una distribución binomial de parámetros n=10 y p=0,4562
p(obtener r éxitos )=p(X = r)=
n r
10 
 p .(1  p) n  r = p(X  4)   (0,4562) 4 (1  0,4562) 6 
r 
 4
10.9.8.7

(0,4562) 4 (0,5438) 6  0,235
4.3.2.1
= 
Aproximación de la distribución binomial mediante la normal. (Corrección de Yates)
Cuando n es grande y p está próximo a 0,5 el comportamiento de una distribución binomial B(n, p) es aproximadamente
igual a una distribución normal,
N (np, npq )
Esto permite sustituir el estudio de una B (n, p ) por el de una
N (np, npq ) .
Suele considerarse que la aproximación es buena cuando np>5 y nq>5
Dado que por mucho que se parezca nunca es igual una binomial que una normal, es necesario aplicar en el cálculo de
probabilidades un ajuste que recibe el nombre de corrección de Yates.
Si X es la binomial y X’ la normal, la corrección consiste en lo siguiente:
188
1

p ( X  r )  p r   X   r 
2

1

2
(Se asocia un intervalo unidad centrado en el punto)
1
1

p ( a  X  b)  p  a   X   b  
2
2

(se alarga el intervalo ½ por la izquierda y ½ por la derecha.)
Para valores de n mayores de 1.000 se puede suprimir la corrección.
Ejercicio 7.
Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de obtener un número de caras comprendido entre
180 y 210, ambos inclusive.
Solución:
Calculamos la media y la desviación típica de la distribución binomial:
1 1
2 2
210,5  200 
 179,5  200
p(180  X  210)  p(179,5  X   210,5)  p
Z 

10
10


 p(2,05  Z  1,05)  p( Z  1,05)  p( Z  2,05)
pero p ( Z  1,05)  0,8531
y p ( Z  2,05)  p( Z  2,05)  1  p ( Z  2,05)  1  0,9798  0,0202
1
2
  np  400.  200 ;
  npq  400. .  10 . Por tanto,
luego p (180  X  210)  0,8531  0,0202  0,8329
Ejercicio 8.
Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una competición y tira 25 veces, ¿cuál es la
probabilidad de que acierte más de 10 tiros?
Solución:
Es una distribución B(25; 0,7) que podemos aproximar a través de la normal:
  n. p  25.0,7  17,5  5
n.q  25.0,3  7,5  5
La aproximación será buena.
  npq  25.0,7.0,3  2,29
10,5  17,5 

p( X  10)  p( X  11)  p( X   10,5)  p Z 
  p( Z  3,06) 
2,29 

 p( Z  3,06)  0,9998
189
Ejercicios propuestos.
1.- Un profesor de matemáticas ha observado que las notas obtenidas por sus alumnos en los exámenes de Estadística siguen
una distribución N(6; 2,5).
Se han presentado al último examen 32 alumnos, ¿cuántos sacaron al menos un 7?.
( Sol. 11 )
2.- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de pruebas anteriores, se
sabe que las puntuaciones siguen una distribución normal de media 80 y desviación típica 25.
¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?
(Sol. 36,74% )
3- Calcula el valor de k para que la función f ( x) 
1
 kx si x  0, 10 sea función de densidad.
5
Obtenido el valor de k, calcula la media y la desviación típica de la distribución.
( Sol. k = 1/50 ;
media = 3,33;
desviación típica = 2,36 )
4.- El peso de los toros de una determinada ganadería se distribuye normalmente con una media de 500 Kg. y 45 Kg. de
desviación típica. Si la ganadería tiene 2000 toros,
a) Cuántos pesarán más de 540 Kg.?
b) Cuántos pesarán menos de 480 Kg.?
c) Cuántos pesarán entre 490 y 510 Kg.?
( Sol. 373; 660; 348 )
5.- Una de las pruebas de acceso a la Universidad para mayores de 25 años consiste en un test con 100 preguntas, cada una
de las cuales tiene 4 posibles respuestas y sólo una correcta. Para superar esta prueba deben obtenerse, al menos, 30
respuestas correctas.
Si una persona contesta al azar, ¿cuál es el número esperado de respuestas correctas?.
¿Qué probabilidad tendrá de superar la prueba?
(Sol. 25; Utilizando la aproximación a través de la normal: p= 0,1492)
6.- Después de realizar varios sondeos sobre una población con escasa cultura, se ha conseguido averiguar que únicamente
el 15 % de la misma es favorable a los tratamientos de psicoterapia. Elegida al azar una muestra de 50 personas de dicha
población, se desea saber:
a) La probabilidad de que haya más de 5 personas favorables a dichos tratamientos.
b) La probabilidad de que a lo sumo haya 6 personas favorables.
(Sol. 0,7852;
0,3446 )
190