Download tomo 1 de estadística ii de cir - la importancia de las matematicas

Document related concepts
no text concepts found
Transcript
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
TOMO 1
COMPULIBRO
ESTADISTICA II DE
CIR
ESCRITO POR
CARLOS IVAN
RESTREPO
EL LIBRO EN SU TOTALIDAD ESTA EN CD. DONDE ENCONTRARAS
EJERCICIO DE PROFUNDIZACION
SI DESEAS EL CD LLAMAR AL 3006096633 O ESCRIBIR AL CORREO
[email protected]
1
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
AGRADESCO PRIMERO A DIOS A MI ESPOSA HIJOS Y NIETOS
QUE ME BRINDAN EL ESPACIO DE DEDICARLE HORAS A LO
QUE MAS ME GUSTA QUE ES TRANSMITIR POR ESCRITO
LO APRENDIDIO A TRAVES DE MIS AÑOS DE ENSEÑANZA DE
LA ESTADISTICA
2
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
CONTENIDO
LA IMPORTANCIA DE LA ESTADISTICA
6
CAPITULO 1
7
RESUMEN
7
FUNDAMENTOS DEL AREA DE MODELOS PROBABILISTICOS 7
COMPETENCIAS
Y
HABILIDADES
SOCIALES
9
1) COMPETENCIAS
ESPECÍFICAS
9
2) COMPETENCIAS
TRANSVERSALES
9
HISTORIA DE LA ESTADÍSTICA Y LA PROBABILIDAD
9
TOMA DE DESICIONES
10
TEORIA DE PROBABILIDADES
10
TIPOS DE PROBABILIDAES
12
APLICACIONES
12
ELEMENTOS DE ESTADISTICA DESCRIPTIVA
13
DEFINICIÓN DE ESTADÍSTICA
13
POBLACION
13
INDIVIDUO
13
MUESTRA
13
MUESTREO
14
VALOR
14
DATO
14
DEFINICIÓN DE VARIABLE
14
VARIABLE CUALITATIVA
14
VARIABLE CUALITATIVA NOMINAL
14
VARIABLE CUALITATIVA ORDINAL
14
VARIABLE CUANTITATIVA
15
a) VARIABLE DISCRETA
15
b) VARIABLE CONTINÚA
15
PRUEBA DE STURGES
15
FACTORIAL DE UN NÚMERO NATURAL
17
VARIACIONES
17
VARIACIONES CON REPETICIÓN
18
PERMUTACIONES
18
PERMUTACIONES CON REPITICION
19
COMBINACIONES
20
COMBINACIONES CON REPETICIÓN
21
ELEMENTOS DE PROBABILIDAD
22
ZONA DE EJEMPLOS
23
EJERCICIOS DE REPASO DEL CAPITULO 1
32
3
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
CAPITULO II
42
DISTRIBUCIONES
43
I) LA DISTRIBUCIÓN BINOMIAL: B(n, p)
43
ELEMENTOS DE ESTADISTICA PARA RESOLVER PRO
48
II) DISTRIBUCIÓN DE POISSON
49
III)DISTRIBUCION MULTINOMIAL
54
IV) DISTRIBUCION HIPERGEOMETRICA
55
V) DISTRIBUCION NORMAL
59
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
60
VI) DISTRIBUCION GEOMETRICA
64
VII) DISTRIBUCION EXPONENCIAL
67
FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD
70
FUNCIÓN DE DISTRIBUCIÓN
71
DISTRIBUCIÓN UNIFORME
76
DISTRIBUCION UNIFORME DISCRETA
77
DISTRIBUCIÓN T STUDENT
78
OTRAS DISTRIBUCIONES
80
1) DISTRIBUCIÓN DE CAUCHY
80
2) DISTRIBUCIÓN ERLANG
80
3) DISTRIBUCIÓN DE LAPLACE
81
4). DISTRIBUCIÓN DE PARETO
82
5.).DISTRIBUCIÓN LOGÍSTICA
82
6) DISTRIBUCIÓN DE GUMBEL
83
7) DISTRIBUCIÓN DE RAYLEIGH
83
8) DISTRIBUCIÓN DE WEIBULL
84
9) DISTRIBUCIÓN BETA
84
EJERCICIOS DE REPASO CAPITULO II
85
CAPITULO III
99
ERROR MUESTRAL
99
ESTIMACION
100
ESTIMACIÓN DE UNA PROPORCIÓN
102
LONGITUD DEL INTERVALO DE CONFIANZA
107
MUESTREO
107
LA ENCUESTA
108
TIPOS DE ENCUESTAS
108
TIPOS DE PREGUNTA
109
REGLAS PARA LA ELABORACION DE UN CUESTIONARIO 110
LA ENTREVISTA
110
TIPOS DE MUESTREO
111
I. MUESTREO PROBABILÍSTICO
111
2. MUESTREO ALEATORIO SIMPLE
111
3. MUESTREO ALEATORIO SIN REPOSICIÓN
112
4. MUESTREO ALEATORIO CON REPOSICIÓN
113
5. MUESTREO ALEATORIO SISTEMÁTICO
114
6. MUESTREO ALEATORIO ESTRATIFICADO
115
7. MUESTREO POR CONGLOMERADO
115
II MUESTREO NO PRIOBABILISTICO
115
1.- MUESTREO POR CUOTAS
116
4
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
2.- MUESTREO INTENCIONAL O DE CONVENIENCIA
117
3.- BOLA DE NIEVE:
117
TAMAÑO DE MUESTRA
117
CÁLCULO DEL TAMAÑO DE LA MUESTRA DE BASE
120
DISTRIBUCIONES MUESTRALES
122
TEOREMA DEL LÍMITE CENTRAL
125
DISTRIBUCIÓN MUESTRAL DE MEDIAS
126
VALOR ESPERADO
129
DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON σ2
DESCONOCIDA
131
DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
131
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS
133
DISTRIBUCIÓN
MUESTRAL
DE
DIFERENCIA
DE
PROPORCIONES
136
DISTRIBUCIÓN MUESTRAL DE NÚMERO DE DEFECTOS 144
EJERCICIO DE REPASO CAPITULO III
148
LINKGRAFIA
161
5
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
LA IMPORTANCIA DE LA ESTADISTICA
Se mostrara a través del libro la importancia de la estadística a
través de grandes frases sobre ella como se presenta a
continuación.
Una única muerte es una tragedia, un millón de muertes es una
estadística.
Josef Stalin
En estadística, lo que desaparece detrás de los números es la
muerte.
Günter Grass
Democracia: es una superstición muy difundida, un abuso de la
estadística.
Jorge Luis Borges
La esencia de la vida es la improbabilidad estadística a escala
colosal.
Richard Dawkins
La falacia del cuadro estadístico estriba en que es unilateral, en la
medida en que representa sólo el aspecto promedio de la realidad
y excluye el cuadro total. La concepción estadística del mundo es
una mera abstracción, y es incluso falaz, en particular cuando
atañe a la psicología del hombre.
Carl Jung
Conseguimos obtener así la fórmula estadística para conocer
aproximadamente la posición de un eléctron en un instante
determinado. Pero, personalmente, no creo que dios juegue a los
dados.
Albert Einstein
6
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
CAPITULO I
ESTE CAPITULO TIENE COMO OBJETIVO ELEMENTOS QUE
DEBEMOS APLICAR EN EL CURSO
ASPECTOS GENERALES
DE QUE TRATA EL CURSO
RESUMEN
Se describe una propuesta didáctica de enseñanza contextualizada
partiendo de que el estudiante debe conocer elementos de
estadística inferencial como el concepto de probabilidades,
propiedades y teorema total y de bayes y con uso del programa g
STAT STUDENT de las distribuciones muéstrales, aplicación de
pruebas de hipótesis y a las técnicas de regresión en el aula de
estadística para ingenieros de segundo año universitario extendido
a cualquier otra carrera. Apropiándonos de la teoría de las
funciones semióticas, desarrollada en la Universidad de LA
UNIDAD CENTRAL DEL VALLE, caracterizamos los elementos de
significado de las propiedades importantes de las distribuciones
muéstrales y evaluamos, mediante campos de problemas
algebraicos y de simulación, los errores o dificultades que los
alumnos ponen de manifestó en las aplicaciones de simulación de
procesos en las ciencias de la ingeniería. Como consecuencia, al
considerar los elementos de significado adquiridos en las
respuestas de los estudiantes, proponemos la simulación para
muestras pequeñas y grandes de forma intuitiva, como primer
acercamiento del alumno hacia la construcción del significado de
las distribuciones muéstrales, usando el lenguaje gráficos con
apoyo del computador, para posteriormente analizar con los
estudiantes su forma algebraica según la naturaleza de las
variables aleatorias contando para esto con una página base para
desarrollar sus dudas llamada de vitutor.
Palabras clave: Enseñanza y aprendizaje de la estadística,
distribuciones muéstrales, regresiones significado y comprensión,
simulación.
ALERTA : SIEMPRE QUE ENCUENTRES ESTA IMAGEN TE
PIDES QUE TERMNES EL EJEMPLO DADO
FUNDAMENTOS DEL AREA DE MODELOS PROBABILISTICOS
Se describe el marco teórico empleado, que ha situado los
elementos de significado institucional y personal de LA
DISTRIBUCIÓN MUESTRAL, PRUEBAS DE HIPOTESIS , DE
ANALISIS DE MUESTREO DE REGRESIONES LINEALES Y NO
7
a)
b)
c)
d)
e)
f)
8
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
LINEALES Y LAS IMPLICACIONES DE LOS NUMEROS INDICES
y a continuación alguna investigaciones previas relacionadas con
sus propiedades y la simulación en ingeniería.
Significado y comprensión de la distribución y als aplicaciones de la
regresiones lineales y no lineales, el análisis de las covarianzas de
los números índices e asumen como una actividad humana
implicada en la solución de cierta clase de situaciones
problemáticas de la cual emergen y evolucionan progresivamente
los objetos matemáticos. Se pretende elaborar un modelo de los
procesos de comprensión de las matemáticas que tenga en cuenta
los factores institucionales y socioculturales implicados en los
mismos. El autor considera diferentes entidades primarias como
constituyentes del significado de un objeto matemático (por
ejemplo), que son las que se analizan en este trabajo:
a) Problemas y situaciones que inducen actividades matemáticas
y definen el campo de problemas asociado al objeto.
b) Procedimientos, algoritmos, operaciones. Cuando un sujeto se
enfrenta a
un problema y trata de resolverlo, realiza distintos
tipos de prácticas, que llegan a convertirse con el tiempo en objeto
de enseñanza.
c) Representaciones materiales utilizadas en la actividad de
resolución de problemas (términos, expresiones, símbolos, tablas,
gráficos).
d) Abstracciones (conceptos, proposiciones). Las definiciones y
propiedades características del objeto y sus relaciones con otros
conceptos.
e) Demostraciones que empleamos para probar sus propiedades y
que llegan a formar parte de su significado.
Objetivos
generales.
El
alumno
debe:
Conocer
y
aplicar
correctamente
los
procedimientos
de
análisis
de
datos
que
mas
habitualmente
son
utilizados
en
el
proceso
de
obtención
de
información
cientí
fica
en
el
ámbito
de la ingeniería.
Identificar
la
cuestión
planteada
y
formularla
en
términos
de
hipótesis
científicas.
Gestionar
bases
de
datos
informatizadas: Organizar, introducir
y
procesar
los
datos
correctamente.
Seleccionar
las
técnicas
más
adecuadas
para
responder
a
las
cuestiones planteadas considerando las características de los
datos, con
que
se
opera.
Realizar
los
cálculos
mediante
ordenador.
Interpretar
los
resultados
y
extraer
las
conclusiones
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
COMPETENCIAS
Y
HABILIDADES
SOCIALES.
1) COMPETENCIAS
ESPECÍFICAS.
a) Competencia
número
1:
Conocer
los
principios
del
método
científico
y
las
características
de
los
diferentes
métodos
utilizados
en
en el área de las ingenierías y
sus
técnicas
de
análisis.
b)
Competencia
número
2:
Ser
capaz
de
aplicar
el
conocimiento
metodológico
para
resolver
los
problemas
planteados
en
la
práctica
profesional.
c) Competencia
número
3:
Ser
capaz
de
analizar
datos
psicológicos
mediante
programas
estadísticos
y
otras
tecnologías
de
la
información.
d) Competencia
número
4:
Ser
capaz
de
interpretar,
valorar
críticamente
y
comunicar
los
resultados
de
la
evidencia
empírica.
2) COMPETENCIAS
TRANSVERSALES.
a) Desarrollar
habilidades
de
expresión
oral
y
escrita
encaminadas
a
realizar
y
presentar
en
público
informes
científicos.
b) Trabajar
en
grupo
(a
desarrollar
en
las
prácticas
con
ordenador).
c) Búsqueda
de
fuentes
bibliográficas
y
documentación.
HISTORIA DE LA ESTADÍSTICA Y LA PROBABILIDAD
Se dice en el mundo de la arqueología que la presencia del hueso
astrágalo de oveja o ciervo en las excavaciones arqueológicas más
antiguas, parece confirmar que los juegos de azar tienen una antigüedad
de más de 40.000 años, y la utilización del astrágalo en culturas más
recientes, ha sido ampliamente documentada. Pero no solo esa es una
señal de la antigüedad de los juegos de azar, pues aquellos que han
tenido la ocasión de visitar las pirámides de Egipto han podido detallar
pinturas que muestran juegos de azar que datan del año 3.500 a. C. y
Herodoto se refiere a la popularidad y difusión en su época de los juegos
de azar, especialmente la tirada de astrágalos y dados. Los dados más
antiguos se remontan a unos 3000 años antes de Cristo y se utilizaron en
el juego como en ceremonias religiosas.
Todo lo anterior conlleva a pensar que las civilizaciones antiguas,
explicaban el azar mediante la voluntad divina como se puede apreciar en
la civilización griega o romana que utilizaban la configuración resultante
de tirar cuatro dados para predecir el futuro y revelar la voluntad favorable
o desfavorable de los dioses. Pero no únicamente los griegos o los
romanaos realizaban prácticas de juego de azar también se encontraron
prácticas similares en culturas tan distintas como la tibetana, la india o la
judía..
A medida que transcurre el tiempo y el cambios de periodos de la
civilización, en unos de esos periodos llamado renacimiento aparece un
nuevo enfoque global de considerar al mundo, desde la perspectiva de un
9
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
abandono progresivo de explicaciones teológicas los cuales conduce a
una reconsideración de los experimentos aleatorios; y los matemáticos
italianos del siglo XVI, comienzan a interpretar los resultados de
experimentos aleatorios simples. Cardano, establece la equiprobabilidad
de aparición de las caras de un dado a largo plazo yes asi como a finales
del siglo XVI, existía un intuitivo pero preciso análisis empírico de los
resultados aleatorios que conllevo a el desarrollo del análisis matemático
de los juegos de azar se produce lentamente durante los siglos XVI y
XVII, y algunos autores consideran como origen del cálculo de
probabilidades la resolución del problema de los puntos en la
correspondencia entre Pascal y Fermat en 165 lo que hace consolidar el
cálculo de probabilidades como disciplina independiente en el período
que transcurre desde la segunda mitad del siglo XVII hasta comienzos del
siglo XVIII donde la teoría de la probabilidad fue aplicada con buenos
resultados a las mesas de juego y con el tiempo a otros problemas
socioeconómicos.
Pero es precisamente en el siglo XVIII que el cálculo de probabilidades
se extiende a problemas físicos y actuariales (seguros marítimos) siendo
este el principal impulsor de la astronomía y física donde surgen
problemas ligados a la contrastación empírica de la teoría de Newton
donde sus investigaciones toman gran importancia en el desarrollo de la
Estadística.
Ya en el siglo XX nace la industria de los seguros, la cual requería de un
conocimiento exacto del riesgo de perder pues de lo contrario no se
podían calcular las pólizas lo que llevo muchos años después a que se
incluyera en muchos centros de enseñanza, ele estudios de las
probabilidades como un instrumento que les permitiría entender los
fenómenos sociales que permitiera comparar con exactitud los datos
observados con la teoría requería un tratamiento riguroso del mismo, que
va a dar lugar a la teoría de errores.
Debido a esto aparecen matemáticos como D. Bernoulli, Abraham de
Moivre, el reverendo Thomas Bayes y Joseph Lagrange inventaron
fórmulas y técnicas de probabilidad y en una de esas formula Bernouilli
proporciona la primera solución al problema de estimar una cantidad
desconocida a partir de un conjunto de mediciones de su valor que, por el
error experimental, presentan variabilidad. Fue pionero en la aplicación
del cálculo infinitesimal al cálculo de probabilidades.
Pero no únicamente
los matemáticos mencionados anteriormente
trabajaron en el área de las probabilidades existieron otros como Pierre
Simon, Marqués de Laplace quien indujo la primera definición explícita de
probabilidad y desarrolló la ley normal como modelo para describir la
variabilidad de los errores de medida; también formuló y estimó el primer
modelo explicativo estadístico y donde Gauss hace su aporte con
respecto a la estimación de modelos estadísticos.
Continuando con esta lista encontramos, geólogo y astrónomo Bravais,
que es el primero en considerar la relación entre errores de medida
dependientes entre sí; a Benjamín Pierce que establece el primer criterio
para rechazar observaciones heterogéneas con el resto , y en el siglo xix
10
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
aparece , el más famoso astrónomo americano llamado S. Newcomb que
el que l introduce los primeros métodos de estimación cuando hay errores
fuertes en algunos datos (Estimación Robusta).
TOMA DE DECISIONES
Hoy por hoy la teoría matemática de la probabilidad constituye el
fundamento de las aplicaciones estadísticas tanto en la investigación
científica, económica, social, ingenieril como aspecto fundamental de la
toma de decisiones la cual e hace que vivamos en un mundo inestable
donde somos incapaces de pronosticar el futuro con absoluta certeza a
pesar de los avances tecnológicos y donde la necesidad de sortear la
incertidumbre nos lleva a estudiar y aplicar la teoría de la probabilidad.
El concepto de la probabilidad pasa por la cabeza de cualquier ciudadano
y con algún conocimiento sobre los posibles resultados de una decisión.
que nos permita reconocer nuestras suposiciones, de tal manera que
podamos comunicar a otros nuestro razonamiento y tomar una decisión
más inteligente de la que lograríamos recurriendo a un método que no
sea científico.
Pero en un mundo globalizado donde los perfiles de los hombres son tan
diferente ya que encontramos el hombre de negocios, el jugador de
póquer o el estratega militar, etc. que deben tomar decisiones en
condiciones de incertidumbre con respecto al futuro y para ello debe
relacionar una probabilidad numérica con cada evento posible que pueda
influir en el resultado de sus decisiones, y que el tener éxito que tenga
en la toma de decisiones, estará enlazada a la capacidad de tratar
sistemáticamente con la incertidumbre misma mediante cuidadosas
evaluaciones y aplicaciones de métodos estadísticos concernientes a las
actividades de los negocios.
LA TEORÍA DE LA PROBABILIDAD
Cuando se hable de probabilidad lo primero que debemos pensar es que
la probabilidad está relacionada con un evento numérico comprendido
entre 0 y 1, el cual representa el riesgo o la posibilidad de que ocurra ese
evento. Una probabilidad de (P = 0) significa que el evento es imposible ;
si P = 0.50, es tan probable que el evento ocurra como que no ocurra; si P
= 1, es seguro que suceda.
Un aspecto importante es que el valor de P no puede ser negativo ni
mayor que uno y además se puede considerar que la probabilidad es la
frecuencia relativa de "éxitos" o aciertos (es decir, la ocurrencia de un
evento determinado) en un proceso aleatorio en que se ha repetido un
gran número de pruebas o ensayos. La frecuencia relativa es el número
de "éxitos" dividido entre el número de pruebas efectuadas.
11
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
FUENTES DE PROBABILIDADES
Es posible estimar probabilidades mediante cualquiera de las tres
siguientes maneras alternativas:
1. Frecuencia relativa de eventos pasados. Las probabilidades
pueden estimarse a partir de las frecuencias relativas que se
observen en un experimento controlado, o mediante muestreo de
un universo grande y finito. La probabilidad a priori (previa) se
deduce de la experiencia obtenida de la observación prolongada.
Donde las probabilidades de eventos complicados pueden
determinarse a partir de las probabilidades de eventos más
sencillos, por medio de un método de simulación, utilizando un
modelo experimental diseñado para representar las condiciones
reales del mismo.
2. Distribuciones teóricas. Las probabilidades pueden determinarse
sin recurrir a las frecuencias relativas. Estas probabilidades pueden
determinarse a partir de la distribución binomial, sin recurrir a
experimentos o muestras basadas en la experiencia pasada. La
validez de dichas distribuciones teóricas depende de cuán
fielmente las hipótesis representen la realidad.
3. Apreciación subjetiva. Si ninguno de los métodos anteriormente
mencionados pueden utilizarse, el responsable de la toma de
decisiones debe estimar las probabilidades en base a su juicio o
criterio y experiencia. Una probabilidad subjetiva es una evaluación
que una persona que toma decisiones hace acerca de la vero –
similitud relativa de que ocurra un evento incierto, o sea,
representa las "apuestas" que se hacen sobre la concurrencia de
ese evento. Tales apreciaciones son sumamente personales y, por
lo tanto, dos individuos pueden asignar diferentes probabilidades
subjetivas al mismo evento.
TIPOS DE PROBABILIDADES
1. Probabilidad simple. Probabilidad de que el dato escogido tenga
una característica.
2. Probabilidad conjunta. Probabilidad de escoger un dato con dos (o
más) características específicas.
3. Probabilidad marginal (al margen de la tabla). No es más que la
probabilidad simple, vista con otro enfoque; o sea, mientras que la
probabilidad simple es un concepto singular, la probabilidad
marginal es esencialmente una suma de probabilidades conjuntas.
4. Probabilidad condicional. La característica específica del dato es la
condición (condiciona la probabilidad).
APLICACIONES
En estos tiempos modernos hace que la complejidad de los negocios en
los últimos años, ha incrementado el uso de la estadística para tomar
decisiones en cualquier nivel de la administración.
12
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Las aplicaciones de métodos estadísticos en las diferentes áreas son
numerosas; por ejemplo: gráficas y tablas estadísticas son usadas
frecuentemente por gerentes de ventas para representar hechos
numéricos de ventas; métodos de muestreo son empleados por
investigadores de mercado, al hacer encuestas sobre las preferencias del
consumidor sobre ciertas marcas de artículos competitivos; métodos de
control de calidad, aplicados en producción, etc.1
RECORDEMOS
ELEMENTOS DE ESTADISTICA DESCRIPTIVA
DEFINICIÓN DE ESTADÍSTICA
La Estadística trata del recuento, ordenación y clasificación de los datos
obtenidos por las observaciones, para poder hacer comparaciones y
sacar conclusiones.
Un estudio estadístico consta de las siguientes fases:
Recogida de datos.
Organización y representación de datos.
Análisis de datos.
Obtención de conclusiones.
Conceptos de Estadística
POBLACIÓN
Una población es el conjunto de todos los elementos a los que se somete
a un estudio estadístico.
INDIVIDUO
Un individuo o unidad estadística es cada uno de los elementos que
componen la población.
MUESTRA
Una muestra es un conjunto representativo de la población de referencia,
el número de individuos de una muestra es menor que el de la población.
11
aprendeenlinea.udea.edu.co/lms/moodle/mod/.../view.php?...true...
13
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
MUESTREO
El muestreo es la reunión de datos que se desea estudiar, obtenidos de
una proporción reducida y representativa de la población.
VALOR
Un valor es cada uno de los distintos resultados que se pueden obtener
en un estudio estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos dos valores: cara y sello.
DATO
Un dato es cada uno de los valores que se ha obtenido al realizar un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5
datos: cara, cara, cruz, cara, cruz.
DEFINICIÓN DE VARIABLE
Una variable estadística es cada una de las características
cualidades que poseen los individuos de una población.
o
Tipos de variable estadísticas
VARIABLE CUALITATIVA
Las variables
cualitativas se
refieren
a características
o
cualidades que no pueden ser medidas con números. Podemos distinguir
dos tipos:
VARIABLE CUALITATIVA NOMINAL
Una variable
cualitativa
nominal presenta modalidades
numéricas que no admiten un criterio de orden. Por ejemplo:
no
El estado civil, con las siguientes modalidades: soltero, casado, separado,
divorciado y viudo.
VARIABLE
CUALITATIVA
CUASICUANTITATIVA
ORDINAL
O
VARIABLE
Una variable cualitativa ordinal presenta modalidades no númericas, en
las que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
14
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,...
Medallas de una prueba deportiva: oro, plata, bronce.
VARIABLE CUANTITATIVA
Una variable cuantitativa es la que se expresa mediante un número, por
tanto se pueden realizar operaciones aritméticas con ella. Podemos
distinguir dos tipos:
a) VARIABLE DISCRETA
Una variable discreta es aquella que toma valores aislados, es
decir no admite valores intermedios entre dos valores específicos. Por
ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
b) VARIABLE CONTINÚA
Una variable continua es aquella que puede tomar valores comprendidos
entre dos números. Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se
podría dar con tres decimales.
PRUEBA DE STURGES
Se para disminuir un numero amplio de intervalos al azar y ser más
precisos a la hora de construir intervalos
Permite disminuir la aleatoridad de los intervalos a través:
¡) k= 1+3,3LogN
¡¡) RANGO INICIAL= DM-dm
¡¡¡) C¡=
(amplitud de intervalo)
¡v) Cn= es la aproximación al dato entero que sigue si es discreta, ej. C¡=
2,4= 3
v) RANGO NUEVO= Rn= (Cn)(k)
v¡) DIFERENCIA DE RANGOS= Rn-Ri
15
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
v¡¡) AJUSTE= DR-1 si es discreto
v¡¡¡) SESGO:
-par, ajuste ÷ 2
-impar, ajuste se limita, ejm: 7= 3ó4 y 4ó3
EJEMPLO 1.1
Distribuir en intervalos los siguientes datos:
4
10
21
9
18
8
11
22
9
19
12
12
23
11
20
16
13
24
11
20
20
14
15
11
20
24
15
15
11
21
5
16
15
13
20
6
17
15
15
15
7
18
5
16
15
8
19
7
17
15
9
20
9
17
14
¡) K= 7
¡¡) Ri= 24-4= 20
iii) Ci=
iv) Cn= 3
v) Rn= (3)(7)= 21
vi) Dr= 21- 20= 1
vii) AJ= 1-1= 0
Intervalos
4-6
7-9
10-12
13-15
16-18
19-21
22-24
∑
Ni
4
8
8
13
8
10
4
55
X´
5
8
11
14
|7
20
23
98
∑(x´ni)
20
64
88
182
136
200
92
782
Nota si es decimales el Cn será el decima que sigue y si es el dato es
discreto se continua con en le Cn con el entero que sigue
16
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
FACTORIAL DE UN NÚMERO NATURAL
Es el producto de los “n” factores consecutivos desde “n” hasta 1.
El factorial de un número se denota por n!.
VARIACIONES
Se llama variaciones ordinarias de m elementos tomados de n en n (m ≥
n) a los distintos grupos formados por n elementos de forma que:
No entran todos los elementos.
Sí importa el orden.
No se repiten los elementos.
También podemos calcular las variaciones mediantefactoriales:
Las variaciones se denotan por
EJEMPLO 1.2
Calcular las variaciones de 6 elementos tomados de tres en tres.
EJEMPLO 1.3
Cuántos números de tres cifras diferentes se puede formar con los
dígitos: 1, 2, 3, 4, 5 ?
m=5
n=3 m≥n
No entran todos los elementos. De 5 dígitos entran sólo 3.
17
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Sí importa el orden. Son números distintos el 123, 231, 321.
No se repiten los elementos. El enunciado nos pide que las cifras
sean diferentes.
VARIACIONES CON REPETICIÓN
Se llama variaciones con repetición de m elementos tomados de n en n a
los distintos grupos formados por n elementos de manera que:
No entran todos los elementos si m > n. Sí pueden entrar todos los
elementos si m ≤ n
Sí importa el orden.
Sí se repiten los elementos.
EJEMPLO 1.4
¿Cuántos números de tres cifras se puede formar con los dígitos: 1, 2, 3,
4, 5 ?
m=5
n=3
No entran todos los elementos. De 5 dígitos entran sólo 3.
Sí importa el orden. Son números distintos el 123, 231, 321.
Sí se repiten los elementos.
PERMUTACIONES
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos.
18
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 1.5
¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos:
1, 2, 3, 4, 5?
m=5
n=5
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos. El enunciado nos pide que las cifras sean
diferentes.
PERMUTACIONES CIRCULARES
Se utilizan cuando los elementos se han de ordenar "en círculo", (por
ejemplo, los comensales en una mesa), de modo que el primer elemento
que "se sitúe" en la muestra determina el principio y el final de muestra.
EJEMPLO 1.6
Calcular las permutaciones circulares de 7 elementos.
PC7= (7 − 1)! = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720
PERMUTACIONES CON REPETICIÓN
Permutaciones
con
repetición de m
elementos donde
elprimer
elemento se repite a veces , el segundo b veces , el tercero c veces, ...(m
= a + b + c + ... = n) son los distintos grupos que pueden formarse con
esos m elementos de forma que :
Sí entran todos los elementos.
Sí importa el orden.
Sí se repiten los elementos.
19
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 1.7
Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; ¿cuántos números de nueve cifras se
pueden formar?
m=9
a=3
b=4
c=2
a+b+c=9
Sí entran todos los elementos.
Sí importa el orden.
Sí se repiten los elementos.
COMBINACIONES
Se llama combinaciones de m elementos tomados de n en n (m ≥ n) a
todas las agrupaciones posibles que pueden hacerse con los m
elementos de forma que:
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
También podemos calcular las combinaciones mediante factoriales:
EJMEPLO 1.8
En una clase de 35 alumnos se quiere elegir un comité formado por tres
alumnos. ¿Cuántos comités diferentes se pueden formar?
No entran todos los elementos.
No importa el orden: Juan, Ana.
No se repiten los elementos.
20
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
COMBINACIONES CON REPETICIÓN
Las combinaciones con repetición de m elementos tomados de n en n (m
≥ n), son los distintos grupos formados por n elementos de manera que:
No entran todos los elementos.
No importa el orden.
Sí se repiten los elementos.
Números combinatorios
El número
por
se llama también número combinatorio. Se representa
y se lee "m sobre n".
Propiedades de los números combinatorios
1.
2.
3.
EJEMPLO 1.9
En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas
formas se pueden elegir cuatro botellas?
No entran todos los elementos. Sólo elije 4..
21
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
No importa el orden. Da igual que elija 2 botellas de anís y 2 de ron, que 2
de ron y 2 de anís.
Sí se repiten los elementos. Puede elegir más de una botella del mismo
tipo.
ELEMENTOS DE PROBABILIDAD
Probabilidad de la unión de sucesos incompatibles
A
p(A
B=
B) = p(A) + p(B)
Probabilidad de la unión de sucesos compatibles
A
p(A
B≠
B) = p(A) + p(B) − p(A
B)
Probabilidad condicionada
Probabilidad de la intersección de sucesos independientes
p(A
B) = p(A) · p(B)
Probabilidad de la intersección de sucesos dependientes
p(A
B) = p(A) · p(B/A)
Probabilidad de la diferencia de sucesos
Teorema de la probabilidad total
p(B) = p(A1) · p(B/A1) + p(A2) · p(B/A2 ) + ... + p(An) · p(B/An )
22
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
TEOREMA DE BAYES
0 ≤ p(A) ≤ 1
p(E) = 1
ZONA DE EJEMPLOS
ALGUNOS EJEMPLOS TOMADOS DE http://www.vitutor.net/1/52.html
EJEMPLO 1.10
Se tira 2 dados, ¿Cuál es la probabilidad de que salga: 5, 7, 9, 10?
LEY
DE
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1)……………………………(2,6)
(3,1)…………………………....(3,6)
S=
(4,1)……………………………(4,6)
(5,1)……………………………(5,6)
(6,1)……………………………(6,6)
Para 5: (1,4)(4,1)(2,3)(3,2)
P(5)= 4/36= 0,1111= 11,11%
Para 7:(1,6)(6,1)(2,5)(5,2)(3,4)(4,3)
P(7)= 6/36= 0,1667= 16,67%
Para 9: (4,5)(5,4)(3,6)(6,3)
P(9)= 4/36= 0,1111= 11,11%
23
LAPLACE
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Para 10: (5,5) (6,4)(4,6)
P(10)= 3/36= 0,0833= 8,33%
EJEMPLO 1.11 Dada la función
½ para x>0
F(x)= ¾ para x  x<2
1 para x>=2
Hallar
a) P(x>=0) SI P(X<0) =½
b) Hallar el complemento de P(x<0)
c) P(x>=0)
SOLUCION
a) AXIOMA:
P(x>=0)+P(x<0)= 1
P(x>=0)= 1-P(x<0)
= 1- ½= ½


ESTIMADO ESTUDIANTE REALIZAR B Y C
EJEMPLO 1.12
Dados los puntos (-20,0) y (30,1) hallar
a)
b)
c)
d)
La pendiente
La ecuación de la recta que pasa por esos puntos
La grafica
Dada la grafica escriba análisis a través de
intervalos
SOLUCION
a)
24
m
1 0
1

30  (20)  50
b)
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Y-Y1= m(X-X1)

CUAL ES EL VALOR DE b
c)La grafica
d) Dada la función de la grafica:
f(x)=
0
si
1
si
x<=-20
x>10
EJEMPLO 1.13
Hallar la probabilidad de que al levantar unas fichas de dominó el maestro
Alfonso Acuña obtenga un número de puntos mayores que 9 o que sea
múltiplo de 4.
25
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 1.14
NEWTON lanza dos dados al aire y se anota la suma de los puntos
obtenidos. Se pide:
1)La probabilidad de que salga el 7.
2) La probabilidad de que el número obtenido sea par.
3) La probabilidad de que el número obtenido sea múltiplo de tres.
EJEMPLO 1.15
De una urna que contiene 4 bolas verde, 5 blancas y 6 negras, se extrae
una bola ¿cuál es la probabilidad de que la bola sea verde o blanca?
¿Cuál es la probabilidad de que no sea blanca?
EJEMPLO 1.16
26
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Juan y Victoria son dos hermanos que salen de caza. El primero mata un
promedio de 2 piezas cada 5 disparos y el segundo una pieza cada 2
disparos. Si los dos disparan al mismo tiempo a una misma pieza, ¿cuál
es la probabilidad de que la maten?
A= JUAN MATA 2 DE 5
B= VICTORIA UNA DE DOS
EJEMPLO 1.17
A una pareja de esposos cuarentones le realizaron un diagnostico de
supervivencia y se encontró que la probabilidad de que un hombre viva 20
años es ¼ y la de que su señora viva 20 años es 1/3. Se pide calcular la
probabilidad:
1)De que ambos vivan 20 años.
2)De que el hombre viva 20 años y su señora no.
3De que ambos mueran antes de los 20 años.
EJEMPLO 1.18
En la Uceva los estudiantes de las carreas ofrecidas por esta institución
educativa pueden optar por cursar como lengua extranjera inglés o
Italiano. En un determinado curso, el 90% de los alumnos estudia inglés y
el resto italiano. El 30% de los que estudian inglés son chicos y de los que
estudian italiano son chicos el 40%. El elegido un alumno al azar, ¿cuál
es la probabilidad de que sea chica?
27
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
p(chica) = 0.9 · 0.7 + 0.1 · 0.6 = 0.69
EJEMPLO 1.19
El sociólogo Rubén Darío González de una baraja española de 48 cartas
extrae simultáneamente dos de ellas. Calcular la probabilidad de que:
1 Las dos sean copas.
2Al menos una sea copas.
3Una sea copa y la otra espada.
EJEMPLO 1.20
En un taller de autos se sabe que por término medio acuden: por la
mañana tres automóviles con problemas eléctricos, ocho con problemas
mecánicos y tres con problemas de chapa, y por la tarde dos con
problemas eléctricos, tres con problemas mecánicos y uno con problemas
de chapa.
1 Hacer una tabla ordenando los datos anteriores.
28
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
2Calcular el porcentaje de los que acuden por la tarde.
3Calcular el porcentaje de los que acuden por problemas mecánicos.
4Calcular la probabilidad de que un automóvil con problemas
eléctricos acuda por la mañana.
EJEMPLO 1.21
Un estudiante dormilón cuenta, para un examen con la ayuda de un
despertador, el cual consigue despertarlo en un 80% de los casos. Si oye
el despertador, la probabilidad de que realiza el examen es 0.9 y, en caso
contrario, de 0.5.
1 Si va a realizar el examen, ¿cuál es la probabilidad de que haya oído el
despertador?
29
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
2Si no realiza el examen, ¿cuál es la probabilidad de que no haya
oído el despertador?
EJEMPLO 1.22
En la biblioteca de la Uceva existe una sección de entretenimiento en las
estanterías donde hay 60 novelas y 20 libros de poesía. Una persona A
elige un libro al azar de la estantería y se lo lleva. A continuación otra
persona B elige otro libro al azar.
1 ¿Cuál es la probabilidad de que el libro seleccionado por B sea una
novela?
2Si se sabe que B eligió una novela, ¿cuál es la probabilidad de que
el libro seleccionado por A sea de poesía?
30
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLOS 1.23 USANDO INTERNET
En estas direcciones
explicados en internet
encontraras
mas
ejemplos
en
videos
1)http://www.youtube.com/watch?v=J-B-Enaphw4
2)http://www.youtube.com/watch?v=J-B-Enaphw4
3)http://www.youtube.com/watch?v=WY80AY6XU0Q&feature=related
4)http://www.youtube.com/watch?v=qCKZKDWRXAA&feature=relate
d
5)http://www.youtube.com/watch?v=LGZbeW-vCW8&feature=related
6)http://www.youtube.com/watch?v=v2autI4LAyA&feature=related
7)http://www.youtube.com/watch?v=4O2waWg5cTg
8)http://www.youtube.com/watch?v=v2autI4LAyA&feature=related
9)http://www.youtube.com/watch?v=4hbNgJc-qR0&feature=related
10)http://www.youtube.com/watch?v=cGT_YHZ7M7s&feature=related
11)http://www.youtube.com/watch?v=VM8uBmr3EkQ&feature=related
12)http://www.youtube.com/watch?v=VM8uBmr3EkQ&feature=related
13)http://www.youtube.com/watch?v=-5EG28z2E08
14)http://www.youtube.com/watch?v=fFbY6dPOacM&feature=relmfu
15)http://www.youtube.com/watch?v=wJn-JqqKcu8&feature=relmfu
31
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJERCICIOS DE REPASO DEL CAPITULO 1
NOTA SI TIENES DUDAS NO DUDES IR A VITUTOR PERO NO
OLVIDES RESCRIBIR LA RESPUESTA CON ENUNCIADO
NOTA LOS EJERCICIOS DE 1 AL 9 TIENE UN OBJETIVO DE
RECORDAR ESTADISTICA DESCRIPTIVA
1) Indica que variables son cualitativas y cuales cuantitativas:
a. Comida Favorita.
b. Profesión que te gusta.
C, Número de goles marcados por tu equipo favorito en la última
temporada.
d. Número de alumnos de tu Instituto.
e. El color de los ojos de tus compañeros de clase.
f. Coeficiente intelectual de tus compañeros de clase.
2. De
las
siguientes variables indica
cuales continuas.
cuáles
son discretas y
a. Número de acciones vendidas cada día en la Bolsa.
b. Temperaturas registradas cada hora en un observatorio.
c. Período de duración de un automóvil.
d. El diámetro de las ruedas de varios coches.
e. Número de hijos de 50 familias.
f. Censo anual de los españoles.
3. Clasificar las siguientes variables en cuantitativas o cualitativas, en
discretas o continuas según el enunciado
a. La nacionalidad de una persona.
b Número de litros de agua contenidos en un depósito.
c Número de libros en un estante de librería.
d Suma de puntos tenidos en el lanzamiento de un par de dados.
e La profesión de una persona.
32
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
f El área de las distintas baldosas de un edificio.
4. Las calificaciones de 50 alumnos en Estadística
siguientes:
han sido las
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6,
3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias para dato no agrupados y
agrupados aplicando le a los agrupados sturges y dibuja el diagrama de
barras.
5. Los 40 estudiantes de una clase han obtenido las siguientes
puntuaciones, sobre 50, en un examen de Estadística.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32,
13.
a. Construir la tabla de frecuencias aplicando sturges
b. Dibujar el histograma y el polígono de frecuencias.
9. Sea una distribución estadística que viene dada por la siguiente tabla:
xi
61
64
67
70
73
fi
5
18
42
27
8
Calcular:
1 La moda, mediana y media.
2 El rango, desviación media, varianza y desviación típica.
6.Calcular la media, la mediana y la moda de la siguiente serie de
números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. Si agrupan
7. Hallar la varianza y la desviación típica de la siguiente serie de datos:
12, 6, 7, 3, 15, 10, 18, 5.
8. Hallar la media, mediana y moda de la siguiente serie de números:
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
16. Una distribución estadística viene dada por la siguiente tabla:
33
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
[10, 15)
fi 3
[15, 20)
[20, 25)
[25, 30)
[30, 35)
5
7
4
2
Hallar:
La moda, mediana y media.
El rango, desviación media y varianza.
Los cuartiles 1º y 3º.
Los deciles 3º y 6º.
Los percentiles 30 y 70.
9. Dada la distribución estadística:
[0,
5)
fi 3
[5,
10)
[10,
15)
[15,
20)
[20,
25)
[25,
∞)
5
7
8
2
6
Calcular:
La mediana y moda.
Cuartil 2º y 3º.
Media.
10) ¿Cuántos números de tres cifras diferentes se puede formar con los
dígitos: 0, 1, 2, 3, 4, 5 ?R/100
11) En un concurso literario de la UCEVA se han presentado 10
candidatos con sus novelas. El cuadro de honor lo forman el ganador, el
finalista y un accésit. ¿Cuántos cuadros de honor se pueden formar?R/
720
12) ¿Cuántos números de tres cifras se puede formar con los dígitos: 0, 1,
2, 3, 4, 5? R/ 180
13) ¿De cuántas formas distintas pueden sentarse ocho personas en una
fila de butacas? 40320
34
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
14) ¿De cuántas formas distintas pueden sentarse ocho personas
alrededor de una mesa redonda?R/ 5040
15) En el palo central de un barco velero se pueden izar tres banderas
rojas, dos azules y cuatro verdes. ¿Cuántas señales distintas pueden
indicarse con la colocación de las nueve banderas? 1260
16) En una clase de 30 alumnos se quiere elegir un comité formado por
tres alumnos. ¿Cuántos comités diferentes se pueden formar?R/ 4060
17) En una bodega hay 5 botellas de vio diferente. ¿De cuántas formas se
pueden elegir 4 botellas? R/70
18) ¿De cuántas formas diferentes se pueden cubrir los puestos de
presidente, vocal y tesorero de un club de fútbol sabiendo que hay 12
posibles candidatos? R/ 1320
19) Con las letras de la palabra libra, ¿cuántas ordenaciones distintas se
pueden hacer que empiecen por vocal? R/48
20) ¿De cuántas formas pueden mezclarse los siete colores del arco iris
tomándolos de dos en dos? R/ 21
21) ¿Cuántos números de cinco cifras distintas se pueden formar con las
cifras impares? R/ 120
22) ¿De cuántos partidos consta una liguilla formada por 6 equipos?30
23) A una reunión de directivos de la UCEVA asisten 10 personas y se
intercambian saludos entre todos. ¿Cuántos saludos se han
intercambiado? R/45
24) Con las cifras 1, 2 y 3, ¿cuántos números de cinco cifras pueden
formarse? R/ 243
25) ¿De cuántas formas pueden colocarse los 11 jugadores de un equipo
de fútbol teniendo en cuenta que en las reglas del futbol el portero no
puede ocupar otra posición distinta dl arco o portería? R/ 3628800
26) En la sala de ejecutivos existe la mesa de reuniones que está formada
por ocho personas, ¿de cuántas formas distintas se pueden sentar, si el
presidente y el secretario siempre van juntos/10080
27) Una comisión de negocios compuesto por cinco hombres y siete
mujeres, forma un comité de 2 hombres y 3 mujeres. De cuántas formas
puede formarse, si:
35
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1. Puede pertenecer a él cualquier hombre o mujer/ 350
2. Una mujer determinada debe pertenecer al comité/ 150
3. Dos hombres determinados no pueden estar en el comité. R/ 105
28) Cuatro libros distintos de estadística, seis diferentes de física y dos
diferentes de química se colocan en un estante. De cuántas formas
distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos. R/ 207360
2. Solamente los libros de matemáticas deben estar juntos. R/ 8709120
29) Un colombiano tiene cinco monedas de distintos valores. ¿Cuántas
sumas diferentes de dinero puede formar con las cinco monedas?31
30) Se ordenan en una fila 5 bolas Verdes, 2 bolas Rojas y 3 bolas
azules. Si las bolas de igual color no se distinguen entre sí, ¿de cuántas
formas posibles pueden ordenarse? R/2520
31) Resolver las ecuaciones combinatorias:
1 .
2.
R/ X=6
R/ X=7
3.
R/ X=7
4.
R/ X=17
32) Resolver las siguientes ecuaciones
1)
R/ X=12
2)
R/ X=5
3)
R/ X=5
4)
R/ X=5
36
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
5)
R/ X= 19
6)
R/ X= 10
33) Se lanzan dos monedas al aire hallar la probabilidad de que salgan
dos caras/1/4
34). Calcular la probabilidad de que al lanzar un dado al aire, salga Un
número par. R/1/2
35) Se lanza un dado ccalcular la probabilidad de obtener un 2 ó un 5. R/
1/3
36) Se lanza un dado calcular la probabilidad de obtener un múltiplo de 2
ó un 6. R1/2
37) Calcular la probabilidad de obtener un 6 al tirar un dado sabiendo que
ha salido par. R/1/3
38) Se sortea un viaje a Panaca entre los 120 mejores clientes de una
agencia de automóviles. De ellos, 65 son mujeres, 80 están casados y 45
son mujeres casadas. Se pide:
a) ¿Cuál será la probabilidad de que le toque el viaje a un hombre
soltero? R/ 1/6
b) Si del afortunado se sabe que es casado, ¿cuál será la probabilidad de
que sea una mujer? 56.25%
39) Sean A y B dos sucesos aleatorios con:
Hallar:
1
R/ 5/8
2
R/ 5/8
3
R/ 1/2
4
R/ 3/8
37
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
5
R/ 3/4
6
R/ 1/8
7
R/ 1/4
40) Sean A y B dos sucesos aleatorios con:
Hallar:
1
R/ 1/3
2
R/ 2/3
3
R/ 1/12
4
R/ 5/12
41) Se sacan dos bolas de una urna que se compone de una bola blanca,
otra amarilla, otra verde y otra negra. Escribir el espacio muestral cuando:
A) La primera bola se devuelve a la urna antes de sacar la segunda R/16
ELEMENTOS EN EL ESPACIO MUESTRAL
B) La primera bola no se devuelve R/ 12 ELEMENTOS EN EL ESPACIO
MUESTRAL
42) Una urna tiene ocho bolas negras, 5 amarilla y siete azules. Si se
extrae una bola al azar calcular la probabilidad de:
A) Sea negra. R/40%
amarilla R/75%
B) Sea azul . R/35%
C)
No
sea
43) Una urna contiene tres bolas rojas y siete blancas. Se extraen dos
bolas al azar. Escribir el espacio muestral y hallar la probabilidad de los
sucesos:
a) Con reemplazamiento. R/
b) Sin reemplazamiento/ 6/90
38
21/90
21/90
42/90
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
44) Se extrae una bola de una urna que contiene 4 bolas verdes, 5
blancas y 6 negras, ¿cuál es la probabilidad de que la bola sea verde o
blanca? ¿Cuál es la probabilidad de que no sea blanca? R/ 2/3
45) En la clase de estadística hay 10 alumnas rubias, 20 morenas, cinco
alumnos rubios y 10 morenos. Un día asisten 45 alumnos, encontrar la
probabilidad de que un alumno: Sea hombre o mujer. R/ 1
46) Se lanzan dos dados al aire y se anota la suma de los puntos
obtenidos. Se pide:
a) La probabilidad de que salga el 7.R/ 1/6
b) La probabilidad de que el número obtenido sea par. R/ ½
c) La probabilidad de que el número obtenido sea múltiplo de tres. R/ 1/3
47) Un estudiante lanzan tres dados. Encontrar la probabilidad de que
Salga 6 en todos R/ 1/216
48) Un jugador de azar si lanza al aire dos monedas, realiza el diagrama
de árbol Hallar la probabilidad de ganar si salen:
A) Salgan Dos caras. R/ 25%
B) Dos sellos R/ 25%
c) Una cara y un sello R/1/2
49) Sean
p(A
A y B dos sucesos aleatorios con p(A) = 1/2, p(B) = 1/3,
B)= 1/4. Determinar:
a)
R/ 75%
b)
R/ 50%
c)
R/ 7/12
d)
R/ 5/8
e)
R/ 5/6
50) En Colombia los alumnos pueden optar por cursar como lengua
extranjera inglés o francés. En un determinado curso, el 90% de los
alumnos estudia inglés y el resto francés. El 30% de los que estudian
39
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
inglés son chicos y de los que estudian francés son chicos el 40%. El
elegido un alumno al azar
a) Realizando un diagrama de árbol mostrar las probabilidades posibles
b) ¿cuál es la probabilidad de que sea chica? R/ 69%
51) A veces ocurre que
ante un examen, un alumno sólo ha
estudiado 15 de los 25 temas correspondientes a la materia del mismo.
Éste se realiza extrayendo al azar dos temas y dejando que el alumno
escoja uno de los dos para ser examinado del mismo. Hallar la
probabilidad de que el alumno pueda elegir en el examen uno de los
temas estudiados. R/ 85%
52) En el taller de matecho donde llevan estadísticas de autos ingresados
se sabe que por término medio acuden: por la mañana tres automóviles
con problemas eléctricos, ocho con problemas mecánicos y tres con
problemas de chapa, y por la tarde dos con problemas eléctricos, tres con
problemas mecánicos y uno con problemas de chapa.
a) Hacer una tabla ordenando los datos anteriores.
b) Calcular el porcentaje de los que acuden por la tarde. R/ 30%
c) Calcular el porcentaje de los que acuden por problemas mecánicos. R/
55%
d) Calcular la probabilidad de que un automóvil con problemas eléctricos
acuda por la mañana. R/ 60%
53) Una clase de matemáticas consta de seis niñas y 10 niños. Si se
escoge un comité de tres al azar, dibuje un diagrama de árbol y hallar la
probabilidad de:
a) Seleccionar tres niños. R/ 21.4%
b) Seleccionar exactamente dos niños y una niña. R/ 48,2%
c) Seleccionar por lo menos un niño. R/ 96.4%
d) Seleccionar exactamente dos niñas y un niño. R/ 26.8%
54) Una bolsa contiene tres monedas. Una moneda es corriente, otra
tiene dos caras y la otra está cargada de modo que la probabilidad de
obtener cara es de 1/3. Se selecciona una moneda al azar y se lanza al
aire dibuje su diagrama de árbol y Hallar la probabilidad de que salga
40
a) Cara.
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
R/61.1%
b) Sello
55) El maestro Uriel Quitian tiene una urna contiene 5 bolas rojas y 8
verdes. Se extrae una bola y se reemplaza por dos del otro color. A
continuación, se extrae una segunda bola. Se pide:
a) Dibuje el diagrama de árbol
b) Probabilidad de que la segunda bola sea verde. R / 58.2%
C) Probabilidad de que las dos bolas extraídas sean del mismo color. R/
41.8%
56) En una clase dirigida por Idelfonso Cobo y en un diagnostico
acostumbrado por el docente encontró que todos los estudiantes de su
curso practican algún deporte, donde el 60% de los alumnos juega al
fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay
un 60% que no juega al fútbol, cuál será la probabilidad de que escogido
al azar un alumno de la clase:
A) Juegue sólo al fútbol. R/ 40%
B) Juegue sólo al baloncesto
R/20%
C) Practique uno solo de los deportes. R/ 50%
57) En Tulua Colombia, el 40% de la población tiene cabellos castaños, el
25% tiene ojos castaños y el 15% tiene cabellos y ojos castaños. Se
escoge una persona al azar:
A) Si tiene los cabellos castaños, ¿cuál es la probabilidad de que tenga
también ojos castaños? R/ 37.5%
B) Si tiene ojos castaños, ¿cuál es la probabilidad de que no tenga
cabellos castaños R/ 40%
C) ¿Cuál es la probabilidad de que no tenga cabellos ni ojos castaños?
58) La federación de oftalmólogos supone que en Colombia 25 de cada
100 hombres y 600 de cada 1000 mujeres usan gafas. Si el número de
mujeres es cuatro veces superior al de hombres, se pide la probabilidad
de que:
a) Muestre las probabilidades a través de un diagrama de árbol
b) Halla una persona sin gafas. R/47%
41
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
c) Halla una mujer con gafas/48%
59) Un edificio de 3 pisos hay tres llaveros A, B y C; el primero con cinco
llaves, el segundo con siete y el tercero con ocho, de las que sólo una de
cada llavero abre la puerta del trastero. Se escoge a Lázaro llavero y, de
él, una llave intenta abrir el trastero. Se pide:
a) Muestre las probabilidades a través de un diagrama de árbol R/ 15.59%
b) ¿Cuál será la probabilidad de que se acierte con la llave?R/15.59%
c) ¿Cuál será la probabilidad de que el llavero escogido sea el tercero y la
llave no abra? R/29.17%
d)Y si la llave escogida es la correcta, ¿cuál será la probabilidad de que
pertenezca al primer llavero A?42,75%
60) Tenemos tres urnas: A con 3 bolas verdes y 5 negras, B con 2 bolas
verdes y 1 negra y C con 2 bolas verdes y 3 negras. Escogemos una
urna al azar y extraemos una bola. Si la bola ha sido verde , ¿cuál es la
probabilidad de haber sido extraída de la urna A? R/26%
61) El profesor Guillermo Vallecilla realiza un lanzamiento de un dado
normal. ¿Cuál es la probabilidad de obtener un 1 si se sabe que el
resultado ha sido impar? R/ 33.3%
62) La empresa de Tornillos El 60% de los tornillos producidos por la
empresa proceden de la maquina A y el 40% de la maquina B. La
proporción de defectuosos en A es 0.1 y en B es 0.5. ¿Cuál es la
probabilidad de que un tornillo de dicha fabrica sea defectuoso? ¿Cuál es
la probabilidad de que, sabiendo que un tornillo es defectuoso, proceda
de la maquina A?.R/ 23.1%
63) En el Hospital Tomas Uribe de Tulua se encontró que un 15% de los
pacientes atendidos son hipertensos, un 10% son obesos y un 3% son
hipertensos y obesos. ¿Qué probabilidad hay de que elegido un paciente
al azar sea obeso o hipertenso? R/ 22%
64) Se sabe por estudios previos que el 0,1% de la población Colombiana
tiene problemas vasculares. Un estudio sobre individuos con problemas
vasculares revela que el 20% de ellos son placas de ateroma. Si el 10%
de los individuos con placas de ateroma están expuestos a muerte súbita
por desprendimiento de trombos ¿qué probabilidad tiene un individuo
cualquiera de estar expuesto a muerte súbita por desprendimiento de
trombos de una placa de ateroma. R/
65) La prevalencia de infarto cardíaco para hipertensos es del 0,3% y
para no hipertensos del 0,1%. Si la prevalencia de hipertensión en una
42
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
cierta población es del 25% ¿Cuál es la prevalencia del infarto en esa
población? R/ 0,15%
66) Tenemos 5 cajones con productos de una cierta industria. Dos
cajones contienen cada uno 4 productos buenos y 1 fallado; otros dos
cajones contienen cada uno 3 productos buenos y 2 fallados; y el último
cajón contiene 6 productos buenos. Se elige al azar un cajón, del cual,
también al azar, se extrae un producto. Calcular la probabilidad de que el
producto extraído resulte bueno. R/ 76%
67) e lanzan dos dados equilibrados con seis caras marcadas con los
números del 1 al 6. Se pide:
a. Halla la probabilidad de que la suma de los valores que aparecen
en la cara superior sea múltiplo de tres. R/ 33.3%
b. ¿Cuál es la probabilidad de que los valores obtenidos difieran en
una cantidad mayor de dos? R/ 33.3%
43
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
CAPITULO II
DISTRIBUCIONES
I) LA DISTRIBUCIÓN BINOMIAL: B(n, p)
Si en una experiencia aleatoria únicamente consideramos dos
posibilidades: que ocurra el suceso A o que no ocurra ( que ocurra A’, el
complementario de A ) , se trata de una experiencia dicotómica.
Al suceso A se le suele llamar Éxito y a la probabilidad de que ocurra, p.
Es decir p=P(A).
A la probabilidad de que no ocurra A P(A’)=1-P(A) se le llama con la letra
q. Es decir, q=1-p
Si repetimos n veces una experiencia dicotómica y lamamos X a la
variable que cuenta el número de éxitos, resulta que:
X es una variable
0,1,2,3,4,5,...........n.
discreta
que
puede
tomar
los
valores:
Pues bien, a la distribución de probabilidad de la variable X se le llama
Distribución Binomial B(n,p).
La media es
  n. p
y la desviación típica es
  n. p.q
.
n
P( X  k )   . p k .q n  k
k 
La probabilidad de que X tome el valor k es :
n
n!
  
Donde  k  k!.(n  k )!
y
n!  1.2.3.4.5.......(n  1).n
n
 
El número  k  se llama número combinatorio y representa todas las
combinaciones posibles de n elementos tomados de k en k. Es decir:
44
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
con n elementos, cuántos grupos distintos de k elementos pueden
formarse.
Llamamos experiencia aleatoria dicotómica a aquella que sólo puede
tener dos posibles resultados A y A'. Usualmente A recibe el nombre de
éxito, además representaremos como p = p(A) y q = 1-p=p(A').
A la función de probabilidad de una variable aleatoria X resultado de
contar el número de éxitos al repetir n veces una experiencia aleatoria
dicotómica con probabilidad de éxito p la llamamos distribución binomial y
la representamos por
B (n, p)
Para esta distribución se verifica que, la variable X puede tomar los
valores:
0, 1, 2, ... , n
y que la variable toma cada uno de estos valores con probabilidad:
De acuerdo a lo anterior se puede definir la DISTRIBUCIÓN BINOMIAL
como una experiencia aleatoria dicotómica a aquella que sólo puede
tener dos posibles resultados A y A'. Usualmente A recibe el nombre de
éxito, además representaremos como p = p(A) y q = 1-p=p(A').
A la función de probabilidad de una variable aleatoria X resultado de
contar el número de éxitos al repetir n veces una experiencia aleatoria
dicotómica con probabilidad de éxito p la llamamos distribución binomial y
la representamos por B (n, p)
Para esta distribución se verifica que, la variable X puede tomar los
valores:
0, 1, 2, ... , n y que la variable toma cada uno de estos valores con
probabilidad:
45
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
En donde:
= nCx lo que implica que
EJEMPLO: 2.1
 5
   10 Mire
 3
porque
EJEMPLO 2.2
SIMPLIFICAR:
EJEMPLO2.3:
Cuál es la probabilidad de obtener exactamente 2 caras en 6 tiradas de
monedas?
X= salga exactamente 2 caras
46
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Si n=6
x=2 p= 1/2 pruebe que f(2) = 0,2344
La probabilidad de obtener 2 caras en 6 lanzamientos es de 23,44%
EJEMPLO 2.4:
¿Cuál es la probabilidad de obtener al menos 4 caras en 6 tiradas?
n= 6
x= 4, 5, 6
PRUEBE SI ES CORRECTO
P(4)+P(5)+P(6)= 34,38% la probabilidad de obtener al menos 4 caras en 6
tiradas es de 34,38%
EJEMPLO 2.5 EN VIDEOS
Mirar la explicación en los siguientes videos
a)http://www.youtube.com/watch?v=k_W_A-EqnRA
b)http://www.youtube.com/watch?v=ANaWgIud0bc&feature=related
c)http://www.youtube.com/watch?v=bfbp2WaMYV8&feature=related
d)http://www.youtube.com/watch?v=bfbp2WaMYV8&feature=related
e)http://www.youtube.com/watch?v=nHeiIR_Gaug&feature=related
47
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
ELEMENTOS DE ESTADISTICA PARA RESOLVER PROBLEMAS DE
PROBABILIDADES
Distribuciones discretas
Esperanza matemática o media
Varianza
Desviación típica
0 ≤ pi ≤ 1
p1 + p2 + p3 + · · · + pn = Σ pi = 1
Distribución binomial
n es el número de pruebas.
k es el número de éxitos.
p es la probabilidad de éxito.
q es la probabilidad de fracaso.
El número combinatorio
Media
Varianza
48
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Desviación típica
II) DISTRIBUCIÓN DE POISSON.
Características:
En este tipo de experimentos los éxitos buscados son expresados por
unidad de área, tiempo, pieza, etc, etc.,:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc,
etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por día, mes, etc, etc.
Para determinar la probabilidad de que ocurran x éxitos por unidad de
tiempo, área, o producto, la fórmula a utilizar sería:
Donde:
p(x,  ) = probabilidad de que ocurran x éxitos, cuando el número
promedio de ocurrencia de ellos es l
 = media o promedio de éxitos por unidad de tiempo, área o producto
e = 2.718
x = variable que nos denota el número de éxitos que se desea que ocurra
Hay que hacer notar que en esta distribución el número de éxitos que
ocurren por unidad de tiempo, área o producto es totalmente al azar y que
cada intervalo de tiempo es independiente de otro intervalo dado, así
como cada área es independiente de otra área dada y cada producto es
independiente de otro producto dado.
49
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Para que una variable siga una distribución de Poisson deben cumplirse
varias
Condiciones:
1. En un intervalo muy pequeño (p. e. de un milisegundo) la probabilidad
de que ocurra un evento es proporcional al tamaño del intervalo.
2. La probabilidad de que ocurran dos o más eventos en un intervalo muy
pequeño es tan reducida que, a efectos prácticos, se puede considerar
nula.
3. El número de ocurrencias en un intervalo pequeño no depende de lo
que ocurra en cualquier otro intervalo pequeño que no se solape con
aquél.
Estas propiedades pueden resumirse en que el proceso que genera una
distribución de Poisson es estable (produce, a largo plazo, un número
medio de sucesos constante por unidad de observación) y no tiene
memoria (conocer el número de sucesos en un intervalo no ayuda a
predecir el número de sucesos en el siguiente).
El parámetro de la distribución, lambda, representa el número promedio
de eventos esperados por unidad de tiempo o de espacio, por lo que
también se suele hablar de lambda como “la tasa de ocurrencia” del
fenómeno que se observa.
EJEMPLOS 2.6:
1. Si el banco BBVA recibe en promedio 6 cheques sin fondo por
día, ¿cuáles son las probabilidades de que reciba, a) cuatro
cheques sin fondo en un día dado, b) 10 cheques sin fondos en
cualquiera de dos días consecutivos?
Solución:
a)
x = variable que nos define el número de cheques sin fondo que
llegan al banco en un día cualquiera = 0, 1, 2, 3, ....., etc, etc.
 = 6 cheques sin fondo por día
e = 2.718
50
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
R/ El 13,39% los 6 cheques están sin fondo por día
b)x= variable que nos define el número de cheques sin fondo que llegan al
banco en dos días consecutivos = 0, 1, 2, 3, ......, etc., etc.
 = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos
días consecutivos
Nota:  siempre debe de estar en función de x siempre o dicho de otra
forma, debe “hablar” de lo mismo que x.
EJEMPLO 2.7
En Grafiartes en el proceso de impresión, se realizo una inspección de
hojalata producida por un proceso electrolítico continuo, donde se
identifican 0.2 imperfecciones en promedio por minuto. Determine las
probabilidades de identificar a) una imperfección en 3 minutos, b) al
menos dos imperfecciones en 5 minutos, c) cuando más una imperfección
en 15 minutos.
Solución:
a)
x = variable que nos define el número de imperfecciones en la
hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.
 = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en
la hojalata
b)
x = variable que nos define el número de imperfecciones en la
hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.
 = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la
hojalata
51
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1-(0.367918+0.367918) = 0.26416
R/La imperfección en promedio por cada 5 minutos en la hojalata es de
26,64%
c)
x = variable que nos define el número de imperfecciones en la
hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.
 = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la
hojalata
=
0.0498026 + 0.149408 = 0.1992106
R/ 19,92% Presenta 3 imperfecciones en promedio por cada 15 minutos
en la hojalata
NOTA
Por lo general se toma para muestras grandes, no indicando que no se
puede aplicar en muestras pequeñas y sino observemos los siguientes
ejemplos.
P(x)=
x.e -λ
X!
donde: λ= n.p
λ es un promedio
EJEMPLO: 2.8
En la clínica Maria Angel la estadística muestra que la probabilidad de
que un individuo sufra una reacción negativa de cierto suero es de 0,001.
Hallar la probabilidad de que entre 300 individuos exactamente 3
individuos sufra reacciones negativas.
Por poisson
Datos: n=300
52
λ= n.p
x= 3
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
P= 0,001
λ= (300)(0,001)
λ= 0,3
P(3)=
= 0,003= 0,33%
R/ La probabilidad de que un individuo sufra una reacción negativa en la
clínica Maria Angel de cierto suero es de 0.33%
Por distribución binomial:
(0,001)3 (0,999)297
planteamiento
Terminar el ejercicio
EJEMPLO 2.9
El 10% de tornillos producido en la fábrica metalúrgica Matecho son
defectuosos. Hallar la probabilidad de que una muestra de 10 tornillos
tomadas al azar exactamente 2 sean defectuosas.
n= 10
p= 0,1
λ= n.p
λ= (10)(0,1)
p(2)=
q= 0,9
x= 2
λ= 1
= 0,1839= 18,39%
HACER EL MISMO EJERCICIO POR DISTRIBUCION BINOMIAL
53
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 2.10 EXPLICADOS EN VIDEOS USANDO INTERNET
1)
http://www.youtube.com/watch?v=uAcWCOOPWa8&feature=related
2)http://www.youtube.com/watch?v=xN-fxZKJ-js&feature=related
3)http://www.youtube.com/watch?v=brykCv0HdRw&feature=related
4)http://www.youtube.com/watch?v=hB4owTsqQIs&feature=related
5)http://www.youtube.com/watch?v=luEmVW_Bnn8&feature=related
6)http://www.youtube.com/watch?v=U10yQnqsfas&feature=related
7)http://www.youtube.com/watch?v=N8uW_mqc1r4&feature=related
8)http://www.youtube.com/watch?v=J3lvuyArpEY&feature=related
III) DISTRIBUCIÓN MULTINOMIAL.
Características:
a)
Al llevar a cabo un experimento con esta distribución se esperan
más de dos tipos de resultados.
b)
Las probabilidades asociadas a cada uno de los resultados son
constantes.
c)
Cada uno de los ensayos o repeticiones del experimento son
independientes.
d)
El número de repeticiones del experimento, n es constante.
Si los sucesos E(1), E(2)……….. E(k) puede ocurrir con frecuencia P(1),
P(2)……….. P(k) respectivamente entonces la probabilidad de que E (1),
E(2)……….. E(k) ocurran X(1), X(2)……….. X(k), veces, se calcula por:
Al igual que hicimos con la distribución binomial, en este caso partiremos
de un ejemplo para obtener la fórmula general para resolver problemas
que tengan este tipo de distribución.
P(x)=
EJEMPLO 2.11
Se lanza un dado 12 veces cual es la probabilidad de obtener el 1, 2, 3, 4,
5, 6, dos veces cada uno?
54
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
N= 12
X(1) =X(2) =X(3)=X(4)=X(5)=X(6)= 2
P(1) =P(2)=P(3)=P(4)=P(5)=P(6)= 1/6
P(x)=
(
)6= 0,0034= 0,34%
R/ Cada uno de los números del dado que puede salir 2 veces cada uno
es del 34%
IV) DISTRIBUCION HIPERGEOMETRICA
Lo que se ha hecho hasta ahora es analizar distribuciones que modelizan
situaciones en las que se realizaban pruebas que entrañaban una
dicotomía (proceso de Bernouilli o binomial ) de manera que en cada
experiencia la probabilidad de obtener cada uno de los dos posibles
resultados se mantenía constante. Si el proceso consistía en una serie de
extracciones o selecciones ello implicaba la reposición de cada extracción
o selección, o bien la consideración de una población muy grande. Sin
embargo si la población es pequeña y las extracciones no se remplazan
las probabilidades no se mantendrán constantes. En ese caso las
distribuciones anteriores no nos servirán para la modelizar la situación. La
distribución hipergeométrica viene a cubrir esta necesidad de modelizar
procesos de Bernouilli o binomiales con probabilidades no constantes (sin
reemplazamiento)
La distribución hipergeométrica es de mucha aplicabilidad en aquellos
casos en los que se extraigan muestras o se realizan experiencias
repetidas sin devolución del elemento extraído o sin retornar a la situación
experimental inicial y donde se modeliza , de hecho, situaciones en las
que se repite un número determinado de veces una prueba dicotómica de
manera que con cada sucesivo resultado se ve alterada la probabilidad de
obtener en la siguiente prueba uno u otro resultado. Es una distribución
.fundamental en el estudio de muestras pequeñas de poblaciones
.pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene
grandes aplicaciones en el control de calidad en otros procesos
experimentales en los que no es posible retornar a la situación de
partida.2
Los experimentos que tienen este tipo de distribución tienen las siguientes
características:
2
http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/hipergeometrica.htm
55
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
a) Al realizar un experimento con este tipo de distribución, se esperan dos
tipos de resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son
constantes.
c) Cada ensayo o repetición del experimento no es independiente de los
demás.
d) El número de repeticiones del experimento (n) es constante.
Se caracteriza por tener submuestras y su expresión está dada por:
P(x)=
y “N” es
Donde “n” pertenece a la submuestras y “a+b=N”
la población escogida, x pertenece a muestra
a
n-x pertenece b muestra b
EJEMPLO 2.12:
El siguiente ejemplo va por partes hasta que se aplica el concepto de
distribución hipergeometrica
De 16 vehículos de una transportadora de leche 5 tienen los frenos
dañados cuantos no tienen los frenos dañados?
a= 5 frenos dañados
N= 16
b= frenos buenos
5+b= 16
b= 11
¿Si de ese lote, 3 tienen los frenos dañados, escriba el elemento
correspondiente a la formula?
X= 3
¿Si se toman 7 camiones al azar, como se expresa?
n= 7
56
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Ahora si construyamos el ejemplo en forma total
De 16 vehículos de una transportadora de leche 5 tienen los frenos
dañados. Si de ese lote, 3 tienen los frenos dañados .Si se toman 7
camiones al azar Cual es la probabilidad de que 3 o más tengan los
frenos dañados
Entonces:
P(3)=
 5 11
  
 3  4  =
11
 
7
=
= 0,2884= 28,84%
P(3)+ P(4)+ P(5)= 36,54% VERIFICAR SI LA RESPUESTA ES
CORRECTA
EJEMPLO 2.13
Un extranjero al llegar a cualquier aeropuerto de Colombia es revisado.
Si un extranjero X para evitar que lo descubran en la aduana, un viajero
ha colocado 6 tabletas de narcótico en una botella que contiene 9
píldoras de vitamina que son similares en apariencia. Si el oficial de la
aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es
la probabilidad de que el viajero sea arrestado por posesión de
narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por
posesión de narcóticos?.
Solución:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número
de tabletas de narcótico que se puede encontrar al seleccionar las 3
tabletas
57
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las
3 tabletas seleccionadas haya 1 o más tabletas de narcótico)
Otra forma de resolver;
p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que
entre las tabletas seleccionadas no haya una sola de narcótico)
b)
p(no sea arrestado por posesión de narcóticos)
EJEMPLOS 2.14 EN VIDEOS
1)http://www.youtube.com/watch?v=xgVxHHMJbu0
2)http://www.youtube.com/watch?v=49dTucA-kHU&feature=related
3)http://www.youtube.com/watch?v=wfEDEDRmAro&feature=related
V) DISTRIBUCION NORMAL
Variable aleatoria de la distribución normal
Una variable aleatoria continua, X, sigue una distribución normal de media
μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las
siguientes condiciones:
58
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1. La variable puede tomar cualquier valor: (-∞, +∞)
2. La función de densidad, es la expresión en términos de ecuación
matemática de la curva de Gauss:
Curva de la distribución normal
El campo de existencia es cualquier valor real, es decir, (-∞, +∞).
Es simétrica respecto a la media µ.
Tiene un máximo en la media µ.
Crece hasta la media µ y decrece a partir de ella.
En los puntos µ − σ y µ + σ presenta puntos de inflexión.
El eje de abscisas es una asíntota de la curva.
El área del recinto determinado por la función y el eje de abscisas es igual
a la unidad.
Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a
0.5 a la izquierda y otra igual a 0.5 a la derecha.
En estadística la distribución normal es una de las distribuciones más
usadas e importantes porque se volvió una herramienta indispensable en
cualquier rama de la ciencia, la industria y el comercio. Muchos eventos
reales y naturales tienen una distribución de frecuencias cuya forma es
muy parecida a la distribución normal.
La distribución normal es llamada también campana de Gauss por su
forma acampanada.
59
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Y


X
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL






La distribución normal tiene forma de campana.
La distribución normal es una distribución de probabilidad que tiene
media  = 0 y desviación estándar  = 1.
El área bajo la curva o la probabilidad desde menos infinito a más
infinito vale 1.
La distribución normal es simétrica, es decir cada mitad de curva tiene
un área de 0.5.
La escala horizontal de la curva se mide en desviaciones estándar.
La forma y la posición de una distribución normal dependen de los
parámetros  y  , en consecuencia hay un número infinito de
distribuciones normales.
Existe una relación del porcentaje de población a la desviación estándar.
En la figura observamos por ejemplo que el área bajo la curva para  1
tiene un porcentaje de 68.26%,  2 = 95.46% y  3  99.73%
-3s -2s -1s
+1s +2s +3s
68.26%
95.46%
60
99.73%
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La población incluye todos los datos, la muestra es una porción de la
población.
Población
Muestra







x-3s
x-2s
x-s
x
x+s
x+2s
x+3s
X
La desviación estándar
sigma representa la
distancia de la media al
punto de inflexión de la
curva normal
X
x-3
x-2
x-
La distribución normal estándar
-3
-2
-1
x
x+
x+2
x+3
z
0
1
2
3
El valor de z
Determina el número de desviaciones estándar  entre algún valor X y la
media de la población  . Para calcular el valor de Z usamos la siguiente
fórmula.
Z
X 

La distribución de probabilidad f (Z) es una distribución normal con media
0 y desviación estándar 1; esto es Z se distribuye normalmente con
media cero y desviación estándar = 1 Z~N(0,1): La gráfica de densidad
de probabilidad se muestra en la figura.
61
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
F(z)
  1
Z
La distribución f (Z) se encuentra tabulada
en la tabla de distribución
0
normal estándar. En esta tabla podemos determinar los valores de Z o la
probabilidad de determinado valor Z.
EJEMPLO 2.15
Siendo el señor Jairo Marín el gerente de personal de una gran compañía
de aluminios requiere que los solicitantes a un puesto efectúen cierta
prueba y alcancen una calificación de 500. Si las calificaciones de la
prueba se distribuyen normalmente con media   485 y desviación
estándar   30 ¿Qué porcentaje de los solicitantes pasará la prueba?
Calculando el valor de Z obtenemos:
Z 
X 

500  485
 0.5
30
=
Buscamos el valor correspondiente Z en las tabla de distribución normal.
Z0.5 = .69146 = 69.146%. siendo esta la probabilidad de que la calificación
sea menor a 500 P (X<500). Dado que el porcentaje pedido es P( X  500)
la solución es 1-.69146 =.3085 , 30.85% de los participantes pasarán la
prueba.
485
30.85%
Z.05
EJEMPLO 2.16:
Encuentre las probabilidades siguientes usando la tabla Z.
a) P(-1.23 < Z > 0)
62
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Z
-1.23
0
Solución: Buscamos el valor Z1..23 en las tablas siendo este = .89065.
restando .89065-.05 = .3905, este valor es la probabilidad de 0 a 1.23 que
es exactamente la misma de –1.23 a 0 por simetría. Por lo tanto la
probabilidad es .3905
EJEMPLO2.17:
En un examen de Estadística la calificación media es de 72 y la
desviación típica 15. Determinar en unidades estándar las puntuaciones
de los alumnos que obtuvieron 60.
Datos:
ẋ= 72
x¡= 60
σ= 15
EJEMPLO 2.18
El peso medio de 500 estudiantes de la Uceva es de 151 Lb y la
desviación típica es de 15 Lb y suponiendo que los pesos están
normalmente distribuidos. Hallar cuantos estudiantes pesan entre 120 y
155 Lb.
63
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
A= 0,4803+0,1026= 0,5829
500
100%
X
58,29%
X= 291
291.
1.
la cantidad de estudiantes que pesan entre 120 y 155 LB es de
Los que pesan 128Lb exactamente?
0,4418
0,4332
A=0,4418-0,4332= 0,0086
0,86%
VI) DISTRIBUCION GEOMETRICA
La distribución geométrica es un modelo adecuado para aquellos
procesos en los que se repiten pruebas hasta la consecución del éxito a
resultado deseado y tiene interesantes aplicaciones en los muestreos
64
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
realizados de esta manera. También implica la existencia de una
dicotomía de posibles resultados y la independencia de las pruebas entre
sí.
Proceso experimental del que se puede hacer derivar
Esta distribución se puede hacer derivar de un proceso experimental puro
o de Bernouilli en el que tengamos las siguientes características
El proceso consta de un número no definido de pruebas o experimentos
separados o separables. El proceso concluirá cuando se obtenga por
primera vez el resultado deseado (éxito).
· Cada prueba puede dar dos resultados mutuamente excluyentes : A y no
A
· La probabilidad de obtener un resultado A en cada prueba es p y la de
obtener un resultado no A es q siendo (p + q = 1).
Las probabilidades p y q son constantes en todas las pruebas, por tanto,
las pruebas, son independientes (si se trata de un proceso de "extracción"
éste se llevará a , cabo con devolución del individuo extraído) .
La distribución geométrica que se ha visto hasta ahora es que si se tira
una moneda (con p = P (cara ) n veces, entonces el numero de sellos se
distribuye como binomial.
Consideramos otro experimento relacionado.
Vamos a seguir tirando la moneda hasta que veamos el primer sello
Cuantas tiradas necesitamos?
Sea X el número de tiradas. Luego
P (X = 1) = p
P (X = 2) = (1 − p)p
P (X = 3) = (1 − p)2p
.
.
P (X = x) = (1 − p)x-1p
Donde P(x)= qx-1p
65
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La distribución de X se llama la distribución geométrica.
EJEMPLO 2.19
Calcular la probabilidad de que salga el No. 5 a la tercera vez que
lanzamos un dado.
Definir éxito: sale No. 5
x=3
p = 1/6 = 0. 1666
q = (1 - 0.16660) = 0.8333
P(X=3) = (0.8333)2(0.1666) =0.1156
NOTA
OTRA FORMA DE INTERPRETAR LA DISTRIBUCION GEOMETRICA
En una secuencia de experimentos binarios independientes (A se observa
con probabilidad P y deja de observarse con probabilidad 1-P), el número
de réplicas antes de la primera observación de A tiene una distribución
geométrica o de Pascal, G(P). Para cada número natural r, la función de
probabilidad se define como
f (r )  P(1  P)r
r 1
siendo su función de distribución F(r )  1  (1  P)
La media y varianza de la distribución geométrica son
E( X) 
1
1
P
V( X) 
1 P
P 2 Respectivamente.
De hecho, se trata de un caso especial de la distribución binomial
negativa tomando n=1.
Geométrica ( o de fracasos)
EJEMPLO 2.20
Calcular la probabilidad de que salga cara la 6ta ocasión que lanzamos
una moneda.
Definir éxito: salga cara
66
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
x=6
p = 1/2= 0.5
q = 0.5
P(X=6) = (0.5)5(0.5)= 0.0156
VII) LA FUNCION DENSIDAD Y LA FUNCION DISTRIBUCION
FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD
Es el conjunto de los valores de la variable aleatoria X y sus
probabilidades respectivas f(x) = Pr(X=x).
Para el caso discreto se suele adoptar la forma de representación
siguiente :
X
F(X)
X1
P1
X2
P2
X3
P3
XI
PI
Xn
Pn
Ante la equivalencia entre frecuencias relativas y probabilidades, se
n
verifica que :
P
i 1
n
1
FUNCIÓN DE DISTRIBUCIÓN
Del mismo modo que se definían las frecuencias acumuladas,
denominamos función de distribución a : F(x) = Pr(X≤x)
MOMENTO ESPERANZA MATEMATICA Y Varianza
1) Momento ordinario k
n
 K   P.i X k
 1
2) Momento de orden central K
n
 k   Pi ( xi  E ( x)) K
i 1
En particular:
67
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Esperanza matemática: Es el momento ordinario de orden 1 ( 1 ) ,
equivalente a la media aritmética.
n
E ( X )  1   Pi X i
i 1
Varianza : Es el momento central de 2º orden
n
n
V ( X )   2   Pi ( X i  E ( X ))   Pi X 2 i  E ( X ) 2   2  1
2
ii 1
2
i 1
Desviación típica : Es la raíz cuadrada de la varianza.
  V (X )
EJEMPLO 2.21
Germán segura victoria lanza cuatro monedas, considerando que el
número de sellos obtenidas. Calcular, de la variable aleatoria así definida:
a) Ley de probabilidad
b) Función de distribución
c) Esperanza matemática y varianza
d) Mediana y moda de la distribución
Del mismo modo que se definían las frecuencias acumuladas,
denominamos función de distribución a : F(x) = Pr(X≤x)
SOLUCION
Lanzadas cuatro monedas, consideremos el número de sellos obtenidas.
Calcular, de la variable aleatoria así definida:
a) Ley de probabilidad o función densidad
b) Función de distribución
c) Esperanza matemática y varianza
d) Mediana y moda de la distribución
Antes de desarrollar el ejercicio primero observemos el espacio muestal
68
CCCC
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Se obtienen 0 sellos =1
CCCs CCsC CsCC sCCC Se obtienen 3 caras y 1 sello =4
CCss
CsCs CssC sCCs sCsC ssCC Se obtienen 2 caras y 2 sellos=6
Csss sCss ssCs sssC Se obtienen 1 cara y 3 sellos=4
ssss
Se obtienen 4 sellos=1
AHORA SI CONTIMUEMOS
a) Ley de probabilidad o función de densidad:
X
f(x)=Pr(X=x)
0
1/16
1
4/16
2
6/16
3
4/16
4
1/16
b) Función de distribución:
X
f(x)=Pr(X=x)
F ( x)  Pr( X  x)
69
0
1/16
1/16
1
4/16
5/16
2
6/16
11/16
3
4/16
15/16
4
1/16
1/16
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Donde mas concretamente la funcion F(x) se ecribira asi
0 para x  0
1 / 16 para 0  x  1

5 / 16 Para 1  x  2
F ( x)  
11 / 16 Para 2  x  3
15 / 16 Para 3  x  4

1 Para x  4
c) Para el cálculo de la esperanza matemática y la varianza de una
variable aleatoria discreta, se aconseja construir la siguiente tabla auxiliar
X
P
PX
PX2
0
1/16
0
0
1
4/16
4/16
4/16
2
6/16
12/16
24/16
3
4/16
12/16
36/16
4
1/16
4/16
16/16
TOTALES
1
32/16=2
80/16=5
Definida la desviación típica como la raíz cuadrada de la varianza :
D(X) = 1
PORQUE LA DESVIACION DA UNO
EXPLICALO QUERIDO AMIGO
Observando la ley de probabilidad o función de densidad, deducimos que
la Moda = 2 (al tener X=2 la mayor probabilidad (6/16) )
70
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Observando la función de distribución, deducimos que :
Mediana = 2 (al ser X=2 el valor para el que F(X) (=11/16) primero iguala
o supera a 0'5)
EJEMPLO 2.22
En la extracción simultánea de tres bolas de una urna que contiene 6
bolas Rojas y cuatro verdes, Miguel observa el número de bolas blancas
extraídas.
De la variable aleatoria así definida, calcular:
a) L a probabilidad de que las tres sean verdes, 1 roja y dos verdes, , 2
rojas y una verde, 3 rojas ,
b) ley de probabilidad
c) Función de distribución
d) Esperanza matemática, varianza y desviación típica.
d) Mediana y moda de la distribución.
SOLUCION
a) AMIGO LECTOR USTED EN CAPACIDAD DE DESCUBRIR LAS
RESPUESTAS DADAS LA SUGERENCIADE DE RECORDAR LA
DISTRIBUCION HIPERGEOMETRICA
P(3VERDES)= 3.3%
P(1RY 2VERDES)=30%
P(2RY1V) =50%
P(3R)=16.7%
b) Ley de probabilidad o función de densidad :
X
PROB
71
0
0.033
1
0.3
2
0.5
3
0.167
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
c) Función de distribución:
0 SI X  0
0.033 SI 0  X  1

F ( X )  0.033 SI 1  X  2
0.833 SI 2  X  3

SI X  3
1
d) Esperanza matemática, varianza y desviación típica:
X
PROB=P
PX
PX2
0
0.033
0
0
1
0.0
0.0
0.3
2
0.5
1
2
3
0.167
0.5
1.5
TOTALES
1.8
3.8
POR LO TANTO PODEMOS DEDUCIR QUE
E( X ) = 1. 8
V ( X )
= 3. 8
- 1.82
= 0.56
D= 0.56 =0.748
Mediana y Moda:
Observando la función de distribución, deducimos que :
Mediana = 2 (al ser X=2 el valor para el que F(X) (= 0'8333) primero
iguala o supera a 0'5)
Observando la ley de probabilidad o función de densidad, deducimos que:
Moda = 2 (al tener X=2 la mayor probabilidad (0'5) )
EJEMPLO 2.23
El Dr Lores ha comprobado que el tiempo de vida de cierto tipo de
marcapasos sigue una distribución exponencial con media de 16 años.
¿Cuál es la probabilidad de que a una persona a la que se le ha
implantado este marcapasos se le deba reimplantar otro antes de 20
años? Si el marcapasos lleva funcionando correctamente 5 años en un
paciente,
Solución: Sea T la variable aleatoria que mide la duración de un
marcapasos en una
persona.
20
P(T  20)   f (t )dt  1  e20 /16  0.7135
0
72
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
VIII) DISTRIBUCION EXPONENCIAL
Distribución exponencial
La distribución exponencial se dice que es equivalente continuo de la
distribución geométrica discreta. Esta ley de distribución describe
procesos en los que:

Nos interesa saber el tiempo hasta que ocurre determinado evento,
sabiendo que,

el tiempo que pueda ocurrir desde cualquier instante dado t, hasta
que ello ocurra en un instante tf, no depende del tiempo
transcurrido anteriormente en el que no ha pasado nada.
Ejemplos de este tipo de distribuciones son:

El tiempo que tarda una partícula radiactiva en desintegrarse. El
conocimiento de la ley que sigue este evento se utiliza en Ciencia
para, por ejemplo, la datación de fósiles o cualquier materia
orgánica mediante la técnica del carbono 14, C14;

El tiempo que puede transcurrir en un servicio de urgencias, para la
llegada de un paciente;

En un proceso de Poisson donde se repite sucesivamente un
experimento a intervalos de tiempo iguales, el tiempo que
transcurre entre la ocurrencia de dos sucesos consecutivos sigue
un modelo probabilístico exponencial. Por ejemplo, el tiempo que
transcurre entre que sufrimos dos veces una herida importante.
Concretando, si una v.a. continua X distribuida a lo largo de
que su función de densidad es
se
dice
parámetro
que
,
sigue
una distribución
, es tal
exponencial de
.
OJO CON EL ANALISIS QUE SIGUE
Figura: Función
73
de
densidad, f,
de
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
una
.
Un cálculo inmediato nos dice que si x>0,
luego la función de distribución es:
Figura: Función de distribución, F, de
, calculada
como el área que deja por debajo de sí la función de
densidad.
74
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Para calcular el valor esperado y la varianza de la distribución
exponencial, obtenemos en primer lugar la función característica
para después, derivando por primera vez
y derivando por segunda vez,
75
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Entonces la varianza vale
ojo 3
IX) DISTRIBUCIÓN UNIFORME
Cuando tenemos una variable aleatoria X se dice que es uniforme en el
intervalo [a, b] si su función de densidad es constante dentro de él. La
distribución uniforme se puede modelizar de algún modo la incertidumbre
más completa sobre una variable aleatoria continua lo que hace que
tenga bastante importancia en el ámbito computacional, pues es a partir
de ella que se pueden realizar simulaciones de cualquier otra variable
aleatoria. La función de densidad de la distribución uniforme es
f (x) 
1
ba
x  a, b
F( x ) 
xa
ba
x  (a, b)
Su media y varianza son, respectivamente,
E( x ) 
ab
2
V( x ) 
1
(b  a) 2
12
La distribución uniforme tiene una característica que es que puede tomar
cualquier valor dentro de un intervalo, donde todos ellos tienen la misma
probabilidad lo que la vuelve en una distribución continua ya que puede
tomar cualquier valor y no únicamente un número determinado (como
ocurre en las distribuciones discretas).
EJEMPLO 2.24
El precio medio del litro de ACPM durante el próximo año se estima que
puede oscilar entre 9140 y 9160 pesos. Podría ser, por tanto, de 9143
3T
76
OMADO DE http://www.bioestadistica.uma.es/libro/node78.htm
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
pesos., o de 9143,4 pesos., o de 9143,45 pesos., o de 9143,455 pesos,
etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.
Si deseamos obtener la función de densidad, que nos permite conocer la
probabilidad que tiene cada punto del intervalo, viene definida por:
f (x) 
1
ab
Donde, b: es el extremo superior (en el ejemplo, $9160, y a: es el extremo
inferior (en el ejemplo, 9140 pesos). Por lo tanto, la función de distribución
del ejemplo sería:
f ( x) 
1
 0.05
9160  9140
Lo que implica que el valor final esté entre 9140 pesos y 9141 pesos
tiene un 5% de probabilidad, que esté entre 9141 y 9142, otro 5%, etc.
El valor medio de esta distribución se calcula: (a+b)/2
X)DISTRIBUCION UNIFORME DISCRETA
La distribución uniforme discreta es la que aparece en situaciones como
el lanzamiento de una moneda, de un dado o en la extracción de una bola
numerada de un urna de la lotería. En todos estos casos, si no hay truco,
existe equiprobabilidad entre todos los sucesos elementales posibles: dos
en el caso de la moneda, seis en el del dado y n en el caso de la urna de
la lotería, siendo n el número de bolas. La función de probabilidad viene
dada por
f ( x) 
1
n
x  (1,..., n)
f ( x )  0 x  (1,..., n)
y la de distribución por
F( x ) 
x
n
x  1,n
Donde [x] la parte entera de x. La media y la varianza de esta distribución
vienen dadas por, respectivamente
1 n
E( X) 
2
77
n2  1
V ( X) 
12
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La función característica es
1
e itb  e ita
 x (t )   e
dx 
a
ba
it (b  a )
b
itx
Los momentos son
ba
E ( X) 
2
(b  a ) 3
E( X ) 
3
2
(b  a ) 2
V( X) 
12
XI) DISTRIBUCIÓN T STUDENT
En probabilidad y estadística, la distribución t (de Student) es una
distribución de probabilidad que surge del problema de estimar la media
de una población normalmente distribuida cuando el tamaño de la
muestra es pequeño
La distribución t difiere de la de Z en que la varianza de t depende del
tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el
tamaño de la muestra tiende a infinito las dos distribuciones serán las
mismas Se acostumbra representar con
el valor t por arriba del cual
se encuentra un área igual a
. Como la distribución t es simétrica
alrededor de una media de cero, tenemos
; es decir, el
valor t que deja un área de
a la derecha y por tanto un área de
a
la izquierda, es igual al valor t negativo que deja un área de
en la cola
derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.
78
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Para encontrar los valores de t se utilizará la tabla de valores críticos de la
distribución t del libro Probabilidad y Estadística para Ingenieros de los
autores Walpole, Myers
EJEMPLO
Ejemplo:
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:
Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de
0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.
P( –t0.025 < t < t0.05) = 0.925
Para encontrar las unidades estándar se aplica
t 
x u
s
n
OTRAS DISTRIBUCIONES
1) DISTRIBUCIÓN DE CAUCHY
La distribución de Cauchy, o de Lorentz, de parámetros a pertenece a los
reales y b>0 es de uso frecuente en física para describir el patrón de
impactos de partículas sobre una recta. También es de interés teórico por
ser una distribución que carece de momentos. Sus funciones de densidad
y de distribución son
f ( x) 
79
b
π ( x  a)2  b 2


1 1
 x a
F( x)   arctan

2 π
 b 
x 
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Como queda dicho más arriba, la distribución de Cauchy no tiene ni
media ni varianza.
EJEMPLO 2.23
Se trata de un modelo continuo cuya función de densidad es:
Cuya integral nos proporciona la función de distribución:
X
F(X ) 
1
  (1  t

2
)
dt 
1 arctan g ( x)
=

2

POR
FAVOR
AMIGO LECTOR COMPROBAR LA IGUALDAD DADA
2) DISTRIBUCIÓN ERLANG
La función de densidad de probabilidad,
f ( x; , ) 
1
 1
x
exp( x / ), x  0

()
En donde  es un entero positivo. La variable aleatoria de Erlang es la
suma de  variables independientes distribuidas exponencialmente, en
donde cada valor se genera por
  1 
x   Ln



1

u

1/ 
La distribución de erlang es la misma distribución Gamma se ha utilizado
frecuentemente en variables tales como:
– El tiempo ( ó espacio) requerido para observar ? ocurrencias del evento
A en el intervalo t ( ó región del espacio ), sucesos del tipo Poisson.
– Problemas de tráfico en líneas telefónicas, ERLANG, 1900.
80
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
–Flujos
máximos,
MARKOVIC,
1965.
– Resistencia de componentes del concreto reforzado, TICHY VARLIETK,
1965.
– Tiempo de falla de un sistema de α componentes, cada uno falla con
frecuencia λ.
–Ingresos familiares.
– Edad del hombre al contraer matrimonio por primera vez.
– Tiempo total para completar una operación, sí ésta se lleva a cabo
en α subestaciones a una frecuencia λ .
3) DISTRIBUCIÓN DE LAPLACE
La distribución de Laplace de parámetros a pertenece a los reales y b>0
se utiliza en ocasiones para modelar errores en observaciones de tipo
real, de forma similar a como se hace con la distribución normal. La
función de densidad es
f (x) 
 xa 
1

exp 

2b  b 
1 xa
F( x )  exp 

2  b 
x 
y
1 ax
F( x )  1  exp 

2  b 
Si x es menor o igual, o a es mayor, respectivamente, que a. Su media es
E[X]=a y su varianza V[X]=2b2.
4. DISTRIBUCIÓN DE PARETO
La distribución de Pareto de parámetros a>0 y b>0, es tal que algunos de
sus momentos existen cuando a supera cierta cota. Tiene aplicaciones en
las ciencias medioambientales y en la estadística industrial. Su función de
densidad es
f ( x )  ab a x a1
f ( x)  0
x b
xb
En la que se notará que toma valores no nulos para x  (b, ) . La
función de distribución toma la forma
81
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
a
b
F( x )  1   
x b
x
F( x )  0
xb
La esperanza y la varianza de la distribución de Pareto son
ab
E( X) 
a 1
si a  1
y
ab 2
V( X) 
(a  2)(a  1)2
si
a2
5...DISTRIBUCIÓN LOGÍSTICA
La distribución logística de parámetros a pertenece a los reales y b>0 se
ha llegado a utilizar como sustituta de la normal, debido a su forma
acampanada y de más fácil manejo. Más frecuente es su uso en la
modelización de respuestas aleatorias binarias, como en la regresión
logística. La función de densidad logística toma la forma
 xa
exp  

b 

f (x) 

 x  a 
b1  exp  

b  


1
F( x ) 

 x  a 
1  exp  

b  


x 
x 
V( X ) 
Por último, sus momentos son E(X)=a y
b2π 2
3
6) DISTRIBUCIÓN DE GUMBEL
La distribución de Gumbel, o del valor extremo, de parámetros
a  , b  0 se utiliza en el análisis de la distribución asintótica de los
extremos muéstrales, con aplicaciones concretas en la predicción de
catástrofes naturales y en el diseño de estructuras de ingeniería civil que
van a estar sometidas a condiciones climatológicas extremas. Su función
de densidad es
82
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
f (x) 
ax
1
 a  x 
exp 
 exp 
 
a
b
b




 a  x 
F( X)  exp   exp 
 
b



x 
x 
donde
es la constante de Euler - Mascheroni, cuyo valor es
aproximadamente 0.5772156649... Finalmente, la media y la varianza de
esta distribución viene dada por la expresión
E( X)  a  bγ
y
b2π 2
V( X) 
6
7)DISTRIBUCIÓN DE RAYLEIGH
La distribución de Rayleigh de parámetro a > 0, es un caso particular de la
de Weibull, estando su uso muy extendido en el contexto del análisis de
datos censurados. La función de densidad es
f ( x )  2a 2 xe  a
f (x)  0
2 2
x0
x
x0
F( X)  1  e a
2 2
F( X)  0
x0
x0
x
La media y la varianza de esta distribución son, respectivamente,
 π

E( X)  

 2a 
y
 1  π 
V( X)  b 2 1  
4 
 a 
8) DISTRIBUCIÓN DE WEIBULL
La variable aleatoria X tiene distribución de Weibull de parámetros a > 0 y
b > 0 si su función de densidad es
ax
f (x)   
bb
a 1
e  x / b 
a
x0
La función de distribución, o de probabilidad acumulada, es
83
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
F( x)  PX  x   1 e ( x / b)
a
x0
Igual que en el caso de la distribución exponencial, la de Weibull se suele
utilizar como modelo paramétrico en problemas de análisis de
supervivencia. En este ámbito, es de interés la probabilidad de que se
presente el fallo o muerte después de transcurrido un tiempo x; de ahí que
se defina la función de supervivencia
S( x)  PX  x  1 F( x)  e
( x / b )a
 0
Por último, la esperanza y la varianza de esta distribución son,
respectivamente,
1 
E( X)  bΓ  1
a 
  2   1 
V( X)  b 2 Γ  1  Γ  1
  a   a 
y

donde siendo
P>0.
Γ (P)   x P1e x dx
0
la función gamma de Euler con
9) DISTRIBUCIÓN BETA
La distribución beta de parámetros a y b, ambos estrictamente positivos,
tiene como soporte el intervalo (0,1), por lo que suele utilizarse en la
modelización de datos que se encuentren dentro de este rango. La
función de densidad es
f ( x) 
1
x a1(1  x )b1
β(a,b)
x  (0,1)
y la de distribución
F( x )  0,
x0
b 1
x
1
a 1
u
(
1

u
)
du
β(a, b) 0
F( x )  1
x 1
F( X) 
x  (0,1)
Siendo la función Beta de Euler. La media y la varianza de esta
distribución son, respectivamente,
84
E( X) 
a
ab
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
ab
y
V( X) 
2
(a  b) (a  b  1)
ESTIMADO LECTOR QUE BUENO SERIA QUE INVESTIGARAS SOBRE
EJEMPLOS Y APLICACIONES DE CADA UNA DE LAS PTRAS
DISTRIBUCIONES
EJERCICIOS DE REPASO CAPITULO II
1) La media de los pesos de 500 estudiantes de un colegio es 70 kg y la
desviación típica 3 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuántos estudiantes pesan:
a) Entre 60 kg y 75 kg. R/476
64 kg. R/11
b) Más de 90 kg. R/0
c) Menos de
2) Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10
veces? R/20.5%
3) ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al
lanzar un dado ocho veces? R/2.6%
4) La probabilidad de tener un accidente de tráfico el profesor Carlos Iván
es de 0,02 cada vez que viaja a Cali, si realiza 300 viajes a Cali, durante
5 años ¿Cuál es la probabilidad de tener 3 accidentes? R/8.9%
5) La probabilidad de que un niño del físico Leonardo Campo nazca
pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién
nacidos haya 5 pelirrojos. R/4.6%
6) En una bolsa hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál
es la probabilidad de que 3 sean blancas? R/65.4%
7) En un evento familiar hay 20 personas: 14 casadas y 6 solteras. Se
eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean
solteras? R/1.75%
8) A unas elecciones se presentaron 2 partidos políticos: Los X que
obtuvieron el 70% de los votos y Z el 30% restante. ¿Cuál es la
85
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hayan
votado por Z?
9) A unas elecciones se presentaron 4 partidos políticos: : La U que
obtuvo un 40% de los votos, Los progresistas el 30%, el polo 20% y el
conservador 10% restante. ¿Cuál es la probabilidad de que al elegir 5
ciudadanos al azar, 3 hayan votado al por la U, 1 por progresista y 1 por
el polo?
10) En un evento internacional, el 20% de los asistentes son españoles, el
30% franceses, el 40% italiano y el 10% portugueses. En un pequeño
grupo se han reunido 4 invitados: ¿cuál es la probabilidad de que 2 sean
españoles y 2 italianos? R/3.84%
11) En una caja hay 7 bolas blancas, 3 verdes y 4 amarillas: ¿cuál es la
probabilidad de que al extraer 3 bolas sea cada una de un color distinto
?R/ 23.07%
12) Se lanza al aire una moneda cargada 8 veces, de tal manera que la
probabilidad de que aparezca cara es de 2/3, mientras que la probabilidad
de que aparezca sello es de 1/3, Determine la probabilidad de que en el
último lanzamiento aparezca cara R/.0.0003048
13) Se supone que los resultados de un examen realizados Hugo Orosco
siguen una distribución normal con media 78 y desviación típica36. Se
pide ¿Cuál es la probabilidad de que una persona que se presenta el
examen obtenga una calificación superior a 72? R/56.36%
14) Haciendo uso de la tabla que proporciona áreas a la izquierda de
cada valor z de la distribución normal tipificada, calcular las
probabilidades (áreas) siguientes:
a) Pr(z<1'35) R/ 91.14% b) Pr(z<-0'338) R/ 36.69% c) Pr(z>2'1) R/1-78%
d) Pr(z>-1) R/ 84.13% e) Pr(-1'39<z≤-0'44) R/24.77%
f)Pr(-1'52≤z≤0'897)R/75.16%
14) Varios test de inteligencia realizados por Lucy Aponte dieron una
puntuación que sigue una ley normal con media 100 y desviación típica
15.. Determinar el porcentaje de población que obtendría un coeficiente
entre 95 y 110.R/37.8%
15) El ingeniero William Bolaños al visitar una empresa que hace
productos en línea Supone que la probabilidad de tener una unidad
86
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de
unidades terminadas constituye un conjunto de ensayos independientes:
a) Cuál es la probabilidad de que entre diez unidades dos se encuentren
defectuosas? R/ 4,76%
b).y de que a lo sumo dos se encuentren defectuosas? R/ 99.84%
c) ¿Cuál es la probabilidad de que por lo menos una se encuentre
defectuosa? R/ 40.13%
7) Sí la probabilidad de que un cierto dispositivo de medición muestre
una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el
sexto de estos dispositivos de medición sometidos a prueba sea el
primero en mostrar una desviación excesiva? R/ 3.9% b) El séptimo de
estos dispositivos de medición sometidos a prueba, sea el primero que no
muestre una desviación excesiva? R/0.0000000148
8) El nivel de colesterol en una persona adulta sana sigue una distribución
normal N(192, 12). Calcula la probabilidad de que una persona adulta
sana tenga un nivel de colesterol:
a) Superior a 200 unidades. R/25.14%
b) Entre 180 y 220 unidades. R/ 83.14%
9) Considerando que en la urna hay un total de 10 objetos, 3 de los cuales
son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la
probabilidad de que 2 sean defectuosos? R/ 30%
10) El Profesor Alejandro Londoño observa que en su salón hay 8
alumnos de ojos cafés, 9 de ojos azules, 7 de ojos negros, y 10 de ojos
verdes; si extraemos 6 alumnos, calcular la probabilidad de que este
último tenga los ojos claros/0.9341%
11) Sólo 24 de los 200 alumnos de la Institución Moderna miden menos
de 150 cm. Si la estatura media de dichos alumnos es de 164 cm., ¿ cuál
es su varianza ?R/141.96
12) Juan Guillermo Valderrama lanza un par de dados y define la variable
aleatoria X como la suma de las puntuaciones obtenidas. Hallar la función
de probabilidad, la esperanza matemática y la desviación R/ 7
desviación=2.415
87
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
13) En Tulua cada tres familias posee teléfono fijo. Si se eligen al azar
90 familias, calcular la probabilidad de que entre ellas haya por lo menos
30 tengan teléfono fijo R//50%
14) Un tren de carga traen en un vagón de ferrocarril a 60 reses donde el
20% de ellas están enfermas de vaca loca, si extraemos con propósito de
inspección sanitaria una muestra del 10% de las reses ¿calcula la
probabilidad de que hayan 2 vacas con dicha enfermedad? R/25.65%
15) Guillermo Mondragón lanza un dado corriente. Si sale número primo,
gana tantos cientos de euros como marca el dado, pero si no sale número
primo, pierde tantos cientos de euros como marca el dado. Determinar la
función de probabilidad y la esperanza matemática del juego. R/ E=16.667
16) Sea X una variable aleatoria discreta cuya función de probabilidad es:
X
pi
0
0,1
1
0,2
2
0,1
3
0,4
4
0,1
5
0,1
1. Calcular, representar gráficamente la función de distribución.
2. Calcular las siguientes probabilidades:
a)
b)
c)
p (X < 4.5)
R/90%
p (X ≥ 3)
R/60%
p (3 ≤ X < 4.5) R/50%
17) Para ingresar a la Uceva en medicina se realiza un examen
tipo test de 200 preguntas de elección múltiple, cada pregunta tiene una
respuesta correcta y una incorrecta. Se aprueba si se contesta a más de
88
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
110 respuestas correctas. Suponiendo que se contesta al azar, calcular la
probabilidad de aprobar el examen.R/ 7.9%
18) De 60 aspirantes a la Uceva a ingeniería industrial 40 son
DE Tulua, si seleccionamos 20 aspirantes al azar ¿calcular la
probabilidad de que 10 sea n de Tuluà ?
19) El gran maestro Efraín Vásquez lanza dos monedas. Gana 1 ó
2 € si aparecen dos caras o una. Por otra parte pierde 5 € si no aparece
cara. Determinar la esperanza matemática del juego y si éste es
favorable. R/−1/4. Es desfavorable
20) El maestro internacional Luis Fernando Plazas lanza una moneda
cuatro veces. Calcular la probabilidad de que salgan más caras que sellos
R/31.25%
21)) En la sala de juego Matecho se realiza la extracción simultánea de
tres bolas de una urna que contiene 6 bolas Rojas y cuatro negras,
observamos el número de bolas blancas extraídas.
De la variable aleatoria así definida, calcular:
a)
ley de probabilidad R/ Ley de probabilidad o función de
densidad :
X
Prob
b)
0
0.033
1
0.3
2
0.5
3
0.167
función de distribución R/
0 si x  0
0.033 si 0  x  1

F ( x)  0.333 si 1  x  2
0.833 si 2  x  3

1
si x  3
c) Esperanza matemática, varianza y desviación típica. E=1.8 V(x)=0.56
D=0.748
d) Mediana y moda de la distribución.R/ Mediana = 2 Moda =2
22) Complete la ley de probabilidad siguiente, sabiendo que su esperanza
matemática es igual a 1.8:
X
Prob
89
0
0.2
1
M
2
N
3
0.3
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Hallar los valores de m yn R/ m=0.1 y n= 0.4
23) Calcular la esperanza matemática, varianza, y la desviación de la
variable aleatoria que tiene como función de distribución:
0
0.2

F ( x)  0.55
0.85

1
R/ E(x)= 4.8
si
x2
si 2  x  4
si 4  x  6
si 6  x  8
si
x8
V(x)= 3.76
D=1.93
24) Si Victoria Duque plantea un proyecto para una sala de juegos,
donde el proyecto consiste en lanzar dos dados y sumando los puntos
obtenidos, los premios que ofrece el juego son los siguientes:
- Devolución de lo apostado: si la suma es inferior a 4 o superior a 10.
- Doble de lo apostado: si se obtiene 5 o 9.
- Cuatro veces lo apostado: si la suma de puntos es 7
- Pierde lo apostado Si la suma es mayor o igual a 4 y menor o igual a 10
Indicar a través de un análisis si el proyecto dado por victoria
favorable o no para la sala de juegos
es
R/ No es favorable para la sala de juegos
25) Las puntuaciones de un examen para ingresar a la Usaca se
distribuyen normalmente con media 15 puntos. La puntuación A ha sido
superada por un 23% de los alumnos. La puntuación B está situada a 5
puntos diferenciales por debajo de la media. Entre B y la media se
encuentra el 30% de los alumnos. Calcular:
a) La desviación típica de las notas. R/ 5.95
b) Las puntuaciones directas de A y B. A=20.21 y B=10
c) El porcentaje de alumnos entre A y B. R/57%
26) Un agente de seguros de la ciudad de Tulua vende pólizas a cinco
personas de la misma edad y que disfrutan de buena salud. Según las
tablas actuales, la probabilidad de que una persona en estas condiciones
90
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos
30 años, vivan:
a) Las cinco personas R/13.2%
b) Al menos tres personas R/ 79.1%
c) Exactamente dos personas. R/ 16.4%
27) El maestro Julio Arroyabe calculó que el promedio de enfriamiento de
todas las neveras de Tulua para una línea de cierta compañía, emplean
una temperatura de -4°C con una desviación típica de 1.2°C.
a. ¿Cuál es la probabilidad de que una nevera salga con una temperatura
superior a -3°C? R/20.33%
b. ¿Cuál es la probabilidad de que una nevera salga con una temperatura
menor a - 5.5°C? R/ 10.56%
28) Si de 31 productos comprado por Fanny Romero para una ancheta
navideña, determinar cuál es la probabilidad de que 20 de los productos
comprados por Fanny salgan defectuosos, si el 50% de los productos
normalmente sale defectuoso/3.97%
29) Se calcula que en la ciudad de Tulua el 20% de las personas tienen
defecto de la vista si tomamos una muestra de 50 personas al azar
¿Calcular la probabilidad de que 10 de ellos tengan defecto en la vista
.R/12.51%
30) Un estudio realizado por el ingeniero Oscar Duque ha mostrado
que, en un cierto barrio de Tulua el 60% de los hogares tienen al menos
dos televisores Se elige al azar una muestra de 50 hogares en el citado
barrio. Se pide:
a. ¿Cuál es la probabilidad de que al menos 20 de los citados hogares
tengan cuando menos dos televisores? R/ 99.81%
b. ¿Cuál es la probabilidad de que entre 35 y 40 hogares tengan cuando
menos dos televisores? R/ 7.16%
31) Un agente de seguros de Tulua Colombia vende pólizas a cinco
personas de la misma edad y que disfrutan de buena salud. Según las
tablas actuales, la probabilidad de que una persona en estas condiciones
viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos
30 años, vivan: a) Las cinco personas R/13.2%
b) Al menos tres
personas. R/79.1% c) Exactamente dos personas R/16.4%
91
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
32) La tipografía Franciscos dirigida por francisco senen colorado
encontró que el 8% de sus impresiones presentan algún problema, para
ello contrata un ingeniero industrial el cual toma una muestra de 40
Impresiones ¿ Calcular probabilidad de que existan 5 impresiones con
problemas ?R/11.4%
33) El dueño de un criadero de árboles está especializado en la
producción de árboles de Navidad. Estos crecen en filas de 300. Se sabe
que por término medio 6 árboles no son aptos para su venta. Asume que
la cantidad de árboles aptos para la venta por fila plantada sigue una
distribución de Poisson.
a) Calcula la probabilidad de encontrar 2 árboles no vendibles en una fila
de árboles. R/4.46%
b) Calcula la probabilidad de encontrar 2 árboles no vendibles en media
fila de árboles. R/22.40%
34) En un estudio realizado por Héctor García de una pila X encontró que
la vida media de operación de una pila de linterna es de 24 horas y está
distribuida normalmente con una desviación de 3 horas. ¿Cuál es la
probabilidad de que una muestra aleatoria de 100 pilas tenga una media
que se desvíe por más de 30 minutos del promedio? R/4.85%
35) Una máquina para acuñar monedas es diseñada por el físico
Leonardo Campo toma 36 observaciones donde el espesor promedio de
las monedas es de 0.20 c m y una desviación de 0.01 c m. ¿Cuál es la
probabilidad de que el promedio del espesor de las 36 monedas supere
los 0.21 c m? R/ 0%
36) La densidad de cierta característica química de algunos compuestos
viene dada por la función siguiente:
0 si x  0
2 x si 0  x  0.8

f ( x)  
0.72 si 0.8  x  1.3
0
si x  1.3
Calcular:
1. los tres primeros momentos ordinarios; los cuales son
b
E(x) =
 x. f ( x)dx R/ 0.7193
a
92
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
R/0.6092
3
E(x )
R/ 0.5714
E(x2)
2. Varianza;
Recordar que V(x)=E(x2)--
E (x) 2
37) En Vaiju un sitio turístico de Tulua hay 30 pericos rusos y 20 pericos
chinos si extraemos 10 pericos al azar calcular posibilidad de que 3 de
ellos hablen chino R/22.6%
38) El maestro Carlos Gil construye una maquina que detecta fallas en los
productos que elabora una fabrica. Si los productos tienen una
probabilidad de falla del 5%, calcular la probabilidad de que la maquina
encuentre su primer producto defectuoso en la octava ocasión que
selecciona un producto para su inspección. R/3.49%
39 En Tulua se estima que la temperatura máxima en el mes de junio
sigue una distribución normal, con media 23° y desviación típica 5°.
Calcular el número de días del mes en los que se espera alcanzar
máximas entre 21° y 27°R/ 13
40) El entrenador MILLER MEDINA de un equipo de baloncesto opina que
los jugadores A, B y C tienen similares aptitudes para ser titulares del
equipo en la posición de base. Así, determina que jueguen el mismo
número de minutos cada partido. Se sabe que el 40% de las canastas son
de C, mientras que A y B consiguen un 30% de encestes. Calcular la
probabilidad de que en un partido con 9 encestes de dos puntos, A
consiguiera dos, B tres y C cuatro. R/ Multinomial
41) En el curso dirigido por el maestro Julio García de los 20 hombres y
18 mujeres del salón el 50% réprobo el examen de estadística, si
tomamos 10 alumnos al azar probabilidad. A) 4 alumnos reprobados
R/22.24% B) 3 mujeres reprobadas R/22.73%
42) Una empresa electrónica observa que el número de componentes que
fallan antes de cumplir 100 horas de funcionamiento es una variable
aleatoria de Poisson. Si el número promedio de estos fallos es ocho,
1. ¿Cuál es la probabilidad de que falle un componente en 25
horas/27.06%
2. ¿y de que fallen no más de dos componentes en 50 horas? R/23.81%
93
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
3. ¿Cuál es la probabilidad de que fallen por lo menos diez en 125
horas/41.7%
43) Para la siguiente situación, indica si sigue una distribución binomial.
En caso afirmativo, identifica en ella los valores de n y p si la situación
plantea que lanzamos cien veces un dado y nos preguntamos por el
número de unos que obtenemos. R/ : R/ si y n=100 y p=1/6
44) De un curso de mercadeo dirigido por Rodrigo Herrera el 60% de los
alumnos son hombres, calcular probabilidad de extraer el 1er hombre a la
cuarta ocasión que extraemos un alumno/3.84%
45) El ingeniero William Buitrago crea unos focos solares y afirma que
sus focos durará un promedio de 500 horas de trabajo. Para conservar
este promedio esta persona verifica 25 focos cada mes. Si el valor y
calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta
afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos
cuya duración fue?:
500
513
496
510
505
521
522
488
475
521
511
500
500
510
500
513
521
502
506
493
510
495
512
503
520
R/ Se puede concluir que la media poblacional no es 500, porque la
muestra poblacional está por encima de esta, y por lo tanto debería estar
por encima de 500.
46). El matemático Héctor Mario Mosquera Supone que la probabilidad de
tener una unidad defectuosa en una línea de ensamblaje es de 0.05. Si el
conjunto de unidades terminadas constituye un conjunto de ensayos
independientes:
1. ¿Cuál es la probabilidad de que entre diez unidades dos se encuentren
defectuosas? R/4.76%
2. ¿y de que a lo sumo dos se encuentren defectuosas? 99.84%
3. ¿Cuál es la probabilidad de que por lo menos una se encuentre
defectuosa?40.13%
47) Lanzamos 5 veces una moneda no trucada es decir sesgada, ¿Cuál
es la probabilidad de que obtengamos exactamente 2 caras?
94
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
48) En un juego de parques la probabilidad de ganar un chico es decir
ganar el juego es 0,8. Calcula la probabilidad de que un jugador que
juega 10 chicos las gane todas y la probabilidad de que gane al menos 8.
49) El Dr Milko Ferrer trae de la costa pantalones donde El 7% de los
pantalones de una determinada marca le salen con algún defecto. Se
empaquetan en caja 80 para distribuirlos a sus grandes amigos. ¿Cuál es
la probabilidad de que en la caja haya más de 10 pantalones defectuosos
R/1.58%
50) Respondemos al azar a un test de 8 preguntas, cada una de las
cuales tiene 4 opciones (solo una de ellas es verdadera). Para aprobar
necesitamos contestar correctamente al menos a 6 de ellas. ¿Cuál es la
probabilidad de aprobar?. ¿Y la probabilidad de fallar las 8?.
51) El maestro Carlos Quintero lanza 5 chinches y observa que el
número de ellas que caen con la punta hacia arriba. Al repetir la
experiencia 350 veces obtenemos:
nº de puntas hacia arriba
0
nº de veces en los 350
60
lanzamientos
1
2
3
4
5
133
101
45
10
1
¿Ajustan los resultados a una distribución Binomial? ¿Cuál sería el valor
de p en caso afirmativo?
52) La última novela García Márquez el autor ha tenido un gran éxito,
hasta el punto de que el 80% de los lectores ya la han leído. Un grupo de
4 amigos son aficionados a la lectura:
a) ¿Cuál es la probabilidad de que en el grupo hayan leido la novela 2
personas? 15,36%
b) ¿Y al menos 2? R/18,08%
53) Supongamos que la duración en minutos de las llamadas telefónicas
sigue una distribución dada por la función
95
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
  3x
e
F ( x)  1  
 2

  3x
 e

  2
 





para todo x  0
Calcular la probabilidad
de que la duración de una llamada cualquiera sea superior a 6 minutos R/
e-2
54) Si el maestro Orlando Flavio Millán tiene la información de que solo el
3% de los alumnos de filosofía son muy inteligentes ¿Calcular la
probabilidad de que si Orlando toma 100 alumnos al azar 5 de ellos sean
muy inteligentes R/10.1%
55) La probabilidad de que Bernardo Tovar acierte en el blanco es 1/4.
Si dispara 10 veces ¿cuál es la probabilidad de que acierte exactamente
en tres ocasiones? ¿Cuál es la probabilidad de que acierte por lo menos
en una ocasión?
56) En las doble calzada Tulua- Buga en un reten de la policía se hizo s
pruebas de alcoholemia se ha observado que el 5% de los conductores
controlados dan positivo en la prueba y que el 10% de los conductores
controlados no llevan aprovechado el cinturón de seguridad. También se
ha observado que las dos infracciones son independientes. Un guardia de
tráfico para cinco conductores al azar. Si tenemos en cuenta que el
número de conductores es suficientemente importante como para estimar
que la proporción de infractores no varía al hacer la selección.
A). Determinar la probabilidad a de que exactamente tres conductores
hayan cometido alguna de las dos infracciones/2.23%
B) Determine la probabilidad de que al menos uno de los conductores
controlados haya cometido alguna de las dos infracciones/5.43%
57) Si el ingeniero Carlos Alberto Buitrago decide vender tv de marca X
cuya producción de televisores trae asociada una probabilidad de defecto
del 2%, si se toma un lote o muestra de 85 televisores, obtener la
probabilidad de que existan 4 televisores con defectos R/6.35%
58) Si de 12am a 1 pm se admite que un número de teléfono de cada
cinco está comunicando, ¿cuál es la probabilidad de que, cuando se
marquen 10 números de teléfono elegidos al azar, sólo comuniquen dos?
R/30.20%
96
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
59) Al centro turístico VAIJU trae en una jaula con 100 pericos 15 de ellos
hablan ruso calcular la probabilidad de que si tomamos 20 pericos al azar
3 de ellos hablen ruso/22.40%
60) El laboratorio Ángel afirma que una droga causa de efectos
secundarios en una proporción de 3 de cada 100 pacientes. Para
contrastar esta afirmación, otro laboratorio elige al azar a 5 pacientes a
los que aplica la droga. ¿Cuál es la probabilidad de los siguientes
sucesos?
A) Ningún paciente tenga efectos secundarios/85.87%
B) Al menos dos tengan efectos secundarios/0,847%
C) Cuál es el número medio de pacientes que espera laboratorio que
sufran efectos secundarios si elige 100 pacientes al azar? R/3
61) El Dr Saúl García Mendieta comprobó que el tiempo de vida de
cierto tipo de marcapasos sigue una distribución exponencial con media
de 16 años. a) ¿Cuál es la probabilidad de que a una persona a la que se
le ha implantado este marcapasos se le deba reimplantar otro antes de 20
años? R/71.35% b) Si el marcapasos lleva funcionando correctamente 5
años en un paciente, ¿cuál es la probabilidad de que haya que cambiarlo
antes de 25 años? R/52.20%
62) Se sabe que el 7% de los útiles quirúrgicos en un lote de 100 no
cumplen ciertas especificaciones de calidad. Tomada una muestra al azar
de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no
más de dos sean defectuosos. R/98%
63) La probabilidad de que cierto examen médico dé lugar a una reacción
“positiva” es igual a 0,8, ¿cuál es la probabilidad de que ocurran menos
de 5 reacciones “negativas” antes de la primera positiva? R /99.97%
64) Se lanza
determinando
dos
monedas,
construir
Dada la función densidad:
0
f(x)=
97
si
x<0
2X
si
0≤x≤1
1
si
x>1
una
función
distribución
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Encontrar F(x):
65) Un sujeto responde al azar un examen de 5 preguntas, cada una con
5 alternativas.
a) Obtener ρ. R/ ρ=0.2 b) Obtener E (X1) y σ 2x R/ E (X1) = 0.2 y σ2x
=0.16 c) Obtener E (X),  x2 , E (P) y σ2p R/ E (X)= 1  x2 =0.8 , E (P)= 0.2
y σ2p=0.023 d) Obtener P (X ≤ 3) 98.75%
66) Encuentre el valor de k tal que P(k < t < -1.761) = 0.045, para una
muestra aleatoria de tamaño 15 que se selecciona de una distribución
normal. R/K= -2.977 Lolo que significa P(-2.977 < t < -1.761) = 0.045
67) El químico Diego Giraldo de la Institución Moderna afirma que el
rendimiento medio de la población de cierto proceso en lotes es 500
gramos por milímetro de materia prima. Para verificar esta afirmación
toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae
entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión
extraería de una muestra que tiene una media de 518 gramos por
milímetro y una desviación estándar de 40 gramos? Suponga que la
distribución de rendimientos es aproximadamente normal R/ Si se desea
obtener la probabilidad de obtener un valor de t con 24 grados de libertad
igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02.
De aquí que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
68) En estudio realizado por el Dr RODRIGO BEVERRA sobre la
movilidad en Tulua encontró que 16 recorridos realizados de prueba una
hora cada uno por la buseta se encontró que, el consumo de gasolina de
un motor es de 16.4 gal, con una desviación estándar de 2.1 gal.
Demuestre que la afirmación que el consumo promedio de gasolina de
este motor es 12.0 gal/hora R/ Para el cual en las tablas, el valor de
t=8.38 corresponde un α=5% y 15 gl es insignificante, y por tanto se
puede concluir que el consumo de 12 gal/h es real
AYUDA SOLUCION DE ALGUNOS
http://www.vitutor.net/1/54.html
98
PROBLEMAS
ESTAN
EN
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
CAPITULO III
ERROR MUESTRAL
Cualquier medida conlleva algún error. Si se usa la media para medir,
estimar, la media poblacional m, entonces la media muestral, como
medida, conlleva algún error. Por ejemplo, supongamos que se ha
obtenido una muestra aleatoria de tamaño 20 de una población con media
m = 10: si la media de la muestra es x=8, entonces a la diferencia
observada x-μ = -2 se le denomina el error muestral. Una media muestral
x puede pensarse como la suma de dos cantidades, la media poblacional
m y el error muestral; si e denota el error muestral, entonces: X = μ + e
EJEMPLO 3.1
Se toman muestras de tamaño 2 de una población consistente en tres
valores, 2,4 y 6, para simular una población “grande” de manera que el
muestreo pueda realizarse un gran número de veces, supondremos que
éste se hace con reemplazo, es decir, el número elegido se reemplaza
antes de seleccionar el siguiente, además, se seleccionan muestras
ordenadas. En una muestra ordenada, el orden en que se seleccionan las
observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó
primero 4 y después 2. La siguiente tabla contiene una lista de todas las
muestras ordenadas de tamaño 2 que es posible seleccionar con
reemplazo y también contiene las medias muestrales y los
correspondientes errores muestrales. La media poblacional es igual a
μ = (2+4+6)/3 = 4. Ver la tabla
La media de la colección de medias muestrales es 4, la media de la
población de la que se extraen las muestras. Si μx denota la media de
todas las medias muestrales entonces tenemos:
μx = (2+3+4+4+5+6+5+4+3)/9 = 4
La suma de los errores muestrales es cero.
e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0
MUESTRAS ORDENADAS
X
e=x-μ
(2,2)
2
2 – 4 = -2
99
(2,4)
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
3
3 – 4 = -1
(2,6)
4
4–4=0
(4,2)
3
3 – 4 = -1
(4,4)
4
4–4=0
(4,6)
5
5–4=1
(6,2)
4
4–4=0
(6,4)
5
5–4=1
(6,6)
6
6–4=2
En consecuencia, si x se usa para medir, estimar, la media poblacional
μ, el promedio de todos los errores muestrales es cero.
ESTIMACION
Estimación de parámetros
Es el procedimiento utilizado para conocer las características de un
parámetro poblacional, a partir del conocimiento de la muestra.
Con una muestra aleatoria, de tamaño n, podemos efectuar una
estimación de un valor de un parámetro de la población; pero también
necesitamos precisar un:
Intervalo de confianza
Se llama así a un intervalo en el que sabemos que está un parámetro, con
un nivel de confianza específico.
Nivel de confianza
Probabilidad de que el parámetro a estimar se encuentre en el intervalo
de confianza.
Estimación puntual y por intervalo
Las medias o desviaciones estándar calculadas de una muestra se
denominan ESTADÍSTICOS, podrían ser consideradas como un punto
estimado de la media y desviación estándar real de población o de los
PARAMETROS.
100
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
¿Qué pasa si no deseamos una estimación puntual como media basada
en una muestra, qué otra cosa podríamos obtener como margen, algún
tipo de error? R/ generaríamos “Un Intervalo de Confianza”
ESTIMADOR PUNTUAL: Utiliza un número único o valor para localizar
una estimación del parámetro.
ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango
dentro del cual se puede encontrar el parámetro y el nivel de confianza
que el intervalo contiene al parámetro.
LIMITES DE CONFIANZA: Son los límites del intervalo de confianza
inferior (LIC) y superior (LSC), se determinan sumando y restando a la
media de la muestra X un cierto número Z (dependiendo del nivel o
coeficiente de confianza) de errores estándar de la media
X .
INTERPRETACIÓN DEL INTERVALO DE CONFIANZA: Tener un 95% de
confianza en que la media poblacional real y desconocida se encuentra
entre los valores LIC y LSC.
P(Z<= - Zexcel ) = alfa/2
P(Z>= + Zexcel ) = alfa/2
Intervalo de confianza donde
se encuentra el parámetro con
un NC =1-
NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR
TIPO 1 = ALFA
Error de estimación admisible
Que estará relacionado con el radio del intervalo de confianza.
Estimación de la media de una población
101
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
El intervalo de confianza, para la media de una población, con un nivel de
confianza de 1 − α , siendo x la media de una muestra de tamaño n y σ la
desviación típica de la población, es:
El error máximo de estimación es:
Cuanto mayor sea el tamaño de la muestra, n, menor es el error.
Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error.
EJEMPLO 3.1
El tiempo que tardan las cajeras de un supermercado en cobrar a los
clientes sigue una ley normal con media desconocida y desviación típica
0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un
tiempo medio de 5,2 minutos.
1. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio
que se tarda en cobrar a los clientes.
2. Indica el tamaño muestral necesario para estimar dicho tiempo medio
con un el error de ± 0,5 minutos y un nivel de confianza del 95%.
n≥4
ESTIMACIÓN DE UNA PROPORCIÓN
102
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Si en una población, una determinada característica se presenta en una
proporción p, la proporción p’, de individuos con dicha característica en
las muestras de tamaño n, se distribuirán según:
Intervalo de confianza para una proporción
El error máximo de estimación es:
OTRAS FORMULAS
P( Z  Z  ) 
2
E
a 1
2
a  la
probabilid ad
del
area
LS  LI
2
Cuando n  30 la proporción de la muestra es una variable aleatoria que
N ( p;
se aproxima a una distribución normal
pq
)
n
EJEMPLO 3.2
El ingeniero Misael Hernández al visitar una fábrica de componentes
electrónicos, encontró que la proporción de componentes finales
defectuosos era del 20%. Tras una serie de operaciones e inversiones
destinadas a mejorar el rendimiento se analizó una muestra aleatoria de
500 componentes, encontrándose que 90 de ellos eran defectuosos.
¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento
no ha sufrido variaciones?
p = 0.2
q = 1 - p =0.8
E = 0.2 - 0.18 = 0.02
103
p'= 90/ 500 = 0.18
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
P (1 - zα/2 <1.12) = 0.86861 - 0.8686 = 0.1314
0.8686 - 0.1314 = 0.737
Nivel de confianza: 73.72%
El error máximo de estimación esta dado por:
Donde “n” es el tamaño de la muestra
E= zα/2.
EJEMPLO: 3.3
Se desea estimar la emisión promedio diaria en toneladas de óxido de
sulfuro emitidos por una planta industrial para este fin disponemos de los
datos siguientes que se constituyen en una muestra aleatoria de la planta
de óxido de sulfuro en 40 días.
17 15
20
29
19
18
22
25
27
9
24 20
17
6
24
14
15
23
24
26
19 23
28
19
16
22
24
17
20
13
19 10
23
18
31
13
20
17
24
14
a) Encontrar los intervalos por la prueba de sturges y hallar la media por
calculadora y por datos agrupados obtenidos.
b) Que podemos decir con la probabilidad del 0,95 acerca del tamaño
máximo de nuestro error.
SOLUCION
- K= 1+3,3Log40= 6,286= 6
Ri= 31-6= 25
104
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Ci=
Cn= 5
Rn=(5)(6)= 30
Dr= 30-25= 5
A=5-1= 4
Sesgo= 6-2= 4 y
Intervalos
4-8
9-13
14-18
19-23
24-28
29-33
∑
31+2= 33
Ni
1
4
11
13
9
2
40
X´
6
11
16
21
26
31
-
Nix´
6
44
176
273
234
62
797
Promedio en la calculadora= 19,6
Promedio a mano=
a)
E=
E= (0,475)(0,8717)
E= (1,96)(0,8717)
E= 1,71
El tamaño máximo de error es del 1,71 en toneladas de óxido de sulfuro
con un nivel de confianza de 95%
INTERVALO DE CONFIANZA
Objetivo: es que al analizar una muestra, este debe caer en el intervalo,
si no cae la muestra tomada no es significativa. El intervalo de confianza
esta dado por:
Ẋ-E≤ u ≤ + E
EJEMPLO: 3.4
Construya un intervalo de confianza del 95%con respecto a la emisión
diaria en promedio real de óxido de sulfuro de la planta.
DATOS: ẋ= 19,6
105
E=1,71
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
19,6 -1,71≤ U ≤ 19,6+ 1,71
17,89≤ U≤ 21,31
INTERVALO DE CONFIANZA DE UNA PROPORCIÓN
Proporción es una fracción, razón o porcentaje que indica la parte de la
muestra de la población que posee un rasgo de interés particular. La
proporción muestral viene dada por: p= x/n
Recordemos que π es el porcentaje de éxito en la distribución binomial y
“p” es similar al concepto de π.
El intervalo de confianza para la proporción de una población es:
pz
p(1  p)
n
En este caso, interesa construir un intervalo de confianza para una
proporción o un porcentaje poblacional (por ejemplo, el porcentaje de
personas con hipertensión, fumadoras, etc.)
Si el tamaño muestral n es grande, el Teorema Central del Límite nos
asegura que:
O bien:
Donde p es el porcentaje de personas con la característica de interés en
la población (o sea, es el parámetro de interés) y p es su estimador
muestral.
Luego, procediendo en forma análoga al caso de la media, podemos
construir un intervalo de 95% de confianza para la proporción poblacional
p.
EJEMPLO 3.5
106
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
En un estudio de prevalencia de factores de riesgo en una cohorte de 412
mujeres mayores de 15 años en el centro del valle, se encontró que el
17.6% eran hipertensas. Un intervalo de 95% de confianza para la
proporción de mujeres hipertensas del centro del valle está dado por:
Luego, la proporción de hipertensas varía entre (0,139 , 0,212) con una
confianza de 95%
LONGITUD DEL INTERVALO DE CONFIANZA
Para responder a la pregunta se puede razonar diciendo que, fijos todos
los parámetros menos la longitud del intervalo, si se quiere mayor certeza
no queda más remedio que ampliar el intervalo, es decir, aumentar su
longitud. La manera rigurosa de justificar esto es recurriendo a la fórmula
del intervalo, que nos dice que su longitud es
L  2Z 
2

n
Ahora, si σ y n permanecen fijos, para estudiar cómo varía L al cambiar α
basta ver cómo varía el cuantil. Al intervalo del 95% le correspondería:
• α = (100-95)/100 = 0,05 → α disminuye
• Ahora la cantidad z
α/ 2 debe dejar menos área (probabilidad) a su derecha →
aumenta. Por tanto, de la expresión anterior se ve que L aumenta.
zα/ 2
MUESTREO
Antes de entrar al mundo de aplicaciones resaltaremos algunos de
aspectos generales de un cuestionario pues son muy pocos libros que
abarcan una teoría con respecto al modo de preguntar
A la hora de formular un cuestionario o encuesta como desarrollo de una
investigación en el área social y, a manera de ejemplo se debe tener en
cuenta:
1. Tener en cuenta cuál es el objetivo de una investigación y delimitar sus
características dentro de un determinado contexto.
2. Desarrollar el cuestionario de manera clara, concisa y concreta.
3. Verificar que tipo de población se escogerá para la realización del
cuestionario o encuesta
107
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
LA ENCUESTA
Esta herramienta es la más utilizada en la investigación de ciencias y es
el medio principal para allegarse información de tal que el sujeto
encuestado plasme por sí mismo las respuestas en el papel.
Es importantísimo que el investigador sólo proporcione la información
indispensable, la mínima para que sean comprendidas las preguntas. Más
información, o información innecesaria, puede derivar en respuestas no
veraces.
De igual manera, al diseñar la encuesta y elaborar el cuestionario hay que
tomar en cuenta los recursos (tanto humanos como materiales) de los que
se disponen, tanto para la recopilación como para la lectura de la
información, para así lograr un diseño funcionalmente eficaz.
Según M. García Ferrando, "prácticamente todo fenómeno social puede
ser estudiado a través de las encuestas", y podemos considerar las
siguientes cuatro razones para sustentar ésto:
1. Las encuestas son una de las escasas técnicas de que se dispone para
el estudio de las actitudes, valores, creencias y motivos.
2. Las técnicas de encuesta se adaptan a todo tipo de información y a
cualquier población.
3. Las encuestas permiten recuperar información sobre sucesos
acontecidos a los entrevistados.
4. Las encuestas permiten estandarizar los datos para un análisis
posterior, obteniendo gran cantidad de datos a un precio bajo y en un
período de tiempo corto.
TIPOS DE ENCUESTAS
Según Cadoche y sus colaboradores, las encuestas se pueden clasificar
atendiendo al ámbito que abarcan, a la forma de obtener los datos y al
contenido, de la siguiente manera:
Encuestas exhaustivas y parciales: Se denomina exhaustiva cuando
abarca a todas las unidades estadísticas que componen el colectivo,
universo, población o conjunto estudiado. Cuando una encuesta no es
exhaustiva, se denomina parcial.
Encuestas directas e indirectas: Una encuesta es directa cuando la
unidad estadística se observa a través de la investigación propuesta
registrándose en el cuestionario. Será indirecta cuando los datos
obtenidos no corresponden al objetivo principal de la encuesta
pretendiendo averiguar algo distinto o bien son deducidos de los
resultados de anteriores investigaciones estadísticas.
Encuestas sobre hechos y encuestas de opinión: Las encuestas de
opinión tienen por objetivo averiguar lo que el público en general piensa
acerca de una determinada materia o lo que considera debe hacerse en
una circunstancia concreta. Se realizan con un procedimiento de
muestreo y son aplicadas a una parte de la población ya que una de sus
ventajas es la enorme rapidez con que se obtienen sus resultados.
108
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
No obstante, las encuestas de opinión no indican necesariamente lo que
el público piensa del tema, sino lo que pensaría si le planteásemos una
pregunta a ese respecto, ya que hay personas que no tienen una opinión
formada sobre lo que se les pregunta y contestan con lo que dicen los
periódicos
y
las
revistas.
A veces las personas encuestadas tienen más de una respuesta a una
misma pregunta dependiendo del marco en que se le haga la encuesta y
por consecuencia las respuestas que se dan no tienen por qué ser
sinceras.
Las encuestas sobre hechos se realizan sobre acontecimientos ya
ocurridos, hechos materiales.
TIPOS DE PREGUNTA
Como los cuestionarios están formados por preguntas, consideremos las
características
que
deben
reunir,
pues
deben excluyentes y exhaustivas, lo que se refiere a que una pregunta
no produzca dos respuestas y, simultáneamente, tenga respuesta. (A
cada pregunta le corresponde una y sólo una respuesta.)
Por otro lado, una manera de clasificar a las preguntas es por la forma de
su respuesta:
Preguntas cerradas: que consiste en proporcionar al sujeto observado
una serie de opciones para que escoja una como respuesta. Tienen la
ventaja de que pueden ser procesadas más fácilmente y su codificación
se facilita; pero también tienen la desventaja de que si están mal
diseñadas las opciones, el sujeto encuestado no encontrará la opción que
él desearía y la información se viciaría. Una forma de evitar esto es
realizar primero un estudio piloto y así obtener las posibles opciones para
las respuestas de una manera más confiable.
También se consideran cerradas las preguntas que contienen una lista
de preferencias u ordenación de opciones, que consiste en
proporcionar una lista de opciones al encuestado y éste las ordenará de
acuerdo a sus interes, gustos, etcétera
Preguntas abiertas: que consisten en dejar totalmente libre al sujeto
observado para expresarse, según convenga. Tiene la ventaja de
proporcionar una mayor riqueza en las respuestas; mas, por lo mismo,
puede llegar a complicar el proceso de tratamiento y codificación de la
información. Una posible manera de manipular las preguntas abiertas es
llevando a cabo un proceso de categorización, el cual consiste en
estudiar el total de respuestas abiertas obtenidas y clasificarlas en
categorías de tal forma que respuestas semejantes entre sí queden en la
misma categoría.
Preguntas de identificación: edad, sexo, profesión, nacionalidad,
etcétera.
Preguntas de hecho: referidas a acontecimientos concretos. Por
ejemplo: ¿terminó la educación básica?
109
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Preguntas de acción: referidas a actividades de los encuestados. Por
ejemplo: ¿ha tomado algún curso de capacitación?
Preguntas de información: para conocer los conocimientos del
encuestado. Por ejemplo: ¿sabe qué es un hipertexto?
Preguntas de intención: para conocer la intención del encuestado. Por
ejemplo: ¿utilizará algún programa de computación para su próxima
clase?i) Preguntas de opinión: para conocer la opinión del encuestado.
Por ejemplo: ¿qué carrera cursarás después del bachillerato?
Preguntas filtro: son aquéllas que se realizan previamente a otras para
eliminar a los que no les afecte. Por ejemplo: ¿Tiene usted coche?
¿Piensa comprarse uno?
Preguntas trampa o de control: son las que su utilizan para descubrir la
intención con que se responde. Para ello se incluyen preguntas en
diversos puntos del cuestionario que parecen independientes entre sí,
pero en realidad buscan determinar la intencionalidad del encuestado al
forzarlo a que las conteste coherentemente (ambas y por separado) en el
caso de que sea honesto, pues de lo contrario «caería» en
contradicciones.
Preguntas de introducción o rompehielos: utilizadas para comenzar el
cuestionario o para enlazar un tema con otro.
Preguntas muelle, colchón o amortiguadoras: son preguntas sobre
temas peligrosos o inconvenientes, formuladas suavemente.
Preguntas en batería: conjunto de preguntas encadenadas unas con
otras complementándose.
Preguntas embudo: se empieza por cuestiones generales hasta llegar a
los puntos más esenciales.
REGLAS FUNDAMENTALES PARA LA ELABORACION DE UN
CUESTIONARIO
Para la realización de un cuestionario eficaz y útil, Cadoche y su equipo
proponen 17 reglas fundamentales para su elaboración:
1Las preguntas han de ser pocas (no más de 30).
2. Las preguntas preferentemente cerradas y numéricas.
3. Redactar las preguntas con lenguaje sencillo
4. Formular las preguntas de forma concreta y precisa.
5. Evitar utilizar palabras abstractas y ambiguas.
6. Formular las preguntas de forma neutral.
7. En las preguntas abiertas no dar ninguna opción alternativa.
8. No hacer preguntas que obliguen a esfuerzos de memoria.
9. No hacer preguntas que obliguen a consultar archivos.
10. No hacer preguntas que obliguen a cálculos numéricos complicados.
11. No hacer preguntas indiscretas.
12. Redactar las preguntas de forma personal y directa.
13. Redactar las preguntas para que se contesten de forma directa e
inequívoca.
14. Que no levanten prejuicios en los encuestados.
15. Redactar las preguntas limitadas a una sola idea o referencia.
110
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
16. Evitar preguntas condicionantes que conlleven una carga emocional
grande.
17. Evitar estimular una respuesta condicionada. Es el caso de preguntas
que presentan varias respuestas alternativas y una de ellas va unida a un
objetivo tan altruista que difícilmente puede uno negarse.
LA ENTREVISTA
La entrevista es muy utilizada también en investigación social, y sus
características son similares a las del cuestionario, siendo la principal
diferencia el hecho de que es el encuestador u observador quien anota
las respuestas a las preguntas conlleva a tener una mayor habilidad por
parte del encuestador u observador en conducir el tema de la entrevista,
debido a que las respuestas son por lo general abiertas y permiten
implementar nuevas preguntas no contempladas por el encuestador
inicialmente.
Las recomendaciones en general y las referentes al tipo de preguntas
utilizadas, son las mismas que las realizadas para el caso del
cuestionario, aunque se le añade el uso de una grabadora (de audio o de
vídeo) para la posterior transcripción de los diálogos. 4
TIPOS DE MUESTREO
En el estudio de muestreo existen diferentes criterios de clasificación de
los tipos de muestreo, pero por lo general pueden dividirse en dos
grandes grupos: métodos de muestreo probabilísticos y métodos de
muestreo no probabilísticos.
I. MUESTREO PROBABILÍSTICO
En estadística las técnicas o métodos de muestreo probabilísticos son
aquellos que se basan en el principio de equiprobabilidad donde todos
los individuos tienen la misma probabilidad de ser elegidos para formar
parte de una muestra y, por lo tanto , todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas. La ventaja
de los de
métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más
recomendables. Y los encontramos de varios tipos:
2. MUESTREO ALEATORIO SIMPLE
El muestreo aleatorio simple se caracteriza por obtener una muestra,
donde se numeran los elementos de la población y se seleccionan al azar
los n elementos que contiene la muestra.
VENTAJAS
4
http://www.rrppnet.com.ar/comohacerunaencuesta.htm
111
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Sencillo y de fácil comprensión.
Cálculo rápido de medias y varianzas.
Se basa en la teoría estadística, y por tanto existen paquetes informáticos
para analizar los datos
DESVENTAJAS
Requiere que se posea de antemano un listado completo de toda la
población.
Cuando se trabaja con muestras pequeñas es posible que no represente
a la población adecuadamente
EJEMPLO3.6
La facultad de ingeniería Industrial tiene 120 alumnos y se quiere extraer
una muestra de 30 alumnos. Explica cómo se obtiene la muestra:
SOLUCION
-Se
enumeran
los
alumnos
del
1
al
120.
-Se
sortean
30
números
de
entre
los
120.
-La muestra estará formada por los 30 alumnos a los que les
correspondan los números obtenidos.
3. MUESTREO ALEATORIO SIN REPOSICIÓN
Los elementos no son devueltos a la población. Sólo pueden aparecer
una vez
en la muestra y el número de muestras posibles se obtiene así
VN , n 
N!
( N  n)!
EJEMPLO
POBLACION
PERSONA
A
B
C
EDAD
1
2
3
DETERMINAR
a) μ
b)  2
c) El numero de muestras posibles si n=2
d) COMPLETE EL SIGUIENTE CUADRO CON EL NUMERO DE
MUESTRAS OBTENIDAS EN EL PUNTO ANTERIOR
MUESTRA X1
X2
S2
PROB
X
1
1
2
112
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
SOLUCION
1 2  3
2
a)  
3
12  22  32
 22  0.67
3
3!
c) V3, 2   6
1!
d) CUADRO DE MUESTRAS SIN REPOSICION
MUESTRA X1
X2
X
1
1
2
1.5
2
1
3
2
3
2
1
1,5
4
2
3
2.5
5
3
1
2
6
3
2
2.5
b)  2 
S2
0.25
1
0,25
0.25
1
0.25
PROB
1/6
1/6
1/6
1/6
1/6
1/6
ESTIMADO LECTOR VERIFICAR LOS DATOS OBTENIDOS EN EL
CUADRO ANTERIOR
4. MUESTREO ALEATORIO CON REPOSICIÓN
Los elementos son devueltos a la población. Pueden aparecer más de
una vez en la muestra.
Muestreo aleatorio simple (muestreo aleatorio) Se puede calcular el
n
número de muestras posibles: VN
 Nn
En nuestro ejemplo anterior construya el cuadro con reposición para N=3
y n=2
MUESTREO ALEATORIO EN POBLACIÓN INFINITA
• Se asume que la población tiene infinitos elementos.
• El número de posibles muestras es infinito.
• Muestreo aleatorio simple:
1. Con reposición.
113
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
2. En población infinita.
5. MUESTREO ALEATORIO SISTEMÁTICO
Si se elige un individuo al azar y a partir de él, a intervalos constantes,
se eligen los demás hasta completar la muestra.
EJEMPLO 3.7
Por ejemplo si tenemos una población formada por 100 elementos y
queremos extraer una muestra de 25 elementos, en primer lugar debemos
establecer el intervalo de selección que será igual a 100/25 = 4. A
continuación elegimos el elemento de arranque, tomando aleatoriamente
un número entre el 1 y el 4, y a partir de él obtenemos los restantes
elementos de la muestra.
2, 6, 10, 14,..., 98
VENTAJAS
Define un intervalo k= N/n
Fácil de aplicar.
No siempre es necesario tener un listado de toda la población.
Cuando la población está ordenada siguiendo una tendencia conocida,
asegura una cobertura de unidades de todos los tipos.
DESVENTAJAS
Si la constante de muestreo está asociada con el fenómeno de interés, las
estimaciones obtenidas a partir de la muestra pueden contener sesgo de
selección
6.MUESTREO ALEATORIO ESTRATIFICADO
Se divide la población en clases o estratos y se escoge, aleatoriamente,
un número de individuos de cada estrato proporcional al número de
componentes de cada estrato.
Un muestreo puede hacerse con o sin reposición, y la población de
partida puede ser infinita o finita.
En todo nuestro estudio vamos a limitarnos a una población de
partida infinita o a muestreo con reposición.
Si consideremos todas las posibles muestras de tamaño n en una
población, para cada muestra podemos calcular un estadístico (media,
desviación típica, proporción, ...) que variará de una a otra. Así
obtenemos una distribución del estadístico que se llama distribución
muestral.
114
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
VENTAJAS
Tiende a asegurar que la muestra represente adecuadamente a la
población en función de unas variables seleccionadas.
Se obtienen estimaciones más precisa
Su objetivo es conseguir una muestra lo más semejante posible a la
población en
lo que a la o las variables estratificadoras se refiere.
DESVENTAJAS
Se ha de conocer la distribución en la población de las variables utilizadas
para la estratificación
EJEMPLO 3.8
En una fábrica harinera que consta de 600 trabajadores queremos tomar
una muestra de 20. Sabemos que hay 200 trabajadores en la sección A,
150 en la B, 150 en la C y 100 en la D. Cuantos trabajadores hay eb cada
sesccion
COMPRUEBA QUE HAY
5 TRABAJADORES EN LA SECCION B Y 5 EN C Y 3 EN D
7. MUESTREO POR CONGLOMERADO
El muestreo por conglomerados consiste en seleccionar aleatoriamente
un cierto número de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos.
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales.
115
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".
En el campo de la investigación educativa, es frecuente obtener muestras
de alumnos, profesores, etc. Recurriendo a conglomerados tales como
aulas, centro, localidades. Usando este procedimiento evitamos la
dispersión de unidades a la que nos conduciría un muestreo aleatorio
simple, y se reducirían los costes y el tiempo de un posible trabajo de
recogida de datos.
VENTAJAS
Es muy eficiente cuando la población es muy grande y dispersa.
No es preciso tener un listado de toda la población, sólo de las unidades
primarias de muestreo.
DESVENTAJAS
El error estándar es mayor que en el muestreo aleatorio simple o
estratificado.
El cálculo del error estándar es complejo
II. MÉTODOS DE MUESTREO NO PROBABILÍSTICOS
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun
siendo conscientes de que no sirven para realizar generalizaciones
(estimaciones inferenciales sobre la población), pues no se tiene certeza
de que la muestra extraída sea representativa, ya que no todos los
sujetos de la población tienen la
misma probabilidad de ser elegidos. En general se seleccionan a los
sujetos siguiendo determinados criterios procurando, en la medida de lo
posible, que la muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos
permiten resolver los problemas de representatividad aun en situaciones
de muestreo no probabilístico, por ejemplo los estudios de caso-control,
donde los casos no son seleccionados aleatoriamente de la población.
Entre los métodos de muestreo no probabilísticos más utilizados en
investigación encontramos:
1.- MUESTREO POR CUOTAS:
También denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la población y/o
de los individuos más "representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un
número de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en
116
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Tulua. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza
mucho en las encuestas de opinión.
2.- MUESTREO INTENCIONAL O DE CONVENIENCIA:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
También puede ser que el investigador seleccione
directa e
intencionadamente los individuos de la población. El caso más frecuente
de este procedimiento el utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos)
3.- BOLA DE NIEVE:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea
muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
TAMAÑO DE MUESTRA
1) TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA DE LA
POBLACIÓN
Para determinar el tamaño de muestra y estimar la media de la
población es necesario emplear el muestreo aleatorio simple. Para
ello es necesario partir de dos supuestos: en primer lugar el nivel de
confianza al que queremos trabajar; en segundo lugar, cual es el error
máximo que estamos dispuestos a admitir en nuestra estimación. Así
pues
los
pasos
a
seguir
son:
1.- Obtener el tamaño muestral imaginando que
Donde:
117
:
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
:
z
correspondiente
al
nivel
de
confianza
elegido
: varianza poblacional
e: error máximo
NOTA: En el Tamaño de la muestra
Si aumentamos el nivel de confianza, aumenta el tamaño de la
muestra.
Si disminuimos el error, tenemos que aumentar el tamaño de la
muestra.
2.-
Comprobar
si
se
cumple
si esta condición se cumple el proceso termina aquí, y ese es el
tamaño adecuado que debemos muestrear.
Si
no
se
cumple,
pasamos
a
una
tercera
fase:
3.- Obtener el tamaño de la muestra según la siguiente fórmula:
Veamos un ejemplo: El ministerio de trabajo en Colombia planea un
estudio con el interés de conocer el promedio de horas semanales
trabajadas por las mujeres del servicio doméstico. La muestra será
extraída de una población de 10000 mujeres que figuran en los
registros de la Seguridad Social y de las cuales se conoce a través de
un estudio piloto que su varianza es de 9.648. Trabajando con un nivel
de confianza de 0.95 y estando dispuestos a admitir un error máximo
de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?.
118
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Buscamos en las tablas de la curva normal el valor de
corresponde con el nivel de confianza elegido:
seguimos los pasos propuestos arriba.
que
= ±1.96 y
1.-
2.- Comprobamos que no se cumple
este caso
, pues en
10000 < 3706 (3706 - 1); 10000 < 13730730
3.-
2) TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN DE LA
POBLACIÓN
Para calcular el tamaño de muestra para la estimación de
proporciones poblacionales hemos de tener en cuenta los mismos
factores que en el caso de la media. La fórmula que nos permitirá
determinar el tamaño muestral es la siguiente:
donde
:
z correspondiente al nivel de
P:
proporción
de
una
categoría
e:
error
N: tamaño de la población
confianza
de
la
elegido
variable
máximo
Siguiendo con el estudio planteado en el punto anterior, supongamos
que tratamos de estimar la proporción de mujeres que trabajan
diariamente 10 horas o más. De un estudio piloto se dedujo que
P=0.30, fijamos el nivel de confianza en 0.95 y el error máximo 0.02.
119
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
OTRAS FORMAS DE TOMAR
EXPLICADOS EN INTERNET
TAMAÑO
DE
MUESTRA
http://www.youtube.com/watch?v=Y0XLJnGbFQs
3) CÁLCULO DEL TAMAÑO DE LA MUESTRA DE BASE
El tamaño adecuado de la muestra para una encuesta relativa a la
población está determinado en gran medida por tres factores: a)
prevalencia estimada de la variable considerada b) nivel deseado de
fiabilidad; y c) margen de error aceptable y para ello vamos a presentar
dos fórmulas
a) Siendo la primera la que se aplica en el caso de que no se conozca
con precisión el tamaño de la población, y es:
n
Z 2  P * Q 
2
E2
Lo que indica que el tamaño de la muestra para un diseño de encuesta
basado en una muestra aleatoria simple, puede calcularse fórmula
anterior
donde
::
n=
tamaño
de
la
muestra
requerido
Z  = nivel de fiabilidad de 95% (valor estándar de 1,96)
2
p=
prevalencia
estimada
en
la
zona
E = margen de error de 5% (valor estándar de 0,05)
del
proyecto
Ejemplo
En el proyecto del Dr Patarroyo con respecto la vacuna contra la malaria
en todo el pacifico colombiano, se ha calculado que cerca del 30% (0,3)
de los niños de la zona del proyecto padecen de malaria. Este dato se
basa en estadísticas nacionales sobre malaria en las zonas rurales.
Utilizando los valores estándar indicados encontrar el tamaño de muestra
ideal
para
aplicar
la
vacuna:
Cálculo:
SOLUCION
120
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1.96 0.3 * (1  0.3)
n
 323
0.52
2
b) La segunda formula se aplica en el caso de que sí se conozca el
tamaño de la población entonces se aplica la siguiente fórmula:
donde
n
Z
p
q
N
E
es el tamaño de la muestra;
es el nivel de confianza;
es la variabilidad positiva;
es la variabilidad negativa;
es el tamaño de la población;
es la precisión o el error.
La ventaja sobre la primera fórmula es que al conocer exactamente el
tamaño de la población, el tamaño de la muestra resulta con mayor
precisión y se pueden incluso ahorrarse recursos y tiempo para la
aplicación y desarrollo de una investigación.
EJEMPLO 3.9
En LA INSTITUCION EDUCATIVA MODERNA DE TULUA se desea
realizar una investigación sobre los alumnos inscritos en los sextos , para
lo cual se aplicará un cuestionario de manera aleatoria a una muestra,
pues los recursos económicos y el tiempo para procesar la información
resultaría insuficiente en el caso de aplicársele a la población estudiantil
completa.
En primera instancia, suponiendo que no se conoce el tamaño exacto de
la población, pero con la seguridad de que ésta se encuentra cerca a los
diez millares, se aplicará la primera fórmula.
Se considerará una confianza del 95%, un porcentaje de error del 5% y la
máxima variabilidad por no existir antecedentes en la institución sobre la
investigación y porque no se puede aplicar una prueba previa.
Primero habrá que obtener el valor de Z de tal forma que la confianza sea
del 95%, es decir, buscar un valor de Z tal que P(-Z<z<Z)=0.95. Donde al
buscar en la tabla nos arroja un resultado de Z=1.96.y por no tener
antecedente se supone un P=0.5
121
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
De esta manera se realiza la sustitución y se obtiene:
Esto quiere decir que el tamaño de la muestra es de 385 alumnos.
Supongamos ahora que sí se conoce el tamaño de la población estudiantil
y es de 9,408, entonces se aplicará la segunda fórmula. Utilizando los
mismos parámetros la sustitución queda como:
Con lo que se tiene una cota mínima de 370 alumnos para la muestra y
así poder realizar la investigación sin más costo del necesario, pero con la
seguridad de que las condiciones aceptadas para la generalización
(confiabilidad, variabilidad y error) se mantienen.
DISTRIBUCIONES MUESTRALES La distribución de frecuencia de un
estadístico muestral se denomina distribución muestral. En general, la
distribución muestral de un estadístico es la de todos sus valores
posibles calculados a partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en
una población grande. Se calcula la madia muestral x para cada muestra;
la colección de todas estas medias muestrales recibe el nombre de
distribución muestral de medias, lo que se puede ilustrar en la siguiente
figura:
EJEMPLO 3.7
122
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la
población de valores 0, 2, 4 y 6. Encuentre:
a) μ, la media poblacional

0246
3
4
b) σ, la desviación estándar poblacional.
Verificar que σ=2.2336
c) μx la media de la distribución muestral de medias.
A continuación se listan los elementos de la distribución muestral de la
media y la correspondiente distribución de frecuencias.
Muestra
media
(0,0)
0
(0,2)
1
(0,4)
2
(0,6)
3
(2,0)
1
(2,2)
2
(2,4)
3
(2,6)
4
(4,0)
2
(4,2)
3
(4,4)
4
(4,6)
5
123
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
3
(6,0)
(6,2)
4
(6,4)
5
(6,6)
6
Distribución de frecuencias de la media
X
f
0
1
1
2
2
3
3
4
4
3
5
2
6
1
La media de la distribución muestral de medias es:
x 
 fx  0 *1  1* 2  2 * 3  3 * 4  4 * 3  5 * 2  6 *1  3
n
16
d) σx, la desviación estándar de la distribución muestral de medias.
x 
 x   
x
n
COMPROBAR QUE ALAPLICAR LA FORMULA ANTERIOR
 X  1.58 Y QUE ESTE VALOR TAMBIEN SE PUEDE CALCULAR POR
124
X 

TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
n
Como para cualquier variable aleatoria, la dsitribución muestral de medias
tiene una media o valor esperado, una varianza y una desviación
estándar, se puede demostrar que la distribución muestral de medias
tiene una media igual a la media poblacional. Esto es: μx = E(x) = μ = 3
TEOREMA DEL LÍMITE CENTRAL
Si se seleccionan muestras aleatorias de n observaciones de una
población con media m y desviación estándar s, entonces, cuando n es
grande, la distribución muestral de medias tendrá aproximadamente una
distribución normal con unamedia igual a m y una desviación estándar de

. La aproximación será cada vez más exacta a medida de que n sea
n
cada vez mayor.
EJEMPLO 3.10
Para la distribución muestral de medias del ejercicio anterior, encuentre:
a) El error muestral de cada media
En la tabla siguiente se ven las muestras, las medias de las muestras y
los errores muestrales:
Muestra
media
Error muestral, e=x-m
(0,0)
0
0 - 3 = -3
125
(0,2)
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1
1 - 3 = -2
(0,4)
2
2 - 3 = -1
(0,6)
3
3–3=0
(2,0)
1
1 – 3 = -2
(2,2)
2
2 – 3 = -1
(2,4)
3
3–3=0
(2,6)
4
4–3=1
(4,0)
2
2 – 3 = -1
(4,2)
3
3–3=0
(4,4)
4
4–3=1
(4,6)
5
5–3=2
(6,0)
3
3–3=0
(6,2)
4
4–3=1
(6,4)
5
5–3=2
(6,6)
6
6–3=3
Verifique que
a) La media de los errores muestrales es cero
b) La desviación estándar de la distribución de los errores muestrales
está dada por
e 
e   e  f 2
N
, y su resultado es 1.58
La desviación estándar de la distribución muestral de un estadístico se
conoce como error estándar del estadístico. Para el ejercicio anterior el
error estándar de la media denotado por
126
x
, es 1.58. Con esto se
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
puede demostrar que si de una población se eligen muestras de tamaño
n con reemplazo, entonces el error estándar de la media es igual a la
desviación estándar de la distribución de los errores muestrales.
En general se tiene:
 x  e
Cuando las muestras se toman de una población pequeña y sin
reemplazo, se puede usar la formula siguiente para encontrar
x 

n
N n
N 1
donde σ es la desviación estándar de la población de donde se toman las
muestras, n es el tamaño de la muestra y N el de la población y la
expresión
N n
se le denomina factor de correcion.
N 1
EJEMPLO 3.11
Suponga que la tabla siguiente muestra la antiguedad en años en el
trabajo de tres decanos de tres facultades distintas:
Decanos
Antiguedad
A
6
B
4
C
2
Suponga además que se seleccionan muestras aleatorias de tamaño 2
sin reemplazo. Calcule
a) La antigüedad media para cada muestra
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las
muestras posibles de tamaño 2, con sus respectivas medias muestrales.
Muestras
Antigüedad
A,B
(6,4)
5
A,C
(6,2)
4
B,C
(4,2)
3
127
Media Muestral
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR

246
4
3
b) La media de la distribución muestral
x 
543
4
3
SE INVITA AL LECTOR QUE TERMINE LOS PUNTOS CY D Y
VERIFIQUE SUS RESPUESTAS
c) El error estándar, o la desviación estándar de la distribución muestral
ES 0.816
d) Que diferencia encuentra entre al aplicar la formula error estándar, o la
desviación estándar de la distribución muestral sin factor de correcion y
con factor de corrección
ERROR ESTANDAR SIN CORRECCION =1.152
ERRROR ESTANDAR CON CORRECION =0.816
DISTRIBUCIÓN MUESTRAL DE MEDIAS
Si recordamos a la distribución normal, esta es una distribución continua,
en forma de campana en donde la media, la mediana y la moda tienen un
mismo valor y es simétrica.
Con esta distribución podíamos calcular la probabilidad de algún evento
relacionado con la variable aleatoria, mediante la siguiente fórmula:
Z
X 

En donde z es una variable estandarizada con media igual a cero y
varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de
probabilidad para cualquier ejercicio, utilizando la tabla de la distribución
z.
128
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien
de cualquier tamaño de una población normal, la distribución muestral de
medias tiene un comportamiento aproximadamente normal, por lo que se
puede utilizar la formula de la distribución normal con    X Y    X ,
entonces la fórmula para calcular la probabilidad del comportamiento del
estadístico, en este caso la media de la muestra , quedaría de la siguiente
manera:
Z
X 

n
y para poblaciones finitas y muestro con reemplazo:
Z
x

n
N n
N 1
EJEMPLO 3,12
Una empresa eléctrica fabrica de lámparas que tienen una duración que
se distribuye aproximadamente en forma normal, con media de 800 horas
y desviación estándar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoriade 16 lámparas tenga una vida promedio de menos de
775 horas.
La interpretación sería que la probabilidad de que la media de la muestra
de 16 lámparas sea menor a 775 horas es de 0.0062.
VALOR ESPERADO
El valor esperado es el más importante concepto en el estudio de las
distribuciones de probabilidad. Desde hace muchos años dicho concepto
ha sido aplicado ampliamente en el negocio de seguros y en los últimos
129
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
veinte años ha sido aplicado por otros profesionales que casi siempre
toman decisiones en condiciones de incertidumbre.
Para encontrar el valor esperado de una variable aleatoria discreta,
multiplicamos cada valor que ésta puede asumir por la probabilidad de
ocurrencia de ese valor y luego sumamos los productos. Es un promedio
ponderado de los resultados que se esperan en el futuro.
Sea X una Variable Aleatoria que toma valores en un conjunto discreto
(en un conjunto finito de números en uno infinito como: los naturales, los
enteros o los racionales), por ejemplo si la variable aleatoria X toma los
siguientes valores:
X = 0, 1, 2, 3, … decimos que es discreta
La probabilidad de que X tome cada uno de sus valores viene dada por la
función de probabilidad:
P(X = i ), para i = 0, 1, 2, 3, ... ;
Sea P(X = i ) = pi para i = 0, 1, 2, 3, ... Se tiene que p1 + p2 + p3 +...+
pn +... = 1
Se define el Valor Esperado de una Variable Aleatoria con distribución
discreta como:
µ = E(X) =
 Xf (X )
Y para una variable aleatoria con distribución continua como

µ = E(X) =  x( f ( x)dx

EJEMPLO 3.13
La variable ‘edad de la clase’ tiene µ=20 y σ 2=2. Asumiendo que X es
normal:
a) Tomamos todas las posibles muestras de n=4 y calcular la media y

Obtener E( X ) y  x2
b) Obtener la probabilidad de encontrar un sujeto con X > 22
c) Obtener la probabilidad de encontrar una muestra con media > 22
SOLUCION
130
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
2 2
a) E( X ) =μ=20 y  x2 =
  0.5
n 4
x  u 22  20
b) Z 

 1,41 donde P(X>22)= P(Z>1.41)= 0.0973

2

Valor encontrado en la tabla de Z
_
c) Z 
X u


22  20
n
2
 2,83
4

P( X  22)  P( Z  2,83)  0.0023
DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON σ2 DESCONOCIDA
En caso de que se desconozca σ2 entonces la distribución muestral puede
calcularse:
T 
X 
Sn
n 1
Cuya distribución es t con n-1 grados de libertad en caso de muestra
pequeña
DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
n variables dicotómicas: X1, X2, ..., Xn tiene como
E(xi)=ρ
y σ2=ρ(1-ρ) y donde
n
será X=X1+X2+ + + + Xn=  X i y su
i 1
proporción será
P=X/n
NOTA: Cuando se vaya a tomar los valores dado y la proporción dada se
pueden diferenciar el valor esperado y la varianza a través de las
siguientes expresiones
VALORES DADO DE X
PROPORCION DADA P
E(X)=nρ
E(P)=ρ
131
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
 (1   )
 2P 
n
 =nρ(1-ρ)
2
NOTA
Parámetros estadísticos de una distribución muestral de las proporciones
de tamaño n:
Una distribución muestral de las proporciones se comporta como una
distribución normal descrita por los parámetros N
EJEMPLO 3.14
Cuál es el valor esperado y la varianza entre 3 estudiantes de derecho de
la UCEVA de primer semestre si se sabe que el 20% no les gusta las
matemáticas por tener contenidos difíciles contestar
a) Encontrar el valor esperado y la varianza sise toma un estudiante al
azar
b) Cual su proporción si resulto uno de los tres que no les gustaba
matematicas
c) Encontrar el valor esperado y la varianza entre los tres estudiantes Y
LA PROPORCION de su valor esperado y la varianza con respecto al no
gustarle las matemáticas
y  2 =nρ(1-ρ)= 1*0.2(0.8)=0.16
a) E=(X)=nρ=1*(0.2)=0.2
b) P=1/3= 0.33
C) E(X ) = nρ = 3(0,2) = 0,6 Y  2 =nρ(1-ρ)=3*0.2(0.8)=0.48
E(P)=ρ=0.2
132
y  2P 
 (1   )
n
=0.2*0.8/3=0.05
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
 =nρ(1-ρ)=3*0.2(1-0.2)=0.16
2
EJEMPLO 3.15
Suponga que se tiene un lote de 12 piezas, las cuales 4 son
defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin
reemplazo. Genere la distribución muestral de proporciones para el
número de piezas defectuosas.
SOLUCION
Como se puede observar en este ejercicio la Proporción de artículos
defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que
el 33% de las piezas de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población
de 12 elementos es 12C5=792, las cuales se pueden desglosar de la
siguiente manera:
ARTICULOS ARTICULOS PROPORCION
DE ARTICULOS
BUENOS
MALOS
DEFECTUOSOS
Nro DE MANERAS
QUE SE PUEDE
OBTENER
UNA
MUESTRA
1
4
0.8
8
2
3
0.6
112
3
2
0.4
336
4
1
0.2
280
5
0
0
56
INDIQUE COMO SE OBTUVIERON LOS RESULTADOS DE LA COLUMNA 3 Y
4
VERIFIQUE QUE
133
a)  p
b)
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
 0.3333
 p  0.1681
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS
Partamos de
media
1
que se tienen dos poblaciones distintas, la primera con
y desviación estándar
1,
y la segunda con media
2y
desviación estándar
2. Ahora bien si elegimos una muestra aleatoria de
tamaño n1 de la primera población y una muestra independiente aleatoria
de tamaño n2 de la segunda población; se calcula la media muestral para
cada muestra y la diferencia entre dichas medias. La colección de todas
esas diferencias se llama distribución muestral de las diferencias entre
medias o la distribución muestral del estadístico
Ahora debemos recordar que la distribución es aproximadamente normal
para n1 30 y n2 30. Si las poblaciones son normales, se puede deducir
que la distribución muestral de medias es normal sin importar los
tamaños de las muestras.
En anteriores ejercicios del texto
que
,por lo que no es difícil deducir que
y que
134
se había demostrado que
.
y
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La fórmula que se utilizará para el cálculo de probabilidad del estadístico
de diferencia de medias es:
EJEMPLO 3.16:
En un estudio para comparar los pesos promedio de niños y niñas de
sexto grado en una escuela primaria ANTONIO JOSE DE SUCRE se
usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que
tanto para niños como para niñas los pesos siguen una distribución
normal. El promedio de los pesos de todos los niños de sexto grado de
esa escuela es de 105 libras y su desviación estándar es de 14.152,
mientras que el promedio de los pesos de todas las niñas del sexto grado
de esa escuela es de 90 libras y su desviación estándar es de 12.257
libras. Si
representa el promedio de los pesos de 20 niños y es el
promedio de los pesos de una muestra de 25 niñas, encuentre la
probabilidad de que el promedio de los pesos de los 20 niños sea al
menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
1=
2
105 libras
= 90 libras
1=
14.142 libras
2=
12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
135
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
20  (105  90)
z
(14.142) 2 (12.457) 2

20
2
 1.25
Por lo tanto, la probabilidad de que el promedio de los pesos de la
muestra de niños sea al menos 20 libras más grande que el de la muestra
de las niñas es 0.1056.
EJEMPLO:3.17
Uno de los principales fabricantes de celulares compra simcard a dos
compañías. Las simcard de la compañía A tienen una vida media de 7.2
años con una desviación estándar de 0.8 años, mientras que los de la B
tienen una vida media de 6.7 años con una desviación estándar de 0.7.
Determine la probabilidad de que una muestra aleatoria de 34 simcard de
la compañía A tenga una vida promedio de al menos un año más que la
de una muestra aleatoria de 40 simcard de la compañía B.
Solución:
Datos:
A=
B
7.2 años
= 6.7 años
A=
0.8 años
B=
0.7 años
nA = 34 simcard
nB = 40 simcard
136
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
=?
EJEMPLO 3.18
Se prueba el rendimiento en km/L de 2 tipos de ETANOL , encontrándose
una desviación estándar de 1.23km/L para el primer etanol y una
desviación estándar de 1.37km/L para el segundo etanol; se prueba el
primer etanol en 35 autos y el segundo en 42 autos.
a. ¿Cuál es la probabilidad de que el primer etanol de un rendimiento
promedio mayor de 0.45km/L que el segundo etanol?
b. ¿Cuál es la probabilidad de que la diferencia en rendimientos
promedio se encuentre entre 0.65 y 0.83km/L a favor del primer
etanol?.
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en
ninguna de las dos poblaciones, por lo que se supondrán que son iguales.
Datos:
1=
1.23 Km/Lto
2=
1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.
137
=?
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
b.
?
La probabilidad de que la diferencia en rendimientos promedio en las
muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1
es de 0.0117.
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE PROPORCIONES
Muchas aplicaciones involucran poblaciones de datos cualitativos que
deben compararse utilizando proporciones o porcentajes. A continuación
se citan algunos ejemplos:

138
Educación.- ¿Es mayor la proporción de los estudiantes que
aprueban matemáticas que las de los que aprueban Estadística?

TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Medicina.- ¿Es menor el porcentaje de los usuarios del
medicamento X que presentan una reacción adversa que el de los
usuarios del fármaco Y que también presentan una reacción de ese
tipo?

Administración.- ¿Hay diferencia entre los porcentajes de hombres
y mujeres en puestos administrativos.

Ingeniería.- ¿Existe diferencia entre la proporción de artículos
defectuosos que produce la máquina X a los que genera la
máquina Y?
Cuando el muestreo proviene de dos poblaciones binomiales y se trabaja
con dos proporciones muestrales, la distribución muestral de diferencia de
proporciones es aproximadamente normal para tamaños de muestra
grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2 tienen
distribuciones muestrales aproximadamente normales, así que su
diferencia p1-p2 también tiene una distribución muestral aproximadamente
normal.
Cuando se estudió a la distribución muestral de proporciones se
comprobó que
que
y que
y que
, por lo que no es difícil deducir
.
La fórmula que se utilizará para el cálculo de probabilidad del estadístico
de diferencia de proporciones es:
139
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 3.19
Los hombres y mujeres adultos radicados en Tulua difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas
culpables de violación de niños. Se cree que el 12% de los hombres
adultos están a favor de la pena de muerte, mientras que sólo 10% de las
mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de
muerte, determine la probabilidad de que el porcentaje de hombres a
favor sea al menos 3% mayor que el de las mujeres.
Solución:
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM
0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser
una distribución binomial y se está utilizando la distribución normal.
140
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Se concluye que la probabilidad de que el porcentaje de hombres a favor
de la pena de muerte, al menos 3% mayor que el de mujeres es de
0.4562.
EJEMPLO 3.20
Una encuesta realizada por la sutev constó de 320 docentes del Valle
del cauca fueron despedidos entre 2006 y 2011, encontró que 20%
habían estado sin trabajo durante por lo menos dos años. Supóngase que
tuviera que seleccionar otra muestra aleatoria de 320 docentes de entre
todos los empleados despedidos entre 2006 y 2011. ¿Cuál sería la
probabilidad de que su porcentaje muestral de docentes sin empleo
durante por lo menos dos años, difiera del porcentaje obtenido en la
encuesta de la sutev , en 5% o más?
Solución:
En este ejercicio se tiene únicamente una población, de la cual se están
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia
de los porcentajes en esas dos muestras, por lo que se debe de utilizar la
distribución muestral de proporciones con P1= P2, ya que es una misma
población.
Otra de las situaciones con la cual nos topamos es que desconocemos la
proporción de trabajadores despedidos entre 2006 y 2011 que estuvieron
desempleados por un período de por lo menos dos años, sólo se conoce
la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó
esa proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo
de probabilidad se debe saber las proporciones de las poblaciones, las
cuales en este ejercicio las desconocemos, por lo que se utilizará el valor
de 0.20 como una estimación puntual de P. En el siguiente tema se
abordará el tema de estimación estadística y se comprenderá el porque
estamos utilizando de esa manera el dato.
141
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
También debe de comprenderse la pregunta que nos hace este problema,
¿cuál sería la probabilidad de que su porcentaje muestral de trabajadores
sin empleo durante por lo menos dos años, difiera del porcentaje
obtenido en la encuesta dela sutev, en 5% o más?, la
palabra difiera quiere decir que puede existir una diferencia a favor de la
muestra uno, o a favor de la muestra dos, por lo que se tendrán que
calcular dos áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P 2
La probabilidad de que su proporción muestral de trabajadores sin
empleo durante por lo menos dos años, difiera del porcentaje obtenido en
la encuesta realizada por la sutev, en 0.05 o más es de 0.1260.
142
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
EJEMPLO 3.21
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son
defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son
defectuosos; se toman muestras de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos
defectuosos de la máquina 2 rebase a la máquina 1 en por lo
menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos
defectuosos de la máquina 1 rebase a la máquina 2 en por lo
menos 0.15?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a. p(p2-p1 0.10) = ?
Otra manera de hacer este ejercicio es poner P1-P2:
143
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La probabilidad de que exista una diferencia de proporciones de artículos
defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.
b. p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos
defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.
DISTRIBUCIÓN MUESTRAL DE NÚMERO DE DEFECTOS
Cuando el mundo globalizado
se habla de ontrol de calidad y
específicamente en los gráficos de control "c" se aplica esta distribución,
la cual consiste en que al extraer un artículo contabilicemos el número de
defectos que tiene ese artículo.
Esta distribución muestral proviene de la distribución de Poisson, en la
cual le media es
144
y que en este caso es el número promedio de defectos
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
por unidad. Como ya es conocido la varianza de la distribución de Poisson
es igual a
manera:
por lo que se puede deducir la formula de la siguiente
Para la distribución muestral de número de defectos la nomenclatura
utilizada es:
c = número defectos por unidad de inspección
C = número de defectos promedio por unidad de inspección
Se debe de recordar que la distribución de Poisson es una distribución
discreta, y se esta utilizando la aproximación de la normal a la Poisson,
debiendo aplicar el factor de corrección de ± 0.5 según sea el caso. La
formula para la dsitribución muestral de número de defectos quedaría de
la siguiente manera:
EJEMPLO 3.22
En cierta empresa se fabrican productos con un promedio de 8 defectos
por unidad. Determine la probabilidad de que el próximo producto
inspeccionado tenga un número de defectos:
a. Mayor o igual a 6
b. Exactamente 7
c. Como máximo 9
a.
145
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La probabilidad de que el siguiente producto inspeccionado tenga por lo
menos 6 defectos es de 0.8106.
b.
La probabilidad de que el siguiente producto inspeccionado tenga
exactamente 7 defectos es de 0.1344.
c.
146
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
La probabilidad de que el siguiente producto inspeccionado tenga a lo
más 9 defectos es de 0.7019.
EJERCICIO DE REPASO CAPITULO III
1) Realiza 5 preguntas posibles de un cuestionario individual.
2)
Realiza 5 preguntas cerradas de una investigación
hacer.
que pienses
3) Enuncia 5 preguntas abiertas de una investigación que pienses hacer.
4) Realice 2 preguntas correspondientes a cada tipo de pregunta
. Preguntas de identificación:
. Preguntas de hecho:
. Pregunta de acción:
. Preguntas de información:
. Preguntas de intención:
. Preguntas de opinión:
. Pregunta filtro:
. Preguntas trampa o de control:
. Preguntas de introducción ó rompe hielo:
. Preguntas muelle, colchón o amortiguadores:
. Preguntas en batería:
. Preguntas de embudo:
5) En el barrio Belén de Cali se quiere hacer un estudio para conocer
mejor el tipo de actividades de ocio que gustan más a sus habitantes.
Para ello van a ser encuestados 100 individuos elegidos al azar.
1. Explicar qué procedimiento de selección sería más adecuado utilizar:
muestreo con o sin reposición. ¿Por qué?
2. Como los gustos cambian con la edad y se sabe que en el barrio Belén
de Cali viven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormente
se decide elegir la muestra anterior utilizando un muestreo estratificado.
147
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Determinar el tamaño muestral correspondiente a cada estrato. R/ 25
niños; 70 adultos; 25 ancianos
3. Suponga que una compañía de servicio de televisión por cable está
pensando en prestar el servicio al barrio belén y para ello; la compañía
planea realizar un estudio para determinar el porcentaje de familias de
dicho barrio que utilizarían sus servicios, como no es práctico preguntar
en cada casa. Qué tipo de muestreo recomienda
6) La variable altura de las alumnas que estudian en la facultad de
idiomas de la UCEVA sigue una distribución normal de media 1,62 m y la
desviación típica 0,12 m. ¿Cuál es la probabilidad de que la media de una
muestra aleatoria de 100 alumnas sea mayor que 1.60 m? 95.15%
7) Se ha tomado una muestra de los precios de un mismo producto
alimenticio en 16 graneros de Tulua, elegidos al azar, y se han
encontrado los siguientes precios:
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribuyen según una ley
normal de varianza 25 y media desconocida:
1. ¿Cuál es la distribución de la media muestral? R/ 104
2. Determine el intervalo de confianza, al 95%, para la media poblacional.
R/ (101.55; 106.45)
8. La media de las estaturas de una muestra aleatoria de 400 personas
de Andalucía Valle es 1,75 m. Se sabe que la estatura de las personas de
ese Pueblo es una variable aleatoria que sigue una distribución normal
con varianza σ2 = 0,16 m2.
1. Construye un intervalo, de un 95% de confianza, para la media de las
estaturas de la población/ (1.7108, 1.7892)
2. ¿Cuál sería el mínimo tamaño muestral necesario para que pueda
decirse que la verdadera media de las estaturas está a menos de 2 cm de
la media muestral, con un nivel de confianza del 90%? R/ La muestra
debe tener al menos 1083 personas.
9. Las ventas mensuales de una tienda de electrodomésticos en las islas
canarias se distribuyen según una ley normal, con desviación típica 900
€. En un estudio estadístico de las ventas realizadas en los últimos nueve
meses, se ha encontrado un intervalo de confianza para la media mensual
de las ventas, cuyos extremos son 4 663 € y 5 839 €.
148
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
1. ¿Cuál ha sido la media de las ventas en estos nueve meses? R/
x=5251
2. ¿Cuál es el nivel de confianza para este intervalo? R/95%
10) Se desea estimar la proporción, p, de individuos daltónicos de una
población a través del porcentaje observado en una muestra aleatoria de
individuos, de tamaño n.
1. Si el porcentaje de docentes daltónicos de Tulua determinan una
muestra igual al 30%, calcula el valor de n para que, con un nivel de
confianza de 0,95, el error cometido en la estimación sea inferior al
3,1%.R// Al menos 840 individuos.
2. Si el tamaño de la muestra es de 64 docentes, y el porcentaje de
docentes daltónicos en la muestra es del 35%, determina, usando un
nivel de significación del 1%, el correspondiente intervalo de confianza
para la proporción de daltónicos de la población. R/(0,196 , 0.504)
11) En una población adulta con una variable aleatoria sigue una ley
normal de media desconocida y desviación típica 2.
1. Observada una muestra de tamaño 400, tomada al azar, se ha
obtenido una media muestra al igual a 50. ¿Calcule un intervalo, con el 97
% de confianza, para la media de la población. (49.783, 50.217)
2. Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la
muestra para qué la amplitud del intervalo que se obtenga sea, como
máximo, 1? Sugerencia tome E=0.5 R/ n  76
12) En el comercial la herradura de Tulua trabajan 150 personas en el
departamento de personal, 450 en el departamento de ventas, 200 en el
departamento de contabilidad y 100 departamentos de atención al cliente.
Con objeto de realizar una encuesta laboral, se quiere seleccionar una
muestra de 180 trabajadores.
1. ¿Qué tipo de muestreo deberíamos utilizar para la selección de la
muestra si queremos que incluya a trabajadores de los cuatro
departamentos mencionados?
2. ¿Qué número de trabajadores tendríamos que seleccionar en cada
departamento atendiendo a un criterio de proporcionalidad? R/30 de
personal, 90 de ventas ,40 de contabilidad
13) La ciencia ha determinado que La cantidad de hemoglobina en sangre
del hombre sigue una ley normal con una desviación típica de 2g/dl.
149
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
Calcule el nivel de confianza de una muestra de 12 extracciones de
sangre que indique que la media poblacional de hemoglobina en sangre
está entre 13 y 15 g/dl. R/ 91.64%
14) En una fábrica de componentes electrónicos, la proporción de
componentes finales defectuosos era del 20%. Tras una serie de
operaciones e inversiones destinadas a mejorar el rendimiento se analizó
una muestra aleatoria de 500 componentes, encontrándose que 90 de
ellos eran defectuosos. ¿Qué nivel de confianza debe adoptarse para
aceptar que el rendimiento no ha sufrido variaciones? R/73.72%
15) Supongamos que se desea realizar una encuesta sobre la brucelosis
ovina en Barragan . Se estima una prevalencia del 15% y se requiere un
5% de precisión sobre una población de 2.000.000 de cabezas. El nivel
de confianza se fija en el 95%. Determinar el tamaño de la muestra
necesario para dicha encuesta. R/ 196
16) La media de edad de los alumnos que se presentan a pruebas de
ingreso a la Uceva es de 18,1 años, y la desviación típica 0,6 años.
a) De los alumnos anteriores se elige, al azar, una muestra de 100. ¿ Cuál
es la probabilidad de que la media de la edad de la muestra esté
comprendida entre 17,9 y 18,2 años?. R/95.21%
b) ¿Qué tamaño debe tener una muestra de dicha población para que su
media esté comprendida entre 17,9 y 18,3 años, con una confianza del
99,5%? R/ 72 personas
17) Las medidas de los diámetros de una muestra tomada al azar, de 200
cojinetes de bolas, hechos por una determinada máquina en la litografía
franciscos, dieron una media de 2 cm y una desviación típica de 0,1 cm.
Hallar los intervalos de confianza del :

68,26%
R/
Z  1
(1,993,:2.007)
2

95,44%
R/
Z  2
(1.986 , 2,014)
2

99,73%
R/ (1.979; 2.021)
Para el diámetro de todos los cojinetes.
18) El Ingeniero de control de calidad de la fábrica de focos necesita
estimar la vida promedio de un gran embarque. Se sabe que la desviación
150
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
estándar del proceso es de 100 horas. Una muestra aleatoria de 50 focos
mostró una vida promedio de 350 horas. Estime un intervalo de confianza
del 95% de vida promedio real de los focos en este embarque R/ (322.27;
377.72) La vida promedio real de los focos se encuentra entre 322.67 y
377.72 horas
19) Supongamos que un curso exitoso d estadística 35 de 42 alumnos
aprueban estadística. Estime un intervalo de confianza para la proporción
de la población del 5%.R/ (0.71; 0.94) es el intervalo de confianza para la
proporción, es decir que entre el 71% y 94% aprobaron el examen, con un
nivel de confianza del 95%
20) Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ =
35 g. Las bolsas se empaquetaron en cajas de 100 unidades..Calcular la
probabilidad de que la media de los pesos de las bolsas de un paquete
sea menor que 495 g. R/7.64%
21) Calcule el tamaño muestral de una encuesta realizada por UCEVA
sobre que se conoce del decreto 1030 de la reforma si el error teórico era
de + 2, con un intervalo de confianza de 95,5% y P=Q en el supuesto de
un muestreo aleatorio simple. R/2500
22) Los siguientes datos son los puntajes obtenidos para 45 personas de
una escala de depresión (mayor puntaje significa mayor depresión).
2
5
6
8
8
9
9
10
11
11
11
13
13
14
14
14
14
14
14
15
15
16
16
16
16
16
16
16
16
17
17
17
18
18
18
19
19
19
19
19
19
19
19
20
20
Construir un intervalo de confianza para el puntaje promedio poblacional
R/ Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el
puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una
confianza 95%.
23) Supongamos que se plantea la hipótesis de que el promedio de peso
de nacimiento la marina es igual a la media nacional de 3250 gramos.Al
tomar una muestra de 30 recién nacidos de la población en estudio, se
obtuvo:
151
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
= 2930
s= 450
n= 30
Construir un intervalo de 95% de confianza para la media poblacional
R/ Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una
confianza de 95%.
Como el intervalo no incluye el valor =3250 gramos planteado en la
hipótesis, entonces esta es rechazada con confianza 95% (o un valor p
menor a 0,5).
24) La nota de una prueba de aptitud siguen una distribución normal con
desviación típica 28,2. Una muestra aleatoria de nueve alumnos arroja los
resultados siguientes:
N
n=9
X
I 1
I
 1098
9
X
2
I
 138148
I 1
a) Hallar un intervalo de confianza al 90% para la media poblacional μ
R/106.5<μ<137.5
b) ¿Cuál será el tamaño de muestra mínimo necesario para obtener un
intervalo al
90% de nivel de confianza, con longitud 10? (la longitud del intervalo es la
diferencia entre sus extremos).R/ 866
25 Una empresa tiene 6.100 empleados se quiere determinar cómo
es el clima laboral en la empresa, usando una confiabilidad del 95%.
un error admisible de 6% y considerando que la proporción de
empleados no satisfechos es del 30%. Calcule el número de
empleados a consultar. si se tiene en cuenta además. que se tienen
diferentes categorías de empleados que pueden influir en la opinión
de los trabajadores. Se adicionó la siguiente información con
respecto al número de trabajadores: Contabilidad y Costos 80
empleados, Administración 150. Operativos 5.600, seguridad 180 y
otros cargos 90. R/216
26. La puntuación promedio de una muestra de 20 jueces de gimnasia
rítmica, elegidos al azar, para una misma prueba presentó una media de
9,8525 y una cuasi desviación típica muestral de 0,0965. Calcular un
intervalo de confianza con un 95% para la nota media. (Se sobreentiende
152
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
que la puntuación de la prueba sigue una distribución normal) R/ 9.807
9897
27 Un entrenador de fútbol está interesado en estimar, con un 99% de
confianza, la fuerza máxima de los músculos cuadriceps de los futbolistas.
Admitiendo que dicha fuerza sigue una distribución normal, selecciona al
azar una muestra de 25 futbolistas, para la que obtuvo una media de 85
Nw y una cuasivarianza de 144. Determinar un intervalo de confianza
para la media .R/ 78287 91713
28 En una encuesta hecha por los alumnos y alumnas de un Instituto a un
total de 100 votantes elegidos al azar en su Ayuntamiento, se indica que
el 55% volvería a votar por el alcalde actual. Calcular un intervalo de
confianza al 99% para la proporción de votantes favorables al alcalde
actual. R/= (0,422 , 0,677)
29 ¿Cuáles deben ser los tamaños muestrales en el sondeo del problema
anterior para tener, con los mismos niveles de confianza, la certeza de
que el alcalde actual salga reelegido por mayoría absoluta, en el caso de
arrojar la encuesta los mismos resultados/ n>891.
30. En una encuesta a 360 alumnos de un centro, elegidos al azar,
resultaron 190 a favor de la política del actual equipo directivo. ¿Cuál es
el intervalo de confianza, con nivel del 95%, para la proporción de
alumnos que apoyan a esta dirección R/ (,04762 , 0, 5794)
31 Se lanza una moneda 100 veces y se obtienen 62 cruces. ¿Cuál es el
intervalo de confianza para la proporción de cruces con un 99% de nivel
de confianza?
R/ (0,495, 0, 745)
32. Para estimar el número de ranas que hay en un estanque procedemos
a pescar cierta cantidad, 30, y las marcamos con un anillo, devolviéndolas
al estanque. Transcurridos unos días volvemos a pescar otro montón y
observamos qué proporción están marcadas con la anilla. Es esta última
pesca obtenemos 100 ranas de las que 7 están marcadas. Calcular un
intervalo al 99% de confianza para la proporción de ranas marcadas.
R/(0,02816 0,11184)
33 - En una muestra de 65 sujetos las puntuaciones en una escala de
extroversión tienen una media de 32,7 puntos y una desviación típica de
12,64.
153
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
a) Calcule a partir de estos datos el correspondiente intervalo de
confianza, a un nivel del 90%, para la media de la población. R/( 30,06 ,
35,34 )
b) Indique, con un nivel de confianza del 95%, cuál sería el máximo error
que podríamos cometer al tomar como media de la población el valor
obtenido en la estimación puntual. R/luego el máximo error que se puede
cometer, a este nivel de confianza, es: 3,16
34. En una muestra de 300 universitarios el 80% ha respondido que asiste
semanalmente al cine. Entre que valores se encuentra, con un nivel de
confianza del 95%, la proporción de universitarios que acude todas las
semanas al cine.
R/( 0,755 ,, 0,845 )
35. El índice de resistencia a la rotura, expresado en kg, de un
determinado tipo de cuerda sigue una distribución Normal con desviación
típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al
azar, se obtuvieron los siguientes índices: 280, 240, 270, 285, 270.
a) Obtenga un intervalo de confianza para la media del índice de
resistencia a la rotura de este tipo de cuerdas, utilizando un nivel de
confianza del 95%. R/ (255,326 282,674)
b) Si, con el mismo nivel de confianza, se desea obtener un error máximo
en la estimación de la media de 5 kg, ¿será suficiente con elegir una
muestra de 30 cuerdas? R/ 38 cuerdas
36. Un fabricante de pilas alcalinas sabe que el tiempo de duración, en
horas, de las pilas que fabrica sigue una distribución Normal de media
desconocida y varianza 3 600. Con una muestra de su producción,
elegida al azar, y un nivel de confianza del 95 % ha obtenido para la
media el intervalo de confianza (372,6; 392,2). Calcule el valor que obtuvo
para la media de la muestra y el tamaño muestral utilizado. R/ media
382,4 y n =144
37. En un hospital se ha tomado la temperatura a una muestra de 64
pacientes para estimar la temperatura media de sus enfermos. La media
de la muestra ha sido 37,1 ºC y se sabe que la desviación típica de toda la
población es 1,04 ºC.
a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
R/(36.89; 37,31)
154
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
b) ¿Con qué nivel de confianza podemos afirmar que la media de la
población está comprendida entre 36,8ºC y 37,4 ºC? R/97,92%
SUGERENCIA no olvidar formula de la longitud
38. Se sabe que los estudiantes del Huila duermen un número de horas
diarias que se distribuye según una ley Normal de media µ horas y
desviación típica σ =2 horas.
a) A partir de una muestra de 64 alumnos se ha obtenido el siguiente
intervalo de confianza (7.26, 8.14) para la media de la población.
Determine el nivel de confianza con que se ha construido dicho intervalo.
R/ 92.16% SUGERENCIA φ(Zα/2)=1-α y la formula de amplitud
b) Determine el tamaño muestral mínimo necesario para que el error que
se cometa al estimar la media de la población por un intervalo de
confianza sea, como máximo, de 0.75 horas, con un nivel de confianza
del 98 %
39) Para controlar la calidad de los exámenes complementarios
realizados en un laboratorio clínico, el jefe de laboratorio decide repetir
personalmente la prueba a 10 de las 250 extracciones de sangre
realizadas ese día. Cuál es el número entero que representa al intervalo
de selección si se realiza un muestreo sistemático R/ 25
40) Se asigna un número diferente a cada elemento del Universo y se
seleccionan los que integrarán la muestra por medio de una Tabla de
números aleatorios o por fichas numeradas que se extraen de un
bombo.
41) el jefe de laboratorio Ángel para controlar la calidad de los exámenes
complementarios realizados en su laboratorio clínico, decide repetir
personalmente la prueba a 10 de las 250 extracciones de sangre
realizadas ese día.
N = 250 n =10 k =250/10 =25
Se escoge como punto de arranque cualquier número entero entre 1 y 25
para inicial la selección. Supongamos que se escoge el 8, la muestra
quedará entonces integrada por las extracciones número: 8; 33; 58; 83;
108; 133; 158; 183; 208 y 233.¿Que tipo de muestreo se aplico?
42) En una campaña contra el tabaquismo se quiere determinar la
proporción de fumadores entre los pobladores de una comunidad, según
el sexo. Se fijó que el tamaño de la muestra debe ser de 300 individuos.
Si las mujeres representan el 55% de los habitantes y por tanto los
155
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
hombres el 45% restante, se escogerían al azar para integrar la muestra
un total de 165 mujeres y 135 hombres. Ellos representan el 55% y el
45% respectivamente de 300.Que tipo de muestreo es el más adecuado
para determinar la proporción.
43) El ministerio de salud de Colombia para identificar los factores de
riesgo vulnerables de la enfermedad ateroesclerótica en los trabajadores
agrícolas de Barragán, se seleccionan aleatoriamente un número de
cooperativas de producción agropecuaria y se estudian a todos los
trabajadores de dichos centros. Para seleccionar las cooperativas cual es
método de muestreo más aconsejable.
44) Entre 8 alumnos de la escuela matechana se pretende realizar 5
pruebas de velocidad lectora eligiendo cada vez al azar a uno de ellos. No
tenemos ningún inconveniente en que un alumno pueda ser elegido más
de una vez para realizar la prueba, por lo que vamos a realizar un
muestreo aleatorio simple con reposición. a) ¿Cuántas muestras
ordenadas posibles existen? R/ 32768 ¿Qué probabilidad se asocia a
cada una de ellas? R/ 0.0000305. ¿Qué probabilidad tenemos de que la
muestra esté constituida por alumnos que se encuentran entre los 5 de
mejor nivel en el área de lenguaje? R/0.0000305
45) A partir del listado alfabético de los 500 alumnos matriculados en la
universidad, se le pide a Bienestar universitario que construya una
muestra de 30 alumnos utilizando el procedimiento de muestreo aleatorio
sistemático. ¿Qué alumnos debo incluir en la muestra R Una de las
posibles respuestas es 1, 18, 35, 52, hasta 485
46) Queremos extraer una muestra compuesta de 20 centros de
Enseñanza de Cali respetando la estructura que presenta la población
respecto a la característica público-privado. Sabemos que de los 225
centros existentes en esta ciudad, 201 son públicos y 24 de titularidad
privada. ¿Cuántas elegiremos de cada tipo si realizamos un muestreo
estratificado con asignación constante? R/10 y 10 públicos y 2 privados
¿Y con asignación proporcional? R/ 18 y 20
47) Entre los 8 alumnos de la zona rural de Santa Lucia se pretende elegir
a 5 alumnos con el fin de medir su velocidad lectora. Para evitar que el
profesor del aula trate de que sus alumnos obtengan un buen resultado y,
para ello, nos proponga a los 5 alumnos que mejores calificaciones suelen
obtener en el área de lenguaje, vamos a realizar un muestreo aleatorio
simple sin reposición, ¿Cuántas muestras ordenadas posibles existen?
R/6720 ¿Qué probabilidad se asocia a cada una de ellas? R/ 0,01488%
156
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
¿Qué probabilidad tenemos de que la muestra, en contra de lo que
pretendíamos, esté constituida por los 5 alumnos de mejor nivel en el área
de lenguaje? R/ 1,786%
48) Los datos presentados a continuación son los puntajes obtenidos
para 45 personas de una escala de depresión (mayor puntaje significa
mayor depresión).
2
11
14
16
19
5
11
15
16
19
6
13
15
17
19
8
13
16
17
19
8
14
16
17
19
9
14
16
18
19
9
14
16
18
19
10
14
16
18
20
11
14
16
19
20
Para construir un intervalo de confianza para el puntaje promedio
poblacional, asumamos que los datos tienen distribución normal, con
varianza poblacional
desconocida., Encontrar, un intervalo de
confianza R/ el intervalo de confianza para es (13,2, 15,8). Es decir, el
puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una
confianza 95%.
49) En el 2012 la Unidad Central del valle tiene 5453 estudiantes, en la
tabla se muestra un detalle de la composición. Necesitamos una muestra
de tamaño 20 de la población de estudiantes:
PREGRADO
POSGRADO
TOTAL
MUJERES
2461
67
2528
HOMBRES
2848
77
2925
TOTAL
5309
144
5453
Elija muestras de tamaño 20 para 2 tipos de muestreo:
a. Muestreo Aleatorio Simple.
b. Muestreo Aleatorio Estratificado.
50) Una compañía de marketing saca una muestra aleatoria de la guía de
teléfonos tomando 10 personas cuyos apellidos comiencen con letra A,
10 personas cuyos apellidos comiencen con la letra B, y así
sucesivamente con cada letra del alfabeto, para una muestra total de 260
personas.
a. ¿Qué clase de diseño muestral se usó aquí? b. ¿Tienen todos los que
están en la guía de teléfonos igual posibilidad de ser elegidos en la
muestra?
157
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
51) En el centro de Tulua hay dos semáforos consecutivos de modo que
2.5 minutos después de que el primero se ponga verde se pone rojo el
segundo. Ambos se cierran cada 2 minutos, permaneciendo cerrados 30
segundos. Un conductor se ha detenido en el primero y el tiempo en
recorren la distancia entre ambos semáforos es de (1,4). ¿Cuál es la
probabilidad de que se pare en el segundo? R/0.166 %
62) Indicar que tipo de muestreo se aplico en cada uno de los siguientes
enunciados
a) Suponga que nos interesa obtener una muestra de las opiniones de los
profesores de una gran universidad
b) Suponga que una compañía de servicio de televisión por cable está
pensando en abrir una sucursal en una ciudad grande; la compañía
planea realizar un estudio para determinar el porcentaje de familias que
utilizarían sus servicios, como no es práctico preguntar en cada casa, la
empresa decide seleccionar una parte de la ciudad al azar
c) Para obtener una muestra de suscriptores telefónicos en una ciudad
grande, puede obtenerse primero una muestra aleatoria de los números
de las páginas del directorio telefónico; al elegir el vigésimo nombre de
cada página obtendríamos un muestreo sistemático, también podemos
escoger un nombre de la primera página del directorio y después
seleccionar cada nombre del lugar número cien a partir del ya
seleccionado. Por ejemplo, podríamos seleccionar un número al azar
entre los primeros 100; supongamos que el elegido es el 40, entonces
seleccionamos los nombres del directorio que corresponden a los
números 40, 140, 240, 340 y así sucesivamente.
63) COMPLETAR
a) La distribución de frecuencia de un estadístico muestral se
denomina __________________________. En general, la distribución
muestral de un estadístico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamaño.
b) Suponga que se han seleccionado muestras aleatorias de tamaño 20
en una población grande. Se calcula la media muestral x para cada
muestra; la colección de todas estas medias muestrales recibe el nombre
de_________________________________________,
c) Mientras mayor sea el tamaño de la muestra, más cerca estará la
distribución muestral de ser ____________________________
158
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
64)Se sabe que la resistencia a la ruptura de cierto tipo de cadena se
distribuye normalmente con media de 2000 libras y una varianza de
25,000 lbs Si se selecciona una muestra aleatoria de 100 cuerdas;
determine la probabilidadde que en esa muestra:
a) La resistencia media encontrada sea de por lo menos 1958 libras.
R/99.60%
b) La resistencia media se mayor de 2080 libras. R/0
65). Como parte de un proyecto general de mejoramiento de la calidad, el
fabricante textil Duke decide controlar el número de imperfecciones
encontradas en cada pieza de tela. Se estima que el número promedio de
imperfecciones por cada pieza de tela es de 12, determine la probabilidad
de que en la próxima pieza de tela fabricada se encuentren:
a) Entre 10 y 12 imperfecciones. R/
b) Menos de 9 y más de 15 imperfecciones.
66). En una prueba de aptitud la puntuación media de los estudiantes de
once de Tulua es de 72 puntos y la desviación estándar es de 8 puntos.
¿Cuál es la probabilidad de que dos grupos de estudiantes, formados de
28 y 36 estudiantes, respectivamente, difieran en su puntuación media en:
a) 3 ó más puntos. b) 6 o más puntos. c) Entre 2 y 5 puntos.
67). Un especialista en genética ha detectado que el 26% de los hombres
y el24% de las mujeres de cierta región de Colombia tiene un leve
desorden sanguíneo; si se toman muestras de 150 hombres y 150
mujeres, determine la probabilidad de que la diferencia muestral de
proporciones que tienen ese leve desorden sanguíneo sea.. de:
a) Menos de 0.035 a favor de los hombres.
b) Entre 0.01 y 0.04 a favor de los hombres.
70. La vida media de un computador es de siete años, con una
desviación estándar de un año. Suponga que las vidas de estas máquinas
siguen aproximadamente una distribución normal, encuentre:
a) La probabilidad de que la vida media de una muestra aleatoria de 9 de
estas máquinas caiga entre 6.4 y 7.2 años.
b) El valor de la media a la derecha del cual caería el 15% de las medias
calculadas de muestras aleatorias de tamaño nueve.
159
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
71). Se llevan a cabo dos experimentos independientes en lo que se
comparan dos tipos diferentes de pintura. Se pintan 18 especímenes con
el tipo A y en cada uno se registra el tiempo de secado en horas. Lo
mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la
población son ambas 1.0. Suponga que el tiempo medio de secado es
igual para los dos tipo de pintura. Encuentre la probabilidad de que la
diferencia de medias en el tiempo de secado sea mayor a uno a favor de
la pintura A.R/0.13%
72) Las estaturas de 1000 estudiantes de colegio Occidente de Tulua
están distribuidas aproximadamente en forma normal con una media de
174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se
extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta
población, determine: a) El número de las medias muestrales que caen
entre 172.5 y 175.8 centímetros.R/ 152 media muestrales b) El número
de medias muestrales que caen por debajo de 172 centímetros.R/ 7
medias muestrales
73) Un Jarabe para el malestar estomacal tiene la advertencia de que
algunos usuarios pueden presentar una reacción adversa a él, más aún,
se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una
muestra aleatoria de 150 personas con malestar estomacal usa el jarabe ,
encuentre la probabilidad de que la proporción de la muestra de los
usuarios que realmente presentan una reacción adversa, exceda el 4%.
a) Resolverlo mediante la aproximación de la normal a la binomial
R/p(x>6) = 0.1685. Este valor significa que existe una probabilidad del
17% de que al extraer una muestra de 150 personas, mas de 6
presentarán una reacción adversa.
b) Resolverlo con la distribución muestral de proporciones R/ existe una
probabilidad del 17% de que al tomar una muestrade 150 personas se
tenga una proporción mayor de 0.04 presentando una reacción adversa.
74) Se ha determinado que 60% de los estudiantes Uceva fuman
cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la
probabilidad de que la proporción de la muestra de la gente que fuma
cigarrillos sea menor que 0.55.Realizarlo por 2 métodos R//La
probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes,
menos de 440 fuman cigarrillos.
.
160
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR
LINKGRAFIA
http://www.bioestadistica.uma.es/libro/node78.htm
aprendeenlinea.udea.edu.co/lms/moodle/mod/.../view.php?...true...
http://www.vitutor.com/pro/2/a_h.html
http://www.vitutor.com/pro/2/a_a.html
http://www.uam.es/personal_pdi/psicologia/carmenx/Tema1.pdf
http://juancarlosvergara.50webs.org/Apuntes/Ejercicios%20Parte%20I.pdf
http://personal.telefonica.terra.es/web/pegonrui/tablas-estadisticas/tablasestadisticas.html
http://dta.utalca.cl/estadistica/ejercicios/recoger/Muestro/propuesto%20mu
estreo%20estra.pdf
http://sancur22ceapuntes.iespana.es/administracion/ceneval/operacionesy
metodos/02metodoscuantitativos/21pruebaship/pruebaship.htm
http://www.mitecnologico.com/Main/PotenciaDeLaPrueba
http://www.frasesypensamientos.com.ar/frases-de-estadistica.html
http://www.itch.edu.mx/academic/industrial/estadistica1/u0102.pdf
http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r51634.PDF
161