Download modulo estadistica ciclo v grado decimo

Document related concepts

Varianza wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Distribución t de Student wikipedia , lookup

Transcript
1
I.E.
CÁRDENAS CENTRO
MÓDULO DE ESTADÍSTICA
CICLO V
GRADO DÉCIMO
2
TABLA DE CONTENIDO
pág.
UNIDAD 1
1.
1.1.
1.2.
1.3.
1.4.
2.
3.
3.1.
3.2.
3.3.
POBLACIÓN, MUESTRA, VARIABLE ESTADÍSTICA: CUALITATIVA Y CUANTITATIVA
POBLACIÓN
LA MUESTRA
VARIABLE CUALITATIVA
VARIABLE CUANTITATIVA
ELABORACIÓN DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIA CON DATOS AGRUPADOS
GRÁFICOS ESTADÍSTICOS: HISTOGRAMA, POLÍGONO DE FRECUENCIAS, OJIVA
HISTOGRAMA
POLÍGONO DE FRECUENCIAS
OJIVA
4
4
4
4
4
4
5
5
5
5
UNIDAD 2
1.
1.1.
1.2.
1.3.
2.
2.1.
2.1.1.
2.1.2.
2.1.3.
2.2.
2.2.1.
2.3.
2.3.1.
2.3.2.
2.3.3.
2.4.
2.4.1.
2.4.2.
2.4.3.
3.
4.
4.1.
4.2.
MEDIDAS DE TENDENCIA CENTRAL CON DATOS AGRUPADOS: MEDIA ARITMÉTICA,
MEDIANA Y MODA
MEDIA PARA DATOS AGRUPADOS
MEDIANA PARA DATOS AGRUPADOS
LA MODA PARA DATOS AGRUPADOS
MEDIDAS DE DISPERSIÓN: RANGO, DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN TÍPICA
O ESTANDAR
RANGO
Rango para datos no agrupados
Rango para datos agrupados
Propiedades del Rango o Recorrido
DESVIACIÓN MEDIA
Propiedades
DESVIACIÓN TÍPICA
Cálculo de la desviación típica para datos no agrupados en clases
Cálculo de la desviación típica para datos agrupados en clases y agrupados por frecuencias
Propiedades
VARIANZA
Varianza para datos agrupados
Varianza para datos NO agrupados
Propiedades
ANÁLISIS DE RESULTADOS DE ENCUESTAS
NÚMERO ÍNDICE
APLICACIONES DE LOS NÚMEROS ÍNDICES
VENTAJAS DE LOS NÚMEROS ÍNDICES
EVALUACIÓN DE COMPETENCIAS
7
7
7
8
8
8
8
8
9
9
10
10
11
11
11
11
12
12
13
14
14
15
15
16
UNIDAD 3
1.
1.1.
TÉNICAS DE CONTEO
DIAGRAMA DE ÁRBOL
17
17
3
1.2.
1.3.
1.3.1.
1.3.2.
PRINCIPIO DE MULTIPLICACIÓN
COMBINACIONES Y PERMUTACIONES
Combinaciones
Permutaciones
17
18
18
18
EVALUACIÓN DE COMPETENCIAS
19
UNIDAD 4
1.
2.
3.
3.1.
3.1.1.
3.1.2.
3.1.3.
CONCEPTO DE PROBABILIDAD
ESPACIOS MUESTRALES
CÁLCULO DE PROBABILIDADES
INDEPENDENCIA DE EVENTOS
Sucesos Excluyentes
Sucesos Independientes
Sucesos Dependientes
20
20
20
21
21
21
21
EVALUACIÓN DE COMPETENCIAS
22
BIBLIOGRAFÍA
24
4
UNIDAD 1
1. POBLACIÓN, MUESTRA, VARIABLE ESTADÍSTICA: CUALITATIVA Y CUANTITATIVA
1.1. POBLACIÓN
número de hermanos, número de discos vendidos,
número de pulsaciones.
Ess
el
conjunto
de
individuos, con alguna
característica común, sobre el que se hace un
estudio estadístico.
Una variable estadística cuantitativa es continua
cuando puede tomar todos los valores posibles de un
intervalo (es decir, se puede medir). Por ejemplo:
peso, talla, medida del salto de longitud.
1.2. LA MUESTRA
Ess un subconjunto de la población, seleccionada de
modo que ponga de manifiesto las carac
características de
la misma, de ahí que la propiedad más importante de
las muestras es su representatividad.
El proceso seguido en la extracción de la muestra se
llama muestreo.
Cada uno de los aspectos que se desea conocer
acerca de la población se denomina
variable
estadística. Las variables estadísticas pueden ser:
2. ELABORACIÓN DE TABLAS DE DISTRIBUCIÓN
DE FRECUENCIA CON DATOS AGRUPADOS
Es aquella distribución en la que la disposición
tabular de los datos estadísticos se encuentran
ordenadoss en clases y con la frecuencia de cada
clase; es decir, los datos originales de varios valores
adyacentes del conjunto se combinan para formar un
intervalo de clase. No existen normas establecidas
para determinar cuándo es apropiado utilizar datos
agrupados
os o datos no agrupados; sin embargo, se
sugiere que cuando el número total de datos (N) es
igual o superior a 50 y además el rango o recorrido
de la serie de datos es mayor de 20, entonces, se
utilizará la distribución de frecuencia para datos
agrupados, también se utilizará este tipo de
distribución cuando se requiera elaborar gráficos
lineales como el histograma, el polígono de
frecuencia o la ojiva.
1.3. VARIABLE CUALITATIVA
Sii se pueden observar o leer, pero no se pueden
contar o medir. Por ejemplo: color de pelo, lugar de
nacimiento, profesión.
1.4. VARIABLE CUANTITATIVA
Si se pueden
eden contar o medir. Por ejemplo: número de
hermanos, peso, número de discos vendidos, talla.
Las variables estadísticas cuantitativas pueden ser
discretas o continuas:
Una variable estadística cuantitativa es discreta
cuando sólo toma un número finito de valores
aislados (es decir, se puede contar). Por ejemplo:
5
La razón fundamental para utilizar la distribución de
frecuencia de clases es proporcionar mejor
comunicación
cación acerca del patrón establecido en los
datos y facilitar la manipulación de los mismos. Los
datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la información
obtenida de una investigación sea manejable con
mayor facilidad.
sobre el eje OX, este será la base del rectángulo que
se dibuja sobre él con altura igual o proporcional a su
frecuencia absoluta. Como los intervalos son
consecutivos, los rectángulos quedan adosados. Si
se utilizaran rectángulos de amplitud diferente,
dif
el
área del rectángulo es la que tendría que ser
proporcional
a
la
frecuencia
absoluta
correspondiente a ese intervalo. Se utiliza el
histograma acumulativo, si se utiliza la frecuencia
absoluta acumulativa.
Ejemplo: Ejemplo, la siguiente tabla muestra las
notas que se sacaron 45 alumnos de un curso en su
última prueba:
Observa que en este caso las clases son las notas y
las frecuencias de clase son la cantidad de alumnos.
3.2. POLÍGONO DE FRECUENCIAS
Se utilizan para variables estadísticas cuantitativas,
discretas o continuas. Para una variable discreta,
el polígono de frecuencias se obtiene uniendo por
una poligonal, los extremos superiores de las barras.
Para una variable continua,
continua el polígono de
frecuencias
uencias se obtiene uniendo por una poligonal los
puntos medios de la base superior de los polígonos
del histograma. Las escalas utilizadas para
representar los polígonos de frecuencias influyen
mucho por el impacto visual de los mismos.
3. GRÁFICOS ESTADÍSTICOS:
S: HISTOGRAMA,
POLÍGONO DE FRECUENCIAS, OJIVA
Representación gráfica de datos estadísticos. Las
tablas estadísticas representan toda la información
de modo esquemático y están preparadas para los
cálculos posteriores. Los gráficos estadísticos nos
transmiten
en esa información de modo más expresivo,
nos van a permitir, con un sólo golpe de vista,
entender de que se nos habla, observar sus
características más importantes, incluso sacar
alguna conclusión sobre el comportamiento de la
muestra donde se está realizando
ando el estudio.
Los gráficos estadísticos son muy útiles para
comparar distintas tablas de frecuencia. Los gráficos
estadísticos más usuales son:
3.1. HISTOGRAMA
3.3. OJIVA
Se utiliza para la representación de variables
cuantitativas continuas, cada intervalo se representa
r
Su objetivo,
jetivo, al igual que el histograma y el polígono
de frecuencias es representar distribuciones de
6
frecuencias de variables cuantitativas continuas, pero
sólo para frecuencias acumuladas.
La diferencia con el polígono de frecuencia es que la
frecuencia acumulada no se plotea sobre el punto
medio de la clase, sino al final de la misma, ya que
representa el número de individuos acumulados
hasta esa clase. Como el valor de la frecuencia
acumulada es mayor a medida que avanzamos en la
distribución, la poligonal que se obtiene siempre va a
ser creciente y esa forma particular de la misma es la
que ha hecho que se le dé también el nombre de
ojiva.
No se utilizan barras en su confección, sino
segmentos de recta, por ello no sólo es útil para
representar una distribución de frecuencias sino
también cuando se quiere mostrar más de una
distribución o una clasificación cruzada de una
variable cuantitativa continua con una cualitativa o
cuantitativa discreta.
ACTIVIDAD
Se ha realizado una encuesta a 20 personas sobre el número de veces, que en la semana, van al cine y se han
obtenido las siguientes respuestas:
Nº días (xi)
fr. absoluta (ni)
0
1
1
2
2
4
3
7
4
1
5
1
6
3
7
1
Total
20
Realiza el diagrama de barras, el polígono de frecuencias y el diagrama de sectores correspondiente.
7
UNIDAD 2
1. MEDIDAS DE TENDENCIA CENTRAL CON
DATOS AGRUPADOS: MEDIA ARITMÉTICA,
MEDIANA Y MODA
dato. Por lo que se utilizan métodos alternos para
aproximar los valores de las medidas descriptivas.
1.1. MEDIA PARA DATOS AGRUPADOS
Cuando se trabaja con datos que han sido
agrupados en una distribución de frecuencias, no se
sabe con certeza los valores individuales de cada
Al calcular la media para datos agrupados, se
supone que las observaciones en cada clase son
iguales al punto medio de la clase:
1.2. MEDIANA PARA DATOS AGRUPADOS
Primero se encuentra la clase mediana, la cual es la clase cuya frecuencia acumulada es mayor o igual a n/2 y
puede determinarse mediante la siguiente fórmula:
8
1.3. LA MODA PARA DATOS AGRUPADOS
Es la observación que ocurre con mayor frecuencia, por lo que es necesario identificar la clase modal, esta se
localiza encontrando la clase que tenga más frecuencia.
2.
MEDIDAS
DE
DISPERSIÓN:
RANGO,
DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN
TÍPICA O ESTANDAR
2.1. RANGO
Es la medida de variabilidad más fácil de calcular.
Para datos finitos o sin agrupar, el rango se define
como la diferencia entre el valor más alto (Xn ó
Xmax.) y el más bajo (X1 ó Xmin) en un conjunto de
datos.
Con las medidas de centralización y posición
podemos conocer los valores centrales de un
conjunto de datos y la distribución de éstos. Uno de
los objetivos de las medidas de tendencia central es
la de sintetizar la información de los datos, pero
estas medidas por sí solas no bastan para ver su
grado de significación, veámoslo con un ejemplo.
2.1.1. Rango para datos no agrupados
R = Xmáx.-Xmín = Xn-X1
Ejemplo:
Consideremos las notas de dos grupos de 50
alumnos, en el primero 25 alumnos obtienen un 10 y
25 un 4, en el segundo los 50 alumnos obtienen un
7. Si calculamos la media en ambos conjuntos es la
misma (7), si sólo nos fijamos en la media podemos
afirmar que los dos grupos de alumnos son
bastantes buenos, pero lo cierto es que en el primer
grupo hay 25 alumnos que han obtenido una nota
excelente y 25 con mala nota, mientras que en el
segundo todos los alumnos han sacado una buena
nota.
Se tienen las edades de cinco estudiantes
universitarios de Ier año, a saber: 18,23, 27,34 y 25.,
para calcular la media aritmética (promedio de las
edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 años
Con datos agrupados no se saben los valores
máximos y mínimos. Si no hay intervalos de clases
abiertos podemos aproximar el rango mediante el
uso de los límites de clases. Se aproxima el rango
tomando el límite superior de la última clase menos
el límite inferior de la primera clase.
La media para el primer grupo es menos
representativa que para el segundo. Hemos visto un
ejemplo, bastante exagerado para comprobar que las
medidas de tendencia central necesitan un
complemento, una medida que nos permita otorgar
mayor o menor representatividad estas medidas.
2.1.2. Rango para datos agrupados
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
Ejemplo:
Si se toman los datos del ejemplo resuelto al
construir la tabla de distribución de frecuencia de
9
las cuentas por
cobrar
de Cabrera’s
Asociados que fueron los siguientes:
Clases
P.M.
fi
fr
fa↓
fa↑
y
fra↓ fra↑
•
Xi
7.420
21.835
– 14.628
10
0.33 10
30
0.3 1.00
3
21.835
36.250
– 29.043
4
0.13 14
20
0.4 0.67
6
36.250
50.665
– 43.458
50.665
65.080
– 57.873
3
0.10 22
11
0.7 0.37
3
65.080
79.495
– 72.288
3
0.10 25
8
0.8 0.27
3
79.495
93.910
– 86.703
5
0.17 30
XXX
30
1.00 XXX XX
X
Total
5
0.17 19
16
5
2.2. DESVIACIÓN MEDIA
0.6 0.54
3
En teoría, la desviación puede referirse a cada una
de las medidas de tendencia central: media, mediana
o moda; pero el interés se suele centrar en la medida
de la desviación con respecto a la media, que
llamaremos desviación media.
Puede definirse como la media aritmética de las
desviaciones de cada uno de los valores con
respecto a la media aritmética de la distribución, y de
indica así:
1.0 0.17
0
XX
X
XXX
Nótese que se toman las desviaciones en valor
absoluto, es decir, que la fórmula no distingue si la
diferencia de cada valor de la variable con la media
es en más o en menos.
El rango de la distribución de frecuencias se calcula
así:
Ya se habrá advertido que esta expresión sirve para
calcular la desviación media en el caso de datos sin
agrupar.
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
= (93.910 – 7.420) = 86.49
Veamos un ejemplo: Se tiene los valores 2, 2, 4, 4,
5, 6, 7, 8, 8. Averiguar la desviación media de estos
valores.
2.1.3. Propiedades del Rango o Recorrido:
•
•
•
puesto que no cuenta con los demás valores de
la variable. Por tal razón, siempre existe el peligro
de
que
el
recorrido
ofrezca
una descripción distorsionada de la dispersión.
En el control de la calidad se hace un uso
extenso del recorrido cuando la distribución a
utilizarse no la distorsionan y cuando
el ahorro del tiempo al hacer los cálculos es un
factor de importancia.
El recorrido es la medida de dispersión más
sencilla de calcular e interpretar puesto que
simplemente
es
la
distancia
entre los
valores extremos (máximo y mínimo) en una
distribución
Puesto que el recorrido se basa en
los valores extremos éste tiende s ser errático. No
es
extraño
que
en
una
distribución
de datos económicos o comerciales incluya a
unos pocos valores en extremo pequeños o
grandes. Cuando tal cosa sucede, entonces el
recorrido solamente mide la dispersión con
respecto a esos valores anormales, ignorando a
los demás valores de la variable.
La principal desventaja del recorrido es que sólo
está influenciado por los valores extremos,,
10
x
x−x
x
2
2
4
4
4
5
6
7
8
8
-3
3
-1
-1
-1
0
1
2
3
3
DM = 1,8
3
3
1
1
1
0
1
2
3
3
Veamos ahora cómo se calcula la desviación media
en el caso de datos agrupados en intervalos.
La desviación media viene a indicar el grado de
concentración o de dispersión de los valores de la
variable. Si es muy alta, indica gran dispersión; si es
muy baja refleja un buen agrupamiento y que los
valores son parecidos entre sí.
La desviación media se puede utilizar como medida
de dispersión en todas aquellas distribuciones en las
que la medida de tendencia central
más
significativas haya sido la media.
Donde observamos que ahora las desviaciones van
multiplicadas por las frecuencias de los intervalos
correspondientes. Además, las desviaciones son de
cada centro, o marca de clase, a la media aritmética.
Es decir,
2.2.1. Propiedades
Nos da la media de la dispersión de los
datos.
Intervienen para su cálculo todos los datos.
Cada vez que insertemos un dato nuevo se
modificará.
Al intervenir un valor absoluto los cálculos
son complicados.
A mayor concentración de los datos entorno
a la media menor será su valor.
DM es no negativa
DM=0 si y sólo si todos los valores son
coincidentes.
Ejemplo:
Para hallar la desviación media de la siguiente tabla
referida a las edades de los 100 empleados de una
cierta empresa:
Clase
ni
16-20
2
20-24
8
24-28
8
28-32
18
32-36
20
36-40
18
40-44
15
44-48
8
48-52
3
Veamos cómo se procede:
Clase
ni
xm
ni ⋅ xm
16-20
20-24
24-28
28-32
32-36
36-40
40-44
44-48
48-52
2
8
8
18
20
18
18
8
3
100
18
22
36
176
2.3. DESVIACIÓN TÍPICA
Con la varianza se elevan al cuadrado las unidades
de medida, sería interesante tener una medida de
dispersión con las mismas unidades de la media y
los datos, esto lo podemos conseguir haciendo la
raíz cuadrada positiva de la varianza, a la que
llamaremos desviación típica.
x−x
16,72
ni ⋅ x − x
Es sin duda la medida de dispersión más importante,
ya que además sirve como medida previa al cálculo
de otros valores estadísticos.
33,44
La desviación típica se define como la raíz cuadrada
de la media de los cuadrados de las desviaciones
con respecto a la media de la distribución. Es decir,
Para datos sin agrupar
DM = 6,09
11
Donde:
I: amplitud de la clase
Para datos agrupados
D: distancia en clases desde cada una en concreto a
la clase que contiene a la media supuesta A.
2.3.1. Cálculo de la desviación típica para datos
no agrupados en clases. Veamos la fórmula
anterior aplicada a un caso concreto.
Ejemplo:
Las alturas en cm de un grupo de 103 personas se
distribuyen así:
Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.
x−x
x
5
8
10
12
16
x−x
-5,2
-2,2
-0,2
1,8
5,8
2
Clases
150 – 155
155 – 160
160 – 165
165 – 170
170 – 175
175 – 180
180 – 185
185 – 190
190 – 195
195 – 200
27,04
4,84
0,04
3,24
33,64
Primero hallamos x = 10,2
Luego S =
13,76 = 3,71
Resp: S = 9,56
2.3.2. Cálculo de la desviación típica para datos
agrupados en clases y agrupados por
frecuencias. Método largo: Se aplica la siguiente
fórmula
S=
Donde
∑ fx
2.3.3. Propiedades
Tiene la misma unidad que los datos y que la
media.
Siempre es positiva, será cero si y sólo si
todos los datos son coincidentes.
Es la medida de dispersión más usada.
Es invariante ante cambios de origen.
Si se produce un cambio de escala la nueva
desviación típica es igual a la anterior
multiplicada por el cambio.
Si se produce simultáneamente un cambio de
origen y escala en los datos, sólo el cambio de
escala afectará a la desviación típica.
2
N
x = x m − x y f es la frecuencia absoluta de
cada intervalo.
Método abreviado o corto: La fórmula a utilizar es:
S=I
∑ fd
N
2
 ∑ fd 

−
 N 


f
3
6
12
18
25
17
10
7
4
1
103
2
2.4. VARIANZA
La desviación media es una medida de dispersión de
datos correcta pero presenta un inconveniente y es
la complejidad de manipulación al intervenir valores
absolutos. Sería conveniente encontrar otra medida
que no presente el problema inicial (que no se
compensen las dispersiones negativas con las
positivas) y cuyo manejo se hace más sencillo. Otra
forma de evitar la compensación de dispersiones es
elevar al cuadrado la diferencia y es más sencillo
trabajar con cuadrados que con valores absolutos,
12
La varianza es
la media
aritmética
del
cuadrado de las des
desviaciones
viaciones respecto a la
media de una distribución estadística.
teniendo
en
cuenta
esta
consideración
introduciremos el concepto de varianza.
La varianza se representa
presenta por
.
2.4.1. Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
2.4.2. Varianza para datos NO agrupados
Ejemplo:
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
13
2.4.3. Propiedades
Como sumamos cuadrados la varianza siempre es positiva y será nula cuando todos los valores de la
variable sean coincidentes y por tanto iguales a la varianza.
Al elevar al cuadrado elevamos la unidad de medida de las observaciones al cuadrado.
Al elevarse al cuadrado las desviaciones aquellos valores más alejados de la media afectarán mucho a la
varianza.
Es invariante ante cambios de origen.
Si se produce un cambio de escala la nueva varianza es igual a la anterior multiplicada por el cuadrado
del cambio.
Si se produce simultáneamente un cambio de origen y escala en los datos, sólo el cambio de escala
afectará a la varianza.
EJERCICIOS
1) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos
conjuntos de números tienen la misma desviación típica pero diferentes medias ¿cómo están relacionadas las
medias?.
2) Multiplicando cada número 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos el conjunto 11, 17, 9 7, 19
15. ¿Cuál es la relación entre la desviación típica de ambos conjuntos? ¿Y entre las medias?
3) Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. ¿Cuál es el valor de la media de X?.
4) Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9 respectivamente.
¿Para cual de las dos variables el valor de la media es más representativo?
5) La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para 2 comunidades
autónomas X y Y, en tantos por cien es la siguiente:
Edades
16–18
18–30
30–50
50–70
70–90
X
Y
3.54
21.56
31.63
28.14
15.12
4.35
29.99
35.21
21.97
8.48
a) Representa sobre los mismos ejes de coordenadas los histogramas de la distribución de la edad para
las dos CC.AA. (emplea distinto trazo o distintos colores). ¿Qué conclusiones obtienes a la vista de los
histogramas?
b) Calcula la edad mediana para las dos comunidades. Compáralas. ¿Qué indican estos resultados?
c) Qué comunidad tiene mayor variabilidad en la distribución de su edad?
14
3. ANÁLISIS DE RESULTADOS DE ENCUESTAS
implica la capacidad de generalización de los
resultados obtenidos.
“Analizar significa establecer categorías, ordenar,
manipular y resumir los datos,” (Kerlinger, 1982, p.
96). En esta etapa del proceso de investigación se
procede a racionalizar los datos colectados a fin de
explicar e interpretar las posibles relaciones que
expresan las variables estudiadas.
Una vez concluidas las etapas de colección y
procesamiento de datos se inicia con una de las más
importantes fases de una investigación: el análisis de
datos. En esta etapa se determina como analizar los
datos y que herramientas de análisis estadístico son
adecuadas para éste propósito. El tipo de análisis de
los datos depende al menos de los siguientes
factores.
El diseño de tablas estadísticas permite aplicar
técnicas de análisis complejas facilitando este
proceso. El análisis debe expresarse de manera
clara y simple utilizando lógica tanto inductiva como
deductiva.
Los resultados de una investigación basados en
datos muestrales requieren de una aproximación al
verdadero valor de la población (Zorrilla, 1994). Para
lograr lo anterior se requiere de una serie de técnicas
estadísticas. Estas técnicas se derivan tanto de la
estadística paramétrica como de la estadística no
paramétrica. La primera tiene como supuestos que la
población estudiada posee una distribución normal y
que los datos obtenidos se midieron en una escala
de intervalo y de razón. La segunda no establece
supuestos acerca de la distribución de la población
sin embargo requiere que las variables estudiadas se
midan a nivel nominal u ordinal (ver Weiers, 1993).
a) El nivel de medición de las variables (los niveles
de medición fueron explicados en la sección 2.4 del
capítulo II).
b) El tipo de hipótesis formulada (ver sección 2.2,
capítulo II).
c) El diseño de investigación utilizado indica el tipo
de análisis requerido para la comprobación de
hipótesis.
El análisis de datos es el precedente para la
actividad de interpretación. La interpretación se
realiza en términos de los resultados de la
investigación. Esta actividad consiste en establecer
inferencias sobre las relaciones entre las variables
estudiadas
para
extraer
conclusiones
y
recomendaciones (Kerlinger, 1982). La interpretación
se realiza en dos etapas:
Las tablas diseñadas para el análisis de datos se
incluyen en el reporte final y pueden ser útiles para
analizar una o más variables. En virtud de éste último
criterio el análisis de datos puede ser univariado,
bivariado o trivariado dependiendo de la cantidad de
variables que se analizan.
4. NÚMERO ÍNDICE
a) Interpretación de las relaciones entre las variables
y los datos que las sustentan con fundamento en
algún nivel de significancia estadística.
Un número índice es una medida estadística que
permite caracterizar la evolución de una magnitud
(simple, como el precio del pan, o compuesta, como
el PIB) en dos instantes o períodos de tiempo
distintos “0” y “t”. Se suelen representar mediante
una letra afectada por un subíndice (que indica el
instante o período que se toma como base o
referencia) y un superíndice (que indica el otro
b) Establecer un significado más amplio de la
investigación, es decir, determinar el grado de
generalización de los resultados de la investigación.
Las dos anteriores etapas se sustentan en el grado
de validez y confiabilidad de la investigación. Ello
15
Ejemplo: un comerciante ha registrado las
siguientes ventas anuales. Tomando como base el
año 1980
instante o período de tiempo al que se refiere el
número índice).
Un Número índice es un valor representativo que
indica las variaciones de una o más variables en un
periodo dado con respecto a un periodo base.
Año
1980
Ventas ($) 200.000
1981
1982
1983
1984
250.000
200.000
190.000
220.000
Cálculo de un índice de ventas
Año
Razón
Cambio de un decimal
Índice multiplicado x 100
1980
200.000/200.000
1.00
100
1981
250.000/200.000
1.25
125
1982
200.000/200.000
1.00
100
1983
190.000/200.000
0.95
95
1984
220.000/200.000
1.10
110
4.1. APLICACIONES DE LOS NÚMEROS ÍNDICES
Los gerentes se valen de los números índices como
parte de un cálculo intermedio para entender mejor
otra información.
Los números índices
son muy versátiles, lo
que los hace aplicable
a cualquier ciencia o
campo de estudio.
Esencialmente
se
usan
para
hacer
comparaciones.
En educación se pueden usar los números índices
para comparar la inteligencia relativa de estudiantes
en sitios diferentes o en años diferentes.
Los índices estaciónales sirven para modificar o
mejorar las estimaciones del futuro.
En el campo donde los números índices son de
mayor utilidad es, en la economía, ya que esta se
vale de indicadores económicos, para estudiar las
situaciones presentes y tratar de predecir las futuras,
dichos indicadores económicos en esencia son
números índices, ejemplo de ello son IPC, PNI,
deflactor implícito del PNI, entre muchos otros.
4.2. VENTAJAS DE LOS NÚMEROS ÍNDICES
Un número índice facilita comparar los cambios en
diferentes tipos de información.
Un índice muestra el cambio en porcentajes del año
base.
Si no existiera cambio alguno, el numerador y el
denominador serian iguales.
Como los números índices muestran cambios en
porcentaje, más bien que cambios aritméticos, el
tamaño de la información y las unidades de medición
no son importantes.
Un número índice puede representar cambios en
muchas cantidades.
ANALIZA
2 situaciones en las que pueden ser útil el número
índice. Relaciona los ejemplos.
16
EVALUACIÓN DE COMPETENCIAS
1. Qué son los fenómenos aleatorios
a) Los que no sabemos lo que va a resultar
b) Un conjunto de posibles resultados.
c) Los que sabemos lo que va a resultar a priori
d) Un conjunto total de fenómenos
c) Los cuartiles.
d) El 2º coeficiente de Ficher
8. En las medidas de dispersión si la variabilidad
es muy grande:
a) La media no tiene trascendencia
b) Los datos están ordenados de forma
creciente
c) La media es siempre cero
d) El espacio muestral es infinito no numerable.
2. Qué es probabilidad
a) Es el resultado de un suceso aleatorio
b) Es dar la medida al resultado de un suceso
aleatorio
c) Es la medida del resultado de un suceso
simple
d) Es el resultado de un suceso simple.
9. Qué otro nombre recibe la curva normal de
media?:
a) Curva de Laplace
b) Curva Normal
c) Curva de Gauss
d) Curva de Tipificación.
3. Una permutación es:
a) La cuasi varianza de un suceso normal y
creciente.
b) Un elemento cuya varianza es infinito
c) Un conjunto de n elementos que se pueden
ordenar
d) La cuasi varianza de un suceso aleatorio
10. En una variable tipificada:
a) La media es la mitad de la varianza.
b) La media es cero
c) La varianza es cero
d) La media es la unidad
4. La varianza nos mide:
a) Alrededor de la cuasi varianza
b) Nos mide la exactitud de la muestra
c) La variabilidad de la variable alrededor de la
media
d) Nos mide la linealidad del espacio muestral.
11. Cómo definirías la mediana:
a) El valor cuadrado de la moda
b) El valor de la variable que hace que la
frecuencia condicionada sea 0.5
c) Ajustar la moda al valor 0.5.
d) Tipificar una variable aleatoria
5. En un espacio muestral la moda será:
a) El valor medio de todos los datos
b) El valor que más veces se repita
c) El valor situado en la mitad de la muestra
d) La media entre el primer y el último valor.
12. Qué es lo que mide la relación entre las
variables?:
a) Coeficiente de determinación
b) Correlación
c) Coeficiente de correlación lineal.
d) Regresión
6. Las medidas de posición son:
a) Varianza, moda y cuasi varianza
b) Moda, varianza y mediana
c) Moda, media y mediana
d) Media, mediana y desviación típica.
7. Quién nos medirá la simetría
distribución?
a) El 1er coeficiente de Ficher
b) Las medidas de dispersión
de
13. Qué estudia la correlación?:
a) La dependencia al exponencial de las
variables.
b) La relación lineal de las variables
c) La interdependencia de las variables
d) La recta de regresión de las variables
una
17
UNIDAD 3
1. TÉNICAS DE CONTEO. Si el número de posibles
resultados de un experimento es pequeño, es
relativamente fácil listar y contar todos los posibles
resultados. Al tirar un dado, por ejemplo, hay seis
posibles resultados. Si, sin embargo, hay un gran
número de posibles resultados tales como el número
de niños y niñas por familias con cinco hijos, sería
tedioso listar y contar todas las posibilidades.
EJERCICIO
Un hombre tiene tiempo de jugar ruleta cinco veces
como máximo, él empieza a jugar con un dólar,
d
apuesta cada vez un dólar y puede ganar o perder
en cada juego un dólar, él se va a retirar de jugar si
pierde todo su dinero, si gana tres dólares (esto es si
completa un total de cuatro dólares) o si completa los
cinco juegos.
Las posibilidades serían, 5 niños, 4 niños y 1 niña, 3
niños y 2 niñas, 2 niños y 3 niñas, etc. Para facilitar
esta tarea existen las técnicas de conteo
1.1. DIAGRAMA DE ÁRBOL
ULTIPLICACIÓN
1.2. PRINCIPIO DE MULTIPLICACIÓN
Un diagrama de árbol es una representación gráfica
de un experimento que consta de r pasos, donde
cada uno de los pasos tiene un número
núme finito de
maneras de ser llevado a cabo.
Si hay m formas de hacer una cosa y hay n formas
de hacer otra cosa, hay m x n formas da hacer
ambas cosas.
Ejemplo:
En términos de fórmula.
fórmula Número total de arreglos =
mxn
Se lanza una moneda, si sale águila se lanza un
dado y si sale sol se lanza la moneda de nuevo.
Esto puede ser extendido a más de dos eventos.
Para tres eventos, m, n, y o:
o
Número total de arreglos = m x n x o
Ejemplo:
Un vendedor de autos quiere presentar a sus clientes
todas las diferentes opciones con que cuenta: auto
convertible, auto de 2 puertas y auto de 4 puertas,
cualquiera de ellos con rines deportivos o estándar.
estándar
¿Cuántos diferentes arreglos de autos y rines puede
ofrecer el vendedor?
Para solucionar el problema podemos emplear la
técnica de la multiplicación, (donde m es número de
modelos y n es el número de tipos de rin).
Número total de arreglos = 3 x 2
No fue
e difícil de listar y contar todos los posibles
arreglos de modelos de autos y rines en este
ejemplo. Suponga, sin embargo, que el vendedor
tiene para ofrecer ocho modelos de auto y seis tipos
de rines. Sería tedioso hacer un dibujo con todas las
posibilidades.
ades.
Aplicando la técnica
de la
multiplicación fácilmente realizamos el cálculo:
Número total de arreglos = m x n = 8 x 6 = 48
18
1.3. COMBINACIONES Y PERMUTACIONES
Ejemplo:
1.3.1. Combinaciones. Las combinaciones son muy
parecidas a los arreglos, con la diferencia de que en
los conjuntos que se forman no importa el orden de
manera que { , , } y { , , }. El número de
combinaciones de an elementos que puedo hacer de
un total de m elementos será:
Tres componentes electrónicos - un transistor, un
capacitor, y un diodo - serán ensamblados en una
tablilla de una televisión. Los componentes pueden
ser ensamblados en cualquier orden. ¿De cuantas
diferentes maneras pueden ser ensamblados los tres
componentes?
Las diferentes maneras de ensamblar los
componentes son llamadas permutaciones, y son las
siguientes:
TDC DTC CDT
TCD DCT CTD
Cnm =
m!
n !i( m − n ) !
Ejemplo:
Permutación: Todos los arreglos de r objetos
seleccionados de n objetos posibles
Si se quiere formar un equipo de trabajo formado por
2 personas seleccionadas de un grupo de tres (A, B
y C). Si en el equipo hay dos funciones diferentes,
entonces si importa el orden, los resultados serán
permutaciones. Por el contrario si en el equipo no
hay funciones definidas, entonces no importa el
orden y los resultados serán combinaciones. Los
resultados en ambos casos son los siguientes:
La fórmula empleada para contar el número total de
diferentes permutaciones es:
n P r = n!
(n – r )!
Donde:
Permutaciones: AB, AC, BA, CA, BC, CB
nPr es el número de permutaciones posible
n es el número total de objetos
r es el número de objetos utilizados en un mismo
momento
Combinaciones: AB, AC, BC
1.3.2. Permutaciones. La técnica de la permutación
es aplicada para encontrar el número posible de
arreglos donde hay solo un grupo de objetos.
n P r = n! = 3! = 3 x 2 = 6
(n – r )!
( 3 – 3 )!
RESUELVE
Juanita invito a sus amigos a cenar. Juanita tiene 10 amigos, pero solo tiene 6 lugares en la mesa.
a) ¿De cuantas maneras los puede sentar a la mesa?, si no le importa como queden acomodados.
b) ¿De cuantas maneras los puede sentar a la mesa?, si le importa como queden acomodados.
c) Dos de sus amigos son un feliz matrimonio, Juanita decidió sentarlos a la mesa juntos. ¿De cuantas maneras
los puede sentar a la mesa?, si no le importa como queden acomodados los demás.
d) ¿De cuantas maneras los puede sentar a la mesa?, si le importa como queden acomodados los demás.
e) Dos de sus amigos son enemigos, Juanita no los quiere sentar juntos a la mesa. ¿De cuantas maneras los
puede sentar a la mesa?, si no le importa como queden acomodados los demás.
f) ¿De cuantas maneras los puede sentar a la mesa?, si le importa como queden acomodados los demás.
19
EVALUACIÓN DE COMPETENCIAS
1. Suponga que hay ocho tipos de computadora pero solo tres espacios disponibles para exhibirlas en la tienda de
computadoras. ¿De cuantas maneras diferentes pueden ser arregladas las 8 máquinas en los tres espacios
disponibles?
2. El profesor quiere saber ¿cuántas series de 2 letras se pueden formar con las letras A, B, C, si se permite la
repetición?
3. En una compañía se quiere establecer un código de colores para identificar cada una de las 42 partes de un
producto. Se quiere marcar con 3 colores de un total de 7 cada una de las partes, de tal suerte que cada una
tenga una combinación de 3 colores diferentes. ¿Será adecuado este código de colores para identificar las 42
partes del producto?
4. En una escuela primaria de la ciudad, imparte clase la maestra Bety. Ella es feliz enseñando al grupo de tercer
grado, que está compuesto por 15 niñas y 12 niños. Bety propone a los niños formar una mesa directiva del grupo
formada por cinco de ellos. La mesa directiva estaría formada por un presidente, un secretario, un tesorero, y dos
vocales.
a) ¿De cuantas maneras puede formar la mesa directiva?, si no le importa como queden asignados los puestos.
b) Bety piensa que como hay más niñas que niños la mesa directiva debe integrarse por 3 niñas y 2 niños. ¿De
cuantas maneras puede formar la mesa directiva?, si no le importa como queden asignados los puestos.
c) La maestra Susana (la de cuarto) le sugiere que solo el puesto de presidente sea para niñas y los otros 4
puestos sean para niños. ¿De cuantas maneras puede formar la mesa directiva?, si no le importa como queden
asignados los otros puestos.
d) El profesor de educación física ( Ramón ) dice que todos los puestos deben de ser para niños, pero podría
dársele el puesto de secretaria a una niña. ¿De cuantas maneras puede formar la mesa directiva?, si le importa
como queden asignados los otros puestos.
e) En el grupo de tercer grado hay 4 reprobados (3 niños y una niña) y la maestra Bety decidió que ellos no
pueden formar parte de la mesa directiva. ¿De cuantas maneras puede formar la mesa directiva?, si no le importa
como queden asignados los puestos.
f) ¿Cuál es la probabilidad, si se selecciona la mesa directiva al azar entre todos los integrantes del grupo de
tercer grado, quede integrada por puras niñas? Sin importar como queden asignados los puestos.
g) ¿Cuál es la probabilidad, si se selecciona la mesa directiva al azar entre todos los integrantes del grupo de
tercer grado, quede integrada por puros niños? Sin importar como queden asignados los puestos.
h) ¿Cuál es la probabilidad, si se selecciona la mesa directiva al azar entre todos los integrantes del grupo de
tercer grado, el presidente, secretario y tesorero sean niños y las dos vocales niñas? Sin importar como queden
asignados los puestos.
20
UNIDAD 4
1. CONCEPTO DE PROBABILIDAD
espacio muestral en este caso es un conjunto de dos
elementos.
La probabilidad nos sirve para medir la frecuencia
con que ocurre un resultado de entre todos los
posibles en algún experimento.
Smoneda = {que salga cara, que salga sello}
Si en lugar de una moneda, lanzamos un dado
entonces el espacio muestral tendrá seis elementos,
uno correspondiente a cada cara del dado:
2. ESPACIOS MUESTRALES
Sdado = {1; 2; 3; 4; 5; 6}
El espacio muestral (lo abreviamos simplemente
como S) es un conjunto formado por todos los
resultados posibles de algún experimento, por
ejemplo, si lanzamos una moneda al aire (a esto
llamamos experimento), existen solo 2 posibilidades,
que salga cara o que salga sello. Por lo tanto el
Y si lanzamos el dado y la moneda al mismo tiempo
el espacio muestral estará conformado por pares
ordenados de la forma:
Smoneda+dado = (cara; 1); (cara; 2); (cara; 3); (cara; 4); (cara; 5); (cara; 6);
(sello; 1); (sello; 2); (sello; 3); (sello; 4); (sello; 5); (sello; 6)
3. CÁLCULO DE PROBABILIDADES
salga el dos), mientras que los casos posibles (n)
son seis (puede salir cualquier número del uno al
seis).
La probabilidad de ocurrencia de un determinado
suceso podría definirse como la proporción de veces
que ocurriría dicho suceso si se repitiese un
experimento o una observación en un número
grande de ocasiones bajo condiciones similares. Por
definición, entonces, la probabilidad se mide por un
número entre cero y uno: si un suceso no ocurre
nunca, su probabilidad asociada es cero, mientras
que si ocurriese siempre su probabilidad sería igual a
uno. Así, las probabilidades suelen venir expresadas
como decimales, fracciones o porcentajes.
Por lo tanto:
(o lo que es lo mismo, 16,6%)
b) Probabilidad de que al lanzar un dado salga un
número par: en este caso los casos favorables (f)
son tres (que salga el dos, el cuatro o el seis),
mientras que los casos posibles (n) siguen siendo
seis.
El método más utilizado en probabilidad es aplicando
la Regla de Laplace: define la probabilidad de un
suceso como el cociente entre casos favorables y
casos posibles.
Por lo tanto:
(o lo que es lo mismo, 50%)
Condiciones importantes
Ejemplos:
Para poder aplicar la Regla de Laplace el
experimento aleatorio tiene que cumplir dos
requisitos:
a) Probabilidad de que al lanzar un dado salga el
número 2: el caso favorable (f) es tan sólo uno (que
21
3.1. INDEPENDENCIA DE EVENTOS
a) El número de resultados posibles (sucesoso
eventos) tiene que ser finito. Si hubiera infinitos
resultados, al aplicar la regla "casos favorables
dividido por casos posibles" el cociente siempre sería
cero.
Existen relaciones entre los sucesos:
3.1.1. Sucesos Excluyentes. Dos o más sucesos
serán excluyentes si solo uno de ellos puede ocurrir
en un experimento, por ejemplo al lanzar una
moneda, si sale cara entonces no puede salir sello y
viceversa, por lo tanto estos sucesos son
excluyentes.
b) Todos los sucesos o eventos tienen que tener la
misma probabilidad. Si al lanzar un dado, algunas
caras tuvieran mayor probabilidad de salir que otras,
no podríamos aplicar esta regla.
A la regla de Laplace también se le denomina
"probabilidad a priori", ya que para aplicarla hay que
conocer antes de realizar el experimento cuales son
los posibles resultados y saber que todos tienen las
mismas probabilidades.
3.1.2. Sucesos Independientes. Dos o más
sucesos son independientes cuando la ocurrencia de
uno, no afecta la ocurrencia del o los otros. Por
ejemplo en el lanzamiento del dado y la moneda si
sale cara o sale sello, no afecta en ninguna medida
el número que salga en el dado, por lo tanto estos
sucesos son independientes.
Cuando se realiza un experimento aleatorio un
número muy elevado de veces, las probabilidades de
los diversos posibles sucesos empiezan a converger
hacia valores determinados, que son sus respectivas
probabilidades.
3.1.3. Sucesos Dependientes. Dos o más sucesos
son dependientes cuando la ocurrencia de alguno de
ellos sí afecta la ocurrencia de los otros. Por ejemplo
si tengo un saco con 2 bolas negras y una bola roja,
el suceso de sacar la bola roja me impedirá sacar
una bola roja en el siguiente intento pues en el saco
solo hay 2 bolas negras, en este caso esos sucesos
son dependientes.
22
EVALUACIÓN DE COMPETENCIAS
1. El siguiente gráfico circular muestra como
Jorge ganó $ 600.000 durante sus vacaciones:
Cuál es la medida del ángulo central de la
sección que lleva por nombre quehaceres?
a) 30º
b) 60º
c) 90º
4. Una familia necesitó $100.000 para hacer un
paseo. La mitad se gastó en carne y lo que
quedó se repartió de esta forma: a) la mitad en
vinos y bebidas, b) un cuarto en frutas y c) el
resto en verduras. ¿Cuál(es) de las siguientes
afirmaciones se desprende(n) de la información
dada?.
d) 120º
2. El diagrama de Venn muestra los resultados de
una encuesta en la que les preguntaron a 100
personas si se informan de las noticias leyendo
los periódicos o mirando televisión.
I)
El gasto de carne fue equivalente al doble
de lo ocupado en vinos y bebidas.
II) En frutas y verduras se gastó lo mismo
que para vinos y bebidas.
III) El 25% del total se ocupó en las frutas y
verduras.
a) Sólo II.
b) II y III
¿Cuál es la probabilidad de que una persona
seleccionada al azar de esta encuesta no elija a la
televisión como una fuente de información de las
noticias?
a) 15
100
c) I y II.
d) I, II y III.
e) I y III.
5. En un equipo de ″A″ jugadores (con pelo negro
y rubio) ″B″ de ellos son rubios. Entonces el
porcentaje que tiene pelo negro es:
c) 55
100
b) 35
d) 75
100
100
3. Los puntos del gráfico indican la cantidad de
cajas de cierto fármaco vendidas durante los seis
primeros meses de un año. ¿Cuál es la cantidad
promedio de cajas vendidas durante ese
período?
a)
b)
c) 100 (A + B) %
d)
e) Ninguna de las anteriores.
6. Una persona que participa en un concurso,
debe
responder Verdadero o Falso a
una
afirmación que se le hace en cada una de seis
etapas. Si la persona responde al azar, la
23
probabilidad de que acierte en las seis etapas es
de:
a)
1
2
1
b)
6
c)
d)
I) La probabilidad de que la flecha caiga en el
1
32
II) La probabilidad de que la flecha caiga en el
número 2 es
1
e)
64
número 2 ó en el 3 es
2
36
c)
5
36
b) Sólo II
c) Sólo III
d) Sólo I y II
1
d)
3
e)
2
3
a) Sólo I
7. Se lanzan dos dados, uno a continuación del
otro. Sabiendo que la suma de los puntos
obtenidos es 6, la probabilidad de que en un
dado aparezca un 2 es:
b)
1
.
4
III) La probabilidad de que la flecha caiga en el
1
12
2
a)
5
1
.
2
número 1 es
e) Sólo I y III
1
6
9. De una tómbola se saca una de 30 bolitas
numeradas de 1 a 30. ¿Cuál es la probabilidad de
que el número de la bolita extraída sea múltiplo
de 4?
a)
23
30
d)
30
7
b)
4
30
e)
30
23
c)
7
30
8. En la figura
se tiene una ruleta en que la flecha puede indicar
cualquiera de los 4 sectores y ella nunca cae en
los límites de dichos sectores. ¿Cuál(es) de las
siguientes proposiciones es(son) verdadera(s)?
24
BIBLIOGRAFÍA
http://html.rincondelvago.com/sistemas-digitales.html
http://es.wikipedia.org/wiki/Tridimensional
http://tdd.elisava.net/coleccion/12/cross-es
http://www.desarrolloweb.com/articulos/332.php
http://www.aulaclic.es/dreamweaver-cs5/t_2_2.htm#ap_02_02
http://web.educastur.princast.es/ies/aramo/departamentos/mate/complejos/complejos%20_1.htm
http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml#centiles
http://www.ematematicas.net/estadistica/medidas/index.php?tipo=ej_dispersion
http://www.ematematicas.net/parit.php
http://www.profesorenlinea.cl/matematica/ProbabilidadCalculo.htm
http://www.mitecnologico.com/Main/TecnicasDeConteo
http://tratamientodedatos.wordpress.com/2011/03/07/medidas-de-tendencia-central-para-datos-no-agrupados-yagrupados/
http://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion2.shtml
http://www.eumed.net/libros/2006c/203/2n.htm
PAREDES NUÑEZ, Pamela; RAMÍREZ PANATT Manuel. Apuntes de Preparación para la Prueba de Selección
Universitaria Matemática.Chile. 2009.
25