Download modulo estadistica ciclo vi grado undecimo
Document related concepts
no text concepts found
Transcript
1 I.E. CÁRDENAS CENTRO MÓDULO DE ESTADÍSTICA CICLO VI GRADO UNDÉCIMO 2 TABLA DE CONTENIDO pág. UNIDAD 1 1. VARIABLE ALEATORIA, ESPACIO MUESTRAL, TÉCNICAS DE CONTEO 1.1. VARIABLE ALEATORIA 1.1.1. Clasificación de las variables aleatorias 1.1.1.1. Variable aleatoria continua 1.1.1.2. Variable aleatoria discontinua o discreta 6 6 6 6 7 EJERCICIOS 7 1.2. 1.3. 1.3.1. 1.3.2. 1.3.3. 8 9 9 10 10 ESPACIO MUESTRAL TÉCNICAS DE CONTEO Principio multiplicativo de conteo Principio aditivo de conteo Permutaciones y combinaciones EJERCICIOS 12 2. 2.1. 2.2. 13 13 14 PROBABILIDAD DE OCURRENCIA DE UN EVENTO PROBABILIDAD CONDICIONAL REGLAS BÁSICAS DE PROBABILIDAD EJERCICIOS 16 UNIDAD 2 1. VALOR ESPERADO Y VARIANZA 1.1. VALOR ESPERADO 1.1.1. Propiedades del valor esperado 1.1.1.1. Al multiplicar todos los valores de una variable por una misma constante, el valor esperado de ésta queda multiplicado por el valor de la constante 1.1.1.2. Al sumar a todos los valores de una variable una misma constante, el valor esperado de ésta queda incrementado por el valor de la constante 1.1.1.3. Si tenemos dos variables X e Y, discretas o continuas, el valor esperado de su suma o diferencia es la suma o diferencia de sus valores esperados 1.1.1.4. Si las variables anteriores, X e Y son variables aleatorias independientes ocurre que el valor esperado de su producto es igual al producto de sus valores esperados 17 17 17 17 17 18 18 EJERCICIOS 18 1.2. 1.2.1. 1.2.2. 1.2.3. 19 20 20 20 VARIANZA Varianza para datos agrupados Varianza para datos NO agrupados Propiedades 3 EJERCICIOS 21 2. 21 DISTRIBUCIÓN BINOMIAL EJERCICIOS 22 3. 3.1. 3.2. 3.2.1. 3.2.2. 3.2.3. 3.2.4. 3.3. 22 22 23 23 23 23 23 24 DISTRIBUCIÓN DE POISSON PROPIEDADES RELACIÓN CON OTRAS DISTRIBUCIONES Sumas de variables aleatorias de Poisson Distribución binomial Aproximación normal Distribución exponencial PROCESOS DE POISSON EJERCICIOS 25 4. 4.1. 4.2. 25 26 29 DISTRIBUCIÓN NORMAL LA NORMAL N(0; 1) TIPIFICAR UNA VARIABLE NORMAL EJERCICIOS 29 UNIDAD 3 1. 1.1. 1.1.1. 1.1.2. 1.1.3. 1.1.4. 1.2. 1.3. 1.3.1. TEORÍA DE LA METODOLOGÍA DE LA INVESTIGACIÓN CIENTÍFICA COMPONENTES DE UN PROYECTO DE INVESTIGACIÓN Fase Proyectiva Fase Metodológica Fase Técnica Fase de Síntesis TIPOS DE INVESTIGACIÓN ORGANIZACIÓN DE LA INFORMACIÓN Pasos para la organización COMPRENSIÓN LECTORA 30 30 30 30 30 30 31 33 34 36 UNIDAD 4 1. MÉTODOS DE INVESTIGACIÓN 37 2 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. COMPONENTES MÍNIMOS DE UN PROYECTO DE INVESTIGACIÓN EL TEMA DE INVESTIGACIÓN JUSTIFICACIÓN Y/O ANTECEDENTES FORMULACIÓN DEL PROBLEMA OBJETIVOS GENERALES Y ESPECÍFICOS ELEMENTOS TEÓRICOS QUE FUNDAMENTAN LA INVESTIGACIÓN - MARCO TEÓRICO HIPÓTESIS (IDENTIFICACIÓN DE VARIABLES) METODOLOGÍA PLAN DE TRABAJO Y/O CRONOGRAMA DE ACTIVIDADES 38 38 38 38 38 39 39 39 39 4 2.9. 2.10. PRESUPUESTO BIBLIOGRAFÍA 39 39 3. INSTRUMENTOS DE RECOLECCIÓN DE LA INFORMACIÓN 3.1. LA ENCUESTA 3.2. LA ENTREVISTA 3.2.1. Tipos de entrevistas 3.2.1.1. Estructurada 3.2.1.2. No estructurada 3.3. LA OBSERVACIÓN 3.4. LA EXPERIMENTACIÓN 3.5. EL DATO CIENTÍFICO 40 40 40 41 41 41 42 42 42 4. TÉCNICAS Y MÉTODOS PARA LA CLASIFICACIÓN DE LA INFORMACIÓN 4.1. TÉCNICAS PARA CLASIFICACIÓN DE INFORMACIÓN 4.1.1. Tratamiento de las fuentes 4.1.1.1. Reunión de fuentes 4.1.1.2. Crítica de las fuentes 4.1.1.3. Contraste de fuentes 4.1.1.4. Respeto a las fuentes 4.1.1.5. Cita de las fuentes 4.2. MÉTODOS PARA LA CLASIFICACIÓN DE LA INFORMACIÓN 43 43 43 43 43 43 43 43 44 PRUEBA TIPO ICFES 45 BIBLIOGRAFÍA 48 5 UNIDAD 1 1. VARIABLE ALEATORIA, ESPACIO MUESTRAL, TÉCNICAS DE CONTEO 1.1. VARIABLE ALEATORIA Al suceso elemental <<preferir la marca X>> se le hace corresponder el número 1; al suceso elemental <<preferir la marca Y>> se le hace corresponder el número 2; al suceso elemental <<preferir la marca Z>> se le hace corresponder el número 3. Dado un experimento aleatorio cualquiera cuyos sucesos elementales posibles pueden identificarse fácilmente mediante un número real, se denomina Variable Aleatoria, X, al conjunto de estos números. La variable aleatoria X será: X = (1,2,3). El número asociado a cada suceso elemental puede ser cualquiera dentro del conjunto de los números reales, con la condición única de que a sucesos elementales distintos le correspondan números también distintos. Se comprueba fácilmente que la correspondencia así definida entre el conjunto de los posibles sucesos elementales de un experimento aleatorio y el conjunto de los números reales es una aplicación inyectiva. También se le llama variable de azar o variable estocástica, y significa cantidad que puede tomar varios valores imprevistos. Ejemplo 1.- Sea el experimento aleatorio de lanzar un dado al aire. Los posibles resultados del experimento (sucesos elementales) son los siguientes: <<que salga 1>>, <<que salga 2>>, <<que salga 3>>, <<que salga 4>>, <<que salga 5>> y <<que salga 6>>. Resulta sencillo asociar a cada suceso elemental el número correspondiente a la cara del dado que haya salido. Por tanto, la variable aleatoria, X, será: X= 1,2,3,4,5,6 Por el contrario, si dado un experimento aleatorio cualquiera no resulta inmediata la asociación de un número para cada uno de los posibles sucesos elementales, se establece una correspondencia entre el conjunto de los posibles sucesos elementales y el conjunto de los números reales, de manera que a cada suceso elemental le corresponda un número real arbitrario y que a sucesos elementales distintos les correspondan números distintos. 1.1.1. Clasificación de las variables aleatorias. Las variables aleatorias pueden ser continuas o discontinuas. En este último caso se denominan también discretas. Se denomina variable aleatoria al conjunto imagen de esta correspondencia, es decir, al conjunto de los números reales que se hayan hecho corresponder a cada uno de los sucesos elementales. 1.1.1.1. Variable aleatoria continua. Si X es una Variable aleatoria continua, puede tomar cualquier valor de un intervalo continuo o dentro de un campo de variación dado. Las probabilidades de que ocurra un valor dado x están dadas por una función de densidad de probabilidad de que X quede entre a y b. El área total bajo la curva es 1. Ejemplo 2.- Sea el experimento aleatorio de averiguar la marca de tabaco que preferirá un individuo entre las posibles marcas: <<X>>, <<Y>>, <<Z>>. Ejemplo. Sea el experimento aleatorio consistente en medir la altura que es capaz de saltar cada miembro de un conjunto de personas. En este experimento, cada miembro del conjunto observado da lugar a un número, por lo que se toma como variable aleatoria el conjunto de las medidas de las En este caso la asociación de un número para cada suceso elemental posible del experimento no es inmediata. En consecuencia, se establece una correspondencia entre el conjunto de los sucesos elementales posibles y el conjunto de los números reales, del modo siguiente: 6 Ejemplo. Sea el experimento aleatorio consistente en lanzar una moneda al aire. Los sucesos elementales del experimento, <<que salga cara>>, <<que salga cruz>>, no vienen representados por los números, por lo que casa suceso elemental se le hace corresponder un número real. Así al suceso elemental <<que salga cara>> se le hace corresponder el número “1” y al suceso elemental <<que salga cruz>> se le hace corresponder el número “2”. alturas que son capaces de saltar las distintas personas. En el supuesto que una persona hubiera saltado 105 cm y otra 106 cm, no existiría ninguna razón para que otra no hubiera saltado un valor intermedio cualquiera entre las dos anteriores, como 105.5 cm. Se trata de una variable aleatoria continua. 1.1.1.2. Variable aleatoria discontinua o discreta. Se dice que una Variable aleatoria Discreta o Discontinua X, tiene un conjunto definido de valores posibles x1,x2,x3,…..xn con probabilidades respectivas p1,p2,p3,…..pn., Es decir que sólo puede tomar ciertos valores dentro de un campo de variación dado. Como X ha de tomar uno de los valores de este conjunto, entonces p1 + p2 +…+ pn=1. La variable aleatoria será: X = (1,2). En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X = x) se entenderá la probabilidad de que X tome el valor de x. De esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una función matemática que asigne una probabilidad a cada realización x de la variable aleatoria X. Esta función recibe el nombre de función de la probabilidad. Se trata de una variable aleatoria discontinua o discreta, ya que únicamente puede adoptar los valores 1 y 2. EJERCICIOS…… 1. Supóngase que la producción de un día de 850 piezas manufacturadas contiene 50 piezas que no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas al azar y sin reemplazo. Sea la variable aleatoria X igual al número de piezas de la muestra que no cumplen. ¿Cuál es la función de distribución acumulada de X? 2. Dada la variable aleatoria X continua y con función de distribución F se define la variable Y=F(X). Demuéstrese que Y sigue una distribución uniforme en [0,1]. 3. Un punto aleatorio X tiene distribución uniforme en el intervalo [0,1] y otro punto aleatorio Y tiene distribución uniforme en el intervalo [2,3]. Se define la variable distancia entre X e Y por d=Y-X. Suponiendo que X e Y son independientes, calcúlese la esperanza matemática y la varianza de d. 4. Supongamos que el consumo familiar de un cierto producto se distribuye como una variable aleatoria de distribución uniforme, con esperanza igual a 10 y varianza unidad. Determina la probabilidad de que dicho consumo este comprendido entre 8 y 12 unidades. 7 1.2. ESPACIO MUESTRAL En la teoría de probabilidades, el espacio muestral o espacio de muestreo (denotado E, S, Ω o U) consiste en el conjunto de todos los posibles resultados individuales de un experimento aleatorio. 52 cartas, una posibilidad del espacio de muestreo podría ser el número (del as al rey), mientras que otra posibilidad sería el palo (diamantes, tréboles, corazones y picas). Una descripción completa de los resultados, sin embargo, especificaría ambos valores, número y palo, y se podría construir un espacio de muestreo que describiese cada carta individual como el producto cartesiano de los dos espacios de muestreo descritos. Por ejemplo, si el experimento consiste en lanzar dos monedas, el espacio de muestreo es el conjunto {(cara, cara), (cara, cruz), (cruz, cara) y (cruz, cruz)}. Un evento o suceso es cualquier subconjunto del espacio muestral, llamándose a los sucesos que contengan un único elemento sucesos elementales. En el ejemplo, el suceso "sacar cara en el primer lanzamiento", o {(cara, cara), (cara, cruz)}, estaría formado por los sucesos elementales {(cara, cara)} y {(cara, cruz)}. Los espacios de muestreo aparecen de forma natural en una aproximación elemental a la probabilidad, pero son también importantes en espacios de probabilidad. Un espacio de probabilidad (Ω, F, P) incorpora un espacio de muestreo de resultados, Ω, pero define un conjunto de sucesos de interés, la σálgebra F, por la cual se define la medida de probabilidad P. Para algunos tipos de experimento puede haber dos o más espacios de muestreo posibles. Por ejemplo, cuando se toma una carta de un mazo normal de Ejemplo: 8 1.3. TÉCNICAS DE CONTEO 1.3.1. Principio multiplicativo de conteo. Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la actividad a realizar puede ser llevado a cabo de N1 maneras o formas, el segundo paso de N2 maneras o formas y el r-ésimo paso de Nr maneras o formas, entonces esta actividad puede ser llevada a efecto de; N1 x N2 x ..........x Nr maneras o formas Suponga que se encuentra al final de una línea de ensamble final de un producto y que un supervisor le ordena contar los elementos de un lote que se ha manufacturado hace unas horas y del que se desconoce el número de productos que lo constituyen, de inmediato usted empezará a contar un producto tras otro y al final informará al supervisor que son, 48, 54 u otro número cualquiera. Ahora suponga que ese mismo supervisor le plantea la siguiente pregunta ¿cuántas muestras o grupos será posible formar con los productos del lote, si las muestras o grupos a formar son de ocho elementos cada una de ellas?. El principio multiplicativo implica que cada uno de los pasos de la actividad deben ser llevados a efecto, uno tras otro. En el primer caso el cuantificar los elementos del lote no presenta dificultad alguna para la persona encargada de hacerlo, pero cuando se le hace el segundo planteamiento, al tratar de formar las muestras o grupos de ocho elementos la persona encargada empezará a tener dificultad para hacerlo, en casos como este es necesario hacer uso de las técnicas de conteo para cuantificar los elementos del evento en cuestión (el número de muestras posibles a formar de ocho elementos), luego, ¿qué son las técnicas de conteo? Ejemplo: Las técnicas de conteo son aquellas que son usadas para enumerar eventos difíciles de cuantificar. Solución: Una persona desea construir su casa, para lo cual considera que puede construir los cimientos de su casa de cualquiera de dos maneras (concreto o block de cemento), mientras que las paredes las puede hacer de adobe, adobón o ladrillo, el techo puede ser de concreto o lámina galvanizada y por último los acabados los puede realizar de una sola manera ¿cuántas maneras tiene esta persona de construir su casa? Considerando que r = 4 pasos Ejemplo en el que definitivamente haremos uso de las técnicas de conteo: N1= maneras de hacer cimientos = 2 N2= maneras de construir paredes = 3 -¿Cuántas comisiones pro limpieza del instituto se pueden formar si hay 150 alumnos que desean ayudar en esta tarea y se desea formar comisiones de ocho alumnos? N3= maneras de hacer techos = 2 N4= maneras de hacer acabados = 1 Se les denomina técnicas de conteo a: las combinaciones, permutaciones y diagrama de árbol, hay que destacar que éstas nos proporcionan la información de todas las maneras posibles en que ocurre un evento determinado. N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12 maneras de construir la casa El principio multiplicativo, el aditivo y las técnicas de conteo proporcionan todas las maneras o formas posibles de como se puede llevar a cabo una actividad cualquiera. Las bases para entender el uso de las técnicas de conteo son el principio multiplicativo y el aditivo. 9 M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora 1.3.2. Principio aditivo de conteo. Si se desea llevar a efecto una actividad, la cual tiene formas alternativas para ser realizada, donde la primera de esas alternativas puede ser realizada de M maneras o formas, la segunda alternativa puede realizarse de N maneras o formas ..... y la última de las alternativas puede ser realizada de W maneras o formas, entonces esa actividad puede ser llevada a cabo de, 1.3.3. Permutaciones y combinaciones. Para entender lo que son las permutaciones es necesario definir lo que es una combinación y lo que es una permutación para establecer su diferencia y de esta manera entender claramente cuando es posible utilizar una combinación y cuando utilizar una permutación al momento de querer cuantificar los elementos de algún evento. M + N + .........+ W maneras o formas Combinación. Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. Ejemplo: Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a hacer la compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u 11 kilogramos), en cuatro colores diferentes y puede ser automática o semiautomática, mientras que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15 kilogramos), en dos colores diferentes y puede ser automática o semiautomática y la lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores diferentes y solo hay semiautomática. ¿Cuántas maneras tiene esta persona de comprar una lavadora? Permutación. Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. Para ver de una manera objetiva la diferencia entre una combinación y una permutación, plantearemos cierta situación. Suponga que un salón de clase está constituido por 35 alumnos. a) El maestro desea que tres de los alumnos lo ayuden en actividades tales como mantener el aula limpia o entregar material a los alumnos cuando así sea necesario. Solución: M = Número de maneras de seleccionar una lavadora Whirpool b) El maestro desea que se nombre a los representantes del salón (Presidente, Secretario y Tesorero). N = Número de maneras de seleccionar una lavadora de la marca Easy Solución: a) Suponga que por unanimidad se ha elegido a Daniel, Arturo y a Rafael para limpiar el aula o entregar material, (aunque pudieron haberse seleccionado a Rafael, Daniel y a Enrique, o pudo haberse formado cualquier grupo de tres personas para realizar las actividades mencionadas anteriormente). W = Número de maneras de seleccionar una lavadora de la marca General Electric M = 2 x 4 x 2 = 16 maneras N = 3 x 2 x 2 = 12 maneras W = 1 x 2 x 1 = 2 maneras ¿Es importante el orden como se selecciona a los elementos que forma el grupo de tres personas? 10 Reflexionando al respecto nos damos cuenta de que el orden en este caso no tiene importancia, ya que lo único que nos interesaría es el contenido de cada grupo, dicho de otra forma, ¿quiénes están en el grupo? Por tanto, este ejemplo es una combinación, quiere decir esto que las combinaciones nos permiten formar grupos o muestras de elementos en PRESIDENTE: SECRETARIO: TESORERO: CAMBIOS Daniel Arturo Arturo Daniel Rafael Rafael donde lo único que nos interesa es el contenido de los mismos. b) Suponga que se han nombrado como representantes del salón a Daniel como Presidente, a Arturo como secretario y a Rafael como tesorero, pero resulta que a alguien se le ocurre hacer algunos cambios, los que se muestran a continuación: Rafael Daniel Arturo Daniel Rafael Arturo Ahora tenemos cuatro arreglos, ¿se trata de la misma representación? Creo que la respuesta sería no, ya que el cambio de función que se hace a los integrantes de la representación original hace que definitivamente cada una de las representaciones trabaje de manera diferente, ¿importa el orden de los elementos en los arreglos?. La respuesta definitivamente sería sí, luego entonces las representaciones antes definidas son diferentes ya que el orden o la forma en que se asignan las funciones sí importa, por lo tanto es este caso estamos tratando con permutaciones. A continuación obtendremos las fórmulas de permutaciones y de combinaciones, pero antes hay que definir lo que es n! (ene factorial), ya que está involucrado en las fórmulas que se obtendrán y usarán para la resolución de problemas. n!= al producto desde la unidad hasta el valor que ostenta n. n!= 1 x 2 x 3 x 4 x...........x n Ejem. 10!=1 x 2 x 3 x 4 x.........x 10=3,628,800 8!= 1 x 2 x 3 x 4 x.........x 8=40,320 6!=1 x 2 x 3 x 4 x..........x 6=720, etc., etc. Obtención de fórmula de permutaciones. Para hacer esto, partiremos de un ejemplo. ¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica en las instalaciones de un instituto, si hay 14 participantes? Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12 candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar. Luego si n es el total de participantes en el concurso y r es el número de participantes que van a ser premiados, y partiendo de la expresión anterior, entonces. Solución: Haciendo uso del principio multiplicativo, 14x13x12x11 = 24,024 maneras de asignar los primeros tres lugares del concurso 11 14x13x12x11= n x (n - 1) x (n - 2) x .......... x (n – r + 1) Esta fórmula nos permitirá obtener todos aquellos arreglos en donde el orden es importante y solo se usen parte (r) de los n objetos con que se cuenta, además hay que hacer notar que no se pueden repetir objetos dentro del arreglo, esto es, los n objetos son todos diferentes. Si la expresión anterior es multiplicada por (n – r)! / (n – r)!, entonces = n x (n –1 ) x (n – 2) x ......... x (n – r + 1) (n – r)! / (n – r)! Entonces, ¿qué fórmula hay que usar para arreglos en donde se utilicen los n objetos con que se cuenta? Si en la fórmula anterior se sustituye n en lugar de r, entonces. = n!/ (n – r)! Por tanto, la fórmula de permutaciones de r objetos tomados de entre n objetos es: nPn= n!/ (n –n)! = n! / 0! = n! / 1 = n! Como 0! = 1 de acuerdo a demostración matemática, entonces nPn= n! RESUELVE 1. Si lanzas dos dados de seis lados sobre una mesa plana horizontal: a) b) c) d) e) ¿Cuántas veces es posible que la suma de los números de las caras que aparecen sea diez? ¿Cuántas veces es posible obtener suma de diez, si una de las caras es cuatro? ¿cuántas veces se obtiene suma par? ¿Cuántas veces se obtiene suma 1?. ¿Cuántas veces se obtiene suma par si los resultados en las dos caras son iguales?. 2. A una fiesta van 15 niñas y 13 niños. Considera todas las parejas que se pueden formar si dos de las parejas son fijas por cuanto son novios intensos y no participan con el resto del grupo. ¿Cuántas de estas parejas tendrán a una “simpática y popular niña” como uno de sus elementos?. 3. Un estudiante tiene cinco libros de literatura, tres de historia, cuatro de filosofía y dos de matemáticas. Arma un estante en donde colocará todos sus libros. ¿De cuántas maneras diferentes puede colocarlos en cada caso? a) Si no hay condiciones para su colocación. b) Si coloca los libros de la misma materia siempre juntos. c) Se coloca cada uno de los dos libros de matemáticas en un extremo. 4. A una función de teatro asisten 7 amigos y se sientan en lugares contiguos. De cuántas maneras pueden acomodar si son tres parejas que quieren sentarse juntas dos a dos y dejar al amigo sin pareja en uno de los extremos? 12 2. PROBABILIDAD DE OCURRENCIA DE UN EVENTO Al estudiar un fenómeno aleatorio es posible que queramos saber el resultado que podemos esperar en lugar de otro, bajo ciertas condiciones. Para dar respuesta a esta inquietud es necesario conocer no sólo todos los resultados posibles del fenómeno sino también definir exactamente cada evento que se va a considerar y sus posibilidades de ocurrencia. La probabilidad de un evento de un espacio muestral es la razón entre el número de casos favorables del evento y el número de casos posibles, siempre y cuando la ocurrencia de cada uno de estos sea igualmente posible. Si EM es un espacio muestral de un experimento o fenómeno aleatorio y A es un evento de tal espacio, la probabilidad del evento A, P(A), se define como la razón entre el número de elementos de A y el número de elementos de EM P ( A) = Número de elementos de A Número de elementos de EM 2.1. PROBABILIDAD CONDICIONAL Un evento es un subconjunto del espacio muestral de un experimento aleatorio. En probabilidad condicional la ocurrencia de un evento condiciona la probabilidad de un segundo evento. Sin embargo, hay muchos casos donde los eventos están totalmente sin conexión, y la ocurrencia de uno de ellos no cambia la probabilidad de ocurrencia del otro, en este caso se dice que son independientes. Sean A y B dos eventos y sea P [B] ≠ 0., A y B son eventos independientes si: P [A/B] = P [A], como consecuencia, si A y B son independientes y ∴ P [A/B] = P [A⋂B] / P [B] = P[A] ⇒ P [A ⋂ B] = P[A] P [B] y viceversa. Dos eventos A y B son independientes si se cumple cualquiera de las siguientes condiciones: 1. P [A/B] = P[A] 2. P [B/A] = P[B] 3. P [A ∩ B] = P[A]P[B] Observación: la proposición 3 se llama regla multiplicativa 13 2.2. REGLAS BÁSICAS DE PROBABILIDAD Ya se mencionó qué son los eventos mutuamente excluyentes y los que no lo son. Hay una regla general para calcular la probabilidad de eventos disyuntos, es decir, que son la combinación de eventos más simples, donde puede ocurrir uno u otro o ambos. Sea A un evento probable en un fenómeno aleatorio. P(A) su probabilidad d de ocurrencia. B otro evento probable en el mismo fenómeno aleatorio. P(B) su probabilidad de ocurrencia. Entonces, si son eventos mutuamente excluyentes: P(A o B) = P(A) + P(B) Esto significa que la probabilidad de que ocurra cualquiera de los doss es la suma de sus probabilidades. Pero, si no son eventos mutuamente excluyentes: P(A o B) = P(A) + P(B) – P(A y B) Esto quiere decir que la probabilidad de que ocurra uno de ellos o ambos es igual a la suma de sus probabilidades menos la probabilidad dad de que ocurran ambos. otro. En una selección de elementos de un conjunto dado, sin que los elementos se reintegren al conjunto, cada selección afecta af la probabilidad de ocurrencia de las subsiguientes. En este caso tenemos eventos dependientes. Por otra parte, un par de eventos son independientes si la ocurrencia de uno no afecta la ocurrencia del 14 Si dos eventos son independientes, la probabilidad de ocurrencia de ambos se calcula multiplicando sus individuales probabilidades asociadas: El resultado es 286 Otra forma de calcularlos es con la expresión P(A y B) = P(A) × P(B) n Cr = n! r ! ( n − r )! Una probabilidad condicional, de un suceso, se calcula con el conocimiento de otro suceso que ya ocurrió: P (B A) = P ( AyB ) P ( A) Ahora falta saber cuántos equipos se pueden formar con dos mujeres y un hombre, para ello nuevamente recurrimos al análisis combinatorio. Puesto que la idea de que un equipo está formado por dos mujeres y un hombre de un total de siete mujeres y seis hombres, se puede traducir en dos mujeres forman el equipo de un total de siete y un hombre de un total de seis. Al ser eventos independientes aplicamos la regla descrita y además el análisis combinatorio. Donde se espera que ocurra B, ya que A ya ocurrió. Ejemplo. ¿Cuál es la probabilidad de que se integre un equipo de trabajo con dos mujeres y un hombre, si se eligen al azar los integrantes de un grupo de seis hombres y siete mujeres? . Para resolver el problema primero necesitamos saber cuántos equipos diferentes se pueden formar, sabemos que el equipo es de tres integrantes y que las personas que lo pueden formar son trece. ( 7 C2 ) ( 6 C1 ) Calculando esto, se obtiene el número 126 Entonces hay 126 maneras diferentes de formar un equipo con dos mujeres y un hombre, además hay 286 formas diferentes de integrar a los equipos. Por lo tanto la probabilidad de que un equipo esté formado por dos mujeres y un hombre es: Debemos emplear el análisis combinatorio. Calculamos las combinaciones de trece elementos tomados de tres en tres. En las calculadoras científicas se tiene la función para el cálculo de combinaciones, el símbolo es n Cr . Entonces calculamos 13 P= C3 . 15 126 63 = = 0.4405 = 44.05% 286 143 EJERCICIOS…… 1. El gerente de un restaurante que sólo da servicio mediante reservas sabe, por experiencia, que el 20% de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas pero sólo dispone de 20 mesas, ¿cuál es la probabilidad de que a todas las personas que asistan al restaurante se les asigne una mesa? 2. Si lanzas un dado normal de seis caras dos veces, ¿Cuál es la probabilidad de obtener: a) b) c) d) e) Pares de seis? Sumas pares? Sumas diez? Sumas de a lo más diez? Sumas superior a diez) 3. Una bolsa contiene seis bolas azules, cuatro bolas rojas, tres bolas verdes y una bola negra. Si extraes al azar un par de bolas, ¿cuál es la probabilidad de que: a) b) c) d) e) Salga una negra? No salga ninguna verde? Ambas sean azules? Las dos sean diferentes? Las dos sean del mismo color? 4. Un avión de alto rendimiento contienen tres computadoras idénticas. Se utiliza únicamente una para operar el avión; las dos restantes son repuestos que pueden activarse en caso de que el sistema primario falle. Durante una hora de operación la probabilidad de que una falle en la computadora primaria( o de cualquiera de los sistemas de repuesto activados) es 0,0005. Suponiendo que cada hora representa un ensayo independiente, (a) ¿Cuál es el tiempo promedio para que fallen las tres computadoras? (b) ¿Cuál es la probabilidad de que las tres computadoras fallen en un vuelo de 5 horas? 5. De una bolsa que tiene cinco bolas rojas y tres azules se saca una bola y luego se saca la otra. a) ¿cuál es el espacio muestral si la primera se devuelve a la bolsa antes de sacar la segunda? (con reposición). b) ¿Cuál es el espacio muestral si la primera no se devuelve antes de sacar la segunda (Sin reposición). c) ¿Cuál es la probabilidad de que las dos bolas sacadas sean del mismo color si no hubo reposición? ¿Cuál si hubo reposición?. 6. Un lote contiene 100 piezas de un proveedor de tubería local y 200 unidades de un proveedor de tubería del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo, a) ¿cuál es la probabilidad de que todas sean del proveedor local? b) ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local? c) ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local? 7. Si lanzas 3 monedas simultáneamente, ¿Cuál es la probabilidad de que el lanzamiento sea: a) Tres caras o tres sellos? b) Por lo menos una cara? c) Ninguna cara? 16 UNIDAD 2 1. VALOR ESPERADO Y VARIANZA 1.1. VALOR ESPERADO El valor esperado es un concepto fundamental en el estudio de las distribuciones de probabilidad. Desde hace muchos años este concepto ha sido aplicado ampliamente en el negocio de seguros y en los últimos veinte años ha sido aplicado por otros profesionales que casi siempre toman decisiones en condiciones de incertidumbre. 1.1.1. Propiedades del valor esperado 1.1.1.1. Al multiplicar todos los valores de una variable por una misma constante, el valor esperado de ésta queda multiplicado por el valor de la constante. Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que ésta puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos. Es un promedio ponderado de los resultados que se esperan en el futuro. Sea X una Variable Aleatoria que toma valores en un conjunto discreto (en un conjunto finito de números en uno infinito como: los naturales, los enteros o los racionales), por ejemplo si la variable aleatoria X toma los siguientes valores: X = 0, 1, 2, 3, … decimos que es discreta La probabilidad de que X tome cada uno de sus valores viene dada por la función de probabilidad: 1.1.1.2. Al sumar a todos los valores de una variable una misma constante, el valor esperado de ésta queda incrementado por el valor de la constante. P(X = i ), para i = 0, 1, 2, 3, ... ; Sea P(X = i ) = pi para i = 0, 1, 2, 3, ... Se tiene que p1 + p2 + p3 +...+ pn +... = 1 Se define el Valor Esperado de una Variable Aleatoria con distribución discreta como: Y para una variable aleatoria con distribución continua como: 17 1.1.1.3. Si tenemos dos variables X e Y, discretas o continuas, el valor esperado de su suma o diferencia es la suma o diferencia de sus valores esperados Es importante indicar que la independencia de las variables es condición suficiente pero no necesaria para que el valor esperado del producto de dos variables sea igual al producto de sus valores esperados, es decir, ésta es una propiedad de las variables independientes pero se cumple en variables que no son independientes. EJERCICIOS…… 1. Lanzamos dos monedas. Si salen dos caras recibimos 3 pesos, si sale una cara recibimos 1 peso y si no sale ninguna cara pagamos 5 pesos .¿Cuál es la ganancia media del juego? 2. Hallar el valor esperado de la variable aleatoria X, dada por la función de probabilidad: E[X ± Y] = E[X] ± E[Y] 1.1.1.4. Si las variables anteriores, X e Y son variables aleatorias independientes ocurre que el valor esperado de su producto es igual al producto de sus valores esperados. 3. Una caja contiene 8 bombillos, de los cuales están 3 están defectuosos. Se selecciona un bombillo de la caja y se prueba. Si este sale defectuoso se selecciona y se prueba otro bombillo, hasta que se escoja un bombillo no defectuoso. Encuentre el número esperado E de bombillos seleccionados. 4. La probabilidad de que una casa de cierto tipo quede destruida por un incendio en cualquier período de doce meses es de 0.005. Una compañía de seguros ofrece al propietario una póliza de seguros contra incendio por $20,000 (dólares) a un año con una prima de $150 dólares. ¿Cuál es la ganancia esperada de la compañía? E[X Y] = E[X] E[Y] 18 1.2. VARIANZA La desviación media es una medida de dispersión de datos correcta pero presenta un inconveniente y es la complejidad de manipulación al intervenir valores absolutos. Sería conveniente encontrar otra medida que no presente el problema inicial (que no se compensen las dispersiones negativas con las positivas) y cuyo manejo se hace más sencillo. Otra forma de evitar la compensación de dispersiones es elevar al cuadrado la diferencia y es más sencillo trabajar con cuadrados que con valores absolutos, teniendo en cuenta esta consideración introducirémos el concepto de varianza. El principal problema de la varianza es que se expresa en unidades cuadráticas que no siempre tienen una interpretación clara. Para obviar este problema se define otra medida de la dispersión que es la desviación típica, σX, o simplemente σ, que se calcula como la raíz cuadrada positiva de la varianza; evidentemente, la desviación típica se mide en las mismas unidades que la variable No obstante, la desviación típica no resuelve todos los problemas que se pueden plantear, como por ejemplo la comparación de situaciones en las que la unidad de medida o el orden de magnitud de esta sea diferente. Para resolver esta cuestión se define una medida adimensional de la variabilidad que es el coeficiente de variación, C V, que se calcula como el cociente entre la desviación típica y la media (a veces este cociente se expresa en tanto por ciento multiplicándolo por 100). La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Es decir que la varianza de una variable es igual a la media de los cuadrados menos el cuadrado de la media. La varianza de una variable mide la dispersión de sus valores respecto al valor central µ. En este contexto de la medida de la variación se plantea el problema de medir la variación conjunta de variables de variables asociadas. Para calcular la varianza por un método más sencillo se utiliza la expresión: Supongamos que tenemos dos variables aleatorias X e Y, discretas o continuas, con función de probabilidad o densidad conjunta f(x,y) y definimos una función z(x,y) igual al producto de las desviaciones de cada valor a su media respectiva (es 2 decir, z(x,y) tiene la misma estructura que (X - µ) = (X - µ) (X - µ) si sustituimos una vez a X por Y). 19 1.2.1.. Varianza para datos agrupados Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. 1.2.2. Varianza para datos NO agrupados Ejemplo: Calcular la varianza de la distribución: tribución: 9, 3, 8, 8, 9, 8, 9, 18 1.2.3. Propiedades Como sumamos cuadrados la varianza siempre es positiva y será nula cuando todos los valores de la variable sean coincidentes y por tanto iguales a la varianza. Al elevar al cuadrado elevamos la unid unidad ad de medida de las observaciones al cuadrado. Al elevarse al cuadrado las desviaciones aquellos valores más alejados de la media afectarán mucho a la varianza. Es invariante ante cambios de origen. Si se produce un cambio de escala la nueva varianza es igual igual a la anterior multiplicada por el cuadrado del cambio. Si se produce simultáneamente un cambio de origen y escala en los datos, sólo el cambio de escala afectará a la varianza. 20 EJERCICIOS 1) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿cómo están relacionadas las medias?. 2) Multiplicando cada número 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos el conjunto 11, 17, 9 7, 19 15. ¿Cuál es la relación entre la desviación típica de ambos conjuntos? ¿Y entre las medias? 3) Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. ¿Cuál es el valor de la media de X?. 4) Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9 respectivamente. ¿Para cual de las dos variables el valor de la media es más representativo? 2. DISTRIBUCIÓN BINOMIAL Por ejemplo las siguientes experiencias son de tipo Bernouilli: Una variable aleatoria X se llama binomial si su valor es igual al número de éxitos que ocurren en n pruebas independientes, teniendo todas ellas la misma probabilidad de éxito, que designamos por p. Su función de probabilidad es: • Jugar a cara o cruz. • El nacimiento de un niño (varón o mujer) • Obtener un “4” en el lanzamiento de un dado. • Obtener un número “par” en el lanzamiento de un dado. • Obtener “copas” al extraer una carta de la baraja española. • La fabricación de una pieza en una factoría (aceptable o defectuosa). • El resultado de una operación (éxito o fracaso). • El lanzamiento a una canasta (encestar o fallar). • Aprobar o suspender un examen. Si una variable X sigue la distribución binomial de parámetros n y p suele designarse como: Cuando se realizan n pruebas independientes de tipo Bernouilli decimos que es una experiencia aleatoria de tipo Binomial. Las constantes n y p son los parámetros de la distribución; obviamente, n > 0 es un número entero y 0 ≤ p ≤ 1. La probabilidad de obtener fracaso es 1−p y se designa con la letra q de forma que p + q = 1. Por ejemplo las siguientes experiencias son de tipo Binomial: El cálculo de la media, la varianza y la desviación típica es algo laborioso y resulta: • Jugar 10 veces a cara o cruz . • Observar 30 nacimientos de un bebé (niña o niño) • Obtener el “4” en el lanzamiento de 15 dados. • Obtener “copas” al extraer una carta 8 veces de la baraja española. • La fabricación de 1000 piezas en un factoría (aceptable o defectuosa). • El resultado de 50 operaciones (é o fracaso). • El lanzamiento a una canasta n veces (encestar o fallar). Experiencias binomiales. Toda experiencia aleatoria que presenta dos resultados posibles, uno que fijamos como “´exito” y lo contrario como “fracaso” se suele denominar de tipo Bernouilli. 21 EJERCICIOS…… 1. La probabilidad de que cierto jugador de baloncesto enceste una canasta de 3 puntos es 0.3. ¿Cuál es la probabilidad de que enceste, exactamente dos canastas de cinco lanzamientos? udiante que ingresa en la universidad se licencie en 5 años es de 0.4. Se eligen al 2. La probabilidad de que un estudiante azar 10 estudiantes. Calcular la probabilidad de que: a) Ninguno se licencie en 5 años. b) Todos se licencien en 5 años. c) Un único estudiante se licencie en 5 años. 3. Una máquina a produce 12 piezas defectuosas de cada mil que fabrica. Hallar la probabilidad de que al examinar 40 piezas: a) Solo haya una defectuosa. b) No haya ninguna defectuosa. 4. En un grupo de 20 estudiantes de un instituto se ha comprobado que cada alumno falta a clase c el 4% de los días. Calcular la probabilidad de que en un día determinado: a) No se registre ninguna falta. b) Falten a clase menos de 3 estudiantes. c) Falte a clase un único estudiante. 5. En una determinada ciudad, la probabilidad del nacimiento de una niña es del 56%. Seleccionamos una familia de cinco hijos. Calcular la probabilidad de que: a) Tenga exactamente 3 niñas. b) Tenga al menos dos niñas. c) ¿Cuál es el número medio de hijas en las familias con cinco hijos?. 3. DISTRIBUCIÓN DE POISSON En teoría de probabilidad y estadística, estadística la distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de un una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado número de eventos durante cierto periodo de tiempo. donde k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces). λ es un parámetro ámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 10 = 40. e es la base de los logaritmos naturales (e = 2,71828 ...) Fue descubierta por Siméon-Denis Denis Poisson, Poisson que la dio a conocer en 1838 en su trabajo (Investigación sobre la probabilidad de los juicios en materias criminales y civiles). 3.1. PROPIEDADES La función de masa de la distribución de Poisson es 22 Tanto el valor esperado como la varianza de una variable aleatoria con distribución de Poisson son iguales a λ. Los momentos de orden superior son polinomios de Touchard en λ cuyos coeficientes tienen una interpretación combinatoria. combinatori De hecho, cuando el valor esperado de la distribución de Poisson es 1, entonces según la fórmula de Dobinski, el n-ésimo ésimo momento iguala al número de particiones de tamaño n. La moda de una variable aleatoria de distribución de Poisson con un λ no entero es igual a , el mayor de los enteros menores que λ (los símbolos representan la función parte entera). Cuando λ es un entero positivo, las modas son λ y λ − 1. La función generadora de momentos de la distribución de Poisson con n valor esperado λ es Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente divisibles sibles. La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parámetro λ0 a otra de parámetro λ es 3.2. RELACIÓN CON OTRAS DISTRIBUCIONES 3.2.1. Sumas de variables aleatorias de Poisson. Poisson La suma de variables aleatorias de Poisson independientes es otra variable aleatoria de Poisson cuyo parámetro es la suma de los parámetros de las originales. Dicho de otra manera, si manera que se mantenga constante, la distribución límite obtenida es de Poisson. 3.2.3. Aproximación normal. normal Como consecuencia del teorema central del límite, límite para valores grandes de , una variable aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente son N variables aleatorias de Poisson independientes, entonces: converge a una distribución normal de media nula y varianza 1. . 3.2.4. Distribución exponencial. exponencial Supóngase que para cada valor t > 0, que representa el tiempo, el número de sucesos de cierto fenómeno aleatorio sigue una distribución de Poisson de parámetro λt. Entonces, los tiempos discurridos entre dos sucesos sucesivos sigue la distribución exponencial. exponencial 3.2.2. Distribución binomial. La distribución de Poisson es el caso límite de la distribución binomial. binomial De hecho, si los parámetros n y de una distribución binomial tienden a infinito y a cero de 23 EJEMPLO: Ejemplos de estos eventos que pueden ser modelados por la distribución de Poisson incluyen: Si el 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa, para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan ngan encuadernaciones defectuosas usamos la distribución de Poisson. En este caso concreto, k es 5 y , λ,, el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo. El número de errores de ortografía que uno comete al escribir una única página. El número de llamadas telefónicas telefónica en una central telefónica por minuto. El número de servidores web accedidos por minuto. El número de animales muertos encontrados por unidad de longitud de ruta. El número de mutaciones m de determinada cadena de ADN después de cierta cantidad de radiación. El número de núcleos atómicos inestables que decayeron en un determinado período El número de estrellas en un determinado determinad volumen de espacio. La distribución de receptores visuales en la retina del ojo humano. La inventiva de un inventor invento a lo largo de su carrera. Este problema también podría resolverse recurriendo a una distribución binomial de parámetros k = 5, n = 400 y =0,02. 3.3. PROCESOS DE POISSON La distribución de Poisson se aplica a varios fenómenos discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un área determinada) cuando la probabilidad de ocurrencia del fenómeno es constante en el tiempo o el espacio. 24 EJERCICIOS…… 1. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho, a) ¿cuál es la probabilidad de que falle un componente en 25 horas? b) ¿y de que fallen no más de dos componentes en 50 horas? c) ¿cuál es la probabilidad de que fallen por lo menos diez en 125 horas? 2. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una distribución Poisson con una media de 2.3 imperfecciones por milímetro. a) Determine la probabilidad de 2 imperfecciones en un milímetro de alambre. b) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre. c) Determine la probabilidad de al menos una imperfección en 2mm de alambre 3. La contaminación constituye un problema en la fabricación de discos de almacenamiento óptico. El número de partículas de contaminación que ocurre en un disco óptico tiene una distribución de Poisson y el número promedio de partículas por centímetro cuadrado de superficie del disco es 0.1. El área de un disco bajo estudio es 100 centímetros cuadrados. a) Encuentre la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio. b) La probabilidad de que ocurran cero partículas en el área del disco bajo estudio c) Determine la probabilidad de que 12 o menos partículas ocurran en el área del disco bajo estudio 4. DISTRIBUCIÓN NORMAL La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos. La función de distribución normal juega un papel central en la estadística ya que, además de sus interesantes propiedades de reproductividad y de aproximación de otras distribuciones, sirve para modelizar una gran cantidad de situaciones prácticas. Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son: La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes. caracteres morfológicos de individuos como la estatura; caracteres fisiológicos como el efecto de un fármaco; caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicológicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc. La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional. 25 aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal. Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad". En la figura se muestran dos distribuciones normales, con media µ = 0 y desviaciones típicas σ = 1 y σ = 0.5. Como las dos tienen la misma media µ = 0, la función n roja es mas alargada pues tiene menos variabilidad que la azul. En probabilidad, obabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas. Una variable aleatoria X se dice que tiene una distribución n de probabilidades normal con media µ y 2 2 varianza σ y se denomina N(µ, σ ) si su funci función de densidad es de la forma: donde µ (mu) es la media y σ (sigma) 2 la desviación estándar (σ es la varianza arianza). es 4.1. LA NORMAL N(0; 1) La normal típica, pica, tiene media µ = 0 y desviación desviaci típica σ = 1, N(0; 1) y se designa con la letra z. Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los valores µ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión: Para calcular las probabilidades P(Z ≤ z0) = Φ(z0) En la figura se muestra la función n de densidad y se aprecia que es simétrica trica respecto de x = µ y los puntos de inflexión de la función n de densidad se encuentran a una distancia σ de la media. se diseña a una tabla que proporciona las respectivas probabilidades. 26 27 Ejemplo: Si z es normal Nz(0; 1) hallar: P(z ≤ 0) P(z ≤ 1) P(z ≤ 2) Solución: Ahora vas a manejar la tabla en forma inversa. Nos dan la probabilidad y calculamos culamos el valor de la variable z0 que acumula dicha probabilidad. Ejemplo: Hallar z0 de la normal Nz(0; 1) en cada caso: P(z < z0) = 0.7019 P(z < z1) = 0.8997 P(z < z2) = 0.9625 Solución: 28 4.2. TIPIFICAR UNA VARIABLE NORMAL a) P(z < z0) = 0.50 b) P(z < z0) = 0.8729 c) P(z < z0) = 0.3300 d) P(z > z0) = 0.9015 e) P(z < z0) = 0.9971 f) P(z > z0) = 0.1190 Cuando tenemos una variable le normal N(µ; σ), para calcular las probabilidades se efectúa efect un cambio de variable que la convierte en una del tipo N(0; 1): 4. Si la estatura X de 500 estudiantes es normal de media 172 cm y desviación típica 5 cm, hallar el número de estudiantes con estatura a) entre 170 y 175 cm b) mayor de 180 cm. A esta variable se la llama normalizada o tipificada. tipi De esta forma, sólo es necesario disponer de la tabla correspondiente a la N(0, 1) para realizar un cálculo dado, ya que: 5. La temperatura T durante el mes de mayo está distribuida de forma normal con media 21º y desviación típica 4º. Hallar el número de días esperados en que haya una temperatura entre 19º y 23º. Ejemplo: Si X es normal N(5; 2) hallar P(X < 8). 6. El tiempo en días de duración de los focos producidos por una empresa, es una variable normal de media 780 y desviación típica de 40 días. Calcúlese el porcentaje de focos con una duración superior a 800 días. Solución: 7. Los pesos de los individuos de una población poblaci se distribuyen normalmente normalme con media 70 kg y desviación típica pica 5 kg. Calcular: a) La probabilidad de que q el peso de un individuo esté comprendido entre 65 y 80 kg. b) La probabilidad de que un individuo pese más m de 100 kg. EJERCICIOS…… UTILIZA LA TABLA N(0,1) 8. En una panadería se cortan panecillos con un peso que se ajusta a una variable normal norm de media 100 g y desviación típica 9 g. ¿Cuál es la probabilidad de obtener un panecillo cuyo peso oscile entre 80 g y la media? 1. Si X es normal N(5; 2) hallar: P(X < 8) P(X < 2) P(2 < X < 8) 2. En una distribución normal N (18;4), hallar hal las siguientes probabilidades: 9. La distribución n de la duración duraci de un embarazo en mujeres es aproximadamente aproxima normal con media 266 días as y desviación desviaci típica 16 días. Calcular: a) La probabilidad de que un embarazo dure más m de 242 días. b) El 20% de los embarazos duran menos de ¿cuántos días? c) El 50% de los embarazos duran menos de ¿cuántos días? a) P(x < 18) b) P(x < 20) c) P(x > 16, 5) d) P(x < 11) e) P(19 < x < 23) f) P(11 < x < 25) 3. En la distribución normal Nz(0; 1), hallar el valor de z0 en cada caso: 29 UNIDAD 3 1. TEORÍA DE LA METODOLOGÍA DE LA INVESTIGACIÓN CIENTÍFICA El método es el modelo de trabajo o secuencia lógica que orienta la investigación, ahora bien el estudio del método o de los métodos se llama metodología. organizados y verificables. En el caso de la vida real, el proceso para apropiarse del conocimiento es continuo y muy desordenado. En el caso de la investigación científica debemos tener en cuenta que se trata de una experiencia creativa donde no pueden excluirse la intuición ni la subjetividad. El método científico (del griego: -meta = hacia, a lo largo -odos = camino-; camino), es decir que se trata del camino que debe seguir el científico para el logro del conocimiento. Para recorrer este camino es necesario respetar algunas grandes fases o momentos: El método científico está sustentado por dos pilares fundamentales. 1.1.1. Fase Proyectiva: Es el primer momento donde el investigador ordena y sistematiza sus inquietudes, formula sus preguntas y elabora organizadamente los conocimientos que constituyen su punto de partida, revisando y asimilando lo que se ya se conoce respecto al problema que se ha planteado. Es el momento que se atiende a la racionalidad y a lograr la coherencia lógica del marco teórico y de la investigación en general. El primero de ellos es la reproducibilidad, es decir, la capacidad de repetir un determinado experimento en cualquier lugar y por cualquier persona. Este pilar se basa, esencialmente, en la comunicación y publicidad de los resultados obtenidos. El segundo pilar es la falsabilidad. Es decir, que toda proposición científica tiene que ser susceptible de ser falsada, esto implica que se pueden diseñar experimentos que en el caso de dar resultados distintos a los predichos negarían la hipótesis puesta a prueba. 1.1.2. Fase Metodológica: es donde el investigador fija la estrategia ante el objeto de estudio, es cuando formula el modelo operativo para apropiarse del conocimiento. La preocupación mayor durante toda esta fase es la de elaborar sistemas de comprobación lo más confiables posibles. La sistematización de los métodos científicos es una materia compleja y tediosa. No existe una única clasificación, ni siquiera a la hora de considerar cuántos métodos distintos existen. Sin embargo aquí se presenta una clasificación que cuenta con cierto consenso dentro de la comunidad científica. 1.1.3. Fase Técnica: Es abordar las formas y procedimientos concretos que nos permitan recolectar y organizar la informaciones que necesitamos. Es esta fase se obtiene la información y además se redefinen y ponen a punto las técnicas y los instrumentos que se emplean en la investigación. Además es importante saber que ningún método es un camino infalible para el conocimiento, todos constituyen una propuesta racional para llegar a su obtención. 1.1.4. Fase de Síntesis: Se inicia cuando el investigador dispone de los datos que le proporciona el objeto de estudio, y así se puede elaborar los nuevos conocimientos. 1.1. COMPONENTES DE UN PROYECTO DE INVESTIGACIÓN La investigación científica es la actividad que nos permite obtener conocimientos científicos, es decir, conocimientos objetivos, sistemáticos, claros, 30 En toda investigación científica se necesitan de tres elementos componentes: - El sujeto de la investigación (el investigador). - El objeto de estudio, que son la infinidad de temas y problemas moviliza al investigador. - El método científico, que es el procedimiento o conjunto de procedimientos que se utilizan para obtener conocimientos científicos. 1.2. TIPOS DE INVESTIGACIÓN Las investigaciones podrán clasificarse de acuerdo a lo expresado más abajo, lo cual no quiere decir que se la única clasificación, sino que según el autor o el área del conocimiento a que se refiera podrá existir distintas forma de clasificarse. 31 32 1.3. ORGANIZACIÓN DE LA INFORMACIÓN 3) No existe un único proceso o secuencia a seguir. Varían, eso sí, en la cantidad de pasos, aunque la secuencia general manifiesta casi siempre una cierta similitud, inevitable por la misma lógica de la investigación. 1) Todo esquema sobre el proceso de investigación tiende a convertirse en una especie de modelo formal restrictivo, en un molde rígido de procedimientos que puede adquirir hasta un carácter burocrático. 4) En la mayoría de los casos debe interpretarse el proceso como algo dinámico, no tiene principio ni fin, debe ser interpretado como un trabajo continuo, donde cada investigación requiere de mayor esfuerzo al investigador. 2) En realidad la labor científica es un trabajo donde la libertad y la creación cumplen un papel central: no hay, ni puede haber, ninguna receta que nos garantice un resultado positivo para nuestro trabajo, por cuanto las dificultades y los imprevistos son tantos que impiden alcanzar una planificación completa del proceso. 5) Esto tiene por objeto mostrar que no hay verdaderamente un orden único en el trabajo sino que existen tareas que se desarrollan de un modo 33 simultáneo, que se complementan y determinan mutuamente. pedagógicos o prácticos: si no hay algo de algún modo desconocido o mal conocido no hay, en verdad, auténtica necesidad de investigar, de obtener nuevo conocimiento. 1.3.1. Pasos para la organización Los problemas de conocimiento no deben confundirse con los problemas de la vida práctica, aunque ambos puedan estar estrechamente ligados. Así, por ejemplo, no es un problema de investigación reducir los accidentes de tránsito, pero en cambio sí lo es responder a la pregunta: cuáles son las causas que producen los accidentes de tránsito? Con base a su repuesta es que podrá resolverse el problema práctico, pero es preciso hacer la distinción entre estas dos clases de problemas para disipar frecuentes equívocos que luego se traducen en serios inconvenientes para el investigador. - Definición del Área temática: implica la selección de un campo de trabajo, de la especialidad o problemática donde nos situamos. Para explicarnos mejor ejemplificaremos diciendo que son áreas temáticas: La educación en el primer ciclo, la función materna en niños sordos, la toma de decisiones, las migraciones internas, la comercialización de obras de arte. - Delimitación de la investigación: en esta etapa se acota el problema de la investigación, se reduce el campo de la investigación. De esta manera la investigación puede ser más profunda. Acá se fijan los objetivos, generales y específicos, del trabajo a desarrollar, aclarando qué fines se considera posible alcanzar concretamente. No puede hacerse investigación científica estudiando todo a la vez, sin ningún orden ni disciplina y sin tener una idea, aunque sea aproximada, de lo que se irá a alcanzar: es necesario contar con un tema de estudio preciso y bien delineado que, por sus proporciones, pueda ser investigado en correspondencia con nuestros recursos teóricos y materiales. Es decir, se trata de campos del saber que tiene unidad interna pero que abarcan una problemática mucho más reducida que las disciplinas, y aún las especialidades, en las que suelen ubicarse. No son áreas temáticas, como podría corresponderle a cada tema anterior, la educación, la función materna, El gerenciamiento, la sociología o el comercio. Toda investigación versa, naturalmente, sobre algún área del conocimiento, se buscará diseñar una investigación de carácter interdisciplinario. - Planteamiento del problema: En esta etapa se realiza la formulación del problema. Esto es una de las fundamentales de todo el proceso de investigación. En ausencia de un problema no hay verdadera búsqueda de conocimientos, no hay creación, aunque puedan hacerse valiosos aportes - Marco Teórico: Esto significa asimilar el bagaje conceptual y las teorías ya elaboradas respecto al 34 tema, pero reenfocadas para los fines específicos de nuestro caso. Implica por lo tanto la revisión y organización de los conocimientos previos disponibles sobre el tema, en lo que se refieren particularmente al problema que e se ha planteado y al punto de vista que se ha asumido acerca del mismo. tiene por misión determinar la forma en que el problema habrá de ser verificado: establecerá el criterio general de comprobación, el sistema de aproximación a la realidad específica considerada, la estrategia general a utilizar. Las variables: se definen conceptuamente, se operacionalizan lizan y se determinan los indicadores que luego servirá para el diseño de los instrumento de recolección de información. - Datos: se obtienen en bruto y necesitan, por tanto, de un trabajo de clasificación y ordenación que habrá de hacerse teniendo en cuenta cuen las proposiciones sobre las que se asienta la investigación. Esta tarea, el procesamiento de los datos. - Analizar y concluir: Finalmente, con estos datos ya procesados adecuadamente, habrá que retomar la labor propiamente analizarlos cuidadosamente para a extraer conclusiones de interés y de esta manera elaborar el informa final. - Diseño: Este cumple la función de complementarse al marco teórico: si éste proporciona el marco conceptual y referencial para el problema, el diseño 35 COMPRENSIÓN LECTORA En 1939, Leonid Vitalyevich Kantorovich (1912-1986), matemático soviético, ideó el concepto de programación lineal, en el proceso de resolver un problema relativo a horarios de producción de una fábrica. Kantorovich estudió matemáticas en la Universidad estatal Leningrado, donde le otorgaron el doctorado a la edad de 18 años. Desde 1934 hasta 1960 fue profesor en la Universidad de Leningrado. A partir de 1961, y por 10 años, fue el presidente de la rama soviética de matemáticas y economía en la academia de ciencias de la Unión de Repúblicas Socialistas Soviéticas. Desde 1971 hasta 1976, dirigió el Instituto de Planeación Económica de Moscú. Aún cuando la preparación de Kantorovich fue totalmente en matemáticas, su interés por la aplicación de ellas a la economía lo llevó a sugerir el uso del método de programación lineal a esta cuando en 1939 publicó su libro Métodos matemáticos para organizar y planear producción. Otro libro con el cual amplió su contribución a la economía y que escribió en 1942 pero publicó en 1959 se titula El mejor uso de recursos económicos. En éste describe la aplicación de técnicas de optimización a un rango amplio de problemas. Los métodos propuestos por Kantorovich se ampliaron, curiosamente, debido a la Segunda Guerra Mundial. Como los pelotones de soldados de la fuerza aérea americana aumentaron considerablemente era difícil coordinar el suministro de provisiones. Un equipo de matemáticos se dedicó al desarrollo de programas que, con el uso de calculadoras y computadores, facilitaron la organización óptima el suministro. El matemático americano George Dantzig (1914- ) desarrolló en 1947, el método simplex, que permite resolver problemas de programación lineal simultáneamente. Dantzig, hijo de un matemático ruso que emigró a Estados Unidos, tuvo muchas dificultades en matemáticas cuando era niño pero debido no sólo al apoyo de su padre sino también de un amigo escolar de un profesor, Dantzig no sólo superó sus problemas sino que llegó a ser un gran matemático. Su campo de interés es la estadística. Según Dantzig el mejor regalo de su padre fue proveerlo de miles de problemas de geometría durante su adolescencia pues “ el ejercicio mental necesario para resolverlos, en el momento en el cual mi cerebro estaba creciendo, contribuyó más que cualquier otra cosa al desarrollo de mi poder analítico". Estudió matemáticas en la Universidad de Maryland y estaba adelantando estudios de postgrado cuando estalló la guerra. En ese momento comenzó a trabajar con la Fuerza Aérea como civil, siendo esto el principio de una carrera exitosa en varias instituciones relacionadas con la defensa de su patria. El término "programación lineal" para el método de resolución lo sugirió T J Koopmans, amigo de Dantzig, en 1948. Tiene su origen en el uso del término militar "programar" usado para referirse a los horarios organizados para entrenamiento, suministro y desplazamiento de los soldados. En 1952, Dantzig comenzó a trabajar con la corporación RAND como investigador para el desarrollo de programas para computadoras. A partir de 1960, retomó su carrera académica como docente en las universidades de Berkeley y Stanford. Contesta: 1. ¿Qué semejanzas existen entre Kantorovich y Dantzig? 2. ¿Cuáles fueron las situaciones de la vida real que llevaron a la creación de los métodos de programación lineal? 3. ¿A quién se debe y cuál es el origen del término "programación lineal"? 4. ¿Cuántos años pasaron entre la primera vez que se usó la programación lineal y el desarrollo del método simplex? 5. ¿En qué campos del saber se aplica principalmente la programación lineal? 36 UNIDAD 4 1. MÉTODOS DE INVESTIGACIÓN Gráficamente podemos interpretar de la siguiente manera: - Método empírico-analítico: Conocimiento basado en la experiencia, y analítico porque tiene en cuenta variables que se analizan en forma particular. Es muy utilizado en las ciencias naturales y sociales o humanas. - Método de la medición: Basado en la experiencia y verificable en estadísticas. - Método dialéctico: afirma que todos los fenómenos se rigen por las leyes de la dialéctica, es decir que la realidad no es algo inmutable, sino que está sujeta a contradicciones y a una evolución y desarrollo perpetuo. Por lo tanto propone que todos los fenómenos sean estudiados en sus relaciones con otros y en su estado de continuo cambio, ya que nada existe como un objeto aislado. - Método experimental: Basado en experimentos, el conocimiento adquirido puede ser verificado en un experimento. Implica alteración controlada de las condiciones naturales, de tal forma que el investigador creara modelos, reproducirá condiciones, abstraerá rasgos distintivos del objeto o del problema. - Método histórico. Está vinculado al conocimiento de las distintas etapas de los objetos en su sucesión cronológica. Para conocer la evolución y desarrollo del objeto o fenómeno de investigación se hace necesario revelar su historia. - Método de la observación científica: El investigador conoce el problema y el objeto de investigación, estudiando su curso natural, sin alteración de las condiciones naturales, es decir que la observación tiene un aspecto contemplativo. - Método sintético. Es un proceso mediante el cual se relacionan hechos aparentemente aislados y se 37 formula una teoría que unifica los diversos elementos. Consiste en la reunión racional de varios elementos dispersos en una nueva totalidad, este se presenta más en el planteamiento de la hipótesis. - ¿Qué resultados personales y generales traerá el desarrollo de esa investigación? - Método sistémico: Está dirigido a modelar el objeto mediante la determinación de sus componentes, así como las relaciones entre ellos. Esas relaciones determinan por un lado la estructura del objeto y por otro su dinámica. Son las razones por las cuales se plantea la investigación. 2.2. JUSTIFICACIÓN Y/O ANTECEDENTES - La justificación teórica son las razones que argumentan el deseo de verificar, rechazar o aportar aspectos teóricos en relación con el objeto de conocimiento. - Método lógico inductivo: Es el razonamiento que, partiendo de casos particulares, se eleva a conocimientos generales. Destaca en su aplicación el método de interpolación. - La justificación metodológica son las razones que sustentan un aporte por la utilización o creación de instrumentos y modelos de investigación. - Método lógico deductivo: Mediante ella se aplican los principios descubiertos a casos particulares, a partir de un enlace de juicios. - La justificación práctica son las razones que señalan que la investigación propuesta ayudará en la solución de problemas o en la toma de decisiones. - Analogía: Consiste en inferir de la semejanza de algunas características entre dos objetos, la probabilidad de que las características restantes sean también semejantes. Los razonamientos analógicos no son siempre validos. - La justificación debe responder a la pregunta. ¿Por qué se investiga? 2.3. FORMULACIÓN DEL PROBLEMA Es el punto de partida de la investigación si no se tiene problema alguno no hay nada para investigar. El proceso de investigación se debe iniciar con un diseño que responda interrogantes que son las inquietudes del investigador. 2. COMPONENTES MÍNIMOS DE UN PROYECTO DE INVESTIGACIÓN Estructura del proyecto. No existe un modelo único, universalmente aceptado, respecto al orden en que deben aparecer las diferentes partes de un anteproyecto. Tentativamente podrá seguirse el siguiente: La formulación se plantea a través de una pregunta de investigación; el investigador espera responderla y de esta manera resolver el problema planteado. 2.1. EL TEMA DE INVESTIGACIÓN En esta etapa el investigador debe plantearse algunas preguntas como: Para la sistematización del problema se formulan subpreguntas que el investigador plantea sobre temas específicos que se han observado en el planteamiento del problema. - ¿Es de interés el tema? 2.4. OBJETIVOS GENERALES Y ESPECÍFICOS - ¿Existe información sobre el mismo? El proceso científico formulado a partir del planteamiento del problema tiene como finalidad buscar respuestas de la situación descrita, objeto de la investigación por ello, es de mucha ayuda - ¿Quién tiene o en donde se puede encontrar la información? 38 responder a la pregunta: ¿Para qué y qué se busca con la investigación propuesta? estudio descriptivo identifica características del universo de investigación, señala formas de conducta, establece comportamientos concretos y descubre y comprueba asociaciones entre variables. El estudio explicativo orienta a la comprobación de hipótesis casuales. Dar respuesta a a esta interrogante permite delimitar el marco de estudio y sus alcances, se deben plantear objetivo general y objetivos específicos. Los primeros deben ofrecer resultados amplios; los específicos se refieren a situaciones particulares que inciden en el objetivo general. 2.8. PLAN DE TRABAJO Y/O CRONOGRAMA DE ACTIVIDADES 2.5. ELEMENTOS TEÓRICOS QUE FUNDAMENTAN LA INVESTIGACIÓN - MARCO TEÓRICO El investigador debe señalar las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas. Mediante la gráfica de Gantt se establece una relación entre las etapas de investigación investigac y tiempo de ejecución, se representa por el uso de barras horizontales. La investigación que se realiza debe tener en cuenta el conocimiento previo, pues forma parte de una estructura teórica ya existente. 2.9. PRESUPUESTO - El marco teórico es la descripción pción de los elementos teóricos planteados por uno por varios autores que permiten al investigador fundamentar su proceso de conocimiento. En el presupuesto deben incluirse los gastos de la investigación en términos de precios y cantidades reales de acuerdo con los rubros: - La función del marco conceptual es definir el significado de los términos (lenguaje técnico) que van a emplearse con n mayor frecuencia y sobre los cuales se relacionan las fases del conocimiento científico (observación, descripción, explicación y predicción) 2.6. HIPÓTESIS VARIABLES) (IDENTIFICACIÓN - Los servicios personales son s los costos que incluyen los causados por honorarios a investigadores, auxiliares de investigación, encuestadores. - Los gastos generales son los costos directos generados por el proyecto. Incluyen transporte, papelería, impresión, procesamiento de la información. DE 2.10. BIBLIOGRAFÍA Son proposiciones afirmativas que el investigador plantea con el propósito pósito de llegar a explicar hechos o fenómenos que caracterizan o identifican el objeto de conocimiento. Las fuentes son hechos o documentos a los que acude el investigador y que le permiten obtener información. Las técnicas son los medios empleados para recolectar la información. 2.7. METODOLOGÍA El tipo de estudio señala el nivel de profundidad y el enfoque con el cual el investigador busca abordar el objeto del conocimiento, por or ello se selecciona una batería de procedimientos, que el camino a seguir por el investigador. En este punto se tiene en cuenta la clasificación de la investigación, la recolección de datos y la forma de probar la tesis. Según el nivel de conocimiento el 39 3. INSTRUMENTOS DE RECOLECCIÓN DE LA INFORMACIÓN Estas encuestas pueden ser Encuestas por Muestreo en donde se elige una parte de la población que se estima representativa de la población total o podrá ser Encuesta de la Población. Es la herramienta que permite una adecuada explotación de la fuente de información. Cuando hablamos de recolección de datos nos estamos refiriendo a información empírica abstraída en conceptos. La recolección de datos tiene que hacer con el concepto de medición, proceso mediante el cual se obtiene el dato, valor o respuesta para la variable que se investiga. La medición, etimológicamente viene del verbo medir y significa comparar una cantidad con su respectiva unidad con el fin de averiguar cuantas veces la segunda está contenida en la primera (Diccionario de la Real Academia Española). El instrumento de recolección de datos está orientado a crear las condiciones para la medición. Los datos son conceptos que expresan una abstracción del mundo real, de lo sensorial, susceptible de ser percibido por los sentidos de manera directa o indirecta. Una forma reducida de una encuesta por muestreo es un "sondeo de opinión", esta forma de encuesta es similar a un muestreo, pero se caracteriza porque la muestra de la población elegida no es suficiente para que los resultados puedan aportar un informe confiable. Todo lo empírico es medible. No existe ningún aspecto de la realidad que escape a esta posibilidad. Medición implica cuantificación. ¿Que se mide? Se miden variables. Se utiliza solo para recolectar algunos datos sobre lo que piensa un número de individuos de un determinado grupo sobre un determinado tema. 3.1. LA ENCUESTA Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra representativa de la población o instituciones, con el fin de conocer estados de opinión o hechos específicos. 3.2. LA ENTREVISTA Existen encuestas abiertas que permiten al encuestado dar opiniones y explayarse en la respuesta, sirven sobre todo para investigaciones cualitativas. También las encuestas pueden ser cerradas, donde el encuestado solo tiene la opción de seleccionar respuestas preestablecidas; se utilizan para encuestas cuantitativas y son de más rápido análisis. 40 La palabra entrevista deriva del latín y significa "Los que se ven entre sí". Una entrevista es un hecho que consiste en un diálogo entablado entre dos o más personas: el entrevistador o entrevistadores que interroga y el o los que contestan. Se trata de una técnica o instrumento empleado en diversas investigaciones, medicina, selección de personal. Una entrevista no es casual sino que es un diálogo interesado, con un acuerdo previo y unos intereses y expectativas por ambas partes. La entrevista periodística se fundamentalmente por tres factores: distingue - Un evidente interés hacia la persona entrevistada - Pericia en el manejo de la técnica de pregunta y respuesta Es en realidad una conversación que tiene como finalidad la obtención de información. Hay muy diversos tipos de entrevistas: laborales (para informarse y valorar al candidato a un puesto de trabajo), de investigación (realizar un determinado estudio), informativas (reproducir opiniones) y de personalidad (retratar o analizar psicológicamente a un individuo), entre otras. - Voluntad manifiesta de difundir el resultado en un medio de comunicación 3.2.1. Tipos de entrevistas 3.2.1.1. Estructurada. Las entrevistas estructuradas son aquellas que el entrevistador ha preparado un cuestionario muy detallado para obtener la información; normalmente se da cuando en investigador conoce mucho del tema y se encuentra en una fase de la investigación donde necesita detalles puntuales. En una entrevista intervienen el entrevistador y el entrevistado. El primero, además de tomar la iniciativa de la conversación, plantea mediante preguntas específicas cada tema de su interés y decide en qué momento el tema ha cumplido sus objetivos. El entrevistado facilita información sobre sí mismo, su experiencia o el tema en cuestión. 3.2.1.2. No estructurada. Una entrevista no estructurada es aquella utilizada para obtener información acerca de una historia de vida, de hechos o sucesos donde el protagonista es el entrevistado; se inicia con preguntas clásicas tales como ¿Cómo alcanzó el cargo de...?, ¿qué puede explicarnos del procesos de fabricación de ....? Si bien la entrevista no estructurada no se lleva preguntas definidas es importante tener una guía de preguntas o ítems previamente establecidos para que, durante la conversación, tratar de tocarlos para obtener la información. La entrevista como instrumento de investigación ha sido utilizada de forma ambiciosa por antropólogos, sociólogos, psicólogos, politólogos o economistas. Es por ello que gran parte de los datos con que cuentan las ciencias sociales proceden de las entrevistas. Los científicos sociales dependen de ellas para obtener información sobre los fenómenos investigados y comprobar así sus teorías e hipótesis. 41 Otras clasificaciones: 3.3. LA OBSERVACIÓN Durante el proceso de investigación, para recolectar la información, el investigador debe seleccionar el conjunto de informantes, a los cuales además de observar e interactuar con ellos, puede utilizar técnicas como la entrevista, la encuesta, la revisión de documentos y el diario de campo o cuaderno de notas en el cual se escribe las impresiones de lo vivido y observado, para organizarlas posteriormente. La observación consiste en la medida y registro de los hechos observables, según el método científico, y por lo tanto, medida por instrumentos científicos. Además, estas observaciones deben ser realizadas profesionalmente, sin la influencia de opiniones o emociones. La observación participante o participativa, es una metodología de las Ciencias Sociales, que culmina como acción participativa, haciéndola una de las técnicas más completa, pues además de realizar un proceso de observación, elabora propuestas y soluciones. 3.4. LA EXPERIMENTACIÓN La experimentación consiste en el estudio de un fenómeno, reproducido generalmente en un laboratorio, en las condiciones particulares de estudio que interesan, eliminando o introduciendo aquellas variables que puedan influir en él. 3.5. EL DATO CIENTÍFICO La Observación participante es una técnica de observación utilizada en las ciencias sociales en donde el investigador comparte con los investigados su contexto, experiencia y vida cotidiana, para conocer directamente toda la información que poseen los sujetos de estudio sobre su propia realidad, o sea, conocer la vida cotidiana de un grupo desde el interior del mismo. Un dato es una estructura compleja. Por lo tanto tiene partes que lo constituyen. - Concepto - Dimensión - Procedimiento - Indicador (o esquema indicador): Es un procedimiento aplicado a una dimensión de una variable. Uno de los principales aspectos que debe vencer el investigador en la observación es el proceso de socialización con el grupo investigado para que sea aceptado como parte del, y a la vez, definir claramente dónde, cómo y que debe observar y escuchar. 42 Ejemplo: Podemos hablar de la potencia de un automóvil y vincularla con su aceleración según el siguiente cuadro: Como se ve, es imposible la unión directa entre el concepto y el indicador, la misión del investigador es diseñar y encontrar como medir para poder unir el concepto no observable con el indicador. 4. TÉCNICAS Y MÉTODOS PARA CLASIFICACIÓN DE LA INFORMACIÓN LA ser numerosas ha de aplicárseles el método estadístico que sea más apropiado. 4.1. TÉCNICAS PARA LA CLASIFICACIÓN DE LA INFORMACIÓN 4.1.1.4. Respeto a las fuentes. Al mismo tiempo, el tratamiento de las fuentes debe ser respetuoso con ellas mediante la fidelidad a las fuentes: no falsearlas ni tergiversarlas para hacerlas decir lo que al investigador interesa que digan. 4.1.1. Tratamiento de las fuentes 4.1.1.1. Reunión de fuentes. El primer paso de cualquier investigación es la reunión de un corpus documental suficiente de todas las fuentes de información que vayan a interesar en el tema sobre el que se esté investigando. 4.1.1.5. Cita de las fuentes. La investigación original no debe ocultar las fuentes en las que se basa. Si la aportación original es insuficiente o irrelevante, no hay originalidad sino plagio. La reproducción de citas puede ser abusiva (a veces la mayor parte de el texto son entrecomillados). Para algunos casos (publicación o edición crítica de fuentes) la tarea del investigador se convierte en una glosa. Es necesario utilizar con cuidado el recurso que se conoce como intertextulidad: no entrecomillar y citar a lo largo del texto que escribe el autor de la investigación, pero reconociendo bien sea en el propio texto, a pie de página o al final del capítulo o la obra que lo que se dice tiene una fuente y no es del todo producción propia. 4.1.1.2. Crítica de las fuentes. El tratamiento de las fuentes documentales, si pretende ser científico, tiene que partir de una crítica de las fuentes, es decir, del juicio que el investigador (periodista o historiador, por ejemplo) deben de hacer sobre su sinceridad y correspondencia con la realidad. 4.1.1.3. Contraste de fuentes. Evaluadas en su validez, las fuentes deben contrastarse entre ellas, viendo si coinciden o discrepan, y en qué grado. De 43 4.2. MÉTODOS PARA LA CLASIFICACIÓN DE LA INFORMACIÓN Una información nos dice que: El tener el dato solo, no nos sirve, el disponer de una información no es relevante, lo importante poder combinar esta información disponible para obtener conclusiones de interés. Este dato aislado nos sirve solo sirve como información pero no como conclusión, ahora si lo combinamos con otros datos: Para ello es importante conformar un sistema matricial que permita lograr las conclusiones, como ejemplo: Como podemos ver armamos un sistema de matrices donde se van relacionando los distintos datos y se obtienen conclusiones de interés tales como que la escuela 1 tiene mejor nivel que la 2. 44 PRUEBA TIPO ICFES 1. El presidente de una empresa tiene 7 corbatas, 9 pantalones, 5 camisas y 3 correas diferentes. De cuantas formas diferentes puede vestirse el empresario, si tiene que usar una de cada una para ir al trabajo? a) 945 b) 678 c) 456 d) 124 6. En un concurso de preguntas y respuestas un concursante contesta al azar dos preguntas de si o no. Cuál es el espacio muestral para este evento? a) E= (S,N) b) E= (S,N) , (S,S) , ( N,S) , (N,N) c) E= (S,N) , (S,S) d) E= (N,S) , (N,N) 7. Cuál es la probabilidad de que al lanzar 2 dados al aire salga un numero par? a) 1 / 36 b) 11 / 22 c) 18 / 36 d) 22 / 36 2. Se quieren hacer grupos de 3 estudiantes para realizar un trabajo de biología, si en grado 11 hay 32 estudiantes. Cuantos grupos distintos se pueden formar? a) 4960 b) 6780 c) 5460 d) 9800 8. Una urna tiene 8 bolas rojas, 5 amarilla y 7 verdes. Si se saca 1 al azar. Cuál es la probabilidad de que no sea roja? a) 8 / 20 b) 12 / 20 c) 18 / 20 d) 2 / 20 3. Se utilizan 10 consonantes y las vocales del abecedario para formar palabras de 4 letras. Cuantas palabras distintas se pueden formar, si en la palabra tiene que haber 3 consonantes y 1 vocal? Consonantes=10 vocales=5 a) 4500 b) 3400 c) 3600 d) 8700 9. Hay 20 invitados a una fiesta y se tienen que organizar las mesas en grupos de 8. De Cuantas formas distintas se pueden sentar los invitados? a) 125970 b) 146790 c) 450000 d) 245678 4. Si tenemos las mismas 10 consonantes y 5 vocales del ejercicio anterior y queremos formar palabras de 4 letras que solo tengan 2 vocales, una al comienzo y una al final. Cuantas palabras diferentes podemos formar? a) 1200 b) 2500 c) 1450 d) 2220 10. ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5.? a) 120 b) 230 c) 155 d) 222 11.En una clase de arte se quieren hacer banderines con franjas de 3 colores diferentes. La profesora presenta las siguientes opciones de colores: morado, verde, amarillo, blanco, negro y gris. ¿De cuantas maneras diferentes se pueden combinar estos colores, para obtener banderines diferentes? a) 60 c) 120 b) 130 d) 70 5. Se lanzan dos dados al mismo tiempo, cual es la probabilidad de que se obtenga un número mayor o igual a 8? a) 15 / 36 b) 16 / 12 c) 12 / 36 d) 8 / 36 45 12. Una mujer tiene 10 faldas, 9 camisas, 6 pares de tacones y 3 bufandas. De cuantas formas diferentes se puede vestir esta mujer: a) 1230 b) 1620 c) 2400 d) 870 El parque Xcaret en México recibe al año unos 700 mil visitantes. La entrada vale 45 dólares para adultos y 22 para niños. 16. Una familia (entre niños y adultos) pagó casi 180 dólares por la entrada, es posible que la familia este conformada por: a) 3 adultos y 2 niños c) 4 adultos y 4 niños b) 3 adultos y 3 niños d) 4 adultos y 2 niños Responde las preguntas 13 y 14 teniendo en cuenta la siguiente información. 17. Tomando x como el número de adultos y z el número de niños que visitan el parque cada año, la expresión 45x + 22z representa: a) 45 adultos y 22 niños. b) El valor de la entrada de 45 adultos y 22 niños en un año. c) 67 personas. d) El valor de la entrada de niños y adultos que visitan el parque anualmente. Se ha preguntado a un cierto número de familias por el número de hijos. Los resultados obtenidos están representados en una tabla y un diagrama de barras. No. De Hijos 0 1 2 3 4 5 TOTAL No. De Familias 2 4 6 ? 2 ? ? Responde las preguntas 18 y 19 de acuerdo con la siguiente información: A continuación se presenta la gráfica que muestra la relación entre el consumo mensual en metros cúbicos y la tarifa de pago mensual, del servicio de agua. 13. Al completar la tabla se tiene que: a) El número de familias que tiene 3 hijos es 5. b) El número de familias que tiene 5 hijos es 5. c) El total de familias encuestadas es 44. d) No hay familias que tengan 5 hijos. 14. Al analizar el diagrama de barras, se puede afirmar que: a) La mayoría de las familias encuestadas tiene 4 o más hijos. b) El 70% de las familias tiene 2 o más hijos. c) El 50% de las familias tiene 2 o menos hijos. d) 30 familias tienen 2 hijos. 15. Dentro de una bolsa guardadas 48 canicas de colores verde, azul y rojo. La probabilidad de sacar una canica verde de la bolsa es de , ¿Cuántas canicas verdes hay dentro de la bolsa? a) 1 b) 6 c) 8 18. Si x representa el consumo mensual en metros cúbicos, la expresión que representa el costo mensual para consumos menores de 40 metros cúbicos es: d) 16 a) 500x b) 22.000x Responde las preguntas 16 y 17 de acuerdo con la siguiente información. 46 c) 22.000 + x d) 22.000 + 500x 19. Si un usuario pagó 37.000 pesos por el consumo mensual, el número de metros cúbicos que consumió en dicho mes está entre: a) 0 y 20 b) 20 y 4 c) 40 y 50 22. La menor cantidad de agua se sacó el día: a) Lunes b) Martes c) Miércoles d) En los tres días se extrajo la misma cantidad de agua. d) 50 y 60 Responde las preguntas 20 y 21 de acuerdo con la siguiente información: 23. ¿Qué cantidad de agua queda disponible para el día jueves?: a) 100 litros c) 175 litros b) 168 litros d) 232 litros Sigue estrictamente el orden de las operaciones indicadas y verás que siempre llegas al mismo resultado. Responde las preguntas 24 a 26 de acuerdo con la siguiente información En Colombia hay 2,5 millones de niños trabajadores. Se considera que en Bogotá, una cuarta parte de los niños es población económicamente activa (trabajadores) y de éstos, uno de cada tres está obligado a trabajar. 24. En Colombia hay aproximadamente 40 millones de habitantes. Los niños trabajadores representan aproximadamente: a) El 25% de los habitantes de Colombia b) Entre el 2,5% y 4% de los habitantes de Colombia. c) El 6,2% de los habitantes de Colombia. d) Entre el 1% y 3% de los habitantes de Colombia. 20. Los números que al ubicarse en el lado 2 NO cumplen con la condición requerida para que el resultado final sea 24 son, respectivamente: a) 4 y 2 b) 16 y 8 c) 22 y 16 25. Si en Bogotá hay aproximadamente 450.000 niños trabajadores, el número aproximado de niños que viven en Bogotá es: a) 150.000 b) 300.000 c) 1.350.000 d) 1.800.000 d) 26 y 13 21. Los números que aparecen dentro de los círculos del lado 1, pertenecen al conjunto de los números: a) Impares b) Primos c) Pares d) Enteros negativos 26. De un grupo de 300 niños trabajadores que vive en Bogotá, el número de niños obligados a trabajar es de: a) 75 b) 100 c) 200 d) 225 Responde las preguntas 22 y 23 de acuerdo con la siguiente información: De un tanque lleno de agua, con capacidad de 400 litros, se extrae de agua el día lunes, del agua restante el día Martes y que queda en el tanque el día Miércoles. del agua 47 BIBLIOGRAFÍA http://html.rincondelvago.com/sistemas-digitales.html http://es.wikipedia.org/wiki/Tridimensional http://tdd.elisava.net/coleccion/12/cross-es http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml#centiles http://www.ematematicas.net/parit.php http://www.profesorenlinea.cl/matematica/ProbabilidadCalculo.htm http://www.mitecnologico.com/Main/TecnicasDeConteo http://tratamientodedatos.wordpress.com/2011/03/07/medidas-de-tendencia-central-para-datos-no-agrupados-yagrupados/ http://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion2.shtml http://www.eumed.net/libros/2006c/203/2n.htm http://html.rincondelvago.com/variables-aleatorias.html http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r51634.PDF http://books.google.com.co/books?id=KgWUmCvw42kC&pg=RA1-PA61&lpg=RA1PA61&dq=Un+futbolista+posee+tres+pares+de+guayos,+cinco+pares+de+medias,&source=bl&ots=feF2ewf4Jy&si g=j1NCMHa3h3ww77ckpp3gR_XWTTc&hl=en&sa=X&ei=y9xxT_WtNcybtwfw2dWuDw&redir_esc=y#v=onepage& q=Un%20futbolista%20posee%20tres%20pares%20de%20guayos%2C%20cinco%20pares%20de%20medias%2 C&f=false http://www.ucm.es/info/genetica/Estadistica/estadistica_basica.htm#Valor esperado de una variable http://www.ucm.es/info/genetica/Estadistica/estadistica_basica.htm#varianza http://personales.unican.es/gonzaleof/Sociales_2/aleatorias.pdf http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Poisson http://www3.uji.es/~mateu/t4-alumnos.pdf http://www.mailxmail.com/curso-tesis-investigacion/tesis-concepto-proceso-investigacion-1-2 PAREDES NUÑEZ, Pamela; RAMÍREZ PANATT Manuel. Apuntes de Preparación para la Prueba de Selección Universitaria Matemática.Chile. 2009. 48