Download MODULO 5 PENSAMIENTO ALEATORIO

Document related concepts
no text concepts found
Transcript
Módulo
5
Pensamiento aleatorio y sistemas de datos
Serie DIDÁCTICA DE LAS MATEMÁTICAS
Gobernación de Antioquia
Secretaría de Educación para la Cultura de Antioquia
Universidad de Antioquia, Facultad de Educación
Diploma en Desarrollo de Competencias Básicas en Matemáticas
en la Educación Básica y Media del Departamento de Antioquia
Módulo 5
Pensamiento Aleatorio y
Sistemas de Datos
Módulo
5
Módulo 5
Pensamiento Aleatorio y Sistemas de Datos
© José Wilde Cisneros y otros autores
© De esta edición: Secretaría de Educación para la Cultura de Antioquia
ISBN: 978-958-9172-86-5
Tiraje: 3.100 ejemplares
Primera edición, 2007.
Gobernación de Antioquia.
Secretaría de Educación para la Cultura de Antioquia
Dirección de Fomento a la Educación con Calidad.
www.seduca.gov.co
Email: [email protected] Diseño, diagramación e impresión:
Editorial Artes y Letras Ltda.
Medellín, Colombia 2007
Pensamiento aleatorio y sistemas de datos
Aníbal Gaviria Correa
Gobernador de Antioquia
Claudia Patricia Restrepo Montoya
Secretaria de Educación para la Cultura de Antioquia
Libardo Enrique Álvarez Castrillón
Director de Fomento a la Educación con Calidad
Coordinadores Área de Matemáticas
Secretaría de Educación para la Cultura de Antioquia
Gerardo Ávalos Ávalos
Supervisor de Educación
María Eugenia Posada Calle
Profesional Universitaria
Autores
COMITÉ ACADÉMICO
Jose Wilde Cisneros
Oscar Fernando Gallo Mesa
Jesús María Gutiérrez Mesa
Carlos Mario Jaramillo López
Orlando Monsalve Posada
John Jairo Múnera Córdoba
Gilberto de Jesús Obando Zapata
Fabián Arley Posada Balvín
Guillermo Silva Restrepo
María Denis Vanegas Vasco
Convenio interadministrativo de la Gobernación de Antioquia,
Secretaría de Educación para la Cultura de Antioquia con
la Facultad de Educación de la Universidad de Antioquia
Módulo
5
Pensamiento aleatorio y sistemas de datos
Agradecimientos
La Secretaría de Educación para la Cultura de Antioquia y la Facultad de Educación
de la Universidad de Antioquia, agradecen la labor de coordinación del Diploma:
Desarrollo de Competencias Básicas en Matemáticas en la Educación Básica y Media
del Departamento de Antioquia a su equipo técnico, a todos los docentes que participaron de él, y en particular, a las siguientes personas e instituciones educativas
que hicieron posible llevarlo a feliz término:
• Integrantes de la Mesa Departamental de Matemáticas.
• Rectores de las Instituciones Educativas donde laboran los docentes integrantes
de la Mesa Departamental de Matemáticas.
• A los docentes del Diploma en Desarrollo de Competencias Básicas en Matemáticas en la Educación Básica y Media del Departamento de Antioquia por la lectura
y sugerencias.
• Al comité académico del Diploma en Desarrollo de Competencias Básicas en Matemáticas en la Educación Básica y Media del Departamento de Antioquia por el
trabajo realizado en pro de esta obra.
• A la Facultad de Educación de la Universidad de Antioquia, a través de sus programas de educación matemáticas por apoyar la consolidación del grupo académico
que desarrolla el diploma.
• Un agradecimiento muy especial al profesor José Wilde Cisneros por sus contribuciones para que en su totalidad este módulo se hiciera posible, como fruto de
sus años de experiencia, estudio e investigación.
Módulo
5
Pensamiento aleatorio y sistemas de datos
Contenido
Presentación.......................................................................................................................................... 11
Introducción
La estadística en la escuela...................................................................................................................... 13
Unidad No.1
HACIA EL PENSAMIENTO ALEATORIO ........................................................................... 19
1.
2.
Hacia el pensamiento aleatorio......................................................................................................... 19
1.1. Muestreo...................................................................................................................................... 21
1.2. Los datos...................................................................................................................................... 23
1.3. Sobre la probabilidad.................................................................................................................. 23
Organización de datos....................................................................................................................... 27
2.1. Conteo y análisis de datos......................................................................................................... 28
2.2. Situación Nº 1 datos y conteo................................................................................................... 30
2.2.1. Datos sin agrupar, conceptos básicos............................................................................ 30
Unidad No.2
DESDE LOS CONCEPTOS Y LOS PROCESOS . ............................................................... 59
2.1. Las medidas de posición y variabilidad................................................................................... 59
2.1.1. Comprensión de las medidas de tendencia central...................................................... 59
2.2. Relación entre Media, Mediana y Moda................................................................................... 69
2.3. Medidas de posición (orden)..................................................................................................... 69
2.3.1. Cuartiles............................................................................................................................. 69
2.3.2. Desviación Intercuartil..................................................................................................... 71
2.3.3. Deciles................................................................................................................................ 71
2.3.4. Percentiles.......................................................................................................................... 71
2.3.5. Cálculos para datos sin agrupar...................................................................................... 71
2.3.6. Cálculos para datos agrupados....................................................................................... 73
2.4. Medidas de dispersión (variabilidad)....................................................................................... 74
2.4.1. El rango o recorrido........................................................................................................... 75
2.4.2. Varianza.............................................................................................................................. 75
2.4.3. La desviación estándar (S o σ)......................................................................................... 76
2.4.4. Coeficiente de variación................................................................................................... 79
Módulo
5
Pensamiento aleatorio y sistemas de datos
2.5. Medidas de asimetría................................................................................................................. 80
2.5.1. Comprensión del concepto básico de simetría.............................................................. 80
2.5.2. Distribución simétrica...................................................................................................... 81
2.5.3. Distribución asimétrica positiva...................................................................................... 81
2.5.4. Distribución asimétrica negativa.................................................................................... 82
2.5.5. Coeficiente de Asimetría de Fisher................................................................................. 82
2.6. Medidadas de Curtosis.............................................................................................................. 82
2.6.1. Distribución mesocúrtica................................................................................................. 82
2.6.2. Distribución leptocúrtica.................................................................................................. 82
2.6.3. Distribución platicúrtica................................................................................................... 83
Unidad No.3
EL AZAR Y LA PROBABILIDAD........................................................................................... 99
3.1. Un poco de historia................................................................................................................... 101
3.2. Algunos tópicos sobre aleatoriedad modelación y probabilidad......................................... 103
3.2.1. Experiencia aleatoria...................................................................................................... 103
3.2.2. Experiencia aleatoria compuesta.................................................................................. 104
3.2.3. Modelos............................................................................................................................ 104
3.2.4. Probabilidad..................................................................................................................... 105
Bibliografía .......................................................................................................................... 133
10
Presentación
Con el presente módulo, el último de la serie, entregamos a la comunidad educativa un trabajo que propende por generar un espacio de reflexión a propósito de los elementos que dan
sustento a lo que en los Lineamientos Curriculares de Matemáticas se denomina pensamiento
Aleatorio y sistemas de datos. Esperamos que este material se convierta en un documento de
trabajo que apoye la labor educativa, no sólo a los docentes que participan del diplomado, sino
también a todos aquellos docentes del área de matemáticas, preocupados por darle sentido a
la enseñanza de las matemáticas en el ciclo de la educación básica y media de nuestro país.
En éste documento se abordan algunas ideas que tienen que ver con el proceso de recolección
de datos, su representación e interpretación, así como el estudio del concepto de probabilidad. Se ofrece una propuesta bajo la cual Deben ser tratados en la escuela, entendiéndolos
como procedimientos que requieren de la reflexión permanente, dada su presencia tanto en
situaciones de la vida cotidiana como de las ciencias, y por tanto, entre otras ideas, obligado
a los docentes a indagar por:
• La modelación y simulación de fenómenos físicos.
• Las diferentes estrategias de conteo.
• Las diferentes formas de aproximación a los conceptos matemáticos de azar, posibilidad,
probabilidad, entre otros propios del pensamiento estadístico.
Adicionalmente se plantea un conjunto de ideas que permitan al docente orientar la toma de
decisiones acerca de la pertinencia de los datos, los métodos para recoger información de
un experimento y las diferentes técnicas de presentación e interpretación. De esta forma se
espera, que los elementos puestos a consideración en este módulo, sirvan de apoyo en esta
importante tarea.
Desde esta perspectiva, y reconociendo la poca producción académica que en el país se ha desarrollado en torno a la estadística educativa, queremos resaltar el trabajo mancomunado entre la
secretaría de educación para la cultura de Antioquia y la Facultad de Educación de la Universidad
de Antioquia, por medio del diploma, para dar la oportunidad a que el docente formador, JOSÉ
WILDE CISNEROS, materialice sus reflexiones, investigaciones y larga experiencia como profesor
de estadística, a través de este módulo: PENSAMIENTO ALEATORIO Y SISTEMAS DE DATOS.
Esta experiencia, un tanto novedosa, se pone a disposición de la comunidad académica como
un ejemplo de trabajo conjunto entre la administración educativa y la academia, para permitir
que los docentes del departamento puedan construir, sistematizar y compartir las prácticas
investigativas con sus colegas. En este sentido, el equipo académico del diploma, coincidió
en que es una buena oportunidad para potenciar la iniciativa de este docente-autor y por ello
le acompañó con sus sugerencias y recomendaciones para la organización y presentación de
la información que en este módulo aparece, que si bien no aborda toda la problemática de
manera exhaustiva, es un buen intento que invita a los demás docentes a reflexionar sobre el
tema. Esperamos que los contenidos aquí tratados sean objeto de revisión y análisis y como
producto de ello, hagan llegar al autor los respectivos comentarios.
11
Módulo
12
5
Pensamiento aleatorio y sistemas de datos
Introducción
La estadística es una ciencia muy antigua que inicialmente fue utilizada por diferentes civilizaciones como una herramienta para los censos de poblaciones, conteo de bienes y producción. En
un segundo momento, se utilizaron técnicas más sofisticadas a partir de la necesidad sentida
de dar estructura matemática a los datos recolectados. De esta forma las sociedades se han
beneficiado de dichos avances y a la vez se sentaron las bases de lo que hoy se conoce como
estadística, la cual actualmente es una ciencia en constante desarrollo.
La recopilación de datos que hacían los babilonios (3000 a. C), sobre la producción agrícola y
los artículos vendidos o cambiados mediante trueque, podría considerarse como estadísticos,
y fueron encontrados en tablillas, con inscripciones cuneiformes. También los egipcios, (año
3100 a. C), ya llevaban las cuentas del crecimiento poblacional y los faraones recopilaban gran
cantidad de datos sobre la riqueza del país, las familias, los soldados, las casas y la profesiones.
Esto fue de gran ayuda para el proyecto de construcción de las pirámides. Además para el siglo
VI a. C, los egipcios tenían la obligación de declarar, cada año, su profesión y sus fuentes de
ingreso, siendo castigados con pena de muerte si no lo hacían.
Son muchos los datos que históricamente dan cuenta del uso de la estadística en diferentes
países y culturas, incluso en la Biblia se hace referencia al recuento de los israelitas que tenían
la edad para prestar el servicio militar, además, y según el Evangelio, lo que motivó a José y
María a viajar a Belén fue precisamente un censo. Pero la institucionalización de los censos
se le atribuye a los romanos (siglo IV a. C), tal vez porque fue el Imperio romano el primero en
recopilar una gran cantidad de información relacionada con la superficie, la renta y todos los
territorios que tenía bajo su control.
En China y en la India (s IV a. C), se publicaron diferentes tratados sobre recuentos industriales,
agrícolas, comerciales, políticos y de economía.
Los recuentos que se hacían en Grecia (310 a. C) tenían que ver con la cantidad de soldados
y de esclavos. Calculaban los impuestos, determinaban los derechos de voto. Así, grandes
hombres como Sócrates, Herodoto y Aristóteles destacaron la importancia de la estadística
para el Estado.
En el continente americano, podría decirse que los “quipos” fueron la muestra y evidencia
de sus recuentos, pues los incas desarrollaron un sistema de estadística muy perfeccionado,
hacían recuentos sobre la economía y la demografía. Los “quipos” eran unas cuerdas con nudos que utilizaban para llevar sus cuentas, y les permitía recordar los resultados en la tabla
de contar.
A pesar de lo expuesto anteriormente con relación al uso de la estadística, ésta sólo muy recientemente ha adquirido la categoría de ciencia. A partir del s XI aproximadamente, empiezan a
aparecer las primeras obras de estadística, especialmente descriptiva, destacándose las obras
de Jean Bodin en Francia (1530 – 1595), en la cual se explica la importancia de los censos; la
de Graunt (Londres 1620 – 1674) sobre la población londinense, a éste último se le considera
13
Módulo
5
Pensamiento aleatorio y sistemas de datos
el fundador de la demografía y el iniciador de la estadística investigadora, la cual se oponía a
la postura universitaria alemana conocida como estadística descriptiva.
Uno de los más grandes avances en estadística, se dio en el siglo XVII, cuando los bancos y
las compañías de seguros empezaron a utilizar los datos estadísticos, además a tratar matemáticamente la demografía, la economía y muchos aspectos de las ciencias sociales. Fue en
Alemania donde comenzó a tomar más fuerza esta disciplina orientada a la descripción de los
bienes del Estado, gozando de una sistematización y respondiendo a principios doctrinales.
Simultáneamente en Francia, se desarrolló la escuela probabilística, la cual basó su desarrollo
en el cálculo de probabilidades como instrumento de investigación. Blas Pascal (1623 – 1662)
y Pierre de Fermat (1601 – 1665) quienes dan inicio al cálculo de probabilidades, trataron de
dar soluciones a los juegos de azar y preguntas hechas por el Caballero de Meré en 1654, la
pregunta que movió a los dos grandes matemáticos a escribir sobre el cálculo de probabilidades
era “¿Cómo distribuir las apuestas en una partida de dados que se interrumpe?”
La estadística logra mayor relevancia científica con los descubrimientos sobre el cálculo de
probabilidades, y sobre el ajuste de curvas a un conjunto de datos, gracias a matemáticos como
Euler, Simpson, Lagrange, Laplace, Legendre y Gauss, y es así como en 1834 nace la “Royal
Statistical Society” y en 1885, se creó el “Instituto Internacional de Estadística”, en el cual se
propone establecer un método uniforme de análisis de datos y al uso correcto de éstos, por
parte de los gobiernos, en la solución de problemas políticos, económicos y sociales.
1.1.La estadística en la escuela
A diferencia de algunos fenómenos que se estudian desde el pensamiento variacional (razonamiento algebraico), cuyos objetos requieren, en general, apelar al uso de variables deterministas, existen otros fenómenos, que requieren el uso de variables aleatorias. Esto puede
entenderse como dos formas diferentes de pensar: por un lado, se estudian fenómenos donde
es posible atrapar, a través de un modelo funcional, la forma como están relacionadas las variables, mientras que por otro lado esto no siempre es posible.
Lo anterior significa que un experimento es determinista, si siempre que se realiza bajo las
mismas condiciones se obtienen los mismos resultados; en el caso contrario, cuando no es
posible predecir el resultado del experimento, se dice que es aleatorio. Así por ejemplo; la
velocidad con que cae un cuerpo con respecto a la altura de donde se dejó caer, corresponde
a un experimento determinista. Pero, un fenómeno aleatorio puede ser el lanzamiento de un
dado, en el cual no es posible determinar el valor que se obtendrá en cada lanzamiento.
Desde el punto de vista escolar, lo anterior muestra que es necesario construir dos líneas
diferentes dentro del pensamiento matemático, una que refleja el carácter exclusivamente
determinista, y otra que se encarga de estudiar el conjunto de situaciones que dependen de
los fenómenos aleatorios.
En Colombia, la Renovación Curricular (proyecto de gran alcance en la educación matemática),
permitió la elaboración de un marco teórico global para la matemática en los nueve grados de
la educación básica. Esta elaboración estuvo dirigida por el Doctor Carlos Eduardo Vasco, quien
implementó el llamado “enfoque de sistemas”, y propuso acercarse a los distintos campos de
14
Introducción
la matemática, a través de la perspectiva de los sistemas; en particular plantea como de gran
importancia en la matemática escolar, el estudio de los sistemas de datos estadísticos.
Partiendo de los avances en la Renovación curricular con la implementación de los diferentes
sistemas matemáticos, y con el ánimo de mejorar los procesos de enseñanza y aprendizaje
de las matemáticas en el país, el MEN, inicia (1996) el proceso de construcción de los Lineamientos curriculares de matemáticas y en 1998, son publicados y empiezan a socializarse con
diferentes grupos de maestros. (ver Interpretación e implementación de los estándares básicos
de matemáticas, 2005)
En los Lineamientos Curriculares se hace énfasis en el desarrollo del pensamiento aleatorio,
por su incidencia en la ciencia, en la cultura y en la forma de pensar cotidiana.
“El desarrollo del pensamiento aleatorio, mediante contenidos de la probabilidad y la
estadística debe estar imbuido de un espíritu de exploración y de investigación tanto por
parte de los estudiantes como de los docentes. Debe integrar la construcción de modelos
de fenómenos físicos y del desarrollo de estrategias como las de simulación de experimentos y de conteos. También han de estar presentes la comparación y evaluación de
diferentes formas de aproximación a los problemas con el objeto de monitorear posibles
concepciones y representaciones erradas. De esta manera el desarrollo del pensamiento
aleatorio significa resolución de problemas”. (MEN 1998).
Con la publicación de los estándares básicos de matemáticas (2003), se da continuidad a lo
propuesto en los lineamientos curriculares, en términos de la posibilidad que tienen los niños
de desarrollar del pensamiento aleatorio, a través de análisis de datos tanto cuantitativos como
cualitativos, sistematización de los mismos y nociones numéricas como conteos múltiples y
algunas situaciones de combinatoria.
Desde esta perspectiva, los sistemas de datos se incorporaron en el currículo de matemáticas
como elementos importantes, necesarios y pertinentes en el contexto social y escolar. Según
Godino y Batanero (2004), las principales razones que fundamentan el estudio de la estadística
son las siguientes1:
• La estadística es útil para la vida posterior a la escuela, ya que en muchas profesiones se
precisan unos conocimientos básicos del tema,
• Su estudio ayuda al desarrollo personal, fomentando un razonamiento crítico, basado en la
valoración de la evidencia objetiva, apoyada en los datos frente a criterios subjetivos.
• Ayuda a comprender los restantes temas del currículo, tanto de la educación obligatoria como
posterior, donde con frecuencia aparecen gráficos, resúmenes o conceptos estadísticos.
Además, puesto que la estadística elemental no requiere técnicas matemáticas complicadas y
por sus muchas aplicaciones, proporciona una buena oportunidad para mostrar a los estudiantes
las aplicaciones de la matemática para resolver problemas reales. La estadística es también
_____________________________________________________
Consultado el 19 de Octubre, 2005 en. http:// www.ugr.es/local/godino/edumat-maestros/ . Godino y Batanero. Didáctica de las
matemáticas para maestros. Proyecto Edumat – Maestros.. Universidad de Granada., octubre de 2004.
1
15
Módulo
5
Pensamiento aleatorio y sistemas de datos
un buen vehículo para alcanzar las capacidades de comunicación, resolución de problemas,
uso de ordenadores, trabajo cooperativo y en grupo, a las que se da gran importancia en los
nuevos currículos.
Cuando tenemos en cuenta el tipo de estadística que se quiere enseñar y la forma de llevar
a cabo esta enseñanza debemos reflexionar sobre los fines principales de ésta, los cuales
pueden ser:
• Que los alumnos lleguen a comprender y a apreciar el papel de la estadística en la sociedad,
incluyendo sus diferentes campos de aplicación y el modo en que la estadística ha contribuido a su desarrollo.
• Que los alumnos lleguen a comprender y a valorar el método estadístico, esto es, la clase
de preguntas que un uso inteligente de la estadística puede responder, las formas básicas
de razonamiento estadístico, su potencia y limitaciones.
Al avanzar paulatinamente de un grado a otro, se hace necesario la comprensión y significación de los objetos de estudio, esto incluye la comprensión de ideas básicas sobre gráficos,
resúmenes estadísticos, diseño de experimentos, incertidumbre, conteo y probabilidad. A
partir de este momento, los conjuntos de datos deben ser vistos como un todo, describir sus
características y usarlas para realizar las diferentes comparaciones entre datos. Ello implica
reconocer que la base de toda investigación en la vida real se realiza a partir de la recolección
de datos seleccionados en forma adecuada.
Desafortunadamente, La escuela se ha centrado en una enseñanza tradicional de la estadística, a través de la aplicación algorítmica de fórmulas para encontrar promedios, elaboración
mecánica de gráficas y construcción de tablas de distribución de frecuencias, muchas veces
sin ningún tipo de interpretación. Además, al estudiante, se le proporcionan datos tomados
de diferentes textos, en contextos totalmente aislados de su realidad. De otro lado no se da
importancia a los resultados obtenidos.
Partiendo de lo anterior, se requieren maestros que diseñen actividades con enfoques exploratorios, que le permita al estudiante investigar y obtener sus propios datos o complementar
los dados por el docente. Hacer énfasis en la elaboración de tablas y gráficas como una forma
de sistematizar los valores obtenidos en los experimentos originales para el estudio de la distribución de frecuencias.
Sobre la base de lo anterior, en el presente módulo se trata de explorar algunos elementos que
permitan la reflexión entorno a la enseñanza y aprendizaje de la estadística y más aún, en
relación con el desarrollo del pensamiento aleatorio a través de los sistemas de datos.
En la primera unidad se exponen algunos conceptos básicos relativos al pensamiento aleatorio
y a la organización y análisis de datos, identificando características erróneas que se han introducido en la enseñanza de la estadística en la escuela, como es el excesivo énfasis en el manejo,
poco conciente, de fórmulas y cálculo que poco aportan al desarrollo de este pensamiento.
En la unidad 1 se sientan las bases teóricas: definiciones y sus respectivos análisis, que permiten el desarrollo, tratamiento y organización de datos. En esta unidad se abarcan temas
relacionados con los diferentes procedimientos, técnicas y enfoques para organizar, recolectar
16
Introducción
y analizar un conjunto de datos obtenidos de una muestra para que se le dé o tengan sentido
dentro de su contexto y realizar las inferencias de acuerdo con ello, sin olvidar las diferentes
formas de representación basados en la distribución de frecuencias.
En la segunda unidad se presenta un análisis conceptual de las diferentes medidas de posición central al igual que las desviaciones, incluyendo conceptos, propiedades y un análisis
justificado del uso de cada una de ellas de acuerdo a su papel en el tratamiento de datos.
Adicionalmente se construye el significado de estas medidas en diferentes situaciones para
el estudio y análisis de las dificultades en su comprensión.
En la unidad número tres, se propone un conjunto de situaciones que permita a los estudiantes
comprender y diferenciar los conceptos de aleatoriedad y determinismo, aun cuando se expusieron intuitivamente en la primera unidad. Igualmente se realiza un extensivo estudio de la
combinatoria para poder encontrar los espacios muestrales que conllevan a la probabilidad.
17
Módulo
18
5
Pensamiento aleatorio y sistemas de datos
Unidad No.1
Hacia el Pensamiento Aleatorio
1. Hacia el pensamiento aleatorio2
Este tipo de pensamiento, llamado también probabilístico o estocástico, ayuda a tomar
decisiones en situaciones de incertidumbre, de azar, de riesgo por falta de información
confiable, en las que no es posible predecir con seguridad lo que va a pasar.
Este pensamiento se apoya directamente en conceptos y procedimientos de la teoría de
probabilidades y de la estadística inferencial, e indirectamente en la estadística descriptiva
y en la combinatoria. Ayuda a buscar soluciones razonables a problemas en los que no hay
una solución clara y segura, abordándolos con un espíritu de exploración y de investigación
mediante la construcción de modelos de fenómenos físicos, sociales o de juegos de azar
y la utilización de estrategias como la exploración de sistemas de datos, la simulación de
experimentos y la realización de conteos.
El azar se relaciona con la ausencia de patrones o esquemas específicos en las repeticiones de eventos o sucesos, y otras veces con las situaciones en las que se ignora cuáles
puedan ser esos patrones, si acaso existen, como es el caso de los estados del tiempo; de
la ocurrencia de los terremotos, huracanes u otros fenómenos de la naturaleza; de los accidentes, fallas mecánicas, epidemias y enfermedades; de las elecciones por votación; de
los resultados de dispositivos como los que se usan para extraer esferas numeradas para
las loterías y de las técnicas para efectuar los lanzamientos de dados o monedas o para el
reparto de cartas o fichas en los juegos que por esto mismo se llaman “de azar”.
En las experiencias cotidianas que los estudiantes ya tienen sobre estos sucesos y estos
juegos, empiezan a tomar conciencia de que su ocurrencia y sus resultados son impredecibles e intentan realizar estimaciones intuitivas acerca de la posibilidad de que ocurran
unos u otros. Estas estimaciones conforman una intuición inicial del azar y permiten hacer
algunas asignaciones numéricas para medir las probabilidades de los eventos o sucesos,
así sean inicialmente un poco arbitrarias, que comienzan con asignar probabilidad cero a
la imposibilidad o a la máxima improbabilidad de ocurrencia; asignar ½ a cualquiera de
_____________________________________________________
Documento, Potenciar el pensamiento matemático: un reto escolar. Estándares básicos de competencias en matemáticas. Bogotá
2005.(paper).
2
19
Módulo
5
Pensamiento aleatorio y sistemas de datos
dos alternativas que se consideran igualmente probables, y asignar 1 a la necesidad o a
la máxima probabilidad de ocurrencia.
Las situaciones y procesos que permiten hacer un conteo sistemático del número de
combinaciones posibles que se puedan asumir como igualmente probables, junto con el
registro de diferentes resultados de un mismo juego, así como los intentos de interpretación
y predicción de los mismos a partir de la exploración de sistemas de datos, desarrollan
en los estudiantes la distinción entre situaciones deterministas y situaciones aleatorias o
azarosas y permiten refinar las mediciones de la probabilidad con números entre 0 y 1. Más
tarde, esas situaciones y procesos pueden modelarse por medio de sistemas matemáticos
relacionados con la teoría de probabilidades y la estadística.
El empleo cada vez más generalizado de las tablas de datos y de las recopilaciones de
información codificada llevó al desarrollo de la estadística descriptiva, y el estudio de los
sistemas de datos por medio del pensamiento aleatorio llevó a la estadística inferencial
y a la teoría de probabilidades. El manejo y análisis de los sistemas de datos se volvió
inseparable del pensamiento aleatorio.
Los sistemas analíticos probabilísticos y los métodos estadísticos desarrollados durante
los siglos XIX y XX se han refinado y potenciado en los últimos decenios con los avances
de la computación electrónica y, por ello, hoy día ya no es tan importante para los estudiantes el recuerdo de las fórmulas y la habilidad para calcular sus valores, como sí lo es
el desarrollo del pensamiento aleatorio, que les permitirá interpretar, analizar y utilizar los
resultados que se publiquen en periódicos y revistas, que se presenten en la televisión o
que aparezcan en pantalla o en hojas impresas como productos de los distintos programas
de análisis de datos.
Por ello, no es ya necesario aprender las fórmulas y procedimientos matemáticos para
calcular la media o la mediana, la varianza o la desviación estándar, sino avanzar gradualmente en el desarrollo de habilidades combinatorias para encontrar todas las situaciones
posibles dentro de ciertas condiciones, estimar si son o no igualmente probables y asignarles probabilidades numéricas, así como en dominar los conceptos y procedimientos
necesarios para recoger, estudiar, resumir y diagramar sistemas de datos estadísticos y
tratar de extraer de ellos toda la información posible con la ayuda de calculadoras, hojas
de cálculo y otros programas de análisis de datos, con el fin de intentar predecir dentro de
ciertos rangos el curso de los acontecimientos respectivos y de tomar decisiones lo más
razonables posibles ante la imposibilidad de saber con certeza lo que va a pasar.
A continuación se presenta un esquema3 en el cual se muestran los principales conceptos
del pensamiento aleatorio, del cual se hace una breve descripción.
_____________________________________________________
Tomado de Interpretación e implementación de los estancares básicos de matemáticas. Pág. 118.
3
20
Hacia el Pensamiento Aleatorio
Este esquema plantea una propuesta que deja atrás el uso exclusivo de cálculos matemáticos, permitiendo observaciones de las cualidades físicas de los objetos, fundamentación del
análisis “exploratorio” y la observación de regularidades y patrones que se ajusten a modelos
(observaciones) con estructuras propias dentro de determinados conjuntos (clases).
1.1.Muestreo
En la toma de decisiones se hace necesario observar las características de una población a
partir de un número determinado de ella, esto es lo que se tiene como idea de “muestreo”,
pero para inducirnos a tal concepto debe tenerse en cuenta el método de selección de los
individuos, así por ejemplo, cuando se desea saber las características de los empleados que
ha dejado una empresa durante los últimos cinco años, es imposible ubicarlos a todos por
múltiples razones, entonces, para dar un informe, se realiza mediante la ubicación representativa de algunos de esos elementos y de esa forma puede garantizarse una generalización
de todo el grupo. A veces es práctico y posible examinar a cada individuo de una población
que se desea describir, ello se consigue mediante un censo. Se debe utilizar el muestreo
cuando no es posible contar o medir a cada individuo de la población.
En estadística se usa la palabra población para referirse no sólo a personas sino a todos los
elementos que son tomados en cuenta en una investigación. Así cuando un catador de vinos
21
Módulo
5
Pensamiento aleatorio y sistemas de datos
va a determinar el sabor de todo un barril, el elemento a examinar es un vaso (un sorbo) de
vino y la población es el barril de vino. Para seleccionar las muestras, se realizan muestreos
no aleatorios o de juicio en el cual la experiencia es vital para la identificación de los elementos de la población que deben incluirse en la muestra. En el muestreo aleatorio o de
probabilidad todos los elementos de la población tienen igual opción de ser escogidos en
la muestra. Con lo anterior se puede determinar en forma objetiva las estimaciones de las
características de la población objeto de estudio que resultan de la toma de una muestra, lo
anterior lleva a describir matemáticamente qué tan objetivas son nuestras estimaciones.
Para la obtención de un buen proceso de muestreo aleatorio, se recomienda algunos métodos:
a) Números aleatorios: estos números pueden ser generados por un programa de computador, o mediante una tabla de dígitos aleatorios, en donde la probabilidad de que aparezca
un digito del 1 al 9 es la misma en cualquier secuencia de igual longitud. Por ejemplo, se
desea realizar una encuesta sobre 100 estudiantes para conocer los hábitos de estudio
si se desea entrevistar a 10 de ellos escogidos aleatoriamente, se puede asignar a cada
estudiante un número desde el 00 al 99 y consultar una tabla y aplicar lo siguiente: recorrer la tabla por columnas de arriba a abajo, empezando por la columna de la izquierda,
y leer sólo los dos dígitos en cada fila, de esta forma los primeros números serían 15, 09,
etc. Seguir de esta manera para conseguir los 10 estudiante, sino se obtienen, se repite el
proceso pero leyendo el tercer y cuarto dígito de cada grupo, en nuestro caso 81, 28 etc.
Gráfico 4
La tabla representa números aleatorios cuyo objetivo es el de ayudar a realizar un muestreo sistemático el cual requiere menor tiempo y en ocasiones un costo menor que el aleatorio simple.
_____________________________________________________
Gráfica escaneada de estadística para administradores. Levin y Rubin. Pág. 320.
4
22
Hacia el Pensamiento Aleatorio
b)Muestreo sistemático: en este método los elementos son seleccionados dentro de un intervalo
uniforme que se mide con respecto al tiempo, al orden o al espacio. Por ejemplo al seleccionar
los 10 estudiantes, se puede escoger 1 cada décimo número, así tendríamos el 1, 11, 21 etc.,
esto presenta una desventaja ya que todos no tienen la misma opción de ser seleccionados
por ejemplo los que tienen los dígitos 2, 3, 4 se quedan sin opción de ser elegidos.
c) Muestreo estratificado: el objetivo es dividir la población en grupos relativamente homogéneos (llamados estratos) y luego se establecen planteamientos de escogencia, o bien se
selecciona de cada estrato un número específico de elementos correspondientes a la fracción
de ese estrato en la población como un todo o se extrae un número igual de elementos de
cada estrato. Este tipo de muestreo es muy bueno cuando se tiene a la población ya dividida,
por ejemplo, en un grado se tienen a los estudiantes de acuerdo con las notas obtenidas y se
puede tomar una muestra de cada uno de los estratos. Se recomienda cuando cada grupo tiene
una pequeña variación dentro de sí mismo, pero hay una amplia variación entre los grupos.
d)Muestreo de racimo: en este caso se divide la población en grupos y se toma una muestra aleatoria de esos racimos (grupos). Se recomienda cuando hay una variación amplia
dentro de cada grupo, pero los grupos son similares entre sí.
e) Muestreo aleatorio simple: se debe seleccionar muestras mediante métodos que permiten
que cada posible muestra tenga igual probabilidad de ser seleccionada y que cada elemento de la población tenga igual oportunidad de ser incluido en la muestra. Por ejemplo,
si deseamos enviar a dos docentes de un grupo de 4 a representar a la institución a un
seminario de educación. Si llamamos A, B, C y D las posibles parejas son: AB, AC, AD, BC,
BD, CD, si se observa bien vemos que se trata de combinaciones donde se toman 2 elementos de un grupo de 5. Observe que cada grupo posee una probabilidad de 1/6, y cada
docente tendría la posibilidad de P(A) = P(AB)+P(AC)+P(AD)=1/6+1/6+1/6=3/6=1/2
que serian probabilidades de asistir de cada docente al seminario.
1.2.Los datos5
Los datos pueden ser cualitativos o cuantitativos, los primeros se refieren a eventos o cualidades no cuantificables como color, sexo, etc; los segundos por el contrario siempre son cuatificables, por ejemplo, las edades de las personas, las apuestas, etc. Dependiendo del tipo
de magnitud al que hagan referencia los datos se puede clasificar en discretos o continuos.
1.3.Sobre la probabilidad
Los fenómenos del mundo que nos rodean, están estrechamente ligados con un conjunto
infinito de otros hechos, se trata de estudiar un número finito de tales vínculos, de tal modo
_____________________________________________________
Ver texto interpretación e implementación de los estándares básicos de matemáticas 2005.
5
23
Módulo
5
Pensamiento aleatorio y sistemas de datos
que se establezcan relaciones o regularidades fundamentales, que pueden reflejar ciertas
desviaciones (las leyes no se cumplen con precisión) debido a la infinidad de vínculos no
previstos en el fenómeno a observar, estos fenómenos son llamados fenómenos aleatorios.
Se puede decir entonces, que la casualidad existe objetivamente en nuestro mundo ya que
no es posible obtener todos los nexos accidentales entre el fenómeno estudiado y la multiplicidad infinita de otros sucesos.
Si un fenómeno dado se estudia una sola vez, no se puede predecir cual será la desviación
accidental de la regularidad, sin embargo, si el número de observaciones del fenómeno se
hace grande, en las mismas desviaciones accidentales se descubren ciertas regularidades
que pueden ser estudiadas y usadas para determinar la influencia de las desviaciones mencionadas sobre el curso de los fenómenos por estudiar. Esto da nacimiento al estudio de las
regularidades en los fenómenos aleatorios frecuentes, los cuales pueden ser observados un
número ilimitado de veces en las mismas condiciones.
El resultado de un experimento puede ser caracterizado cualitativa o cuantitativamente, cualquier característica cualitativa del resultado del experimento se denomina acontecimiento
(suceso), por ejemplo el impacto o el fallo de un tiro sobre un blanco. Cualquier característica
cuantitativa del experimento se llama magnitud aleatoria, por ejemplo los puntos de coordenadas de impacto de un disparo, resultado de la medición de cierta magnitud.
La probabilidad por su carácter abstracto, genera dificultades para su enseñanza y aprendizaje, por lo tanto su aproximación requiere de construir, con los niños, ideas intuitivas a
través de situaciones azarosas donde no es posible procesos de raversibilidad. Es decir, que
no se pueden manipular los fenómenos para producir un resultado específico, ni devolver
los objetos a su estado inicial deshaciendo la operación concreta, por ejemplo en el juego
de la ruleta si se hace girar desde una posición inicial hacia la derecha, es poco probable
que girándola hacia la izquierda se llegue a la posición inicial, observe que este proceso de
“reversibilidad” está sujeto a un número infinito de otros hechos (la fuerza entre otros).
Se hace necesario tener en cuenta para la enseñanza de la probabilidad que el niño diferencie
las situaciones aleatorias y las deterministas, con lo cual dada una serie de experimentos,
se pueda determinar cuales aparecen con mayor o menor frecuencia. Por ejemplo se pueden
realizar actividades en la cuales se construyan un par de dados en cartulina, a uno se le
coloca dos caras con el número cuatro y ninguna con el uno, al otro se le pega un pedazo
de plastilina en uno de los puntos. Se analiza a cual de los números aparecen con mayor
frecuencias y si los estudiantes pueden predecir este hecho.
Se necesita de una buena comprensión de la combinatoria para poder abordar el tema de la
probabilidad, es decir el conteo es la parte fundamental y se debe realizar desde diferentes
modelos como el propuesto por Dubois, (1984,37-57):
Selección de una muestra a partir de un conjunto de objetos: este tipo de modelo, generalmente pide enumerar o contar las diferentes muestras de tamaño dado que pueden
formarse a partir de un conjunto inicial, para ello este modelo permite observar si todos
los objetos son distinguibles (diferentes), o algunos son iguales; si considera repetición
o no de elementos; si interviene o no la ordenación de elementos.
24
Hacia el Pensamiento Aleatorio
Colocación de objetos en casillas:(cajas, celdas, urnas) lo que se pide es enumerar o
contar las diferentes aplicaciones entre dos conjuntos de objetos, se precisa si los elementos son iguales o distintos, si las celdas (subconjuntos) son distinguibles o no, se
debe considerar el orden de colocación de los objetos dentro de las celdas, si se permite
más de un objeto por celda, si se permiten celdas vacías.
Partición en subconjuntos de un conjunto de objetos: este modelo pide clasificar los elementos de un conjunto inicial en un número dado de subconjuntos incompatibles, de modo
que la clasificación sea exhaustiva, aquí se precisa si: los elementos son iguales o distintos,
si los subconjuntos son distinguibles o no, se debe considerar el orden de colocación de
los objetos dentro de subconjuntos, si se permite más de un objeto por subconjunto, si se
permiten subconjuntos vacíos.
Rafael Roa Guzmán,(2000, Pág. 23) propone tres tipos de esquemas combinatorios que ayudan a la interpretación de los enunciados de las situaciones de recuento:
Estos esquemas sólo son una ayuda para los docentes para solucionar preguntas en algunos
tipos de situaciones. En ningún momento se trata de seguir esquemas predeterminados y
menos enseñarlos a los estudiantes.
Esquema de selección
Se requiere seleccionar muestras de un tamaño r a partir de un conjunto de n objetos.
Esquema
Modelo
Selección ordenada sin reemplazamiento
Variaciones
Selección ordenada con reemplazamiento
Variaciones con repetición
Selección no ordenada sin reemplazamiento
Combinación
Selección no ordenada con reemplazamiento
Combinaciones con repetición
Esquema de colocación
Cuando se requiere colocar r objetos dentro de n cajas (celdas o urnas) o bien establecer una
aplicación de un conjunto de r objetos en otro conjunto de n objetos. Según se considere que
el orden de los objetos dentro de las cajas debe o no tenerse en cuenta y los objetos sean
iguales o diferentes, se obtienen los siguientes casos:
a) colocaciones inyectivas: con a lo sumo un objeto por caja (r ≤ n)
b)colocaciones sobreyectivas: con a lo menos un objeto por caja (r ≥ n)
c) colocaciones biyectivas: con un solo objeto por caja (n = r)
d)colocaciones cualesquiera: se puede colocar el número que se desee de objetos en cada
caja o dejar alguna vacía.
25
Módulo
5
Pensamiento aleatorio y sistemas de datos
Colocaciones
Objetos
Celdas
Tipo aplicación
Modelo
Ordenada
Distintos
Distintas
Inyectiva
V
Sobreyectiva
r!*C n-1,r-1
Biyectiva
Pn
Cualquiera
r!*CR
Inyectiva
V
Biyectiva
Pn
Cualquiera
VR
Inyectiva
C n,r
Sobreyectiva
C n-1,r-1
Cualquiera
CR
No ordenada
Distintos
Iguales
Distintas
Distintas
Donde CR: combinaciones con repetición.
VR: variaciones con repetición.
Pn: Permutaciones
Esquema de permutación
Se pide efectuar una partición de un conjunto de r elementos en n subconjuntos.
Colocación de objetos
Particiones en subconjuntos
Ordenadas
Ordenados
No ordenadas
No ordenados
De objetos distintos
De objetos distintos
De objetos indistinguibles
De objetos indistinguibles
En cajas distintas
Particiones ordenadas
En cajas indistinguibles
Particiones no ordenadas
Inyectivas
En subconjuntos vacíos o con una unidad
Sobreyectivas
En subconjuntos no vacíos
Biyectivas
En subconjuntos con una sola unidad
Cualquiera
Subconjuntos con mas de una unidad y con vacíos
Los esquemas anteriores no constituyen una clasificación de problemas combinatorios, simplemente se trata de cómo ajustarse a un modelo combinatorio en forma didáctica.
Además, no es necesario ajustarse a tales modelos en la básica hasta el grado 8º, si se hace
necesario llegar a ellos desde las diferentes actividades planteadas y a partir del grado 9º
La diferencia de cada uno de estos modelos permite obtener un tipo diferente de conteo, el
cual puede ser permutación, variación o combinación. Como puede verse, lo anterior nos
26
Hacia el Pensamiento Aleatorio
representa uno de los núcleos de la matemática discreta, o simplemente métodos en los
cuales intervienen conjuntos discretos y funciones definidas sobre los mismos.
Piaget considera la combinatoria como un componente esencial del pensamiento formal,
comparándolo con los esquemas de la proporcionalidad y la correlación., indica además que
el razonamiento hipotético deductivo opera por medio de las operaciones combinatorias que
se aplican sobre un conjunto de posibilidades que deben examinarse y enumerarse hasta
llegar a una conclusión.
Algunos autores, entre ellos Fischbein y Gazit consideran que el trabajo combinatorio, cuando
se emplea el diagrama arbolar debe realizarse por medio de las variaciones con repetición, y
a continuación el de las permutaciones, variaciones y combinaciones., proponen tareas que
incluyen dibujar el diagrama, contar grupos de elementos y en una última instancia obtener
a partir de un patrón la fórmula.
Para empezar el trabajo combinatorio, algunos autores como Engel, Varga y Walser, proponen
utilizar una metodología basada en juegos, introducir como ideas básicas las reglas de la
suma, producto y cociente y finalmente utilizar los diagramas de árbol.
Los ejes expuestos se presentan a toda la comunidad de matemáticas del departamento de
Antioquia un trabajo orientado hacia el desarrollo del pensamiento aleatorio que le ayuda
al docente a reorientar su trabajo en el aula y a dinamizar las relaciones con los diferentes
pensamientos, por igual se trata de un documento en permanente construcción que ayuda
de una u otra forma a desarrollar la propuesta curricular en el área de matemáticas de las
instituciones educativas. Este módulo se compone de las siguientes unidades:
2. Organización de datos
“Para la mayoría de los estudiantes la estadística es un tema misterioso donde operamos
con números por medio de fórmulas que no tienen sentido” (Graham, 1987, p. 5).
En nuestra sociedad los avances de la ciencia y la tecnología han sido acelerados y la estadística
ha jugado un papel relevante en tal desarrollo al brindar herramientas de análisis de variabilidad,
determinar relaciones entre variables y su complejidad, así mismo detallando modelos y optimizándolos en su diseño, realizando predicciones y lo más importante en la toma de decisiones.
Cabe notar la influencia que en psicología ha tenido las investigaciones (realizadas por Piaget,
Inhelder, Fischbein entre otros) sobre razonamiento estocástico, también las relaciones entre
el desarrollo de cualquier país y su sistema estadístico para producir informaciones claras y
precisas que conduzcan a la toma de decisiones en lo político, económico y social.
El creciente interés por la enseñanza de la estadística se ve reflejado en los estándares
cuando se propone por ejemplo en grados 1º a 5º de básica, los siguientes:
27
Módulo
5
Pensamiento aleatorio y sistemas de datos
• Clasificar y organizar la presentación de datos (relativos a objetos reales o eventos escolares) de acuerdo con cualidades o atributos.
• Representar datos relativos a su entorno usando objetos concretos, pictogramas
y diagramas de barras.
• Comparar y describir la distribución de un conjunto de datos.
2.1.Conteo y análisis de datos
Al hablar de la enseñanza de la estadística pensamos en el tipo de situaciones didácticas y
pertinentes a usar, de tal forma que le sea útil, interesante y sobre todo que el estudiante elabore
a partir de ellas su propio conocimiento. La conceptualización debe estar de acuerdo con el proceso de desarrollo mental del niño, para ello la propuesta en el aula de clase debe evidenciarse
a partir de actividades y situaciones problemas progresivas, con el fin de que no se llegue a la
aritmetizaciòn o simplemente se llegue al llamado uso de fórmulas a partir de una guía.
La recolección de información nos lleva al conteo, al uso del número en todo tipo de estudios
fenomenológicos y es aquí donde el docente debe canalizar sus acciones didácticas y tener en
cuenta los planteamientos en los cuales según Piaget e Inhelder el niño tiene conocimientos
intuitivos sobre la frecuencia relativa, distribución, aleatoriedad y razonamiento combinatorio.
Proponer situaciones de acuerdo a la edad de tal forma que sean percibidas para llegar a interiorizar en forma concreta el puente entre pensamiento numérico y pensamiento estadístico.
Entre las muchas conceptualizaciones de estadística, de Cabriá6 (Filosofía de la estadística.1994)
propone una definición muy interesante:
“La estadística estudia el comportamiento de los fenómenos llamados de colectivo. Está
caracterizada por una información a cerca de un colectivo o universo, lo que constituye su
objeto material; un modo propio de razonamiento, el método estadístico, lo que constituye
su objeto formal y unas previsiones de cara al futuro, lo que implica un ambiente de incertidumbre que constituyen su objeto o causa final”.
Aparece en esta definición el objeto material como un miembro de una colección, aparece pues
el número asociado a lo cardinal. Tal objeto nos da información respecto de algunas características que deben o ameritan ser estudiadas, teniendo como principal motivador la información,
que nos indica que deben a partir de una muestra ser representativa respecto al colectivo e
igualmente ver en la muestra la variabilidad (incertidumbre) ya que una muestra puede ser diferente de otra; implícitamente nos indica que las previsiones tienen incertidumbre y es debido
precisamente a que las inferencias se realizan a través de las muestras y éstas a veces no son
representativas pues en raras ocasiones se toma el universo (censos).
_____________________________________________________
Citado en Didáctica de la Estadística. Carmen Batanero
6
28
Hacia el Pensamiento Aleatorio
En nuestro tiempo, la informática ha jugado un papel fundamental en el análisis de datos, pues
se hace posible analizar conjuntos grandes de muestras de forma que se aprovecha la mayor
información posible, es aquí donde las representaciones múltiples juegan un papel significativo, ya que dicho análisis se puede tabular, graficar (diferentes formas de acuerdo al tipo de
variable) y el niño nuevamente entra en el juego de la percepción, por esto no debe verse el
análisis tabular como un resumen ya que se pierden propiedades fundamentales en cada uno
de los objetos al realizar la distribución de frecuencias por intervalos, esto es debido a que el
niño observa en los objetos cualidades individuales, por ejemplo como a alguien que le guste
el helado de fresa, pues al ver la distribución de frecuencias se le pierde la idea individual, no
así cuando se le presenta un gráfico de tortas ya que la complejidad de lo abstracto varía.
29
Módulo
5
Pensamiento aleatorio y sistemas de datos
2.2.Situación nº 1 datos y conteo
2.2.1. Datos sin agrupar, conceptos básicos
En el eje organización de datos se utilizan técnicas como la clasificación, organización,
representación y modelos a partir de una presentación de datos que pueden obtenerse
mediante:
1. Observación directa: En la solución de un problema de investigación, se acude a la fuente
de la que se desea obtener la información, para ello se utilizan instrumentos como conversatorios o toma de datos por medio de apuntes de algún fenómeno que se esta observando, por ejemplo preguntar por los precios de algunos artículos en diferentes tiendas.
Otro ejemplo de observación directa es anotar el número de infracciones de tránsito que
ocurren en un sitio determinado en intervalos de tiempo.
2. Encuestas: La encuesta es un procedimiento utilizado en la investigación de mercados
para obtener información mediante preguntas dirigidas a una muestra de individuos representativa de la población o universo, de forma que las conclusiones que se obtengan
puedan generalizarse al conjunto de la población siguiendo los principios básicos de la
inferencia estadística, ya que la encuesta se basa en el método inductivo, es decir, a partir
de un número suficiente de datos podemos obtener conclusiones a nivel general.
La principal ventaja de la encuesta frente a otras técnicas es su versatilidad o capacidad
para recoger datos sobre una amplia gama de necesidades de información.
3. Archivo: Esta técnica consiste en utilizar datos que fueron recogidos con anterioridad por
otra persona o un grupo de investigadores. Por ejemplo, tomar datos del anuario departamental, informes del Dane o Sistema nacional de pruebas, entre otros.
Se pueden observar hechos que ocurren en la naturaleza, como el crecimiento de una planta,
el tiempo que empleamos para ir de nuestra casa a la escuela o institución educativa, ver
en el periódico los marcadores de los partidos de fútbol, apostar al cara y sello etc., estos
sucesos tienen características importantes como por ejemplo, al realizar una apuesta al cara
y sello estamos seguros que saldrá una de las dos situaciones, a este tipo de sucesos los
llamamos deterministas, ya que se va a producir siempre la misma situación en las mismas
condiciones. Pero a veces hay sucesos en los cuales no podemos determinar con certeza lo
que va a ocurrir, por ejemplo cuántos frijoles tiene una libra, con toda seguridad hay variación
en el tamaño de los frijoles al realizar comparación con otra libra, en forma, tamaño, etc., a
este tipo de sucesos los llamamos aleatorios.
En la aleatoriedad juega un papel importante el azar, éste se le atribuye en forma general a
los resultados de los juegos, generando la teoría de probabilidades, ejemplo cuántas veces
obtengo un as, en cinco juegos.
Las situaciones que se presentan a continuación, tienen como propósito:
30
Hacia el Pensamiento Aleatorio
“Explorar e interpretar los datos, relacionarlos con otros, conjeturar, buscar configuraciones cualitativas, tendencias, oscilaciones, tipos de crecimiento, buscar correlaciones,
distinguir correlación de causalidad, calcular correlaciones y su significación, hacer inferencias cualitativas, diseños, pruebas de hipótesis, reinterpretar los datos, criticarlos,
leer entre líneas, hacer simulaciones, saber que hay riesgos en las decisiones basadas en
inferencias” (Vasco C. citado en lineamientos).
Una tabla de frecuencias es un resumen del conjunto de datos por analizar, por ello se debe
tener otras apreciaciones de ellos sobre todo cuando se realizan otras representaciones
como las gráficas, las cuales llevan a observar hechos relevantes de la distribución de
frecuencias, que a la vez nos permite establecer relaciones con otras distribuciones.
En el análisis de la observación de un individuo intervienen características o propiedades
que son atribuidas al azar, a ellas se les llama variables estadísticas. Estas se clasifican
en cualitativas y en cuantitativas, dependiendo si se trata de un atributo o de representaciones numéricas, además pueden ser de tipos discretas o continuas, como en casos del
número de frutos de un cultivo de aguacate, el peso en kilos de tal cultivo.
El análisis de datos al realizar medidas sobre la población se obtiene valores experimentales y de acuerdo a ello se asignan valores representativos acordes a las características o
atributos involucrados en un mismo individuo, tal medición se lleva a cabo con la siguiente
tipología:
a) Escala nominal: clasifica a los individuos de la población en clases que se pueden diferenciar entre sí pero no realizar relaciones de ningún tipo (orden).Ej. estado civil, color
de ojos, gusto por sabores etc. cada variable puede codificarse numéricamente pero el
número no representa una magnitud.
b)Escala ordinal: aquí las categorías pueden ser ordenadas, pero la magnitud no es importante ya que no hay proporcionalidad entre dos o más categorías, así al tener un
orden por el gusto de los helados, el 1(fresa) indica el más preferido y el 4 (chocolate)
el menos preferido.
c) Escala de intervalo: las categorías se clasifican y ordenan realizando una cuantificación
entre dos o más categorías. Esta medida exige un punto de referencia arbitrario y una
unidad de medida. Como ejemplo común se tiene las escalas de medida de temperaturas y eras cronológicas, aquí el cero no es ausencia de …, 0ºC indica que está el medio
ambiente frío (y mucho).
d)Escala de razón: además del orden y la distancia, en esta escala es importante la razón
entre dos categorías, se hace necesario un cero absoluto como ausencia, así el decir
que un árbol de aguacates no dio frutos indica que tuvo cero (0) aguacates, si un árbol
produjo 300 aguacates y el otro 150 aguacates, uno obtuvo el doble que el otro, además
existen variables continuas como volumen, área etc.
31
Módulo
5
Pensamiento aleatorio y sistemas de datos
La escala de medida de las variables, es importante debido al tipo de análisis a realizar, ya
que ella sugiere la representación gráfica adecuada para obtener resúmenes descriptivos
numéricos adecuados, además en el análisis de datos, es importante diseñar instrumentos
adecuados los cuales nos permiten recolectar datos necesarios que nos conlleven a la solución de un problema en cuestión, entre otros se encuentra: medición, observación directa,
encuestas.
Luego se debe realizar un resumen de dichos datos, los cuales los representamos en las tablas de frecuencia al igual que representaciones gráficas. A este respecto Díaz y Gutiérrez
(1986.Pág. 18.) dicen “en general no es posible una representación gráfica de atributos cualitativos, sin embargo ciertos datos nominales u ordinales pueden representarse mediante
gráficos de barras”.
Para las variables cualitativas y discretas, se acostumbra utilizar diagramas de barra y gráficos de sectores, para las cuantitativas se utilizan histogramas y polígonos de frecuencias.
Se utiliza comúnmente la ojiva en frecuencias acumuladas.
Tabla de frecuencias: Es una tabla en la cual se los valores posibles de una variable y se
registra el número de valores observados que corresponde a cada individuo.
En general la tabla contiene lo siguiente:
ni:es la frecuencia absoluta o resultado del conteo de cada una de las variables involucradas.
Las veces que se repite el dato Xi
fi:indica la frecuencia relativa para cada una de las variables.
Σ: Este símbolo representa la suma total n, para indicar el total de la muestra.
fi = ni/n: es la forma de hallar la relación entre una variable y el total de la muestra.
N: es la frecuencia acumulada
Fi*100: es el porcentaje acumulado.
Los datos se acostumbran a representar por Xi.
La suma n1 + n2 +
+nm = es igual al número de datos.
La frecuencia absoluta acumulada Ni es la suma de las i frecuencias absolutas anteriores
Ni =
32
; Ni = Ni-1 + ni
Hacia el Pensamiento Aleatorio
Así N3 =
n1 + n2 + n3 = N2 + n3
La frecuencia relativa indica la proporción de veces que ha ocurrido el dato Xi con respecto al
total de datos. Muchas veces es usual representarla en porcentaje, obteniendo fi = ni /n, se interpretaría como f3 = 4/10 =0.4= 40% el dato 3 representa el 40% de los datos de la muestra.
Observe que la frecuencia relativa es al menos igual a 0 y a lo más igual a 1.
De esta forma la frecuencia relativa se convierte en una función, veamos:
Supóngase que una muestra dada de tamaño n consta de m valores numéricamente
diferentes:
X1,X2, ….Xm (m<=n)
Con frecuencias relativas correspondientes:
f1,f2,…fm, entonces, en f(x) para cada X=Xj es igual a la frecuencia relativa correspondiente
fj y es igual a 0 para cualquier x que no aparece en la muestra.
La frecuencia acumulada relativa es la suma de la i frecuencias relativas anteriores:
Fi =
; Fi = Fi-1 + fi
Ejemplo F3 =
f 1 + f2 + f3 = F 2 + f3
F3= 0.436 indica que los 4 primeros datos representan el 43.6% de los datos de la muestra.
Note que
=1
Para el análisis de datos en forma gráfica, se tiene en cuenta los siguientes diagramas que
ayudan a resumir los datos:
Diagrama de barras
Los gráficos de barras son utilizados para variables de tipo discreto y permiten representar
la frecuencia en cada uno de los niveles de las variables de interés. Particularmente, la altura
de cada barra es proporcional a la frecuencia o cantidad de elementos que pertenecen a la
categoría en particular.
El siguiente gráfico de barras muestra las veces que han ganado el campeonato mundial de
fútbol algunos países.
33
Módulo
5
Pensamiento aleatorio y sistemas de datos
Diagrama de tortas (sectores)
El gráfico circular es útil para representar proporciones de distintas clases dentro de una
muestra. La muestra es representada por un círculo y cada una de las clases que la componen, por un sector de éste.
En este gráfico el área de cada sector es proporcional a la frecuencia de la modalidad que
representa, la cual es vista en un sector circular cuyo ángulo central se obtiene multiplicando
la frecuencia relativa por 360º, de este modo se obtiene la amplitud del ángulo central.
Un método para iniciar el análisis exploratorio de los datos, previo al uso de los métodos
estadísticos tradicionales, y que además proporciona información rápida, visual es la representación gráfica de tronco y hoja, descrito por Tukey, es utilizado para las representaciones de distribución de variables cuantitativas obteniendo con él no sólo una gráfica de
distribución de frecuencias, si no la visualización de los valores de las observaciones objeto
de estudio. Esta representación se basa en la ordenación de los datos a manera de gráfico,
pero sin llegar a ello, utilizando las decenas y las unidades.
Veamos su uso a través del siguiente ejemplo que contiene las calificaciones obtenidas en
una prueba de matemáticas:
34
Hacia el Pensamiento Aleatorio
78
93
61
100
70
83
88
74
97
72
66
73
76
81
83
64
91
70
77
86
Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir,
el número 51 se verá como 5 | 1. De esta manera las decenas se pondrán en una columna,
en forma vertical, y las unidades a su derecha:
Para entenderle un poco más, hemos de decir que el primer renglón que dice 6 | 1 6 4 quiere
decir que entre la lista de datos se encuentran los valores 61, 66 y 64.
Esta es la representación gráfica tronco y hoja, donde cada renglón es una posición de tronco
y cada dígito de la derecha es una hoja.
El procedimiento para realizarla es primero empezar con los troncos, es decir la columna de
la izquierda, y después dato por dato ir llenando las hojas a la derecha de la línea vertical,
en el tronco correspondiente.
Además, si se desean tener los datos ordenados, y algunos los prefieren de esa manera, se pueden ordenar las hojas en cada renglón para que la representación tenga la siguiente forma:
En realidad una representación de tronco y hojas presenta la misma información que la lista
original de datos, pero de una manera mucho más compacta (especialmente si la lista de
datos es más grande) y manejable.
Pictogramas: Actualmente, y mucho en los medios masivos de comunicación, se utilizan
gráficos para ilustrar los datos o los resultados de alguna investigación. Regularmente se
utilizan dibujos para representar dicha información, y el tamaño o el número de estos dibujos
dentro de una gráfica queda determinado por la frecuencia correspondiente. A este tipo de
gráfica se le llama pictograma y éstos son dos ejemplos:
35
Módulo
5
Pensamiento aleatorio y sistemas de datos
El de la izquierda representa la población de los Estados Unidos (cada hombrecillo representa
a dos millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro
sistema solar tomando como unidad a la masa de la Tierra (cada? representa la masa de nuestro
planeta: Venus tiene masa menor y Neptuno tiene 17 veces más masa que la Tierra).
Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de gráficas, las posteriores sí. Otros programas contemporáneos (como el Corel Draw o el Harvard
Graphics) sí son capaces7.
Nota: En la elaboración de gráficos, es de vital importancia la precisión, la claridad en los
títulos, la elección del tipo de gráfico y el uso de escalas adecuadas, todo ello para dar una
idea clara de la información que se desea comunicar.
• ESTÁNDARES INVOLUCRADOS
Ahora encontrará una propuesta organizacional de los estándares asociados a las situaciones propuestas y resueltas que sirven de base para discusiones de otras situaciones que los
docentes puedan plantear y de las que tienen esta unidad.
Conceptos y procedimientos
Las actividades que se presentan en la situación uno apuntan a engrosar los conocimientos
de forma tal que conlleven a un entendimiento de las relaciones existentes entre los datos
(variables analizadas) con base en ello el análisis exploratorio proporciona métodos sencillos para la preparación y organización de datos, detectar fallos en el diseño y recolección,
tratamiento y evaluación de los mismos. Sirven las actividades para observar lo que está
sucediendo con los datos ausentes, identificando casos atípicos.
A partir de un conjunto de técnicas sencillas sintetizar y presentar información contenida
en un conjunto de datos. Se examina en forma previa los datos como un paso necesario
_____________________________________________________
Tomado de :www.uagmx/matematicas/estadisticas
7
36
Hacia el Pensamiento Aleatorio
Sistemas de datos
Primero a tercero
Clasificar y organizar la presentación de datos (relativos a objetos
reales o eventos escolares) de acuerdo con cualidades o atributos.
Representar datos relativos a su entorno usando objetos concretos,
pictogramas y diagrama de barras.
Representar dato usando tablas y gráficas (de barras, diagramas de
líneas, circulares)
Cuarto a quinto
Interpretar información presentada en tablas y gráficas (de barras,
diagramas de líneas, circulares).
Resolver y formular problemas a partir de un conjunto de datos provenientes de observaciones, consultas y experimentos.
Comparar e interpretar datos provenientes de diversas fuentes (prensa, revistas, televisión, experimentos, consultas, entrevistas).
Sexto a séptimo
Usar representaciones gráficas adecuadas para presentar diversos
tipos de datos (diagramas de barras, diagramas circulares)
Resolver y formular problemas a partir de un conjunto de datos presentados en tablas, diagramas de barras, diagramas circulares.
Reconocer que, diferentes maneras de presentar la información,
puede dar origen a distintas interpretaciones.
Octavo a noveno
Décimo a undécimo
Interpretar analítica y críticamente información estadística proveniente de diversas fuentes (prensa, revistas, televisión, experimentos,
consultas, entrevistas).
Justificar inferencias provenientes de los medios o de estudios diseñados en el àmbito escolar
Interpretar nociones básicas relacionadas con el manejo de información (como población, muestra, variable, estadígrafo y parámetro).
Numérico
Primero a tercero
Reconocer el significado de número en diferentes contextos (medición, conteo, comparación, codificación, localización entre otros).
Cuarto a quinto
Analizar y explicar las representaciones de un mismo número (naturales ,fracciones, decimales, porcentajes).
Sexto a séptimo
Justificar operaciones aritméticas utilizando las relaciones y propiedades de las operaciones.
Métrico
Primero a tercero
Diferenciar atributos mensurables de los objetos y eventos (longitud,
superficie, capacidad, masa y tiempo) en diversas situaciones.
Cuarto a quinto
Diferenciar atributos mensurables de los objetos y eventos (longitud,
superficie, capacidad, masa, tiempo y amplitud angular) en diversas
situaciones.
37
Módulo
5
Pensamiento aleatorio y sistemas de datos
el cual requiere tiempo y que habitualmente se descuida por parte de los docentes. Acceder a los datos conlleva una selección adecuada de acuerdo al grado en el cual se esté
realizando el estudio y de acuerdo al tipo de variables involucradas, así poder realizar un
estudio de tipo numérico y tener una idea inicial de la información contenida en el conjunto de datos.
Se prepara al estudiante para que comprenda gradualmente un proceso estocástico, a partir
de la adquisición progresiva de los diferentes elementos que intervienen a partir de experimentos aleatorios y no aleatorios, así mismo la preparación hacia los conceptos básicos de
la teoría frecuencialista de la probabilidad.
• GESTIÓN DE LA SITUACIÓN
La situación en sus actividades no presenta énfasis en dificultades respecto a la parte teórica, aunque la actividad 2, se debe tener especial cuidado ya que se involucra en forma
intuitiva para el estudiante lo que representa el concepto de aleatoriedad, a partir de dos
actividades en la cual un estudiante realiza el experimento con el lanzamiento de los dados
y el otro coloca en la tabla según su creencia los datos que desee.
El análisis de las dos tablas es fundamental para poder comprender el proceso de aleatoriedad a partir de simulaciones, para ello se debe realizar un análisis en grupo con todos los
estudiantes, esto debido a que no existen patrones definidos para el caso del experimento
simulado. Al comparar las diferentes gráficas en el proceso real, se debe buscar patrones,
en este caso debe “verse” que la distribución se asemeja a la campana de Gauss.
Actividad Nº 1. Recolección de datos
Propósitos
Recolectar información proveniente de diversas fuentes.
Realizar conteos con los elementos puestos en escena de la vida escolar
Actividad Nº 1 Juego con bloques lógicos
Material
Bloques lógicos.
En una bolsa se le colocan al estudiante:
6 círculos rojos
4 círculos amarillos
4 círculos azules
6 rectángulos rojos
6 rectángulos amarillos
38
Hacia el Pensamiento Aleatorio
Cómo jugar
1. Agrupar las fichas por color y forma: Círculos amarillos, rectángulos rojos etc.
2. Cuando haya terminado, se le pide que llene la siguiente tabla:
Nombre
Color
Cantidad
(Frecuencia)
Relación
Círculo
Círculo
Círculo
Rectángulo
Rectángulo
Rectángulo
TOTAL
--------------------
Situaciones para reflexionar
¿Cuántas fichas hay de color amarilla?
¿Cuántas fichas hay en total?
¿Cuántas piezas en total hay más que amarillas?
¿Cuál es la relación de círculos amarillos respecto al total de piezas?
¿Cuál es la relación de círculos azules respecto al total de piezas?
¿Cuál es la relación de círculos rojos respecto al total de piezas?
¿Cuál es la relación de rectángulos amarillos respecto al total de piezas?
¿Cuál es la relación de rectángulos rojos respecto al total de piezas?
¿Cuál es la relación de rectángulos azules respecto al total de piezas?
Actividad nº 2
El propósito es diferenciar un proceso aleatorio de otro que no lo es.
Jugando con dados
Material
1 dado sin cargar (normal)
2 jugadores
Cómo jugar
1. Cada uno lanza el dado, quien obtenga mayor puntaje realiza el experimento en forma
concreta así: Lanza el dado 40 veces y anota una x frente al número correspondiente,
hasta terminar.
2. El jugador perdedor, coloca los 40 resultados marcando con cruces donde el crea conveniente sin tirar los dados (simulación).
3. Anote los datos obtenidos en la siguiente tabla:
39
Módulo
5
Pensamiento aleatorio y sistemas de datos
Prueba real
Número
Marca (x)
Frecuencia (conteo)
Total
40
40
Número
Marca (x)
Frecuencia (conteo)
40
40
1
2
3
4
5
6
Prueba simulada
1
2
3
4
5
6
Total
Situaciones para reflexionar
1. Cómo diferenciar un experimento aleatorio de otro que no lo es?
2. En el experimento real siempre se ha de tener la misma frecuencia?
3. Qué pasa si se obtienen 10 veces el número cinco?
4. Compara los dos experimentos colocando las X sobre cada número en la siguiente tabla:
Aleatorio
1
40
2
3
4
Simulado
5
6
1
2
3
4
5
6
Hacia el Pensamiento Aleatorio
5. En qué se parecen?
6. El valor más frecuente es el mismo?
7. Cuál de las secuencias presenta mayor variabilidad (rango)?
Actividad nº 3
Propósito: iniciar al estudiante en el proceso de tabulación de datos y en la realización de
encuestas.
Consultando textos
Determinar cual es la vocal más usada en nuestro idioma.
Para comenzar, la población de estudio referida serán todas las vocales del idioma Español,
que es infinita. Pero podemos determinar una muestra a partir de una página completa de un
libro cualesquiera, no es un buen ejemplo de muestreo, pero la experiencia nos ha mostrado
que es una buena muestra para los propósitos de la clase.
Material
1. Libro. Se puede pedir que lleve (para grados 6º en adelante) el que están leyendo en la
asignatura de español
Cómo empezar
La toma de la muestra se podrá hacer realizando un listado de todas las vocales del texto en
el orden en que aparecen y luego señalando con un color para cada vocal.
Organizar en la siguiente tabla.
Para el caso de las vocales se consideran como variables nominales
Vocal
ni
fi
%
Ni
Fi
a
e
i
o
u
Total Σ = n
Situaciones para reflexionar
1.
2.
3.
Cuál es la vocal más usada en nuestro idioma?
Coincide esta vocal para otro idioma?
Cómo hallarías el porcentaje de cada vocal?
41
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad nº 4
Realizar una encuesta entre los estudiantes del grupo, en la cual se va a observar la variación
de la edad con el crecimiento y el sexo.
La pregunta problematizadora sería: ¿Cual es la influenciad de la estatura con relación a la
edad y el sexo?
La estatura tiene influencia en el crecimiento del pie?
Material
1. Metro.
2. Hoja o un cuarto de cartulina.
Cómo empezar
Cada estudiante lleva una hoja de papel o un cuarto de cartulina, se quita los zapatos y
dibuja en ella su pie (calca). Luego lo mide con un metro.
Se mide luego la estatura de cada uno (sin zapatos).
Cada estudiante le realiza las siguientes preguntas a cada uno sus compañeros:
1. Sexo M  F 
2. Estatura en cm.
3. Edad en años cumplidos
4. Tamaño del pie.
Llenar las siguientes tablas
Variable: sexo
Xi Sexo
ni
fi
Ni
1
2
Responda:
Qué porcentaje corresponde a las mujeres en tu grupo?
En el siguiente círculo, gráfica los porcentajes de cada
variable
42
Fi
Hacia el Pensamiento Aleatorio
Variable: edad
Tipo:
Escala de medida:
Xi Edad
ni
fi
Ni
Fi
Situaciones para reflexionar
1. ¿Qué porcentaje de estudiantes tiene la edad entre ____ y ____ ?
2. El número de estudiantes con ____ años es _____
3. El 50% de los estudiantes tiene _____ o mas años
4. La mayor frecuencia a qué porcentaje corresponde?
Elabore un gráfico de Frecuencias acumuladas vs Porcentaje acumulados. (OJIVA)
En el eje Y coloque Ni al lado izquierdo y en el Y derecho coloca la Fi, para ello divida en 25%
este eje hasta completar el 100%. En el eje X coloca las edades.
5. Responder: En cual valor empieza el 25% de las edades menores?
6. Qué porcentaje de estudiantes poseen una estatura superior a ____CMS?
Para la estatura se aprovecha el mismo cuadro
43
Módulo
5
Pensamiento aleatorio y sistemas de datos
Xi Estatura
ni
fi
Ni
Fi
7. ¿Qué porcentaje de estudiantes tiene la estatura entre ____ y ____ ?
8. El número de estudiantes con ____ cms es _____
9. El 50% de los estudiantes tiene _____ ò más cms.
10. La mayor frecuencia a qué porcentaje corresponde?
Ahora organizaremos algo diferente, por sexo, realizamos las 2 tablas con respecto a la medida del pie para luego concluir y comparar.
Sexo femenino
Variable: medida del pie en cms
Xi medida del pie en cms
ni
fi
Ni
Fi
ni
fi
Ni
Fi
Sexo: masculino
Variable: medida del pie en cms
Xi medida del pie en cms
44
Hacia el Pensamiento Aleatorio
Situaciones para reflexionar
1. En cual de los sexos existe mayor medida del pie?
2. Cual cree que es la razón para llegar a esa conclusión?
3. Cual de los datos posee mayor dispersión? ( Rango)
Ahora realice un diagrama de barras para ambos sexos para comparar la medida del pie.
Sexo femenino:
Sexo masculino
Si se supone que la longitud de un pie es de acuerdo a la edad normal y está entre _____
cms y ______ cms, qué porcentaje de estudiantes se consideran normales en crecimiento
para ambos sexos?
Se puede decir que la mitad de los estudiantes tiene entre ____ y _____ cms?
Qué porcentaje de cada sexo tiene medida de pie inferior a _____ cms?
Actividad nº 5
Propósito: conceptuar sobre cada una de las frecuencias matemáticamente.
Un docente colocó una tabla de frecuencias en el tablero sobre el número de tornillos defectuosos en una muestra de 20 cajas, pero al terminar sonó el timbre para salir a descanso y
los estudiantes borraron algunos datos, por favor ayúdenos a encontrarlos y responda las
inquietudes que se formulan:
Xi : tornillos defectuosos
ni (cajas)
fi
0
2
0.10
1
3
0.15
2
Fi
10%
0.25
3
4
Ni
50%
16
4
Σ
45
Módulo
5
Pensamiento aleatorio y sistemas de datos
a.
Qué porcentaje de tornillos tiene 3 o mas defectos?
b.
En qué rango se encuentra el 25% y 75% de tornillos defectuosos?
c.
Cual es la cantidad de cajas con mas tornillos defectuosos?
Actividad nº 6
En un campeonato de fútbol intercolegiado se han inscrito 12 equipos. Los puntos que se
dan por partido jugado son: 3 al ganador, 0 al perdedor y en caso de empate 1 a cada equipo, excepto en la semifinal (tercera fase) donde en caso de empate, el ganador se decidirá
por tiros desde el punto penal. Los organizadores del campeonato construyeron el siguiente
diagrama donde se observa la programación general de los partidos en cuatro fases: (Icfes,
2002, Pág. 33)
46
Hacia el Pensamiento Aleatorio
Situaciones para reflexionar
1. El periódico de la institución quiere analizar el diagrama de los partidos por fase. Realice
las conclusiones pertinentes de acuerdo al número de partidos jugados en cada fase.
2. Si su función fuera el de reorganizar el diagrama de los partidos por fase, de tal forma que
un equipo tenga mayor posibilidad de pasar de un subgrupo de la fase 2 a un subgrupo
de la fase 3, cómo lo haría?.
3. Un comentarista del periódico trató de resumir la información del diagrama del campeonato con respecto a la cantidad de partidos, realizando la siguiente tabla:
Fases
Número de
partidos
grupos
subgrupos
1
2
3
4
A
B
C
D
1
2
A
B
6
6
1
1
6
6
6
6
6
6
1
1
Analice si los datos coinciden con la totalidad de la información del diagrama.
4. Un equipo ha llegado a la final y de los partidos que jugó empató 2 y perdió uno. Represente gráficamente los puntos que hizo el equipo por partido.
Las siguientes actividades se prestan para que el estudiante realice un análisis basado en
los conceptos anteriores.
5. Los ejercicios del 4 al 7 son tomados de las pruebas TIMSS
47
Módulo
6.
7.
48
5
Pensamiento aleatorio y sistemas de datos
Hacia el Pensamiento Aleatorio
•SITUACIÓN: Datos y conteo, datos agrupados
Conceptos básicos
El objetivo de toda investigación estadística es llegar a resultados confiables, precisos
(quedando siempre incertidumbre, no siempre exactos), esto nos indica que debe existir un
margen de error pero debe llevarse al mínimo en lo posible, debemos pues estar dentro de
márgenes tanto por exceso como por defecto, para ello, la variable a la cual se le realiza el
estudio debe de provenir de una muestra grande, suficiente como para considerar errores
experimentales pequeños. Todo resultado de un experimento en el cual la información es
representada en forma volumétrica no nos indica mayor información concreta sobre las características a estudiar debido a que pueden tomar valores aislados o puede estar dentro
de un intervalo8, sin embargo para poderla manejar se debe recurrir al proceso o técnica de
agrupación de datos, esta técnica es aplicable tanto a datos discretos como a continuos, tal
técnica, permite agrupar en intervalos y marcas de clase la información obtenida sin perder
demasiada información.
Al tomar la decisión de agrupar datos, se debe tener en cuenta el número de intervalos en
el cual se va a dividir. Para ello no existen criterios únicos, al respecto Batanero y Godino
(2001) comentan: “…no existe una regla fija, y en última instancia será un compromiso entre
la pérdida de la información que supone el agrupamiento y la visión global y sintética que
se persigue”.
Daremos aquí varios enfoques sobre diferentes autores, respecto a la forma de realizar una
agrupación de datos por intervalos, no se recomienda uno en particular simplemente se
adapta a la situación de análisis más deseada o pertinente.
Edwin Kreyszig,(1973. Pág. 33) propone: un intervalo I debe contener todos los valores de
la misma (muestra). Se subdivide I en subintervalos llamados intervalos de clase o celdas;
los puntos medios de estos intervalos se denominan marcas de clase. Se dice que los valores de la muestra en cada uno de los intervalos forma una clase. Al número de valores en
una clase se le llama frecuencia de clase; su división entre el tamaño n de la muestra es la
frecuencia relativa de clase. Esta frecuencia, considerada como función de las marcas de
clase, se denomina función de frecuencias de la muestra agrupada.
En muchas aplicaciones será posible obedecer las siguientes reglas que son útiles:
1. Todos los intervalos de clase deberán tener la misma longitud.
2. los intervalos de clase se escogerán de manera que las marcas de clase correspondan a
números simples ( números con pocos dígitos diferentes de cero)
_____________________________________________________
Al estudiar por ejemplo el número de hijos por familia de estrato 1 se tiene una variable de tipo discreto en el cual se puede tener 0
hijos por lo cual es un dato aislado, y en el estudio de la estatura de estudiantes de un grado, se puede tener una pequeña que no
sea muy común pero está dentro de un intervalo.
6
49
Módulo
5
Pensamiento aleatorio y sistemas de datos
3. Si un valor de la muestra coincide con el punto extremo común de dos intervalos de clase,
lo tomaremos en cuenta sumando ½ a la frecuencia de clase de cada uno de los intervalos
de clase. De ser posible escogeremos los intervalos de clase de tal manera que no sucedan
tales coincidencias.
Al escoger menos intervalos, se perderá más información, ya que los valores originales de
la muestra no aparecerán explícitamente. El agrupamiento debe hacerse de tal manera que
solo se eliminen los detalles que no son esenciales. En muchas aplicaciones prácticas se
pueden escoger entre 10 y 20 intervalos de clase.
La muestra agrupada puede cambiar si se cambian las marcas de clase, reteniendo las longitudes y el número de intervalos de clase. Se observa pues que hay factores arbitrarios en
el proceso de agrupamiento.
Si se va a comparar una muestra con otra previamente agrupada, es importante que se escoja el mismo agrupamiento, eje estudios demográficos, la edad se agrupa por lo general en
intervalos del primer año de vida, después los siguientes cuatro años y luego en intervalos
de 5 (o 10) años. Si se ignora esta convención, sería muy difícil comparar los resultados de
diferentes estudios.
Godino y Batanero9 comentan: Una regla que se utiliza a menudo es tomar un entero próximo a la raíz cuadrada del número de datos como número de intervalos. Para proceder a la
construcción de una distribución de frecuencias con datos agrupados es preciso tener en
cuenta las siguientes nociones:
Máximo: se llama máximo de una variable estadística continua al mayor valor que toma la
variable en toda la serie estadística.
Mínimo: es el menor valor que toma la variable en toda la serie estadística.
Recorrido: es la diferencia entre los valores máximo y mínimo en toda la serie estadística.
Clase: es cada uno de los intervalos en que podemos dividir el recorrido de la variable
estadística.
Extremo superior de clase: es el máximo valor de dicha clase.
Extremo inferior de clase: es el mínimo valor del intervalo.
Marca de clase: es el punto medio de cada clase.
Según el extremo superior de cada clase coincida o no con el extremo inferior de la clase siguiente, podemos distinguir dos clases de tablas de frecuencias. Si el extremo superior de cada clase
_____________________________________________________
Análisis de datos y su didáctica. Godino y Batanero.2001.
9
50
Hacia el Pensamiento Aleatorio
coincide con el inferior de la siguiente, los intervalos se suponen semiabiertos por la derecha.
Es decir, en cada clase se incluyen los valores de la variable que sean mayores o iguales que
el extremo inferior del intervalo, pero estrictamente menores que el extremo superior.
La información de una tabla puede resumirse gráficamente así:
Histograma: consiste en unos rectángulos construidos sobre los ejes cartesianos, y las áreas
son proporcionales a las frecuencias de cada intervalo. La base de cada rectángulo se construye sobre el eje X y representan los intervalos de clase. La altura representa la frecuencia
de cada clase.
Cada observación representada en un histograma ocupa un rectángulo de igual área y de
base dada por el ancho del intervalo correspondiente.
Para cada intervalo, el rectángulo que representa su frecuencia, puede imaginarse formado
por un ‘apilamiento’ de los rectángulos correspondientes a sus observaciones.
Intervalos
Frecuencia
[1-2)
6
[2-3)
10
[3-4)
4
[4-5)
2
[5-6)
1
En la tabla anterior, todos los intervalos tienen el mismo tamaño. Esto hace que, la altura
del rectángulo asociado a cada intervalo sea directamente proporcional a la frecuencia correspondiente.
Gráfico de cajon: el gráfico de caja es una representación que describe la información contenida en una muestra basándose en cinco estadísticas:
Valor máximo (Máx.)
Tercer cuartil (Q3)
Mediana (m)
Primer cuartil (Q1)
Valor mínimo (Mín.)
Como puede observarse, las estadísticas calculadas para construir este gráfico, dividen el
recorrido de los valores observados en cuatro partes. Cada una de éstas contiene aproximadamente el 25% del total de las observaciones.
La interpretación del gráfico está basada en la comparación de las longitudes de los
cuatro tramos.
51
Módulo
5
Pensamiento aleatorio y sistemas de datos
Debe tenerse presente que cada uno de los tramos tiene la misma cantidad de elementos,
por lo tanto los tramos de menor longitud representan una mayor densidad. Es decir, los
tramos más cortos representan una mayor aglomeración de elementos muestrales.
Nota: La ventaja de esta representación reside en que permite resumir datos en forma simple,
entregando una visión global de la muestra con pocos elementos. A pesar de la simplicidad
de este gráfico, no es fácil entenderlo en un comienzo y, al igual que muchos otros, requiere
de algún cuidado en su análisis para poder interpretar la información que entrega. Este tipo
de gráfico se estudiará con detalle en la sección de medidas de posición.
Polígono de frecuencias: es la línea que resulta de unir los puntos medios de la base superior de cada rectángulo.
La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos
clases con frecuencias cero: una antes de la primera clase con datos y otra después de la
última. El resultado es que se “sujeta” la línea por ambos extremos al eje horizontal y lo que
podría ser una línea separada del eje se convierte, junto con éste, en un polígono.
52
Hacia el Pensamiento Aleatorio
El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante el año de 1990 en cinco países (fuente: Revista “Ciencia y Desarrollo”,
1994, XIX(114):12):
OJIVA: llamado polígono acumulativo de frecuencias, se obtiene uniendo la abscisa correspondiente al extremo superior de cada clase y la ordenada a la frecuencia acumulada hasta dicha
clase, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por
ésto la aplicación de la técnica es parcial):
1. Un extremo de la ojiva no se “amarra” al eje horizontal, para la ojiva mayor que sucede
con el extremo izquierdo; para la ojiva menor que, con el derecho.
2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor
que, utilizando los datos que se usaron para ejemplificar el histograma:
La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que
está sobre la frontera de clase “4:00” se ven las visitas que se realizaron en una hora mayor
que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). De forma
análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son
el número de observaciones menores que la frontera señalada (en caso de tiempos sería el
número de observaciones antes de la hora que señala la frontera).
Si se utiliza una distribución porcentual acumulativa se obtiene una ojiva (mayor que o menor
que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente
ejemplo es la misma ojiva menor que se acaba de usar, pero con una distribución porcentual:
53
Módulo
5
Pensamiento aleatorio y sistemas de datos
Datos agrupados.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases
y a partir de estas determinar sus características y por consiguiente las de la población de
donde fue tomada.
Ejemplo:
Los siguientes datos se refieren al diámetro en pulgadas de una tubería.
6.75
6.50
7.25
7.00
7.25
7.00
6.50
6.70
6.70
6.75
7.00
6.50
6.00
6.50
6.25
6.75
6.25
6.75
6.75
6.25
6.50
6.25
6.00
6.25
7.00
6.50
6.50
6.75
6.65
6.75
7.15
6.65
6.75
6.75
7.00
7.00
7.00
7.10
7.10
7.15
a) Agrupe datos, considere k = 6 para este caso.
A veces la obtención de k se realiza en forma arbitraria, teniendo en cuenta tomar entre 5 y 25
intervalos como límite , los especialistas utilizan la llamada regla de Sturges (1926), si k es el
número de intervalos deseados y n el número de datos, entonces k = 1+3.32log(n), pues como
se puede apreciar el número de intervalos es arbitrario y depende mas de la experiencia y no
de la teoría ya que si se toman demasiados intervalos, la agrupación es ineficiente ya que
no se reduce lo suficiente el conjunto de datos originales. Si se toman pocos intervalos se
pierde la información original y por supuesto el objetivo de la investigación.
b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de probabilidad.
Solución: Agrupando datos;
Rango = valor máximo – valor mínimo
1. R = VM - Vm = 7.25 – 6.00 = 1.25
Número de intervalos:
2. k = 6
54
Hacia el Pensamiento Aleatorio
Amplitud de cada intervalo: este valor casi siempre contiene varias cifras decimales, se recomienda por simplicidad redondear por encima al número de cifras decimales que tengan
los datos originales.
3.
Los intervalos pueden tener la misma amplitud o éstas pueden ser diferentes dependiendo
de la naturaleza de los datos.
4. Formando clases. Límites de los intervalos.
Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado
en la muestra; donde
LI: límite inferior.
LS: límite superior.
Los límites de los intervalos deben escogerse de tal forma que incluyan los valores máximo
y mínimo para que la ampliación se reparta por partes iguales en los extremos.
La marca de clase es el punto medio de cada intervalo: xi = (LS-LI)/2
El conteo de datos se realiza por cada intervalo.
Marca Límite real Límite real
de clase
inferior
superior
Frecuencia
relativa
Frecuencia
Relativa acumulada
6.185
2/40 = 0.05
0.05
6.185
6.405
5/40=0.125
0.175
6.515
6.405
6.625
0.175
0.350
6.735
6.625
6.845
0.325
0.675
7
6.955
6.845
7.065
0.175
0.850
7.07 – 7.28
6
7.175
7.065
7.285
0.15
1.000
Total
40
LI LS
Frecuencia
5.97 – 6.18
2
6.075
5.965
6.19 – 6.40
5
6.295
6.41 – 6.62
7
6.63 – 6.84
13
6.85 – 7.06
1.000
Gráficas:
55
Módulo
5
Pensamiento aleatorio y sistemas de datos
Situaciones para reflexionar
a. Cuál es el intervalo de mayor frecuencia?
b. Cómo están distribuidas las frecuencias?
c. Cuántos tubos tiene un diámetro mayor a 6.736 pulg?
d. Qué porcentaje mide menos de 6.515 pulg?
e. Entre cuales límites está el 25% de los tubos mas gruesos?
Conceptos y procedimientos
En la representación gráfica, el estudiante debe tener habilidad para lectura crítica de datos,
lo cual le permite ser competente en este pensamiento, ya que se deja de ser repetitivo y
solamente se estaría en un sistema estadístico donde lo principal es la aplicación reiterativa
de una fórmula. Curcio (1989) describe tres niveles distintos de comprensión de gráficos:
a) “Leer los datos”: este nivel de comprensión requiere una lectura literal del gráfico; no se
realiza interpretación de la información contenida en el mismo. Por ejemplo en una nube
de puntos, se refiere a cuestiones sobre la lectura de las escalas o encontrar el valor de
una de las coordenadas de uno de los puntos, dado el valor de la otra coordenada.
b) “Leer dentro de los datos”: incluye la interpretación e integración de los datos en el gráfico;
requiere la habilidad para comparar cantidades y el uso de otros conceptos y destrezas
matemáticas. Por ejemplo en cuestiones de covariaciones, indicar si la relación, podría ser
representada o no mediante una función lineal o si sobre la relación es directa o inversa.
c) “Leer más allá de los datos”: requiere que el lector realice predicciones e inferencias a
partir de los datos sobre informaciones que no se reflejan directamente en el gráfico.
Aquí se podría predecir el valor de y para un x dado.
56
Hacia el Pensamiento Aleatorio
• GESTIÓN DE LA SITUACIÓN
Las actividades propuestas presentan niveles de complejidad apropiados para los grados
6º,7º y 8º, este tipo de actividad puede proponérsele los estudiantes desde el comienzo de
la campaña para la elección de personero en las diferentes instituciones, en la cual ellos pueden realizar las encuestas y diferentes ítems basados en el propuesto. Se puede realizar en
grupos de tres estudiantes para fortalecer el trabajo en equipo y además las competencias
ciudadanas, por ejemplo con relación a la participación democrática y lograr por otro lado la
integración con el área de sociales ya que los estudiantes de estos grados pueden aportar
ideas sobre el gobierno escolar.
Con respecto a la actividad ocho se tiene un prototipo clásico que está en la mayoría de los
textos escolares, pero la forma de realizar la reflexión no es la tradicional ya que ha sido
tomada de una de las preguntas de tipo Icfes en la cual se evalúa la competencia de compresión de lectura de gráficas.
Actividad nº 7
En una institución educativa, para el cargo de personero se postularon 4 candidatos. Una
semana antes de las elecciones se realizó una encuesta, tomando una muestra representativa
de todo el estudiantado y se formuló una pregunta acerca del candidato de su preferencia.
Los resultados obtenidos se expresan en la siguiente grafica10:
Situaciones para reflexionar
Con base en la información, se puede afirmar con certeza que:
a. Todos los estudiantes de la muestra respondieron la pregunta.
b. En candidato 1 obtuvo casi el mismo número de votos que el candidato 2.
c. Los candidatos 1 y 2 obtuvieron la misma votación.
d. El candidato 2 obtuvo la mitad de votos que el 4.
La siguiente tabla de frecuencias es compatible con la gráfica?
_____________________________________________________
Adaptado de Icfes 2002. La prueba. El Tiempo.
10
57
Módulo
5
Pensamiento aleatorio y sistemas de datos
Candidato
Nº de votos
1
21
2
11
3
34
4
19
Total
85
a. No, debido a ________________________________________________
b. Si , significa que _________________________________________________
Una vez realizada la elección, se dio como absoluto ganador al candidato 3, que obtuvo 56%
de la votación total. La popularidad del ganador se incrementó 2% en los tres últimos días
antes de la elección. Esto quiere decir que:
a. El candidato 3 obtuvo 672 votos a su favor de los 1200 posibles.
b. De los 1200 estudiantes, 24 corresponden al 2%.
c. Faltando 4 días, de los 1200 votantes, 648 votarían por él.
d. El candidato 3 obtuvo 12 votos más al aumentar su popularidad.
Actividad nº 8
Se ha preguntado a un cierto número de familias por el número de hijos: Los resultados obtenidos están representados en una tabla y en un diagrama de barras11.
Número de
hijos
Número de
familias
0
2
1
4
2
6
3
?
4
2
5
?
Total
?
Situaciones para reflexionar
Completar la tabla
Al analizar el diagrama de barras, se puede afirmar:
a. La mayoría de las familias tiene 4 o mas hijos.
b. El 70% de las familias tiene 2 o mas hijos
c. El 50% de las familias tiene 2 o menos hijos
d. 30 familias tienen 2 hijos
_____________________________________________________
Tomado de Sistema Nacional de Evaluación de la educación. 2002. 9º grado
11
58
Unidad No.2
Desde los conceptos y los procesos
2.1.Las medidas de posición y variabilidad
2.1.1. Comprensión de las medidas de tendencia central
Realizado el proceso de análisis de datos en forma descriptiva, se hace necesario el proceder a la realización de los resúmenes estadísticos que nos proporcionan la forma como se
distribuyen los datos calculando una serie de valores alrededor de los cuales se agrupan
dichas observaciones.
Los estándares para los grados quinto y sexto “Encuentra la media, la mediana y la moda de
un sistema de datos e interpreta su significado” para el grado sexto “Interpreta diagramas
de barras, diagramas circulares y pictogramas y calcula frecuencias, medianas, modas y
medias a partir de ellas”12 lo anterior nos permite buscar que los docentes puedan construir
primero sus propios modelos, conceptos e interpretaciones y luego a partir de fuentes documentales y nuevas experiencias les permita llevar a sus estudiantes situaciones problémicas
que le eviten dificultades en la conceptualización de estas importantes medidas, situaciones
que evidencien en los estudiantes argumentaciones, conjeturas, hipótesis y todas aquellas
competencias implícitas en la escogencia de una medida de tendencia central de acuerdo
con el contexto que se le presente y de allí puedan realizar sus modelaciones.
Conceptualizaciones
Las medidas de centralización o tendencia central son medidas que buscan centralizar la
información de alguna manera, por lo tanto son medidas de síntesis que recopilan las características más relevantes de la distribución de frecuencias.
Promedios (media aritmética)
Son medidas que hace uso de toda la distribución de frecuencias. Por esta razón, la media
(promedio) es un valor típico o representativo de los datos, el cual dice alrededor de qué
valor se agrupa los datos con respecto al centro de la distribución. Cambell (1974)13 “observa
_____________________________________________________
Estándares Básicos de Matemáticas. MEN (2003).
Citado en el documento Concepciones de los maestros de primaria en formación sobre los promedios. (Batanero, Godino y
Navas) 1997.
12
13
59
Módulo
5
Pensamiento aleatorio y sistemas de datos
que debido a la representatividad, se tiende a situar la media en el centro del recorrido de
la distribución”, propiedad que es cierta para distribuciones simétricas que analizaremos
más adelante.
Brosseau (1983) afirma que en la enseñanza de la media existe un obstáculo de tipo didáctico al introducir el simbolismo, y que es más práctico facilitar inicialmente la comprensión
del significado realizando ejemplos concretos o comparaciones.
• ESTÀNDARES INVOLUCRADOS
Ahora encontrará una propuesta organizacional de los estándares asociados a las situaciones propuestas y resueltas. Se presenta un esquema organizativo de la estructura
conceptual presente en el pensamiento aleatorio y sistemas de datos.
Sistemas de datos
Primero a Tercero
Cuarto a Quinto
Identificar regularidades y tendencias en un conjunto de datos
Comparar y describir la distribución de un conjunto de datos.
Usar e interpretar la mediana, promedio.
Sexto a Séptimo
Usar medidas de tendencia central (media, mediana, moda) para
interpretar el comportamiento de un conjunto de datos
Reconocer relación entre un conjunto de datos y su representación.
Octavo a Noveno
Interpretar conceptos de media, mediana y moda.
Seleccionar y usar algunos métodos estadísticos adecuados, según
el tipo de información
Décimo a Undécimo
Describir tendencias que se observan en conjuntos de variables relacionadas.
Usar comprensivamente algunas medidas de centralización, localización, dispersión y correlación (percentiles, cuartiles, centralidad,
distancia, rango, varianza, covarianza y normalidad).
Numérico
Primero a Tercero
Cuarto a Quinto
Usar la estimación para establecer soluciones razonables acorde
con los datos del problema.
Justificar regularidades y propiedades de los números, sus relaciones y operaciones utilizando calculadoras o computadores.
Variacional
Sexto a Séptico
Octavo a Noveno
60
Reconocer el conjunto de valores de una variable en situaciones
concretas de cambio.
Identificar relaciones entre propiedades de las gráficas y propiedades de las ecuaciones algebraicas.
Desde los conceptos y los procesos
El siguiente esquema muestra un posible modelo que permite acceder a la Estadística
Descriptiva, tomando como base fundamental el Análisis Exploratorio de Datos, en este
sentido se consigue un entendimiento básico de los datos y de las relaciones existentes
entre las variables analizadas.
61
Módulo
5
Pensamiento aleatorio y sistemas de datos
Veamos algunos análisis de situaciones en la cual el significado y comprensión de las medidas de posición es de vital importancia antes de mencionar un algoritmo en particular o
propiedades para resolver situaciones problemas.
Conceptos y procedimientos
Este grupo de actividades llamadas de aprestamiento tiene como objetivo el cálculo de las
medidas de tendencia central, en especial la media aritmética, y para ello se usa la comprensión de los conceptos de acuerdo con la estimación de medidas que los estudiantes deben
ubicarse en un rango posible. Así mismo se aborda situaciones en las cuales el promedio
ponderado juega un papel fundamental.
• GESTIÓN DE LA SITUACIÓN
Se tienen dos actividades con una dificultad en la forma de emplearse el concepto y por
consiguiente la comprensión del mismo respecto a la media ponderada, esto se debe básicamente a que se aplica el algoritmo en forma mecánica, sin comprender su significado,
además, porque no se visualiza el conjunto de datos como un todo.
Al respecto, Godino (1966) indica “el problema de la comprensión está por consiguiente,
íntimamente ligado a cómo se concibe el propio conocimiento matemático. Los términos y
expresiones matemáticas denotan entidades abstractas cuya naturaleza y origen tenemos
que explicitar para poder elaborar una teoría útil y efectiva sobre qué entendemos para
comprender tales objetos….”
Se deben proponer actividades que en forma progresiva origine la comprensión de la media
y las demás medidas de tendencia central, para ello debe centrarse en una representación
semiótica de los objetos abstractos que usamos actualmente para enfrentar la situación en
donde los diferentes símbolos sean los representantes de cada uno de los datos que intervienen en la solución de la situación.
Así, simbólicamente, se expresa la media como = (x1+ x2 +…+ xn) / n
En donde los xi son los valores observados de la variable y n es el número total de datos.
La media presenta las siguientes propiedades, que se deben tener en cuenta al momento
de su interpretación y solución de la situación según el contexto:
a. Es un valor comprendido entre los extremos de la distribución.
b. La suma de las desviaciones de los datos respecto a la media es cero.
c. El valor medio es influenciado por los valores de cada uno de los datos
d. La media no tiene que ser igual a uno de los valores de los datos.
e. El valor obtenido puede ser una fracción. Esta propiedad debe entenderse y comprenderse ya que no tiene sentido según el tipo de variable considerada, ocurre
cuando por ejemplo al realizar un estudio sobre una variable cuantitativa discreta
como el promedio de número de hijos por familia.
f. Hay que tener en cuenta los valores nulos en el cálculo de ella.
62
Desde los conceptos y los procesos
g. La media es un representante de los datos a partir de los que ha sido calculada. Esta
propiedad es interesante en la medida que debe comprenderse el efecto que, sobre las
medidas de posición central tiene un cambio en alguno o todos los datos.
h. Cuando aparecen valores extremos y pocos significativos la media puede no ser representativa.
i. No es posible calcularla si el carácter es cualitativo o cuando existen datos agrupados
con algún intervalo no acotado.
j. La media es el “centro de gravedad” de la distribución y es única para cada distribución.
Actividades de aprestamiento
Actividad 1 Midiendo en tu institución
Trabaja por parejas.
Uno de los compañeros, toma una distancia del patio de descanso con un metro, y la señala como una recta (con tiza), la longitud la anota en un cuaderno, luego el otro compañero
estima la longitud (sin medirla). Se anotan en cada cuaderno las medidas y las diferencias
entre el valor estimado y el valor real de la medida.
Luego se realizan preguntas como las siguientes:
¿Crees que si repites el experimento varias veces, la medida estimada será igualada o muy
aproximada a la real?.
¿Cuántas veces será necesario realizar el experimento?.
Luego cambia con tu compañero, comparan cual de los dos obtiene mejores estimaciones.
Nota: Realiza esta experiencia con segmentos cortos dibujados en el cuaderno.
Actividad 2 Tiro al blanco
Este experimento se consigue en la página 26 del módulo 1 Pensamiento Numérico, la variación consiste en lo siguiente:
4 jugadores.
Lanzar el objeto desde diferentes distancias 1m, 2m y 3m, 4m, 5m y se tiene en cuenta las
veces que cae en el centro.
Cada jugador realiza 6 lanzamientos.
A medida que realiza el juego, se van tomando los datos en un cuaderno de los registros
obtenidos.
De acuerdo con los resultados:
¿Cuál de los dos jugadores es el más acertado en cada una de las distancias?.
¿Cuál es el mejor de todo el grupo?.
¿ Crees que si practicas bastante, tiene mayor probabilidad de acertar en el centro?.
63
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad 3
En una clase de 6º (IEAB14, 2004) algunos estudiantes miden con metro tradicional (metro costurero) otros con metro de construcción y otros con una escuadra, un mismo pedazo de baldosa,
obteniendo los siguientes valores en centímetros: 21.3; 21.2; 21; 21.2; 21.4; 21.5; 21.3.
¿Cuál sería la mejor estimación de la medida del pedazo de baldosa?
Como puede verse, se obtienen diferentes valores debido posiblemente a la imperfección del
instrumento o quizás a la malicia del estudiante al realizar una comparación con alguno de sus
compañeros y simplemente uno midió y los demás dieron datos aproximados. Para solucionar el
problema simplemente basta con sumar los valores y dividir por 6, obteniéndose 21.28 cm.
Lo que se analiza en este sentido es que a partir de un conjunto de medidas conocidas, se
debe obtener una medida que es desconocida en presencia de errores. ¿Cuál es la razón que
nos lleva a concluir que el valor verdadero esté mas cercano a una de las medidas?
Actividad 4
En una urbanización de un barrio, se desea estimar el número promedio de niños por familia. Se divide el número total de niños de la urbanización por 100 que es el número total de
familias) y se obtiene como resultado 1.4
De acuerdo con lo anterior se puede afirmar que:
a. La mitad de las familias de la urbanización tienen 2 niños o menos.
b. En la urbanización hay más familias con 1 hijo que con 2 hijos.
c. El número más común de niños es 2.
d. En la urbanización hay 140 niños
Actividad 5
En el grado 6º (IEAB, 2004) los estudiantes resolvieron la siguiente situación: Juan tiene
$1500, Pedro $ 500, José $300, María $700, Nelly $1800 y Andrés no tiene plata. ¿Cómo repartir el dinero en forma equitativa?
En este ejercicio la mayoría de los estudiantes sumó y dividió por 5. Dieron varios argumentos, uno y el principal era que a Andrés no le correspondía dinero pues no era injusto darle la
plata de los demás. En esta situación se trata de repartir equitativamente (uniformemente)
por lo tanto es buena opción la media aritmética.
Actividad 6
En una bodega tienen 20 tanques con líquido, 12 contienen leche y el resto contienen agua,
la cantidad promedio de cada tanque con leche es 1200 lits y la cantidad promedio de cada
tanque con agua es de 400 lits. ¿Cuál es la cantidad promedio de lits de los 20 tanques?
_____________________________________________________
Institución Educativa Andrés Bello, en la cual laboro.
14
64
Desde los conceptos y los procesos
Este ejercicio es resuelto de la siguiente manera en la mayoría de los casos:
(1200+400)/2 =800 lits.
Nótese que esta situación no puede resolverse por la media simple, sino que se debe ampliar
el concepto al de media ponderada, (1200x12 + 400x8)/20 =880 lits.
Conceptos y procedimientos
Para el siguiente bloque de actividades, es fundamental tener en cuenta el siguiente concepto:
Mediana
Es la medida que, una vez ordenados los valores de la variable en orden creciente y repetidos tantas veces como indica su frecuencia, deja a su izquierda y derecha el mismo número
de observaciones, es decir, deja el 50% a su izquierda y el 50% de las observaciones a su
derecha, se representa por Me.
Este estadístico15, se refiere a todo el conjunto de datos, y no a ninguna de las observaciones
en particular, al respecto, Cobo y Batanero(2000) comentan “… decir que un colectivo tiene
una cierta tendencia o referirse a uno de sus resúmenes estadísticos implica que el colectivo
es una colección de individuos idénticos que varían respecto a la propiedad de interés. La comprensión de dicho estadístico implicará también las de las variabilidad de los datos respecto
a su valor…”, se debe comprender que proporciona información global de la muestra.
Bajo esta perspectiva, se da un tratamiento al concepto de mediana para identificar la forma
en la cual debe calcularse algoritmicamente, requiere primero de su comprensión debido a las
dos formas de calcularla, ya que no siempre está en la posición central, puede no coincidir con
alguna de las observaciones, así, para su cálculo debe tenerse en cuenta cuando el número
de observaciones es par y cuando impar y el tipo de datos. Una característica importante es
que la mediana es invariante si se disminuye una observación inferior a ella o si se aumenta
una superior, además este estadístico no contempla todos los valores de los datos.
• GESTIÓN DE LA SITUACIÓN
Existe de pronto un poco de confusión del estudiante al tratar de ubicar la mediana en el
centro de los datos sin tener en cuenta que debe ordenarse para ubicar el punto medio de
la distribución, por lo que de alguna manera interioriza el concepto, pero no lo comprende
debido a que olvidan a qué secuencia numérica se refiere dicho valor.
Actividad 7
Considerando el número de hijos de un grupo de familias, se han obtenido los siguientes
valores: 2, 0, 2, 4, 4 , 6, 6, 4, 6, 7, 4, 4, 7, 4, 2, 0, 4, 6, 7, 7
¿Cual estadístico convendría aplicar: la media o la mediana, como justificaría la escogencia?
_____________________________________________________
Hablamos de estadístico para referirnos a muestras y parámetros para poblaciones.
15
65
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad 8
En la siguiente serie numérica, 2, 2.5, 3, 3.25, 4, 5, 6.5, 7.5, 50. ¿Cual estadístico es más
representativo?
Actividad 9
Un vendedor ambulante de confites, de lunes a sábado, vende las siguientes cantidades
en unidades:
a. 110, 120, 130, 120, 130, 130
b. 110, 120, 128, 140, 130, 100
c. 80, 72, 96, 70, 70, 100
¿Cuál es el estadístico más representativo en caso de promediar las ventas?.
Si los confites los vende a 2 por $ 100, ¿cuál seria el promedio de las ventas?.
En este caso ¿la media sería mejor representante que el promedio?
Ahora veremos cómo calcular la mediana, ya que como se dijo depende del tipo de datos,
de la forma de presentación y del número de datos que interviene.
2.1.2.1. Datos no tabulados
Esta forma de cálculo se tuvo en cuenta en la solución de las situaciones anteriores, dependiendo si el número de datos es par o impar, para el caso de impares, la observación obtenida
ocupa el centro, teniendo presente que se han ordenado creciente o decrecientemente.
En el caso que el número de valores es par, la mediana corresponde a la media aritmética
de los valores que se ubican en el centro, es en este caso donde este estadístico no coincide
con ninguno de los valores, a menos que los valores centrales sean iguales.
2.1.2.2. Datos tabulados
Veremos ahora lo que sucede si los valores se encuentran en una tabla de frecuencias, en
tal caso es útil hallar las frecuencias acumuladas, esto nos permite realizar un diagrama de
frecuencias absolutas acumuladas, siendo n/2 la ordenada correspondiente a la mediana y
con n como el número de datos. Aquí se presentan algunos inconvenientes debido al tipo
de variable si es continua o discreta. Si se trabaja con las frecuencias relativas acumuladas,
en la representación gráfica la ordenada correspondiente a ½ es el valor correspondiente
a la mediana.
Ejemplo:
En un sondeo de opinión sobre como está planteando el seleccionador de Brasil los partidos
de fútbol de preparación para el próximo mundial, se obtuvo los siguientes datos:
66
Desde los conceptos y los procesos
Opinión
fi
hi
%
Fi
Hi
1.Totalmente de
acuerdo
20
0,392
39,2%
20
39,2%
2.De acuerdo
10
0,196
19,61%
30
58,82%
3.Indiferente
8
0,157
15,69%
38
74,51%
4.En desacuerdo
6
0,118
11,76%
44
86,27%
5.Totalmente en
desacuerdo
7
0,137
13,73%
51
100,00%
Total
51
1,000
100,0%
Veamos las gráficas acumuladas tanto para frecuencias, como para porcentajes:
Fig 1 (Frecuencias acumuladas)
Fig 2 (Porcentajes)
La modalidad que corresponde al 50% indica que el 50% o más de la población están de
acuerdo con el seleccionador.
Observe que en este caso ningún valor xi corresponde en la fig1 a una frecuencia relativa
acumulada donde F(x)=n /2, para este caso 26, igual ocurre en el análisis del porcentaje
acumulado en la fig2. Por lo tanto se analiza que el valor de la mediana es tal que:
F(xi-0) < ½ < F(xi+0), es decir, tal que n1+ n2+…ni-1< n/2 < n1+ n2+…+ni
Observe que el valor ½ corresponde al salto que tiene la gráfica en la distribución para uno
de los valores de la variable, ello se debe a que todos los valores comprendidos entre ni-1 y
ni son iguales a xi, y uno de ellos ocupa exactamente la posición n/2.
Ahora variemos el problema y demos la situación en la cual el número de datos es par:F(x) = n/2,
la mediana está indeterminada entre los valores xi y xi+1, ya que cualesquiera de los valores
de x incluidos en el intervalo (xi,xi+1) cumple la definición de mediana.
67
Módulo
5
Pensamiento aleatorio y sistemas de datos
2.1.2.3. Cálculo para datos agrupados
Se tiene en cuenta la aplicación del modelo:
Xmed = Li +
Li, es el límite inferior que contiene a los datos de frecuencias acumuladas.
Fmed-1 es la frecuencia acumulada anterior en donde está la mediana.
A es la amplitud de cada intervalo.
Fme es la frecuencia en donde se ubica el Li.
En el trabajo con datos agrupados (trabajo por intervalos), prácticamente se debe tomar los
modelos (llamados fórmulas) funcionales y tener algunas propiedades en cuenta respecto de
cada medida de tendencia central, por ejemplo, la mediana es la única medida central que hace
mínima la suma de todas las desviaciones absolutas, siendo además en la representación gráfica
el valor que divide la vertical del histograma en dos partes de áreas de igual medida. Para la
moda se debe tener en cuenta su utilización se realiza tanto como para variables cualitativas
y cuantitativas. Cuando se calculan estas dos medidas, no influyen los valores extremos, como
si ocurre con la media, por lo cual es poca representativa en estos casos, otra propiedad es que
no usan toda la información posible y además, sus cálculos son sólo aproximaciones.
La moda
Si se tiene en análisis una variable cualitativa, la media no se puede calcular, por lo tanto
es de vital importancia en la descripción del grupo de datos el uso de la moda, el cual es
el valor de la variable que tiene mayor frecuencia. Además, ésta no es única siempre, cada
moda corresponde a un máximo local de la distribución de frecuencias, se enfatiza que en la
moda lo importante son las frecuencias y no el valor de la variable. Se representa por Mo.
Algunas distribuciones presentan dos valores para la moda, esto es poco común en el trabajo experimental, en otras ocasiones, si se presenta significa que los datos provienen de
dos distribuciones diferentes. Por ejemplo, si dos máquinas que producen un mismo artículo
trabajan promedios diferentes bastante alejados entre sí y se desea reunir la producción
total, la distribución de frecuencias resultante serça de tipo binomial.
2.1.3.1. Cálculo para datos sin agrupar
El único estadístico que se puede utilizar en presencia de variables nominales es la moda,
que como su nombre indica, es el valor-categoría que más se presenta. La moda es el valor
que corresponde al máximo del diagrama diferencial (diagrama de barras o histograma).
En la siguiente figura (Fig3), correspondiente al ejemplo del seleccionador del equipo brasileño, se muestra la moda, indicando estar totalmente de acuerdo con él.
68
Desde los conceptos y los procesos
Fig3
2.1.3.1. Cálculo para datos agrupados
Xmo = Li +
donde Li es el límite inferior que contiene la mayor frecuencia
absoluta, d1 es la diferencia entre la máxima frecuencia y la anterior; d2 es la diferencia entre
la máxima frecuencia y la siguiente.
2.2. Relación entre Media, Mediana y Moda
La moda es la abscisa correspondiente al punto máximo de la curva. La mediana, por su parte es
la abscisa del eje que divide la curva en dos partes de igual área. La media es la abscisa correspondiente al centro de gravedad de la curva debajo de la cual se asume una masa uniforme.
2.3. Medidas de posición (orden):
Indican la posición relativa que ocupa una observación en una distribución de frecuencias.
Son también llamados cuantiles, y son valores o estadísticos de orden que dividen a la
distribución en partes iguales, es decir, en intervalos que comprenden el mismo número
de observaciones. Al ordenar los datos, se llama cuantil de orden q en el cual 0 < q < 1, y
se representa por xq, al valor de la variable que está por debajo de él (la proporción r de
los valores observados). Por ejemplo la mediana, es el cuantil 0.5, puesto que la mitad del
conjunto de datos es menor que o igual a este valor. La razón anterior permite comparar los
cuantiles con los porcentajes, así, podemos decir que en una distribución cualquiera, 50%
de los datos están en el cuantil 0.5 o por debajo de él.
Dentro de estos estadísticos tenemos:
2.3.1. Cuartiles
Son tres valores de la variable, que dividen al conjunto de observaciones en cuatro grupos
iguales, en donde en cada grupo se halla el 25% de la población. Este concepto favorece en
69
Módulo
5
Pensamiento aleatorio y sistemas de datos
gran medida la comprensión y significado del diagrama de cajas. Los Cuartiles se representan
por: Q1, Q2 y Q3 que representan el primer, segundo y tercer cuartil respectivamente.
2.3.1.1. Primer cuartil (Q1)
Considera el 25% de la información a su izquierda y el 75% a la derecha, es decir, es el valor de la
variable que supera al 25% de las observaciones y a la vez, es superado por el restante 75%.
2.3.1.2 Segundo cuartil (Q2)
Considera el 50% de la información tanto a la derecha como a la izquierda, este coincide
con la mediana, este valor de la variable supera al 50% de las observaciones y a la vez, es
superado por el otro 50%.
2.3.1.3. Tercer cuartil (Q3)
Considera el 75% de la información a la izquierda y el 75% a la derecha, es el valor de la variable que supera al 75% de las observaciones, pero es superado por el 25% restante de las
observaciones.
Ejemplo:
Puede resultar de interés conocer qué porcentaje de automóviles sobrepasa el estándar de
emisiones de gases que es aceptable según la legislación vigente. Ya no se trata en este
ejemplo de describir el centro de un conjunto de datos, se hace necesario ser más específico.
Es probable que la emisión de gases promedio de un conjunto de automóviles esté dentro
de la norma. Pero, ¿es aceptable que el 25% de ellos no la cumpla?
Otro ejemplo
Se podría dividir el grupo de estudiantes en cuatro categorías: A, B, C y D. Pues supongamos
se asignan tres tipos de becas a los estudiantes, de la siguiente forma. Al 25% que obtenga
mejores notas (categoría A para más excelentes) se le da una beca por 5 años. Al 25% que
le sigue en calificaciones (categoría B más sobresalientes) se le otorga una beca por 3 años.
Al 25% siguiente (categoría C entre sobresalientes y aceptables) una beca por 1 año y al 25%
restante (categoría D) no se le otorga ninguna beca.
Esto indica por ejemplo, que en una clase de 20 estudiantes que estén ordenados por calificaciones en forma “descendente” (si las aceptamos cualitativamente) de: Excelente a
Deficiente se becan por 5 años, del 6 al 10 se becan por 3 años, del 11 al 15 se becan por 1
año, y del 16 al 20 no reciben beca.
Además, si deseáramos conocer que oportunidad tenemos de obtener una beca. Podríamos
tomar un grupo de notas o datos, de forma aleatoria entre todas las notas de la institución,
esto representaría una muestra. Luego se determina cuales son las calificaciones que establecen a qué categoría pertenece el estudiante. Esto es equivalente a calcular cada uno
de los cuartiles (primer, segundo y tercer cuartil), que no es otra forma, que los valores
correspondientes a la escala de calificaciones, en las cuales se producen los cambios para
70
Desde los conceptos y los procesos
cada categoría. Es decir, el tercer cuartil representa la calificación a partir de la cuál están
ubicados el 25% de los estudiantes de categoría A, el segundo cuartil (la mediana) es igual
a la calificación en la cual hay 50 % de los estudiantes por encima y 50% por debajo, los que
están entre el segundo y el tercer cuartil son el 25% de estudiantes categoría B. Y el primer
cuartil representa la calificación por debajo de la cual hay 25% de estudiantes categoría D,
además los que están entre el primer cuartil y el segundo son el 25% categoría C.
Esto puede de una forma más sencilla permitirle también tener una buena idea de que oportunidad tiene de obtener una determinada beca dentro de este curso.
2.3.2. Desviación Intercuartil:
Esta medida de dispersión se construye basándose en la diferencia entre el tercer y primer
cuartil. En realidad es la mitad de esa diferencia.
Desv. Inter. = Q3 – Q1
Este estadístico cumple una función similar a la desviación estándar, pero es mucho más
resistente al efecto de valores extremos en los datos. De hecho, los cuartiles primero y tercero
dejan entre sí la mitad de la muestra, La otra mitad se encuentra fuera y por lo tanto la presencia de un bajo número de datos extremos no cambia el valor de la desviación intercuartil.
2.3.3. Deciles
Son 9 valores que dividen a la distribución en 10 partes iguales, cada una de las cuales contiene
el 10% de las distribuciones. Se representan por D1, D2,…D9. Si N es el tamaño de la población,
el decil k-èsimo deja a su izquierda (k.N)/10 observaciones y a su derecha (10-k).N/10.
2.3.4. Percentiles
Son 99 valores de la variable que dividen a los datos en 100 partes iguales. Se representan
por Pk, donde k indica el porcentaje de datos que quedan a su izquierda, es decir, Pk = Xi
indica la puntuación porcentual acumulada k.
2.3.5. Cálculos para datos sin agrupar
El cálculo de las medidas de posicón, debe realizarse mediante el uso de los gráficos de
cajón, o en su defecto utilizando los modelos o funciones expuestas a continuación:
2.3.5.1. Cuartiles
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza:
El primer cuartil:
Cuando n es par:
71
Módulo
5
Pensamiento aleatorio y sistemas de datos
Cuando n es impar:
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:
2.3.5.2. Deciles
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
funciones:
Cuando n es par:
Cuando n es impar:
Siendo k, el número del decil.
2.3.5.3. Percentiles
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
funciones:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo k, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75.
72
Desde los conceptos y los procesos
2.3.6. Cálculos para datos agrupados
2.3.6.1. Cuartiles
Calculamos Q1 para datos agrupados mediante el uso del siguiente modelo:
Q1= Li +
; en donde, Fa es la frecuencia acumulada anterior a la que
contiene a Q1 ; fQ1 es la frecuencia en el intervalo que contiene a Q1
La interpretación es similar a la anterior
2.3.6.2. Deciles
D3 = Li +
La interpretación se realiza similar a los cuartiles
D7 = Li +
2.3.6.3. Percentiles
De forma similar que en los anteriores estadísticos, se realiza la interpretación.
P70 =Li +
P30 =Li +
Nota: Se aconseja utilizar estos estadísticos para variables continuas, cuando la distribución
contiene un número grande de intervalos y se requiere examinar una parte de la distribución
que presenta una característica espacial a ser estudiada.
73
Módulo
5
Pensamiento aleatorio y sistemas de datos
2.4. Medidas de dispersión (variabilidad)
Se refieren a la extensión de los datos en una distribución, es decir, el grado en que las
observaciones se distribuyen. Ella nos proporciona información adicional para juzgar la
confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posición central es la menos recomendable o representativa, como un todo, que
cuando éstos se agrupan más estrechamente alrededor de la media. Si la dispersión es cero,
indica ausencia de dispersión.
Veamos mediante un ejemplo lo expuesto anteriormente, comparando dos muestras hipotéticas: 20, 40, 120 con 56, 58, 66
Si calculamos la media de ambas muestras obtenemos:
= ( 20+ 40+ 120)/3 =60
1
= (56 + 58+66)/3 =60
2
Observe que ambas muestras tienen el mismo tamaño 3 e igual promedio 60, pero existe
una diferencia fundamental entre ellas, porque los valores de la primera se encuentran mas
separados unos de otros (y, por lo tanto, también del valor medio) que los valores de la segunda muestra, por lo anterior se hace necesario el estudio de medidas de variabilidad que
permitan diferenciar muestras como las anteriores.
Fig 4
Fig 5
En los gráficos, se ve claramente que en la Fig5 los datos están mas cerca de 60 (el promedio)
que en la Fig4, lo cual indica que hay mayor dispersión con respecto a la media en la Fig4.
En Economía, por ejemplo, ganancias ampliamente dispersas son indicio de un mayor riesgo
para los accionistas (debido a los niveles extremos, tanto positivos como negativos), que en
el caso en que los niveles de dispersión de las ganancias permanecen relativamente esta-
74
Desde los conceptos y los procesos
bles. En medicina es preocupante una droga cuya pureza promedio es buena, pero que oscila
desde muy pura hasta altamente impura, ya que es riesgosa para la vida humana.
2.4.1. El rango o recorrido
Una manera de medir la variación en un conjunto de valores es calculando el recorrido. El recorrido es la más sencilla y directa de las medidas de dispersión, y a la vez la menos confiable
de las medidas de variación. Se trata simplemente de la distancia entre el valor menor y el
valor mayor en un conjunto de observaciones. El hecho de que sólo tome en consideración
dos valores, hace que la medida sea muy pobre. Nótese que si hay un valor extremo en la
distribución, se tendrá la impresión de que la dispersión es grande cuando, en realidad, si
hiciéramos caso omiso de esa calificación, podríamos encontrar que dicha distribución es,
por el contrario, una distribución “compacta”. El recorrido refleja únicamente las dos calificaciones extremas de la distribución, es decir, solamente dos puntuaciones exactas de un
grupo son las que lo determinan, ignorando todas las demás puntuaciones. El recorrido no
puede darnos una idea precisa con respecto a la dispersión y, en el mejor de los casos, debe
considerarse sólo como un índice preliminar o muy aproximado.
2.4.2. Varianza
Dado un conjunto de datos, una forma de medir su variabilidad consiste en calcular las diferencias de cada dato respecto del centro de los datos representado por su promedio. Como
las diferencias tienen signos negativos o positivos, según el dato sea menor o mayor que
el promedio, la simple suma de las diferencias no sirve por los valores que se compensan.
Tanto es así, que la suma de estas diferencias es siempre cero. Al usar la varianza muestral,
debe notarse que los resultados obtenidos no están en la misma unidad de medida que los
datos originales:
σ2 =
Aquí N representa el tamaño de la población, fi la frecuencia
de cada una de las clases.
la media; xi el punto medio de la clase.
Nota: La anterior simbolización (fórmula matemática) se usa para poblaciones, en caso de
tener muestras, se divide por (n-1) y se representa por S2, siendo n el número de observaciones de la muestra.
Si los datos son sin agrupar se toman las siguientes modelaciones:
σ2 =
_
con µ como media ; N tamaño de la población, x la observación
o elemento observado.
75
Módulo
5
Pensamiento aleatorio y sistemas de datos
2.4.3. La desviación estándar (S o σ)
Dependiendo si es para una muestra o para una población es la medida de dispersión más
adecuada para la estadística descriptiva. Tanto en la escalas de intervalo como en las de
razones, la varianza y la desviación estándar son las mejores medidas de dispersión. Toman
en consideración todos los puntajes y controlan por el efecto de valores extremos. La desviación permite una interpretación precisa de las calificaciones dentro de una distribución.
Si todos los sujetos son iguales en una característica (por ejemplo, rendimiento académico),
entonces el resultado será igual a cero. Por el contrario, si aumentan las diferencias, aumentará el rendimiento (índice), alejándose más y más del punto cero.
Se define matemáticamente como: la raíz cuadrada positiva de la varianza.
Lo anterior se simboliza:
σ =
(Para población y con datos agrupados)
La desviación será pues σ =
Levin et. al. (1996. Pág.119) dicen respecto a la desviación estándar
“nos permite determinar, con un buen grado de precisión, dónde están localizados los valores de una distribución con relación a la media. Podemos hacer esto
de acuerdo con un teorema establecido por el matemático ruso P.L. Chebyshev
(1821-18949). El teorema de Chebyshev dice que no importa qué forma tenga la
distribución, al menos 75% de los valores caen dentro de ± 2 desviaciones estándar a partir de la media de la distribución, y al menos 89% de los valores caen ± 3
desviaciones estándar a partir de la media”
La cita anterior permite medir con más precisión el porcentaje de observaciones que caen
dentro de un alcance específico de las curvas simétricas con una forma de campana (distribución normal).
Figura 6
76
Desde los conceptos y los procesos
Observe que el 68% de los datos caen dentro de ± 1 desviación a partir de la media µ
El 95% de los valores está dentro de ± 2 desviaciones a partir de la media.
Aproximadamente el 99% estará en el intervalo que va desde 3 desviaciones por debajo de
la media hasta 3 desviaciones por encima de la media.
Lo anterior nos permite utilizar un modelo para ver estos resultados, que se calculan así:
Resultado estándar de la población =
Resultado estándar de la muestra =
Consideremos la interpretación en pruebas saber para obtener una mejor idea de lo anteriormente expuesto:
Análisis por puntaje promedio y desviación estándar16
El puntaje promedio indica el comportamiento global de los estudiantes a nivel individual, institucional, municipal, departamental o nacional. Este puntaje da cuenta del desempeño general
en relación con los diferentes niveles de dificultad que existen en la prueba. En cada una de las
pruebas, y por cada grado (5º y 9º), el puntaje fluctúa entre 0 y 100 puntos aproximadamente.
Por su parte, la medida de la dispersión o desviación estándar refleja qué tan homogéneos
o heterogéneos son los resultados, es decir, informa si los puntajes individuales obtenidos
por las y los estudiantes son similares entre sí o, por el contrario, hay algunos estudiantes
con puntajes muy altos y otros con puntajes muy bajos.
Se espera entonces que el promedio sea alto, es decir, que tienda a 100 y que la desviación
estándar sea baja, es decir, tienda a 0.
En este tipo de resultados podemos obtener cuatro posibilidades de análisis de acuerdo con
la relación entre puntaje promedio y desviación estándar:
1. Cuando el puntaje promedio de la institución es mayor o superior al del grupo de
referencia (municipio, departamento o país), pero su desviación estándar es menor
o inferior a la de dichos grupos de referencia. Ello significa que el puntaje promedio
obtenido por la institución superó al de dicho grupo de referencia, y que el desempeño de los estudiantes en las pruebas fue homogéneo. Es decir, la mayoría de los
estudiantes tuvieron mejores desempeños que los del grupo de referencia: Este es
un resultado deseable en términos de calidad, al que toda institución debe aspirar
mediante la realización de planes de mejoramiento.
_____________________________________________________
http//www.colombiaaprende.edu.co .Tomado del MEN. Análisis de Pruebas saber.
16
77
Módulo
5
Pensamiento aleatorio y sistemas de datos
Fig7 Puntaje promedio superior y desviación estándar inferior
2. Cuando el puntaje promedio y su desviación estándar son mayores o superiores a los
del grupo de referencia (municipio, departamento o país). Ello significa que algunos
de sus estudiantes obtuvieron puntaje promedio muy alto, pero hay otros estudiantes
de la misma institución que obtuvieron resultados muy bajos.
Fig8 Puntaje promedio y desviación estándar superiores
3. Cuando el puntaje promedio y su desviación estándar son menores o inferiores (lo
contrario del caso anterior) a los del grupo de referencia (municipio, departamento o
país). Ello significa que los estudiantes de la institución en su mayoría tiene niveles
en el desarrollo de competencias inferiores a los del grupo de referencia.
78
Desde los conceptos y los procesos
Fig9 Puntaje promedio y desviación estándar inferiores
4. Cuando el puntaje promedio es menor o inferior al del grupo de referencia (municipio,
departamento o país), pero la desviación estándar es superior a la de dicho grupo de
referencia. Ello significa que la media de la institución estuvo por debajo de la media
de dicho grupo de referencia y que los resultados presentan alta dispersión; en otras
palabras, en la institución la mayoría de los estudiantes presentan desempeños bajos,
pero dentro de ellos hay quienes presentan desempeños supremamente bajos.
Fig10 Puntaje promedio inferior y desviación estándar superior
2.4.4. Coeficiente de variación
La desviación estándar S o σ es útil como medida de la variación dentro de un conjunto de
datos. Más aún, si las medias son iguales se pueden comparar directamente las dos S. Sin
79
Módulo
5
Pensamiento aleatorio y sistemas de datos
embargo, cuando se desea comparar la dispersión en dos conjuntos de datos, comparar las S
puede conducir a resultados sin sentido, si las medias difieren o si las unidades de medición
son diferentes. Esto es así, puesto que cada S se obtiene a partir de la media particular que
corresponde a cada conjunto.
Lo que se necesita en situaciones como ésta es una medida de variación relativa, en lugar
de una variación absoluta. La medida que nos puede resolver este problema es el coeficiente
de variación (C.V.), llamado de Pearson, que es la relación entre la S y la media aritmética.
Se multiplica además por 100, para considerar el resultado en forma de porcentaje. A mayor
porcentaje, mayor es la variación y viceversa.
CV =
para la población
CV =
para la muestra
Para realizar un buen análisis, de éstas medidas, antes veamos un concepto importante que tiene
que ver con la forma en que se dispersan los datos, lo cual nos conllevará a realizar análisis en
la forma correcta donde se debe tomar una medida de posición acorde al contexto de trabajo.
2.5. Medidas de asimetría
2.5.1. Comprensión del concepto básico de simetría
En el análisis de datos se aplica a las distribuciones que cumplen con la siguiente característica: definido un centro (media, mediana u otra) las dos mitades resultantes se corresponden la una con la otra.
La importancia radica en que si una distribución es totalmente simétrica, posee ciertas características peculiares, como la coincidencia de las medidas de tendencia central o como
requerir menos funciones muestrales para el análisis de la distribución, al respecto Vicente
Manzano y Ana Duran (2001. vol17) comentan:”cualesquiera dos valores equidistantes al
centro cuentan también con la misma frecuencia (y, por lo tanto, con la misma frecuencia
acumulada con respecto al mismo centro)”
Así, debe tenerse en cuenta que la simetría es una dispersión, en la cual si es equitativa con
respecto a un centro, la distribución es simétrica, si es diferente a un lado, la distribución
es asimétrica. Se tiene diferentes tipo de medida de simetría, lo cual al operara sobre las
diferencias de los datos respecto a la media, se tienen los llamados momentos así: El primer
momento se anula, el segundo corresponde a la varianza y no distingue el sentido de la dis-
80
Desde los conceptos y los procesos
persión, el tercer momento señala la importancia de la dispersión ya que indica el sentido y
además, por ser una tercera potencia conserva invariantes los signos originales, con lo que
es sensible al sentido de la dispersión.
Mientras mas dispersos están los datos, mas se incrementa el valor del tercer momento, sin
querer indicar que es una causa para una mayor simetría.
Las siguientes gráficas nos dan idea de la asimetría:
Fig 11 Distribución Simétrica
2.5.2. Distribución simétrica: existe la misma concentración de valores a la derecha y a la
izquierda de la media)
Fig 12 Distribución de Asimetría a derecha
2.5.3. Distribución asimétrica positiva: existe mayor concentración de valores a la derecha
de la media que a su izquierda
81
Módulo
5
Pensamiento aleatorio y sistemas de datos
Fig 13 Distribución de Asimetría a izquierda
2.5.4. Distribución asimétrica negativa: existe mayor concentración de valores a la izquierda
de la media que a su derecha
2.5.5. Coeficiente de Asimetría de Fisher
Sirve medir el nivel de asimetría, que viene dado por
Para el análisis se tiene en cuenta que xm es la media, ni es la frecuencia, n el número de
observaciones.
Los resultados pueden ser los siguientes:
g 1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha
de la media que a su izquierda)
g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda
de la media que a su derecha)
2.6. Medidadas de Curtosis
La curtosis es una medida relacionada con la forma de la curva de frecuencias.
2.6.1. Distribución mesocúrtica: presenta un grado de concentración medio alrededor de
los valores centrales de la variable (el mismo que presenta una distribución normal).
2.6.2. Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de
los valores centrales de la variable.
82
Desde los conceptos y los procesos
2.6.3. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de
los valores centrales de la variable.
Fig14
Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
El Coeficiente de Curtosis viene definido por el siguiente modelo (fórmula algebraica):
Los resultados pueden ser los siguientes:
g 2 = 0 (distribución mesocúrtica) .
g2 > 0(distribución leptocúrtica ).
g2 < 0 (distribución platicúrtica) .
• GESTIÓN DE LA SITUACIÓN
Las actividades propuestas, deben realizarse en parejas para discutir algunos conceptos
importantes y sobre todo los que estén relacionados con los cuantiles debido a que al utilizar
las formas funcionales se pueden presentar algunas incoherencias respecto a las interpretaciones, caso tal en que el educador debe intervenir y aclarar cada aspecto.
Actividad 10
Tomemos un dado y lo lanzamos 30 veces, anotamos las frecuencias en la siguiente tabla y
la completamos:
83
Módulo
5
Pensamiento aleatorio y sistemas de datos
xi
ni
Ni
hi
Hi
1
2
3
4
5
6
total
Situaciones para reflexionar:
¿El punto 3 a qué percentil equivale?
¿Qué nos indica lo anterior?
¿La mediana en qué puntuación estará?
¿Qué decil corresponde al puntaje 4?
¿Cuántos superan la puntuación 4?
¿Qué puntuación es superada por el 25%?
¿A qué porcentaje corresponde la moda?
¿Cual será la medida de posición más representativa para esta situación y cómo la analizas?
Actividad 11: pesando papitas
Material:
Una balanza muy buena (gramera) sensible.
En el grupo cada estudiante trae un paquete de papitas de la misma marca y del mismo
sabor.
Marcadores
Cinta de enmascarar
Instrucciones
Los paquetes se marcan con un número en forma ascendente con la cinta de enmascarar.
Se anota el peso neto de cada paquete de papita.
En la balanza se pesa el paquete y se anota en el cuaderno, esto lo realiza cada uno de los
estudiantes.
Luego se destapan las papas y se pesan sin el papel.
Los estudiantes intercambian los datos.
Se realizan dos tablas, una con el peso de las papas con papel, la otra sin el papel.
Para cada tabla halle: promedio. Compare cada uno de los resultados con el valor neto. Que
le dice esta diferencia?
84
Desde los conceptos y los procesos
Ahora realice un gráfico de frecuencias acumuladas por cada tabla y realice una comparación
y analice cual presenta mayor dispersión respecto al promedio.
Que le recomiendas a los productores de las papitas?
NOTA: si el grupo es demasiado grande, se le recomienda colocar 8 u 10 valores únicamente
y así trabajar cada tabla. (Esto no es agrupar en intervalos).
Actividad resuelta (Análisis)
Prueba de Aptitud Académica.
En la tabla siguiente se tiene los puntajes obtenidos en la Prueba de Aptitud Académica por
30 jóvenes, provenientes de un mismo establecimiento educacional:
En esta actividad, se quiere calcular (aunque no es nuestro objetivo en el módulo) a partir
de la modelación (utilizar fórmulas) las diferentes medidas de posición y las de variación,
para realizar análisis, que debe tenerse en cuenta en las investigaciones que realizan los
estudiantes en las otras asignaturas, se recalca el hecho que es de formación mecánica
antes que de formulación como situación problèmica. Sin embargo el siguiente estándar,
nos permite estar dentro del pensamiento aleatorio y sistemas de dato:
“Resolver y formular problemas seleccionando información relevante en conjuntos de
datos provenientes de fuentes diversas (prensa, revistas, televisión, experimentos, consultas, entrevistas)”.
Aptitud Verbal
Aptitud
Matemática
Aptitud Verbal
Aptitud
Matemática
1
685
664
2
490
548
16
730
642
17
618
533
3
580
567
18
690
654
4
705
665
19
680
542
5
470
452
20
690
678
6
620
506
21
710
732
7
650
618
22
742
749
8
702
718
23
685
570
9
643
621
24
595
574
10
540
555
25
674
657
11
575
502
26
722
747
12
600
531
27
585
620
13
500
478
28
505
482
14
680
558
29
600
643
15
587
600
30
543
500
85
Módulo
5
Pensamiento aleatorio y sistemas de datos
Para tabulación del problema, se realizaron los cálculos con el programa Excel.
Datos de aptitud verbal.
Intervalo
fi
Xi
hi
Fi
Hi
Xi*fi
Xi -
470
1
489,5
0,033
1
0,033
489,5
-171,6
29446,56
509
3
528,5
0,100
4
0,133
1585,5
-132,6
52748,28
548
2
567,5
0,067
6
0,200
1135
-93,6
17521,92
587
4
606,5
0,133
10
0,333
2426
-54,6
11924,64
626
5
645,5
0,167
15
0,500
3227,5
-15,6
1216,8
665
2
684,5
0,067
17
0,567
1369
23,4
1095,12
704
8
723,5
0,267
25
0,833
5788
62,4
31150,08
743
5
762,5
0,167
30
1,000
3812,5
101,4
Total
30
1
19833
(Xi -
)2*fi
51409,8
196513,2
Ahora hallemos el promedio
=
= 661.1
Lo anterior indica que en promedio la aptitud verbal de los estudiantes es de 661.1 puntos.
Fig15
Mediana (Xmed).
Hallamos primero a n/2 así: 30/2=15. El siguiente modelo nos permite hallar la mediana
para datos agrupados.
86
Desde los conceptos y los procesos
Xmed = Li +
Ahora se ubica el Li , que es el límite inferior que contiene a 15 dentro de los datos de frecuencias acumuladas, para nuestro caso es 587
Fmed-1 es la frecuencia acumulada anterior en donde está la mediana, en nuestro caso es
10, la A es la amplitud de cada intervalo aquí es 509 – 470 = 39 y fmed es la frecuencia en
donde se ubica el Li en este ejemplo es 5.
Xmed= 587 +(15 – 10)*39/5 = 626.
Lo cual indica que el 50% de los estudiantes poseen una aptitud verbal de 626 puntos o más.
Moda (Xmo).
Mediante el siguiente modelo se halla la moda para datos agrupados:
Xmo = Li +
La máxima frecuencia se encuentra en fi = 8, luego Li = 665
d1 = 8-2 = 6; d2 = 8 - 5 = 3
Xmo = 665 +
= 691
Esto nos indica que el puntaje más frecuente en aptitud verbal es de 6914 puntos, lo cual
indica que no es una medida representativa para este ejemplo.
Al comparar la mediana con el promedio, nos damos cuenta que existe una diferencia, así,
661.1 – 626 = 35.1, cual indica la existencia de un sesgo en los datos, lo cual se aprecia en
la asimetría de la Fig15.
Cuartiles
Calculamos Q1 para datos agrupados mediante el uso del siguiente modelo:
Q1= Li +
Veamos: hallemos n/4; 30/4= 7,5 que se ubica en Fi = 10, así Li = 548, Fa = 6, fQ1=4
87
Módulo
5
Pensamiento aleatorio y sistemas de datos
Q1 = 548 +
= 562,62
Indica que el 25% de los estudiantes obtuvo un puntaje en aptitud verbal de menos de 562,62
puntos, o también puede interpretarse como el 75% de los estudiantes obtuvo un puntaje en
aptitud verbal superior a 562,62 puntos.
Es de vital importancia hacer la acotación para los Cuartiles de la siguiente manera: si se
desea hallar el cuartil 3, el modelo cambia a 3n/4, si se desea hallar el cuartil dos el modelo
se cambia por 2n/4, lo que indica obtener el 50% o media de las observaciones.
También si los datos no están agrupados, el modelo cambia así:
Q1 =
2n/4 etc.
a medida que se va hallando un cuartil distinto, se cambia en el modelo
Deciles
D3 = Li +
Hallemos 3n/10 = 90/10=9; esta frecuencia se encuentra en Li = 548, Fa = 6; fD3=4
D3 = 548 +
= 577,25
Nos indica que el 30% de los estudiantes obtuvo un puntaje de 577,25 o menos en aptitud
verbal.
De acuerdo al decil que se va a hallar, se cambia en el modelo, por ejemplo si se va a hallar
el decil 7, se coloca 7n/10 y así sucesivamente.
Percentiles
P70 =Li +
, se trabaja de forma similar a las anteriores
Hallemos 70n/100 = 2100/100= 21, lo que indica que Li =665, Fa =17, fp70=8
P70 =665+
88
= 684,5
Desde los conceptos y los procesos
Lo que indica que el 70% de los estudiantes obtuvieron un puntaje en aptitud verbal de 684.5
o menos.
Para datos sin agrupar, se tiene en cuenta el siguiente modelo:
P60 =
, se tienen en cuenta las variaciones de las que se ha venido hablando,
para P85 se cambia 85n/100.
Veamos las medidas de dispersión
Para la desviación típica
S =
S =
= 26,032
Esto indica que la desviación con respecto a la media es de 26.032 puntos.
Es en esta parte se utiliza el teorema de Chebyshev para analizar su importancia, como sabemos que el promedio de puntaje en aptitud verbal de los estudiantes es de 661.1 se tiene:
661.1-2(26.032) = 608.46
661.1+2(26.032) = 713,16
Esto significa que el 75% de los datos es decir 30*0.75 = 22.5 de los datos se encuentran
entre 608.46 y 713.16 puntos.
Hallemos ahora el coeficiente de variación, éste permite comparar varios conjuntos de datos
expresados en diferentes unidades, o en las mismas unidades pero con distinto orden de
magnitud. Se expresa en porcentaje.
CV =
= 0.0393 = 3.93% de variación absoluta con respecto a la media.
El dato anterior permite realizar una comparación con los estudiantes para la aptitud matemática, indicando donde se obtiene un mejor rendimiento. Entre mas cerca esté a cero el CV
indica que la muestra es muy homogénea y por supuesto se tiene una muestra confiable.
89
Módulo
5
Pensamiento aleatorio y sistemas de datos
A continuación se hace un análisis para la gráfica de cajón, para ello, usamos los estadísticos:
Máx. =749
Mín. = 452
Xme = 626
Q1 = 562,6
Q3 = 691.8 (compruébelo)
Ahora se traza una línea horizontal de longitud proporcional al recorrido de la variable, en
ella se colocan los extremos Mín. y Máx.
Paralelo al eje, se construye una caja rectangular con altura arbitraria y cuya base va desde
el primer cuartil al tercero, o sea desde 562,6 hasta 691,8, veamos.
La caja se divide en dos partes, trazando una línea a la altura de la mediana; Xme = 626:
Cada parte indica el intervalo de variabilidad de una cuarta parte de los datos, es decir, el
25% de los datos está entre 452 y 562.6 así:
90
Desde los conceptos y los procesos
El otro 25% de la puntuación se encuentra entre 562.6 a 626 y 626 a 691.8.
A la caja así dibujada se le adicionan dos guías paralelas al eje (se ve como una), una a cada
lado, con las siguientes características: el primer segmento se prolonga desde el primer
cuartil hasta el valor máximo entre el mínimo de de la distribución y la diferencia entre Q1
-1.5*(Q3 – Q1), en nuestro caso tenemos
562.6 - 1.5*(691.8 - 562.6) = 368.8
Por lo tanto el máximo entre 452 y 368.8 es 452.
El otro segmento abarca desde el tercer cuartil hasta el mínimo entre el máximo de la distribución y la suma de Q1 +1.5*(Q3 – Q1) en este caso
562.6 +1.5*(691.8 - 562.6) = 756.4
Indica que el otro extremo se prolonga hasta 756.4
El análisis es el siguiente:
Si alguno de los datos quedan fuera del intervalo cubierto por la caja y estos segmentos,
indica que se tienen puntos atípicos, se señalan con una marca que puede ser un asterisco
(*), esto demuestra que son valores muy alejados de los valores centrales de la distribución,
esto indica lógicamente la simetría. Sirve además esta caja para comparar la misma variable
en dos muestras diferentes.
Según la explicación anterior, ¿que comparación se puede hacer con respecto a la puntuación
obtenida en aptitud verbal?
¿Se ajustan los estadísticos obtenidos a ese razonamiento?
91
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad propuesta (Continuación)
Ahora se realizará las mismas operaciones para el análisis de la aptitud matemática.
A continuación se le da la tabla de frecuencias para aptitud matemática:
Intervalo
fi
Xi
hi
Fi
Hi
Xi*fi
452
1
473,5
0,03333
1
0,033
473,5
-161,9667
26233,20111
495
2
516,5
0,06667
3
0,1
1033
-118,9667
28306,13556
538
5
559,5
0,16667
8
0,267
2797,5
-75,96667
28854,67222
581
7
602,5
0,23333
15
0,5
4217,5
-32,96667
7607,607778
624
4
645,5
0,13333
19
0,633
2582
10,03333
402,6711111
667
6
688,5
0,2
25
0,833
4131
53,03333
16875,20667
710
1
731,5
0,03333
26
0,867
731,5
96,03333
9222,401111
753
4
774,5
0,13333
30
1
3098
139,0333
77321,07111
Total
30
1
Xi -
19064
(Xi -
)2*fi
194822,9667
Debe comparar cada una de los resultados para observar la dispersión y las demás medidas.
¿Cuál de los datos presenta mayor simetría con respecto a la media?
¿En cuál de las pruebas les fue mejor a los estudiantes?
Analice el CV para cada prueba y justifique cual de las dos es más confiable.
Haga una gráfica de cajón y realice el análisis pertinente. ¿Se pueden comparar los resultados con los de aptitud verbal?
Conceptos y procedimientos
Las actividades que se presentan a continuación pretenden que a partir de análisis de la
distribución de frecuencias con diferentes medidas de tendencia central iguales, se puedan
observar los diferentes grados de variabilidad.
El docente debe tener en cuenta dentro del análisis de las actividades, que al recurrir al
cálculo del coeficiente de variación, es una medida relativa y que su utilidad radica en que
es independiente de la unidad usada en los valores de la variable, por lo cual se pueden
comparar distribuciones cuyos datos estén medidos en diferentes unidades.
En las medidas de variabilidad, es importante destacar algunas propiedades relevantes
tanto de la varianza como la desviación típica:
a. A medida que los datos se alejan de la media, la varianza y la desviación también.
b. Al aumentar el tamaño de la muestra, disminuyen los dos estadísticos.
92
Desde los conceptos y los procesos
c. Cuando todos los datos de la distribución son iguales, los dos estadísticos son iguales
a cero.
d. Para el cálculo se utilizan todos los datos de la distribución, por tanto, cualquier cambio
de valor será detectado.
Es conveniente además realizar diagramas de dispersión como el siguiente:
La obtención de datos, por ejemplo que relaciona la estatura con el peso, permite la realización de diagramas como el siguiente, realizado en excel:
X
45
55
55
55
56
58
58
60
60
60
68
68
69
70
70
85
87
90
Y
160
145
150
165
165
162
165
160
163
170
155
170
172
175
180
175
180
190
Fig16
Este diagrama de dispersión (Fig16), indica relación existente entre la altura y el peso. Se
puede estimar la estatura de una persona que pesa 60 kg.
El objetivo principal es la obtención de todos los estadísticos y el respectivo calculo de las
desviaciones y a partir de esos datos obtener información sobre la mejor medida.
Actividad nº 1
Ahora se proponen una serie de situaciones en las cuales debes utilizar razonadamente los
estadísticos apropiados según el contexto.
93
Módulo
5
Pensamiento aleatorio y sistemas de datos
1. Con los datos de la situación de tiro al blanco, completa la siguiente tabla:
Jugador
1m
2m
3m
4m
5m
A
B
C
D
¿Cuál de los jugadores es más eficaz?
Realiza una gráfica en un mismo plano con cada jugador y compara los resultados de acuerdo
con los estadísticos numéricos.
¿Entre qué límites varía el 75% de los valores centrales?
Si uno de tus compañeros obtiene 5 puntos, ¿en qué percentil se ubica?
¿Existen valores atípicos en la distribución?.
¿A qué fenómeno le atribuyes el resultado?.
Actividad nº 217
Un estudio nutricional en una institución educativa en el cual se midió el peso de acuerdo con la
edad, y resultó que el peso promedio fue de 52 Kg., cuando el esperado era de 58 Kg. Después de
hacer una serie de labores nutricionales para aumentar el peso durante un lapso de tres meses,
se tomaron nuevamente los pesos y los resultados se muestran en las siguientes gráficas:
Fig 17
_____________________________________________________
Adaptado de Examen de Estado.2004-2
17
94
Fig 18
Desde los conceptos y los procesos
Situaciones para reflexionar
1. De acuerdo con ello, analice si las labores nutricionales fueron efectivas.
2. Al hacer una comparación de las dos figuras (Fig17 y Fig18), analice: si el promedio de
edad es superado por menos estudiantes que los que superan el peso promedio.
3. Dos estudiantes que no estuvieron presentes en la medición, se les hizo la medición del
peso a la semana siguiente y ellos pesaron 50 y 54 Kg. Respectivamente, analice la efectividad de la labor nutricional teniendo en cuenta estos nuevos pesos.
Tiro al blanco (Nuevamente)
Actividad nº 3
En la siguiente situación, se toma el puntaje obtenido en 6 lanzamientos para cada jugador.
Material
Una cartulina, en la cual se dibujan círculos concéntricos con los puntajes dados.
Como jugar
Formar grupos de 6 estudiantes, con un dado se ordena la salida de mayor a menor puntaje
obtenido. Si hay empate se resuelven lanzando nuevamente los dados. Cada jugador anota
en la tabla el respectivo puntaje, marcando con una X las veces en que cayó en cada círculo.
Si cae fuera, se repite el lanzamiento.
95
Módulo
5
Pensamiento aleatorio y sistemas de datos
Jugador
-2
1
10
15
20
TOTAL
XX
2
3
4
5
6
TOTAL
Situaciones para reflexionar
1. Halla el promedio total (de todos los jugadores).
2. Calcula la variación o dispersión que obtuvo cada uno de los jugadores con respecto al
promedio.
3. ¿Qué te indica los porcentajes que caen en el intervalo X ± S?.
4. ¿Cuál es la muestra menos asimétrica?
5. ¿Cuánto te desviaste?
Problema
Los siguientes datos son ficticios: en una clase se realiza una encuesta sobre la cantidad de
dinero que le dan a los estudiantes y sobre las variables dadas en la tabla.
96
Sexo
Deporte
Peso
Estatura
Calzado
Pesos
2
1
59
161
37
1500
1
3
45
160
38
2500
1
2
65
166
39
0
2
2
74
170
41
1500
1
1
68
175
40
2500
2
2
69
176
41
3000
1
3
86
191
42
3500
2
3
58
154
38
2500
1
3
74
168
39
0
1
1
64
166
38
2500
2
3
64
166
40
2000
2
2
74
170
41
1500
1
1
68
175
40
2500
1
3
69
176
41
3000
2
2
86
191
42
3000
1
2
65
166
39
0
2
2
74
170
41
1500
Desde los conceptos y los procesos
1
1
68
175
40
2500
2
2
69
176
41
3000
1
3
86
191
42
3500
2
3
58
165
39
2500
sexo: 1= hombre 2= mujer
Deporte: 1= nada, 2=poco , 3 = mucho
En la siguiente tabla, se adjuntan los resúmenes estadísticos de algunas de las variables
consideradas en una clase con niños de 6º grado, incluye la cantidad de dinero que se le
da para los descansos.
Variable
Peso (kg)
Media
68,7142857
Mediana
68
Moda
74
Des.Tìpica
9,6813166
Mínimo
45
Máximo
86
Rango
41
Datos
20
Estatura (cm)
Nº zapato
Pesos
Situaciones para reflexionar
a. Termine de ubicar la información de las demás variables.
b. ¿Qué medida es más adecuada para cada variable?
c. ¿Cuál de las variables presenta mayor/menor dispersión?
d. ¿Qué estudiante sería más representativo en cada una de las variables (de acuerdo a
la tabla)?.
e. ¿Existe algún estudiante que sea representativo en todas las variables?
f. ¿Son más altos los estudiantes que practican mucho deporte?
g. ¿Reciben las niñas más dinero que sus compañeros?
h. Realiza diagramas de dispersión para analizar diferentes variables, por ejemplo deporte_
estatura.
97
Módulo
98
5
Pensamiento aleatorio y sistemas de datos
Unidad No.3
El azar y la probabilidad
Introducción
Llegar a las instancias de la didáctica de probabilidades no es fácil, ya que en nuestro país
no se tienen muchos conocimientos sobre proyectos de investigación sobre la enseñanza de
la probabilidad y temas afines y más a niveles de básica y media técnica, por lo tanto es a
partir de los estándares básicos de matemáticas que nos proponemos realizar estrategias que
permitan desarrollar en nuestros estudiantes un razonamiento y pensamiento formal para que
ellos descubran en forma progresiva esquemas de representación implícitos en las diferentes
niveles de situaciones problemas.
El punto de partida para esta unidad está basado en los significados de la aleatoriedad, y
experimento aleatorio como conceptos claves en la concepción de la probabilidad. Para ello,
el proceso de generación de una sucesión es lo que se denomina experimento aleatorio, los
posibles resultados de dicho proceso son los sucesos aleatorios y la sucesión obtenida en una
serie de ensayos es la secuencia aleatoria.
Para Piaget e Inhender la comprensión del azar por parte del niño vista como complementaria a la relación causa-efecto forma un marco de referencia para identificar los fenómenos
aleatorios. Desde el punto de vista físico, el azar se caracterizará por procesos de mezcla
irreversible, mientras que la causalidad mecánica tendrá una reversibilidad intrínseca18.
En la parte de aleatoriedad la propiedad de reversibilidad no es funcional a como volver los operandos primitivos al deshacer la operación por su proceso inverso que lo permite. Por ejemplo19, si
hacemos girar la aguja en una ruleta, desde una posición inicial, impulsándola hacia la derecha,
es muy poco probable que un impulso a la izquierda devuelva la aguja a su posición inicial.
Para Piaget, el niño tiene un pensamiento irreversible, que le permite colocar una barrera en
la comprensión de la aleatoriedad debido a que no puede diferenciar entre acontecimientos
reversibles y fortuitos, originados por mezclas de causas irreversibles. Tal motivación lleva
al niño hasta la etapa de las operaciones concretas en la que pueden claramente aparecer
factores de caracterización de los fenómenos causados y poder adquirir en forma intuitiva el
significado de aleatoriedad.
_____________________________________________________
Citado en la tesis doctoral de Luis Serrano Romero. Significados institucionales y personales de objetos matemáticos ligados a la
aproximación frecuencial de la enseñanza de la probabilidad.
19
Tomado de Didáctica de la estadística. Carmen Batanero. Pág. 56.
18
99
Módulo
5
Pensamiento aleatorio y sistemas de datos
En tal sentido, Fischbein rechaza las ideas de Piaget respecto a la concepción del azar cuando concibe que esa idea no es innata y la no comprensión de causa y efecto por parte del
niño en el periodo preoperacional, pues se basa en la intuición primaria del azar, es decir,
existe una distinción entre fenómeno aleatorio y determinista a partir de los 7 años, además
los niños al practicar los juegos de azar sencillos son capaces de elegir la opción de mayor
probabilidad. Plantea que la distinción entre azar y lo deducible no se realiza espontánea y
completamente al nivel de las operaciones formales.
En los fenómenos aleatorios los resultados aislados son imprevisibles, pero el conjunto
de posibilidades puede determinarse mediante un proceso de desarrollo de razonamiento
combinatorio, con lo que se vuelve previsible. Lo anterior se debe comprender para poder
expresar la idea de probabilidad como la razón de posibilidades de un caso en particular y
el conjunto de posibilidades.
Puede observarse que el pensamiento aleatorio, también involucra otros tipos de pensamiento
como el numérico y variacional, este último ofrece formas de realizar modelos a través de las
funciones que intervienen en las situaciones de las distribuciones de probabilidad.
En el siguiente esquema se propone tomar como base fundamental las probabilidades, partiendo de la aleatoriedad y el análisis combinatorio.
100
El azar y la probabilidad
3.1. Un poco de historia
Aproximadamente por el año 3500 a.C., los juegos de azar eran practicados con objetos de
hueso, considerados como los precursores de los dados, y fueron ampliamente desarrolladas
en Egipto y otros lugares. Dados cúbicos con marcas virtualmente idénticas a las de los dados
modernos han sido encontrados en tumbas egipcias que datan del año 2000 a.C. Sabemos
que el juego con dados ha sido popular desde esa época y que fue parte importante en el
primer desarrollo de la teoría de la probabilidad20.
Se dice que probabilidades numéricas para ciertas combinaciones de dados ya habían sido
calculadas por Girolamo Cardano (1501 - 1576) y por Galileo Galilei (1564 - 1642). Cardano en
su obra “Lanzando los dados”, publicada 87 años después de su muerte, introduce conceptos
de combinatorios en cálculos de probabilidad y define la probabilidad como “el numero de
resultados favorables dividido por el número de posibles resultados”.
Se acepta generalmente que la teoría matemática de la probabilidad fue iniciada por los
matemáticos franceses Blaise Pascal y Pierre Fermat. Cuenta la historia que un día de 1654
Antoine Gombaud, Caballero de Méré, un noble francés con interés en los juegos de los
dados y las cartas, llamó la atención de Pascal en una aparente contradicción en un juego
popular de dados. Este caballero creyó haber encontrado una falsedad en los números al
analizar que el comportamiento de los dados era diferente cuando se utilizaba un dado que
cuando se empleaban los dos. La falsedad consistía en una comparación errática entre las
posibilidades de obtener un seis con un solo dado u obtener un seis con ambos. El juego
consistía en lanzar un par de dados 24 veces, y el problema en decidir cuando apostar por
un “doble seis” en una tanda de 24 lanzamientos. Una regla de juego aparentemente bien
establecida indujo a Méré a creer que apostar a un doble seis en 24 lanzamientos podría ser
provechoso, pero sus propios cálculos indicaron lo contrario. Lo anterior se debió a que Méré
no tuvo en cuenta que al jugar con dos dados se entra al análisis de probabilidades compuestas en el cual se deben calcular por la multiplicación. En una carta de Pascal a Fermat
en la que narraba esta anécdota concluía que “el caballero Méré tiene mucho talento, pero
no es geómetra; esto es, como sabéis un gran defecto” (carta del 29 de julio de 1654)21
Este problema y otros propuestos por de Méré, llevó a un intercambio de cartas entre Pascal
y Fermat, en las cuales los principios de la teoría de la probabilidad fueron formulados por
primera vez. Aunque algunos problemas especiales en los juegos de azar habían sido resueltos por algunos matemáticos italianos en los siglos XV y XVI (Cardano, Galilei), ninguna
teoría general se desarrolló antes de esta famosa correspondencia.
Basándose en dicha correspondencia, el físico-astrónomo-matemático alemán Christian Huygens, maestro de Leibniz, publicó en 1656 el libro De ratiociniis in ludo aleae (Razonamientos
en juegos de azar), el primer libro impreso sobre probabilidad.
_____________________________________________________
Tomado de: http//correo.puj.edu.co/probabilidad/historia.
La historia de la probabilidad. Ponencia Rev Col Cienc Vol 16:1.2003. Luis F Restrepo y Julián González.
20
21
101
Módulo
5
Pensamiento aleatorio y sistemas de datos
En 1689 Jacob Bernoulli publicó un importante trabajo sobre series infinitas y su ley sobre los grandes números en teoría probabilística. Fue un temprano precursor del uso de
la teoría probabilística en medicina y meteorología en su trabajo Ars conjectandi (“El arte
de la conjetura”), publicado de manera póstuma, en 1713. Este trabajo estaba dedicado a
establecer las nociones básicas de probabilidad. Para esto fue necesario introducir también
un buen número de nociones básicas de combinatoria pues se usaron fuertemente como
aplicaciones al cálculo de probabilidades. Se puede decir que con los trabajos de Bernoulli
se inicia el establecimiento de la combinatoria como una nueva e independiente rama de
las matemáticas.
A finales del siglo XVIII, se evidenció la existencia de analogías entre los juegos de azar y
fenómenos aleatorios en física, biología y ciencias sociales. Contribuciones de importancia
fundamental fueron hechos hacia finales del siglo XVIII y comienzos del XIX por los matemáticos, astrónomos y físicos franceses Joseph Louis Lagrange and Pierre Simon Laplace, el
matemático y astrónomo germano Karl Friedrich Gauss, y el matemático francés Simeón-Denis
Poisson. Las permutaciones fueron primeramente estudiadas por Lagrange en 1770 e inventó
y maduró el cálculo de variaciones y más tarde lo aplicó a una nueva disciplina la Mecánica
Celestial, sobre todo al hallazgo de mejores soluciones al Problema de tres cuerpos.
La publicación más importante de esta era fue Théorie analytique des probabilités (1812) de
Laplace, en la cual se discuten aplicaciones prácticas de la teoría (errores en observaciones; la
determinación de las masas de Júpiter, Saturno y Urano; métodos de triangulación para supervivencia; y problemas de geodésicas, en particular la determinación del meridiano de Francia)
y desarrolla el concepto de distribución normal, descubierta en primera instancia por Abraham
de Moivre. Además, complementó el trabajo comenzado por Gauss sobre teoría de errores.
En 1801 Gauss publicó Disquisitiones Arithmeticae, su principal trabajo y uno de los más
importantes en la historia de las matemáticas. Esta obra cubre temas de teoría de números,
análisis matemático, teoría de probabilidades, geometría, fisicomatemática, astronomía y
geodesia. En probabilidad mostró que ésta puede representarse por una curva en forma de
campana (distribución gaussiana), que es la base en la distribución estadística de datos.
En 1837, en su Obra Recherches sur la probabilité des jugements... (“Investigaciones sobre
la probabilidad de opiniones”) Possion introduce lo que conocemos como la distribución de
Poisson, o ley de Poisson de los grandes números, un método aproximado usado para describir
probables ocurrencias de eventos improbables en un número grande de ensayos inconexos.
Entre 1850 a 1900 el desarrollo de la probabilidad fue dominada por la escuela rusa de teoría
probabilística (Petersburgo), enfatizando en métodos matemáticos rígidos. Las figuras más
prominentes de esta escuela fueron Pafnuty Chebyshev, y sus discípulos Andrei Markov y
Alexander Lyapunov. Markov se enfocó principalmente en el método de movimientos. Su
introducción de la cadena de Markov como un modelo para el estudio de variables aleatorias
hizo posibles grandes cantidades de investigación en procesos estocásticos. Un uso práctico
para su matemática se encontró en el uso de sus cadenas para modelar la alteración de vocales
y consonantes en los trabajos literarios rusos. Él también escribió un libro de probabilidad y
102
El azar y la probabilidad
estadística, uno de los mejores de su tiempo. Su trabajo influyó en muchos otros matemáticos
famosos y estadísticos, incluso S. N. Bernstien, V. yo. Romanovsky, y Jerzy Neyman (quién
entonces tomó las estadísticas a un nuevo y más práctico nivel).
Pearson aplicó la estadística a los problemas biológicos de la herencia y la evolución, resaltándose la publicaciones realizadas entre 1893-1912 tituladas “Contribuciones de la Matemática a la teoría de la Evolución”, en las cuales se encuentran contribuciones al análisis
de regresión, coeficiente de correlación el incluyó el test de “fi al cuadrado” y fue él quien
acuñó el termino de desviación estándar.
La rama toma su forma actual a partir de los años 30’s cuando Kolmogorov establece con
sus axiomas para el cálculo de probabilidades las bases matemáticas para asentar la teoría,
con lo cual, además se aclaran las aparentes paradojas existentes. Todo esto aparece en
su famosa monografía Grundbegriffe der Wahrscheinlichkeitsrechnung, (1933). Los antecedentes del esquema Kolmogorov son: I. Los notables avances que en el área del análisis
matemático se dan durante la primera década de este siglo con la creación de la teoría de
la medida (E. Borel) y de la integral de Lebesgue. Esto surge independientemente de la
probabilidad, a pesar de lo cual, resulta ser la herramienta ideal para su desarrollo y sólido
sustento matemático. Por el lado de la probabilidad, se cuenta con la demostración de E. Borel
de la ley fuerte de los grandes números en donde éste ya maneja la noción de probabilidad
con las propiedades aditivas. Por otra parte, los trabajos de Norbert Wiener y los de Paley
y Zigmund, contienen desarrollos importantes de la teoría y en ellos ya manejan la idea de
probabilidad como medida” .
3.2. Algunos tópicos sobre aleatoriedad modelación y probabilidad
Es conveniente antes de ingresar a los conceptos de la probabilidad dejar claro el concepto
de aleatoriedad y sobre como podemos realizar modelos que nos llevarán a la comprensión
de la teoría formal del tema en cuestión.
En el atlas de 2005 se tiene la siguiente significación:
3.2.1. Experiencia aleatoria
Experiencia cuyo resultado depende del azar. Son experiencias aleatorias el lanzamiento de
una moneda, el de un dado, o la extracción de una carta de una baraja. Los elementos de
una experiencia aleatoria se llaman sucesos aleatorios o, simplemente, sucesos.
También se consideran experiencias aleatorias algunos acontecimientos relacionados con
la sociología, la demografía, la economía u otras ciencias cuyos resultados se estudian más
eficazmente si se consideran como aleatorios que si se pretende estudiar las causas concretas que los provocan; es el caso, por ejemplo, del número de accidentes de tráfico que se
producen en un fin de semana en una cierta carretera.
103
Módulo
5
Pensamiento aleatorio y sistemas de datos
3.2.2. Experiencia aleatoria compuesta
Si se puede considerar como resultado de concatenar dos o más experiencias simples. Así,
extraer tres cartas de una baraja es una experiencia que se puede considerar compuesta por
tres experiencias sencillas consistentes cada una de ellas en extraer una carta.
Las experiencias simples que dan lugar a una compuesta se llaman independientes si el
resultado de cada una de ellas no influye en el de las siguientes. La experiencia consistente
en lanzar dos dados, uno tras otro, se compone de dos experiencias independientes, pues el
resultado que se obtenga en el primero no afecta a las probabilidades en el segundo.
Dos o más experiencias consecutivas son dependientes si el resultado de cada una afecta a las
probabilidades de los sucesos en las siguientes. Por ejemplo, en la experiencia consistente en
sacar dos cartas de una baraja, al extraer la primera se modifica la composición de la baraja.
Por tanto, las probabilidades en la segunda dependerán de lo que ocurrió en la primera.
Aunque no aparece el término aleatoriedad, se da una idea intuitiva y por lo tanto como en
la mayoría de los textos, se ve claramente que el proceso aleatorio, está relacionado con las
probabilidades y el azar.
Para Batanero (2001, Pág. 2), partir de la observación (método científico) de los fenómenos
que ocurren en la naturaleza podemos diferenciar aquellos que son constituidos por el azar
y que representan aleatoriedad y contingencia24, cuando se tiene un fenómeno aleatorio,
decimos que éste es reproducible en las mismas condiciones, aunque presente diferentes
resultados pero sin saber con certeza lo que ocurrirá en una experiencia particular, por ejemplo, no sé con seguridad el tiempo que demora un ciclista en recorrer 100km. Pero se puede
reproducir la situación en las mismas condiciones para analizar los diferentes resultados que
se producen (se puede hacer un recuento del tiempo gastado por dos o más ciclistas, puede
ser una prueba contra reloj). Por el contrario en una situación contingente, el fenómeno no
es repetible bajo las mismas condiciones, así en el esté presente el azar, por ejemplo cuando
se va por una calle y ocurre un accidente de tránsito.
3.2.3. Modelos
En cuanto a los modelos, Carlos Eduardo Vasco25 comenta “Para mí, el principal propósito del
pensamiento variacional es la modelación y no es propiamente la resolución de problemas ni
de ejercicios. Al contrario para mí, los mejores problemas o ejercicios deberían ser desafíos
o retos de modelar algún proceso. Para poder resolver un problema interesante tengo que
armar primero un modelo de la situación en donde las variables covarìen en forma semejante
a las de la situación problemática…”
Vasco, en el mismo documento dice “La modelación es pues el arte de producir modelos
matemáticos que simulen la dinámica de ciertos subprocesos que ocurren en la realidad”.
_____________________________________________________
Tomado de: http//correo.puj.edu.co/probabilidad/historia.
La historia de la probabilidad. Ponencia Rev Col Cienc Vol 16:1.2003. Luis F Restrepo y Julián González.
20
21
104
El azar y la probabilidad
Los estudiantes deben aprender a realizar modelos en todas las ciencias (áreas o asignaturas)
y en sus diferentes etapas de la vida escolar, con lo cual se forma un proceso de aprendizaje
eminentemente significativo, por ello a partir de ahí la propuesta de trabajo en la parte de
probabilidad debe partir de la modelación y simulación de fenómenos aleatorios.
Como ya se tiene una idea de la aleatoriedad, se debe pasar a realizar modelaciones, por
ejemplo, no sé con seguridad el tiempo que demora un ciclista en recorrer 60km en una
competencia contra reloj, al calcular el tiempo que gasta el ciclista, se debe tener en cuenta
la hora en la cual se realizó la experiencia, el tiempo (invierno, verano), sitio (velódromo, pista
callejera etc.). Todos estos puntos serán importantes para tratar de encontrar un modelo que
nos describa el tiempo gastado y se requiere del juicio personal y del análisis cuidadoso de
la situación para decidir cuáles de los aspectos de la realidad son los que en definitiva nos
parecen importante para resolver el problema que planteamos. Nótese pues que se tiene ya
la idea intuitiva de un experimento aleatorio.
Ahora para construir el modelo, debemos tener en cuenta una serie de decisiones: ¿aceptamos
que el tiempo de llegada del próximo ciclista es independiente del que acaba de llegar?.
¿Trataremos los tiempos como variable continua?.
¿Cuáles son otras variables, además del tiempo de llegada que me podrían interesar en el
trabajo con el modelo?.
Una vez que hemos construido un modelo matemático para la situación (por ejemplo aceptamos que los tiempos de espera siguen una distribución uniforme entre un ciclista y otro)
y obtenidas las conclusiones a partir del modelo queda todavía la parte más importante:
comparar estas conclusiones con el comportamiento real de la situación analizada y decidir
que el modelo matemático nos proporciona una buena descripción de la realidad. Resaltamos el hecho de que construir un modelo es obtener una mejor comprensión de una parte
de nuestro mundo y, así, poder predecirla y si es posible controlarla. Un modelo no es “real”,
ni tampoco “verdadero”;
3.2.3. Probabilidad
En toda ciencia y en especial las matemáticas es vital e importante analizar los diferentes
puntos de vista sobre la comprensión de los significados de los conceptos puestos en juego
al igual que el razonamiento acerca de errores y dificultades en su enseñanza ya que ellos
inciden en la toma de decisiones en situaciones de incertidumbre.
Si bien es cierto que aprovechando las distribuciones de probabilidad se empieza a formar el concepto de probabilidad frecuencialista, debe tenerse en cuenta que es apenas
un abrebocas a las discusiones planteadas por la gran mayoría de autores en cuanto a la
interpretación y la conceptualización de la misma, debido a los diferentes enfoques y definiciones dadas a la probabilidad.
Por ejemplo al realizar un experimento un número determinado de veces, n , se sabe que la
frecuencia absoluta del suceso es ni, por lo tanto el cociente h = ni/n es la frecuencia relativa
105
Módulo
5
Pensamiento aleatorio y sistemas de datos
de dicho suceso (estudiado en los apartes de las tablas de frecuencia), lo importante es que
se puede observar que dicha frecuencia varia entre 0 y 1. El valor de la frecuencia relativa
de ese suceso no es fija para n, ya que se trata de un fenómeno aleatorio y además, al realizar el mismo experimento n veces, por dos o más personas, se pueden obtener diferentes
valores de las frecuencias relativas. Sucede que para una serie grande de repeticiones del
experimento, las frecuencias relativas se van acumulando alrededor de un valor fijo. Tal hecho se conoce como la ley de los grandes números. Un ejemplo fue el realizado por Pearson
quien al lanzar una moneda 24000 veces, obtuvo una frecuencia relativa de 0.5005 para las
12012 caras. Se cuenta que Buffón lanzó una moneda 4040 veces y obtuvo 2048 caras, cuya
frecuencia relativa es 0.506930.
Con las observaciones anteriores se construye el primer concepto de probabilidad: como
un proceso aleatorio en el cual la frecuencia relativa converge a un valor, al repetir un experimento un número grande de veces.
En el concepto anterior de hecho, presenta quizás entre otros, las fallas:
a. No se tiene en cuenta que los sucesos deben tener la misma ocurrencia, es decir deben
ser equiprobables (regla de Laplace), por ejemplo cuando se lanza una tachuela, la probabilidad de caer de cabeza que acostada no es la misma.
b. El tamaño de la muestra ya que a mayor tamaño de la muestra, existe menor variabilidad
y que en muestras pequeñas existe mayor variabilidad.
c. Nuunca se obtiene el valor exacto de la probabilidad, sino una estimación al mismo.
Los anteriores análisis permitieron el concepto de la regla de Laplace, partiendo como se comentó
en la parte histórica de la solución de algunos juegos de azar, en el cual se considera un espacio
muestral finito para la ocurrencia de n sucesos elementales en el cual ninguno de ellos puede
ocurrir con mayor frecuencia que los otros, en tal caso la probabilidad de estos sucesos es 1/n.,
a partir de este hecho, Laplace habla de sucesos compuestos y dice que las probabilidades de
un suceso que se descompone en k sucesos elementales puede calcularse como k/n.
De lo anterior, se llega a la conocida regla de Laplace en la cual la probabilidad de un suceso que puede ocurrir en un número finito de ocasiones es considerada como “una fracción
cuyo numerador es el número de casos favorables y el denominador el número de todos los
casos posibles”.
Según Godino et. al. (1987), esta definición se encontró inadecuada incluso en la época de
Laplace, ya que además de ser circular y restrictiva, no ofreció respuesta a la pregunta de
qué es realmente probabilidad; sólo proporcionó un método práctico de cálculo de probabilidades de algunos sucesos sencillos. Por otro lado, esta definición no puede aplicarse a los
experimentos con un número infinito de posibilidades o a aquellos casos en que el espacio
muestral es finito, pero no puede aceptarse la condición de simetría26.
_____________________________________________________
Carmen Batanero. Significados de la probabilidad en la educación secundaria.
26
106
El azar y la probabilidad
Uno de los inconvenientes para la aplicación de este concepto es que si se tiene un espacio
muestral infinito, es imposible aplicar la regla anterior.
Existe además, otra forma de asignación de probabilidades: de manera subjetiva, esto es,
asignar una probabilidad a un evento de acuerdo con la experiencia de la persona, se cita por
ejemplo ¿cuál es la probabilidad de que Colombia clasifique al mundial del 2010? y las personas dan sus opiniones, desde luego muy subjetivas. Pero la verdad es que con el teorema de
Bayes se tiene un nuevo punto de vista que permite transformar las probabilidades a priori
(antes de realizar el experimento) de varias causas, una vez observadas sus consecuencias,
a probabilidades a posteriori, que incorporan la información de los datos observados.
En este sentido las probabilidades son tomadas como grado de creencia de una persona, el
cual está basado en su experiencia para asignar probabilidades, así al final resulta engorroso
calcular la probabilidad de un suceso ya que diferentes personas tienen distintas concepciones y por supuesto conocimientos respecto a un hecho en particular.
Dentro de las dificultades expuestas en el párrafo anterior, se encuentra que ya no es posible hallar una regla para asignar probabilidades para expresar los grados de experiencia
personal, ni la realización del suceso varias veces en las mismas condiciones (en medicina,
economía), no hay regla fija que permita asignar un valor numérico a una probabilidad.
Es a partir de Borel que se empieza a organizar el significado de probabilidad como un tipo
especial de medida, al cual Kolmogorov aplica la teoría de conjuntos y de la medida, para
darle un enfoque axiomático, el concepto más aceptado hoy día.
Veamos como construir el enfoque axiomático: en la gran mayoría de los experimentos
aleatorios es cierto que la frecuencia relativa de un suceso A en un gran número de ejecuciones es aproximado a un número P(A), llamado ocurrencia o probabilidad del evento A en
el experimento esto indica que si se realiza el experimento muy a menudo, la frecuencia
relativa es aproximadamente igual a P(A).
Como P(A) tiene que ver con la frecuencia relativa, se tiene que:
0 ≤ P(A) ≤ 1
Si A y B son eventos mutuamente excluyentes27 ( A∩B ≠∅), se cumple que:
P (A∪B) = P(A) + P(B)
Si al conjunto de todos los resultados posibles del experimento lo llamamos espacio muestral
S, se tiene que:
P(S) = 1
Si el espacio muestral es infinito y A1, A2, …. Son eventos mutuamente excluyentes, se tiene que:
P(A1∪A2 ∪…) = P(A1 )+ P(A2 )+…
_____________________________________________________
Al tratar con conjuntos, se debe tener en cuenta que la intersección entre dos conjuntos es vacía para que sean disjuntos.
27
107
Módulo
5
Pensamiento aleatorio y sistemas de datos
El anterior análisis nos hace ver claramente que hay posibilidades cuya asignación es 0, por
ejemplo la posibilidad de realizar un viaje al sol, a tal posibilidad se les conoce como imposibles,
pero también nos indica que existe una posibilidad de 1,tal posibilidad es conocida como segura,
por ejemplo la probabilidad de que llueva el próximo año, además existe la opción de movernos
en el intervalo 0 ≤ Probabilidad (de un evento) ≤ 1, lo cual indica que existen un número infinito
de asignaciones para la ocurrencia de un evento, así mismo indica que existe una función para
la asignación de probabilidades para cada uno de los posibles eventos del espacio muestral.
3.2.3.1. Sesgos de la probabilidad
En el análisis de la probabilidad, es común observar que los estudiantes obtengan algunos
sesgos que contribuyen a un razonamiento subjetivo de las probabilidades.
Polya28 trata el término heurística y se refiere a la comprensión del método que conduce a la
solución de problemas y mas concretamente a las operaciones mentales típicamente útiles
en este proceso. Añade que la heurística se construye sobre una experiencia resultante,
simultánea con la solución de problemas.
Al respecto Kahneman et. al (1982, pag.106) conceptualizan la heurística como procesos
mentales que restringen la complejidad de un problema, de modo que sea accesible al resolutor. Dicen además que esto no garantiza la solución al problema planteado al contrario del
algoritmo que produce la solución para cualquier problema, dentro de una clase dada.
En los juicios probabilísticos se encuentran algunos sesgos, que fueron estudiados por Tversky y Kahneman, siendo ellos tratados en las heurísticas siguientes:
3.2.3.1.1. Heurística de la representatividad
Consiste en calcular la probabilidad de un suceso basado en la representatividad del mismo respecto a la población de la que proviene. En primer lugar, se prescinde del tamaño de la muestra,
y con ello del estudio de la variabilidad del muestreo, produciendo una confianza indebida en las
pequeñas muestras. En segundo lugar, se supone que cada repetición del experimento, aunque
sea limitada, ha de producir todas las características de la población. Por ejemplo, se espera que
la frecuencia de una característica en la muestra coincida con la proporción de la misma en la
población; por ello tras una larga racha de aparición de un suceso se espera intuitivamente la
aparición del suceso contrario, olvidando la independencia de los ensayos repetidos.
Como concepciones erróneas que surgen de ésta heurística, se tienen los segos respecto a
la muestra, lo cual indica que se deben reproducir todas las características de la población
aunque se trate de una muestra pequeña
3.2.3.1.2. Heurística de la disponibilidad
Consiste en realizar un juzgamiento más probable por los sucesos que son más fáciles de
recordar. Esta heurística se apoya en el concepto de muestra, ya que al evaluar un estudio
_____________________________________________________
Citado en la tesis doctoral de Luis Serrano Romero. Significados institucionales y personales de objetos matemáticos ligados a la
aproximación frecuencial de la enseñanza de la probabilidad.
28
108
El azar y la probabilidad
se usan muestras, con ello se corre el riesgo de que la muestra no sea representativa de la
población a estudiar, también se debe a falta de razonamiento combinatorio.
3.2.3.1.3. Heurística de accesibilidad
Consiste en estimar la probabilidad de un suceso de acuerdo a la facilidad con que se recuerden ejemplos en los que dicho suceso ocurrió o por la facilidad con que pueden generarse
ejemplos en los que tal suceso ocurre.
3.2.3.1.4. Sesgo de equiprobabilidad
Lecoutre, Durand y Cordier, en sus experimentos describen la creencia de los individuos en la
equiprobabilidad de todos los sucesos asociados a cualquier experimento aleatorio, incluso
en aquellos en que no es aplicable el principio de la indiferencia.
3.2.3.1.5. Errores sobre la probabilidad condicional
A los estudiantes les resulta difícil comprender que la probabilidad de un suceso pueda condicionarse por otro que ocurra después de él. Por ejemplo pueden encontrar sin sentido la pregunta
sobre probabilidad de que la madre de una persona de ojos azules tenga ojos azules.
• ESTÁNDARES INVOLUCRADOS Y RELACIONADOS
A continuación se presentan los estándares relacionados con los elementos teóricos puestos a consideración en esta unidad, igualmente, abarcan la mayor parte de las situaciones
propuestas.
Sistemas de datos
Primero a Tercero
Describir situaciones o eventos a partir de un conjunto de datos.
Explicar desde su experiencia la posibilidad o imposibilidad de ocurrencia
de eventos cotidianos.
Predecir si la posibilidad de ocurrencia de un evento es mayor que la de otro.
Cuarto a Quinto
Hacer conjeturas y poner a prueba predicciones acerca de la posibilidad de
ocurrencia de eventos.
Comparar diferentes representaciones del mismo conjunto de datos.
Sexto a Séptimo
Usar modelos (diagramas de árbol, por ejemplo) para discutir y predecir
posibilidad de ocurrencia de un evento.
Hacer conjeturas acerca del resultado de un experimento aleatorio usando
proporcionalidad y nociones básicas de probabilidad.
Octavo a Noveno
Comparar resultados experimentales con probabilidad matemática esperada.
Resolver y formular problemas seleccionando información relevante en
conjuntos de datos provenientes de fuentes diversas (prensa, revistas ,
televisión, experimentos, consul tas, entrevistas ).
experimentos aleatorios (de las ciencias físicas, naturales o sociales)
Décimo a Undécimo Diseñar
para estudiar un problema o pregunta.
Usar conceptos básicos de probabilidad (espacio muestral , evento, independencia.. .).
109
Módulo
5
Pensamiento aleatorio y sistemas de datos
Numérico
Primero a Tercero
Reconocer significados del numero en diferentes contextos
Usar diferentes estrategias de cálculo y de estimación para resolver problemas en situaciones aditivas y multiplicativas.
Cuarto a Quinto
Interpretar las fracciones en diferentes contextos.
Analizar y explicar las distintas representaciones de un mismo número.
Sexto a séptimo
Justificar el uso de representaciones y procedimientos en situaciones de
proporcionalidad
Décimo a Undécimo
Comparar y contrastar las propiedades de los números sus relaciones y
operaciones
Variacional
Primero a Tercero
Construir secuencias numéricas y geométricas utilizando propiedades de
los números y de las figuras geométricas.
Cuarto a Quinto
Predecir patrones de variación en una secuencia numérica, geométrica o
gráfica.
Sexto a séptimo
Reconocer el conjunto de valores de una variable en situaciones concretas
de cambio.
Octavo a Noveno
Modelar situaciones de variación con funciones.
Décimo a Undécimo
Analizar las relaciones y propiedades entre las expresiones algebraicas y
las gráficas de funciones polinòmicas y racionales.
• SITUACIONES DE APRESTAMIENTO
Actividad nº 1: jugando a los dados
Esta situación se toma del Módulo 2 página 36.
Materiales
2 dados
Como se quiere es repetir el proceso, el estudiante debe llenar la hoja, pero variamos la forma: escribe las posibles maneras de obtener cada uno de los resultados de la parte superior
(como total)
2
3
4
5
6
4+2
3+3
5+1
110
7
8
9
10
11
12
El azar y la probabilidad
¿Es importante el orden en que salga cada número del dado?
¿Cuál de los totales se presenta con mayor frecuencia?
¿A cuál de los totales le apostaría con mayor seguridad?. Explica tu respuesta.
¿Consideras como equivalente los resultados 5+1 y 1+5?. Por qué?
¿Cuál es la cantidad total con mayor y menor posibilidad de salir en un lanzamiento de los
dos dados?
¿Cuál es la probabilidad de cada cantidad?
¿Es más probable sacar un seis con un solo dado que un doble seis (con dos dados)?
¿Cuál es la probabilidad de obtener un doble número?
¿Cuál es la probabilidad de que, al lanzar dos dados, la suma sea 10?
¿Cuál es la probabilidad de que, al lanzar 5 dados, exactamente tres caigan en 1?
• GESTIÓN DE LA ACTIVIDAD
En esta parte se explora claramente la pertinencia del concepto de espacio muestral, el inicio
a la combinatoria, y se aprovecha la propiedad conmutativa para diferenciar una permutación de una combinación, esto ocurre por ejemplo al tener un resultado como 5+1=1+5, es
lógico que en los niveles inferiores se aproveche esta situación para resaltar nuevamente la
descomposición de un número.
Nota: Al contestar la última pregunta de la situación anterior, deben buscarse primero todas
las posibles combinaciones de pares posibles al lanzar los dados.
La actividad anterior se puede expandir para tres dados, lanzamiento de tres monedas y
observar el espacio muestral para cada suceso.
Actividad nº 2 Pascal y de Merè29
1. En 8 lanzamientos consecutivos de un dado se intenta obtener un uno, donde el juego se suspende después de tres intentos fallidos ¿en qué proporción ha de ser compensado el jugador?
_____________________________________________________
Tomado de Instituto de Matemáticas. UNAM. Investigación probabilidad.2002.
29
111
Módulo
5
Pensamiento aleatorio y sistemas de datos
2. En una partida de dados intervienen dos jugadores y apuestan 32 doblones de oro cada
uno, eligiendo un número diferente, gana el juego el primero que obtenga tres veces el
número que eligió. Después de un rato de juego, el número elegido por el primer apostador
ha salido dos veces mientras el otro jugador sólo una vez ha acertado, en este instante
la partida debe suspenderse. ¿Cómo dividir los 64 doblones de oro apostado?
Para resolver esta situación, se deben realizar modelos.
Nota: En la correspondencia entre Pascal y Fermat estuvieron de acuerdo en que el primer
jugador tiene derecho a 48 doblones de oro30.
Actividad nº 3 El triángulo de pascal
Existe una forma sencilla de obtener las probabilidades de cualquier combinación especial.
Pascal dedujo una forma para obtener una cara en el lanzamiento de una moneda, se basó
simplemente en la formación triangular de números, la cual muestra la forma de obtener cara
o sello o cualquier combinación de ellas en determinado número de lanzamientos.
Por ejemplo para una moneda, la posibilidad de que salga cara es una entre dos, o sea, ½.
Para 3 monedas: si todas las opciones son sellos: 1/8; dos sellos una cara 3/8; dos caras y
un sello, 3/8 etc.
En el lanzamiento de cinco monedas, las posibilidades son uno entre 32 para que salgan
cara o sello; 5/32 para cuatro sellos y una cara.
Situaciones para reflexionar
1. Si se lanzan dos monedas, ¿cuál es la probabilidad de que salgan dos caras?
_____________________________________________________
Ponencia La historia de la probabilidad. Luis F Restrepo y Julián González.Rev Col Cien Pec. Vol 16:1,2003
30
112
El azar y la probabilidad
2. Si se lanzan dos monedas, ¿cuál es la probabilidad de que salgan una cara y un sello?
3. En el lanzamiento de seis monedas:
a. ¿Cuál es la probabilidad de que todas salgan cara o todas sellos?
b. ¿Cuál es la probabilidad que 5 sean caras y una sea sello?
c. ¿Cuál es la probabilidad que 3 sean sellos y tres sean caras?
• GESTIÓN DE LA ACTIVIDAD
Observe que en el triángulo de Pascal cada fila se obtiene de la inmediata superior, de esta
forma se escribe un 1 en cada extremo y debajo de cada par de números contiguos se escribe la suma, así, cada fila representa la posibilidad de que salgan cara o sello al lanzar un
número determinado de monedas.
Es importante resaltar la forma del triángulo de Pascal en la obtención de binomios perfectos, cubos, etc.
Principios fundamentales de conteo
El conteo o enumeración, puede ser un proceso intuitivo primario del niño, que se interioriza o mejor aún se estructura como una intuición secundaria en la escuela al realizar los
primeros estudios sobre aritmética, pero que luego se va desentendiendo o prestando poca
atención debido al “poco” campo de aplicación que se le encuentra en esta etapa para luego
recordársele nuevamente en el álgebra, quizás la geometría y el cálculo en el estadio de las
operaciones formales, lo anterior no tiene sentido ya que se necesita una continuidad en la
formalización de la conceptualización del niño.
Numerosas investigaciones demuestran que con frecuencia los estudiantes universitarios
(adultos) presentan sesgos en su razonamiento probabilístico como una consecuencia de un
razonamiento y una formación deficiente en conteo (combinatoria).
El conteo hace parte de las matemáticas discretas, su estudio sistemático comenzó en el
siglo XVII, cuando se plantearon problemas de tipo combinatorio en el estudio de los juegos
de azar, pues contar el número de objetos que verifican ciertas propiedades es tan importante para encontrar la solución de problemas de diversos tipos, sobre todo en el cálculo de
probabilidades de sucesos.
Para adentrarnos a la obtención de resultados correctos en el desarrollo de las probabilidades, debemos considerar algunos conceptos básicos de conteo al igual que de teoría de
conjuntos ya que ambos son complementarios.
Empezaremos considerando nuevamente la palabra experimento, para referirnos a las
observaciones obtenidas de situaciones tanto en forma incontrolable, así como las que se
obtienen en condiciones controlables.
113
Módulo
5
Pensamiento aleatorio y sistemas de datos
Cuando efectuamos un experimento, se puede tener uno o más resultados, los cuales denominaremos eventos. Aquí se tiene el primer contacto como conjunto. Por ejemplo si deseamos contar el
número de bacterias producidas en un vaso de yogurt, algunos eventos de interés pueden ser:
A: Contenido de 1500 bacterias.
B: el número de bacterias que contiene está entre 1500 y 3000.000
También los eventos pueden estar asociados al lanzamiento de un dado como en la sección
anterior, e interesarnos solamente por:
A: Se observe un número par.
B: se observe un 2 o un tres.
C. Obtener un dos.
Aquí se puede empezar a trabajar en la diferenciación de eventos, pues en el caso de los dados,
la obtención de un número par, se puede descomponer en varios como: obtener 3, 5, 7, 9, 11,
de esta forma el evento inicial se convierte en un evento compuesto, por el contrario el evento
obtener un 2, no se puede descomponer, razón por la cual se le llama evento simple.
Se aprovecha la teoría de conjuntos para expresar las relaciones entre varios experimentos
asociados. Si consideramos los conjuntos en forma topológica como agrupaciones de puntos,
se puede asociar cada evento simple con un experimento, en el cual cada punto distinto es
llamado punto o espacio muestral, así este espacio es considerado como un experimento
en el que se asocian todos los posibles puntos muestrales.
Nace así el concepto de espacio muestral finito, cuando los puntos del experimento son finitos o un número infinito contable (enumerable) de puntos muestrales, tales espacios se les
denomina discretos. Por ejemplo en el conteo de los puntos entre 1500 y 3000.000 es infinito,
pero aquí se puede establecer una correspondencia biunívoca entre el número de puntos
muestrales diferentes y los números enteros.
Puede observarse que el evento es un subconjunto del espacio muestral.
Actividad nº 4 Una obra de teatro
En la institución educativa donde usted labora, se va a montar una obra de teatro, que se
debe estrenar en dos semanas, por lo apresurado de la agenda se escoge a tres hombres
y dos mujeres para que protagonicen los papeles principales (masculino y femenino), de
cuántas formas puede elegir el director a esta pareja?
Actividad nº 5 Vistiendo muñecos
Un grupo de niños de tercero, posee un muñeco el cual deben vestir, es decir colocarle camisa y pantalón, cuentan con tres camisas y dos pantalones, de cuántas maneras diferentes
pueden ellos vestir al muñeco?
114
El azar y la probabilidad
Actividad nº 6 Recién casados
Una pareja de recién casados decide comprar una cocina y un equipo de sonido, el almacén
a donde acuden, le ofrecen 4 tipos de equipo de sonido de tres marcas diferentes y 3 clases
de cocina. ¿De cuántas maneras distintas pueden realizar la compra?
Actividad nº 7 Sobre la subjetividad de la aleatoriedad
Se introducen dos regletas de igual tamaño pero una de color rojo y otra de color amarillo dentro
de una bolsa. Se saca una al azar y se anota el color, se devuelve la regleta a la bolsa.
Situaciones para reflexionar
1. Un estudiante anota los siguientes resultados:
a. R, R, R, R, R, A, A, A, A, A
b. R, A, R, A, R, A, R, A, R, A
c. R, A, R, R, R, A, A, R, A, R
¿Cuál secuencia considera que sea la correcta?
2. Después de haber obtenido un resultado y devolver la regleta a la bolsa, ¿crees que puedas predecir con seguridad el próximo resultado?
3. Si realizas otras 10 extracciones y anotas los resultados, esto sería una especie de
entrenamiento,de acuerdo con lo anterior ¿ es más probable que la próxima regleta sea
roja que amarilla?
4. De los últimos tres resultados escritos, ¿te parece más probable alguno de ellos?
• GESTIÓN DE LA ACTIVIDAD
El objetivo es indagar sobre la percepción del estudiante sobre la regularidad representada en
la convergencia de la frecuencia relativa de sucesos elementales que conllevan a la probabilidad
frecuencialista, con patrones aleatorios de muestras pequeñas. Se interesa también el ejercicio
por la aplicación intuitiva de la regla de Laplace, en cuanto a la equiprobabilidad de eventos.
La respuesta c presenta una sucesión en la cual se manifiesta la regularidad global y la
variabilidad local.
En la segunda pregunta, el objetivo es ver si el estudiante posee el concepto de probabilidad,
debido a que el estudiante puede hablar de suerte, o no comprender el término seguro, o en
un último caso puede creer que puede influenciar el azar, controlando el experimento, por
ejemplo tratando de palpar las regletas. Al respecto, Fischbein dice que en los estudiantes
se presentan algunas distorsiones en los juicios probabilísticos debido a que no poseen
una definición clara de los términos: “cierto”, “posible” e “imposible”, llegando incluso a
confundir raro con imposible.
115
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad nº 8
Colocar 4 regletas de diferente color (amarillo, verde, azul, roja) en fila. ¿De cuántas formas
se pueden alinear?
• GESTIÓN DE LA ACTIVIDAD
Se trata de una situación de colocación de objetos distinguibles (diferentes regletas de diferentes colores) en posiciones (las cuales pueden ser celdas, casillas) distinguibles, igualmente se puede analizar como una situación cuyo esquema es la selección ordenada con
agotamiento de todas los elementos, lo cual hace necesario un riguroso establecimiento de
posiciones (cuatro en este caso) sin repetición (elegir las 4 regletas en orden sucesivo).
Se observa que la regleta roja puede ocupar la primera posición de 4 formas, obteniéndose
un cambio de las demás, esto da la idea básica de permutación y por lo tanto se puede hablar de un modelo como la forma de permutar (cambiar) n elementos tomando n a la vez, sin
tener repeticiones de ellos, así es conveniente aplicar la notación de n!.
Actividad nº 9
Se introducen en una bolsa 4 regletas, dos amarillas, una verde y una café. Se toma una regleta
al azar y se anota su color. Sin volver la regleta a la caja, se toma una segunda regleta y se
anota su color. Se continúa así hasta seleccionar las 4 regletas.¿De cuántas formas diferentes
se puede realizar la selección?.
• GESTIÓN DE LA ACTIVIDAD
Se tiene un esquema donde la selección es el ordenamiento en el cual se combinan elementos
distinguibles y no distinguibles (las dos regletas del mismo color). En este modelo las formas
de obtener las secciones corresponden al cambio de un número determinado de objetos en el
cual se repite una de ellas dos veces. Como puede verse, se trata de una selección exhaustiva
donde el orden es importante y en el cual en las regletas de igual color, el cambio de orden
no produce una nueva selección.
Este modelo para los grados superiores, puede llevarse a la permutación con repetición sin duda con
elementos que el estudiante puede tener en cuenta sin problemas de aprendizaje y aplicación.
116
El azar y la probabilidad
En general, para este modelo igual que el anterior al permutar n elementos tomando r a la vez, es
importante el orden y además se tiene en cuenta los elementos que se repiten de cada grupo.
Una manera importante de ver este concepto es en el trabajo con diagrama arbolar, veamos
o que sucede en este análisis:
La situación del verde se repite para el café, de tal manera que se obtiene una solución del
problema en forma acertada, este tipo de diagrama da al estudiante una visión de la estructura del problema, y a partir de él, los estudiantes asimilan el principio constructivo de las
configuraciones combinatorias y además, les proporciona un significado intuitivo global para
la comprensión del modelo (fórmula) algebraica. Este diagrama también, le da una forma de
lo que significa la enumeración en forma elemental.
Es de anotar que para ejercicios donde el resultado es muy grande, queda casi imposible la
manera de usar este diagrama, además, debe tenerse en cuenta que se pueden presentar
algunas dificultades en el estudiante en la interpretación del diagrama, pues en ocasiones
cuando el número de enumeración es grande, trata de buscar un patrón aplicando una fórmula algebraica que puede ser la no conveniente.
Actividad nº 10
Se dispone de tres vasos iguales con jugo (ver figura). Se desean colocarlos sobre 4 portavasos de diferentes motivos: Uno con la bandera de Antioquia, el otro con la bandera del
Nacional, otro con la Bandera del Medellín y un último con la bandera del Envigado. Como
cada portavaso sólo puede contener a lo sumo un vaso. ¿De cuántas formas se pueden colocar los vasos sobre los portavasos?.
117
Módulo
5
Pensamiento aleatorio y sistemas de datos
• GESTIÓN DE LA ACTIVIDAD
Se trata de un modelo en el cual se trata de colocar objetos no distinguibles (vasos “iguales”) sobre objetos distinguibles (portavasos con diferentes logos), generándose un modelo
donde el orden no interviene, teniendo una selección no ordenada. En este momento, el
docente, según el grado donde está trabajando introduce el concepto de combinación en
forma adecuada. Observe que el orden de colocación de los vasos (selección) no produce
nuevas combinaciones.
Seleccionar 3 vasos “idénticos” entre cuatro portavasos diferentes, se realiza una selección
no exhaustiva ya que en cada portavaso se coloca un solo vaso, de forma que los vasos no
se pueden repetir, de esa forma el orden de selección de los portavasos no produce nuevas
configuraciones, es decir el orden de colocación no influye para la formación de nuevas
configuraciones, lo anterior nos lleva a la idea de combinaciones.
Actividad nº 11
Para simular una lotería, se introducen en una bolsa tres balotas numeradas con los dígitos 3,5 y 6. Extraemos una balota a l azar y anotamos el dígito, no se devuelve a bolsa y se
saca una segunda balota, se repite el proceso. ¿Cuántos números distintos de tres cifras se
pueden obtener?
Actividad nº 12
Un parqueadero dispone de 5 casetas numeradas del 1 al 5, si llegan tres clientes potenciales
y ninguna de las casetas está ocupada, ¿de cuántas formas se pueden parquear?
118
El azar y la probabilidad
• GESTIÓN DE LA ACTIVIDAD
Esta situación trata de colocar tres objetos diferentes (distinguibles) en celdas distinguibles,
se puede interpretar como una situación de selección ordenada sin reemplazamiento, esto
indica que cada que se tome una decisión por parte de un cliente en la escogencia de la
caseta, se produce una nueva configuración, debido a que cada cliente puede seleccionar
una caseta disponible.
Veamos como se puede utilizar el diagrama de las celdas con la aplicación del principio de
la multiplicación:
Observe que el cliente 1 se puede ubicar de 5 formas diferentes, quedando 4 casetas disponibles para el segundo y tres para el tercer cliente.
Pero también, y en grados superiores puede emplearse el modelo algebraico de las variaciones.
En general, se trata de la colocación de r objetos en n celdas, teniendo en cuenta el orden de
colocación, lo cual nos lleva a conceptuar sobre las variaciones.
Actividad nº 13
Un estudiante, posee cuatro láminas de diferentes equipos de fútbol, y decide repartirla
entre tres de sus amigos. ¿De cuántas formas diferentes es posible realizar el reparto?
• GESTIÓN DE LA ACTIVIDAD
Esta situación trata del reparto de un conjunto de objetos diferentes (las láminas) en tres
subconjuntos distinguibles (sus amigos). No hay restricción en la forma de repartición, es
decir, respecto al número de objetos en cada subconjunto, lo cual lleva a la formación de
grupos de 4 personas, entre un conjunto de 3 elementos (personas), con repetición en la cual
el orden de los elementos en el grupo influye.
Este modelo, que es de partición y selección tiene en cuenta la identificación de un patrón
de formación de las configuraciones, veámos un análisis:
El número de elementos a repartir puede ser 0,1,2,3 ó 4 porque un amigo puede recibir
exactamente esa cantidad, ya que si decide darle las 4 láminas a uno sólo, los demás no
recibirán ninguna.
Se puede aprovechar para descomponer el 4 en diferentes y posibles sumandos:
119
Módulo
5
Pensamiento aleatorio y sistemas de datos
a. 4 = 4+0+0 = 0+4+0 = 0+0+4; con lo cual se indica que existe una sola forma de repartir
las láminas (las 4 a cada uno de los 3).
b. 4 = 1+3+0 = 1+0+3 = 3+0+1 = 0+1+3 = 3+0+1 = 0+3+1, cada una de las seis descomposiciones, da lugar a 4 configuraciones posibles (modos de repartir las láminas).Así,
por ejemplo si se tiene las láminas de N, E, M, y C al asignarle una de ellos a un amigo,
las otras 3 se asigna a otro de los amigos.
c. 4 = 2+2+0 = 2+0+2= 0+2+2. Aquí, cada una de las tres descomposiciones obtenidas,
da lugar a 6 configuraciones diferentes, en efecto se puede aplicar el modelo algebraico
de combinación, al no poder repetir objetos y además, como el orden no influye, las dos
láminas que se dan a una persona 4 de 2.
d. Finalmente, 4 = 2+1+1 = 1+2+1 =1+1+2. cada una de estas tres descomposiciones,
da lugar a 12 nuevas configuraciones. Si se han distribuido dos láminas a uno de los
amigos (para lo cual hay 6 configuraciones) las otros dos se distribuyen entre los amigos
restantes, lo cual se puede realizar de dos maneras diferentes, al aplicar el principio de
la multiplicación, se obtienen las 12 configuraciones.
e. Si se suman los totales de las configuraciones, se obtienen: 3x1+6x4+3x6+3x12=81
La otra forma de analizar la situación, que puede ser más conveniente en grados inferiores
a 8º es la colocación en celdas de las reparticiones así:
Observe la acomodación en las celdas (amigos) 4 la asignación de las tres láminas (equipos).
Actividad nº 14
En una bolsa, se tienen 4 balotas seleccionadas con los números 3, 5, 6 y 8. se elige una balota
de la bolsa , se anota su número y se devuelve a la bolsa. Se elige una segunda balota, se
anota su número y se devuelve a la bolsa, finalmente se elige una tercera balota y se anota
su número. De cuántas formas puede obtenerse un número de tres cifras?
120
El azar y la probabilidad
Actividad nº 15 La locura instantánea31
• La situación problémica es: A un arquitecto le piden construir dos columnas formadas
por 4 cubos cuyas caras son de diferentes colores (4), pero las columnas se deben colocar
de modo que aparezcan los cuatro colores (diferentes) en cada uno de los cuatro lados de
la columna. En la segunda los 4 colores iguales en cada uno de los lados de la columna.
• GESTIÓN DE LA ACTIVIDAD
Se empieza a reforzar el trabajo con estudiantes de octavo y noveno grado basados en las
situaciones problemas y el uso adecuado de las regletas de Cuisinaire. En esta fase se logra incrementar el razonamiento de los estudiantes, y a potenciar la creatividad lógica en general.
Se trata de contrastar en parte, la teoría de Fischbein32 realizando indagaciones en estudiantes cuyas edades oscilan entre 9 a 13 años y circunstancias bajo las cuales éstos adquieren esquemas combinatorios, así como las posibilidades y estrategias de intervención
didácticas pertinentes.
Se debe primero dibujar en el plano el cubo y luego pintar las caras y después armar los
cubos y de esta manera tratar de hallar la solución. La situación anterior se resuelve de la
siguiente forma en el aula:
Formar grupos de cuatro estudiantes, cada uno construye un cubo de iguales dimensiones por
ejemplo todos de 5 cm. de lado. Se pintan con colores diferentes las seis caras (pueden ser:
_____________________________________________________
Adaptado del texto: Matemáticas Discretas y combinatoria. Pág. 541 Ralph P. Grimaldi
Effects of age and instruction on combinatory hability in children. (1970)
31
32
121
Módulo
5
Pensamiento aleatorio y sistemas de datos
amarillo, azul, rojo, verde). El objetivo del juego es colocar los cubos en una columna, de modo
que aparezcan los cuatro colores diferentes en cada uno de los cuatro lados de la columna.
Luego cada columna con los 4 colores diferentes por cada cara de la columna formada.
Para intentar estimar el número de disposiciones posibles, se pueden realizar las siguientes
preguntas:
a. Si queremos colocar el primer cubo en la parte inferior de la columna,¿cuántas formas hay
de hacerlo?.
b. Al colocar el cubo 2 sobre el primero, de cuántas maneras se puede hacer?.
c. Si continuamos con este razonamiento cuántas formas hay en total para los cuatro cubos?.
Este problema se puede extender de acuerdo con el grado, se les pide que pinten las 6 caras
de los 4 cubos, repitiendo 2 colores y se le realizan las mismas preguntas. Se pueden dejar
dos caras sin pintar y resulta otro tipo de ejercicio. Se puede dejar una sola cara sin pintar y
las otras caras con diferentes colores etc. Realizarlo con todas las caras de diferentes colores.
Se debe manejar cada situación que se presente y analizarlas siempre con 4 cubos y con las
mismas condiciones, ya que si presenta las diferentes situaciones para armar una columna
(por ejemplo 1 cubo sin dos caras sin pintar, 1 con 2 caras repetidas, otro con 6 colores diferentes etc.) se le forma ya no una situación sino un verdadero caos.
Hacer 4 cubos con los mismos colores y se repiten dos colores
Otra variación, hacer 4 cubos dejando dos caras sin pintar.
Veamos como se podría solucionar la situación inicial:
122
El azar y la probabilidad
Cubo 1
Cubo 2
Cubo 3
Cubo 4
Observe que la situación anterior requiere:
1. Saber donde ubicar cada color, ya que al armar los cubos, se pueden tener una o ninguna
solución de la situación.
2. Aprovechar la manera de mover los cubos para enseñar el concepto de rotación y las formas
en que puede realizarse.
3. Conceptuar sobre combinaciones y permutaciones.
4. También se introduce el concepto de probabilidad, después de obtener el espacio muestral.
Las preguntas a resolver:
1. ¿De cuántas formas se puede ubicar el cubo de la base?
2. ¿Cuántas opciones tiene el siguiente cubo?
3. El tercer cubo de ¿cuántas maneras puede ubicarse?
4. ¿Y el cuarto?
5. En total ¿cuántas formas existen de formar las combinaciones?
6. ¿Cómo se resolverá la situación si se pintan los cubos con 6 colores diferentes?
Estimemos el número de disposiciones posibles. Si se quiere colocar el cubo1 en la parte
inferior de la columna, hay a lo sumo cuatro formas posibles, al desdoblar el cubo 1 vemos
que no hay diferencia si se coloca la cara roja o la cara amarilla opuesta sobre la mesa. Sólo
nos interesa las 4 caras restantes en la base de la columna. Con tres pares de caras opuestas,
habrá como máximo cuatro formas de colocar el primer cubo. Ahora considere el segundo
123
Módulo
5
Pensamiento aleatorio y sistemas de datos
cubo, aunque se repitan algunos colores, ningún par de caras opuestas tiene el mismo color. Por lo tanto se tienen 6 formas de colocar el segundo cubo sobre el primero. Entonces
podemos rotar el segundo cubo sobre el primero para ubicar la columna con diferentes
colores, de tal forma que no se cambie la cara de arriba del primer cubo o la cara de abajo
del segundo cubo. Así con 4 rotaciones posibles se puede colocar el segundo cubo de 24
formas diferentes; observe que se hace necesario la aplicación del teorema fundamental de
la multiplicación, continuamos con este razonamiento, y se observa que hay 4*24*24*24 =
55296 FORMAS POSIBLES POR CONSIDERAR para resolver el problema, sin embargo podría
no haber solución al armar las torres.
Ahora resuelva la situación para la segunda columna.
Actividad nº 1633
Al acabar una reunión a la que asisten cierto número de personas, entre ellas se dan la mano.
¿Cuántos apretones de mano se dieron si había 5 personas?.
¿Cuántos apretones de mano se dieron si había 7 personas?.
¿Cuántas personas había si en total se dieron 6 apretones de mano?.
¿Cuántas personas había si en total se dieron 45 apretones de mano?
Llamando n al número de personas escribe una expresión en función de n que dé el número
de apretones de mano.
• GESTIÓN DE LA ACTIVIDAD
Esta situación puede relacionarse con una análoga de Geometría plana, basta para ello sugerir
al estudiante una representación, que por una parte le permite hallar la expresión pedida,
basado en regularidades y patrones, en donde las personas se representan por puntos del
plano (no alineados) y cada apretón un segmento que tiene por extremo dos de los puntos
dibujados, como se ve a continuación.
En este caso se obtendrá un saludo entre dos personas A y B.
Entre tres personas, se da la siguiente ilustración.
Lo que nos indica que hay 3 apretones de manos entre tres personas
_____________________________________________________
Adaptada de Carmen Azcarate y Jordi Deulofeu. Funciones y gráficas.
33
124
El azar y la probabilidad
Si hay 4 personas, ocurre algo más estructurado
Lo que indica que intervienen las diagonales del cuadrado, en este caso se tiene 2 diagonales
sumadas al número de lados, nos da 6 saludos. Observe que “parece” ser que de cada vértice
sale una diagonal por lo que en total para la suma de diagonales por vértice se tienen 4; sin
embargo cada diagonal es realmente una línea, de esta manera, existen dos diagonales en
cualquier cuadrilátero.
A partir de este momento se le propone al estudiante hallar el número de diagonales de un
polígono, conocido el número de vértices del mismo.
Así desde el grado 6º se puede llevar a cabo la solución de la siguiente forma: teniendo en
cuenta esta tabla, presentada por Múnera :
Figura
polígono
Nº
Lados
Nº
vértices
Nº
diagonales
que salen por
cada vértice
Total de
diagonales que
salen de todos
los vértices
Total de
diagonales en
el polígono
Total
saludos
5
5
2
10
5
10
Triángulo
Cuadrilátero
Pentágono
Hexágono
Heptágono
Octágono
Nonágono
Decágono
Eneágono
n
Se debe llegar a la siguiente conclusión para el total de saludos:
, a partir de
la cual se debe variar el tipo de pregunta y de acuerdo con el grado.
_____________________________________________________
Tabla adaptada de Jhon Jairo Múnera, en el documento: construcciones de aprendizajes matemáticos desde el enfoque de situaciones problemas.
34
125
Módulo
5
Pensamiento aleatorio y sistemas de datos
Observe que la solución a la situación se puede realizar utilizando el modelo de combinación, ya que se tiene n personas para que se saluden entre dos, lo cual nos conlleva a
saludos para el caso de encontrasen 30 personas.
Actividad nº 17
De cuántas formas diferentes pueden sentarse alrededor de una mesa circular un padre y
sus tres hijos?
• GESTIÓN DE LA ACTIVIDAD
En este tipo de actividad, se agrupan los elementos de tal manera que se deja en una posición
fija un elemento, en este caso p que representa al padre, las demás posiciones las cuales
son h1, h2, y h3 se deben permutar para obtener el número pedido de formas diferentes.
Observe que se tienen en total 6.
Se debe proponer al estudiante un proceso con 5 elementos para buscar un patrón que lo
guíe hacia una conclusión, la cual le permita obtener permutaciones circulares para cualquier número de elementos.
Actividad nº 18
¿De cuántas formas diferentes pueden ubicarse las vocales y las consonantes b y c en la
siguiente figura?
126
El azar y la probabilidad
• GESTIÓN DE LA ACTIVIDAD
En esta actividad debe tenerse en cuenta el principio fundamental de la multiplicación, en
el cual se permuta en forma circular 6 elementos y el otro elemento queda ocupando una
posición central, para ello debe basarse en el patrón obtenido en la propuesta anterior.
OTRAS SITUACIONES CON PROBABILIDADES
• GESTIÓN DE LA ACTIVIDAD
El objetivo de la actividades siguientes es observar de modo a priori las conclusiones de
los estudiantes, ya que la mayoría puede decidir que la respuesta correcta es la d, en la
actividad nº 1, sin tener en cuenta el razonamiento combinatorio puesto en escena en las
actividades anteriores, recurriendo de esta manera al sesgo de la equiprobabilidad, además,
intervienen los sucesos compuestos.
Para la actividad nº 2 se pone en juego la equiprobabilidad y la estimación frecuencial de la
probabilidad.
En la tercera actividad, se trata de que el estudiante se inicie en predecir algunas situaciones,
basado en reglas sencillas que le serán de utilidad para calcular probabilidades de eventos
compuestos, los cuales son dependientes o independientes.
Actividad nº 19
Cuando se lanzan tres dados simultáneamente, ¿Cuál de los siguientes resultados es más
probable que ocurra?
a. un 3, un 2 y un 5.
b. Un 6 tres veces.
c. Un 4 dos veces y un 6.
d. Los tres resultados son equiprobables.
e. Es imposible saberlo.
Actividad nº 20
¿Cuál de las siguientes afirmaciones te parece verdadera cuando se lanza un dado?. Dar una
explicación a tu razonamiento.
a. La probabilidad de obtener un tres es mayor que la de obtener un cinco.
b. La probabilidad de obtener un dos es menor que la de obtener un cuatro.
c. La probabilidad de obtener un uno es igual a la de obtener un seis.
d. La probabilidad de obtener un dos es mayor que ½.
127
Módulo
5
Pensamiento aleatorio y sistemas de datos
Actividad nº 21
Si se tiene en una bolsa 3 regletas de color blanco y tres de color azul, de tamaños congruentes (igual medida) y forma, describe todos los posibles resultados si:
a. Se saca la primera regleta, se anota su color y se introduce en la bolsa nuevamente.
b. Igual al anterior, pero no se devuelve la regleta a la bolsa.
Actividad nº 22
Al lanzar dos monedas simultáneamente, ¿es más fácil obtener una o dos caras?
• GESTIÓN DE LA ACTIVIDAD
Una forma de representar las posibilidades de la actividad anterior, es el cálculo de las probabilidades a partir del diagrama arbolar, muy útil cuando se trata de experimentos compuestos, a continuación se puede observar la construcción de dicho árbol.
Un análisis es :puesto que en la mitad de las veces se obtiene cara en el primer lanzamiento
(experimento) y de esta mitad, la mitad de las veces se obtiene cara en el segundo lanzamiento, la probabilidad de obtener dos caras es la mitad de un medio, lo que es un cuarto.
En el diagrama del árbol, matemáticamente, la probabilidad final de un resultado se obtiene
como el producto de las probabilidades en cada rama que lleva a dicho resultado.
Conceptos y procedimientos
En la siguiente actividad es de vital importancia el reconocimiento de la relación existente
entre la combinatoria y la probabilidad, además, se estudian las concepciones de los estudiantes sobre las sucesiones de Bernoulli, empezando por la idea de sucesión limitada de
ensayos, que progresivamente se va ampliando.
Uno de los conceptos que interviene es el de probabilidad condicional, el cual nos indica
la probabilidad de que un evento B suceda cuando se sabe que algún otro evento A se ha
128
El azar y la probabilidad
presentado, lo anterior se expresa matemáticamente como P(B | A). esta expresión, comúnmente se lee “la probabilidad de que el evento B ocurra dado que ocurrió A”. Como fórmula
funciona de la siguiente manera:
P(A | B) = P (A ∩ B)/ P(A), en donde P(A∩B) es la probabilidad de que los sucesos A y B se
den simultáneamente, teniendo en cuenta el espacio muestral.
Para los eventos independientes, la ocurrencia de uno, no afecta al otro, teniendo entonces
matemáticamente la siguiente forma:
Dos eventos A y B son independientes, si y sólo sí:
P(B |A) = P(B) y P(A| B) = P(A)
Lo anterior trae como consecuencia que: P(A∩B) = P(A)P(B) en eventos independientes.
La actividad presta atención primero en que se trata de una experiencia aleatoria, y como
segundo, nos hallamos frente a una breve sucesión de pruebas Bernoulli, ya que cada extracción tiene en cuenta dos posibles resultados.
Actividad nº 23
En una bolsa se tienen dos regletas, una de color verde y otra de color amarillo, ambas de
iguales dimensiones (forma y tamaño). Se saca una de ellas, se anota su color y se devuelve
a la bolsa.
a. Realiza la experiencia dos veces más.
b. ¿Crees que existen otras posibles secuencias en la extracción de las regletas?. En caso
afirmativo, escribe alguno de los resultados que podrían haber salido.
c. De los últimos resultados que escribiste, ¿cuál te parece más probable?.Explique.
d. ¿Es posible escribir todos los posibles resultados que se pueden obtener al sacar tres
veces una regleta de la bolsa, si cada vez se devuelve la regleta a la bolsa?
e. Realiza 5 extracciones y anota su resultado.
f. De acuerdo con los resultados anteriores ¿es más probable que la próxima regleta extraída
sea azul?
g. Supongamos que se tiene el siguiente juego entre dos personas, y una de ellas apuesta a
que siempre saca la regleta amarilla. En cada extracción se juega una moneda de $50. Si
la regleta sale amarilla, gana $50 en caso contrario pierde una moneda de $50. La persona
al principio del juego tenía 50 monedas. Realiza esta prueba 10 veces como si fueses el
apostador y anota tus resultados.
h. Según los resultados,¿cuántas monedas tendrías ahora?.
i. Haz una gráfica, de acuerdo a la frecuencia y el número de monedas que tienes después
de cada jugada. ( Repita el experimento 3 veces de la extracción de las diez regletas)
129
Módulo
5
Pensamiento aleatorio y sistemas de datos
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
44
43
42
41
40
1
2
3
4
5
6
7
8
9
10
j. Después de las 5 primeras jugadas, el jugador tenía 51 monedas. Ha pasado de 50 a 51
monedas siguiendo la secuencia: A V A A V.
k. ¿Existen otras secuencias?.
l. ¿Cuál es la mayor ganancia que se puede obtener en las 5 primeras jugadas?
m.¿Es lo anterior poco o muy probable?
n. El jugador tiene ahora 53 monedas y va a realizar tres jugadas más. ¿es más probable
que después de estas jugadas tenga nuevamente 53 monedas, que tenga tres más o que
tenga tres menos que antes? Explica.
Actividad nº 24
Para la ruleta representada por el gráfico siguiente:
130
El azar y la probabilidad
El conjunto de resultados posibles es {verde, amarillo, rojo}, con la siguiente función frecuencial:
Rojo
¼
Verde
3/8
Amarillo
3/8
¿Cuál es la probabilidad de obtener el suceso {rojo, verde}?
Actividad nº 25
¿Cuál es la probabilidad de obtener cara y 6 en el lanzamiento simultáneo de una moneda
y un dado?
Actividad nº 26
En una bolsa se tienen 3 bolas de color rojo y 6 bolas de color amarillo. Se extraen sucesivamente
dos. Llamamos el suceso A=”obtener la bola roja” y el suceso B=”obtener la bola roja”.
Hallar la probabiliodad de obtener los sucesos A y B, es decir, P(A y B) en los siguientes casos:
a. Se devuelve la primera bola a la bolsa.
b. No se devuelve la bola a la bolsa.
Actividad nº 27
Una urna contiene 6 monedas de $500 y 4 de $100. Se extraen dos monedas, una a continuación de otra y sin reemplazamiento.
¿Cuál es la probabilidad de que ambas sean de $100?.
¿Cuál es la probabilidad que la primera sea de $500 y la segunda de $100?
¿Cuál es la probabilidad que las dos sean del mismo valor?
¿Cuál es la probabilidad que la segunda sea de $500?
131
Módulo
132
5
Pensamiento aleatorio y sistemas de datos
Construcciones Básicas del Doblado de Papel
Bibliografía
ABEL, Díaz. Armando., Gutiérrez (1986). Curso de estadística general. U de A. Facultad de
educación.
BATANERO, C. (2000) .Significado y comprensión de las medidas de posición central.
BATANERO, C. (2001). Didáctica de la estadística. Geeug.Granada.
BATANERO, C., Godino, J , y Navarro _ Pelayo. (1994). Razonamiento Combinatorio. Madrid.
Síntesis.
BATANERO, C., J.Godino. (1997). Concepciones de los maestros de primaria en formación sobre
los promedios.(paper).
BATANERO, C., J.Godino.,D. R.Green.,P. Holmes y A. Vallecillos. Errores y dificultades en la
comprensión de los conceptos estadísticos elementales.(Paper).
BATANERO., Godino y Navas (1997) .Concepciones de los maestros de primaria en formación
sobre los promedios.(paper).
Biblioteca de Consulta Microsoft ® Encarta ® 2005. © 1993-2004 Microsoft
BROUSSEAU, G.( 1983).. Les obstacles epistèmologiques et les problèmes en mathèmatiques.
Recherches en didactique des mathematiques.
CAÑIZARES, Jesús.(1997). Influencia del razonamiento proporcional y combinatorio y de creencias
subjetivas en las intuiciones probabilísticas primarias. Tesis de doctorado.
CISNEROS, José y otros. (2005). Implementación e interpretación de los estándares básicos de
Matemáticas. Medellín.
CISNEROS, José. Estadística. Educación semipresencial. Coopropol.1998.
COBO, Belen y Carmen, Batanero. (2000). La mediana en la educación secundaria obligatoria:¿un
concepto sencillo.(paper). .
CURSIO, F. (1989). Developing graph comprensión. Reston.
133
Módulo
5
Pensamiento aleatorio y sistemas de datos
DUBOIS, J.G (1984). Une sistematique des configurations combinatories simples. Educational
studies in mathematics. Paris.
ENGEL, A (1973). Probabilidad y estadìstica. Valencia.
ENGEL, A., Varga, T. y Walter, W. (1976). Hasard ou strategie?. Paris.
ESTRADA, Asunción. Análisis de las actitudes y conocimientos estadísticos elementales en la
formación del profesorado.(paper).
FISCHBEIN, E. (1975). The intuitive sources of probabilistic thinking in children.
FISCHBEIN, E. y Gazit, A. (1988). The combinatorial solving capacity in children and adolescents.
GODINO, J ., Batanero, C. (2001) Estocástica y su didáctica para maestros. Granada.
GODINO, J., Batanero, C. y Cañizares, M. (1987). Azar y probabilidad. Fundamentos didácticos
y propuestas curriculares. Editorial Síntesis.
GULLON, A.(1970). Introducción a la estadística aplicada. Editorial Alambra.
INHELDER, B y Piaget, J. (1955). De la logique de l’enfant a la logique de l’adolescent. Paris.
KAHNEMAN, D., Slovic, P. y Tversky, A. (1982). Judgement Ander uncertainty: Heuristics and
biases. Cambrige university.
KREYSZIG, Erwin (1973). Introducción a la estadística aplicada. Principios y métodos.Edit Limusa..
LEVIN, Richard.(1996) Estadística para administradores. Prentice Hall.
MENDENHALL,William., Scheaffer, Richard. y Wackerly, Dennis.(1986) Estadística Matemática
con aplicaciones. Grupo editorial Iberoamèrica.
MINISTERIO DE EDUCACIÓN NACIONAL .Lineamientos curriculares para matemáticas. Santafè
de Bogotá.1998.
MINISTERIO DE EDUCACIÓN NACIONAL. Análisis de Pruebas saber. Consultado de: http//
www.colombiaaprende.edu.co .
MINISTERIO DE EDUCACIÓN NACIONAL. Estándares básicos de Matemáticas y Lenguaje
.Santafè de Bogotá. 2003.
134
Bibliografía
MÚNERA, J.(2006). Construcción de aprendizajes matemáticos desde el enfoque de situaciones
problemas. Revista Formando maestros.I.E. Normal Superior de Envigado Nº 3.
PIAGET, J. e Inhelder, B. (1951). La gènese de l’idèe de hasard chez l’enfant. Paris. Presses Universitaires de France.
POLYA (1957). Cómo plantear y resolver problemas. Mèxico . Edit.Trillas.
PUGACHEV (1973). Introducción a la teoría de las probabilidades. Editorial Mir.
RALPH P. Grimaldi. Matemáticas discreta y combinatoria. Edi. Adison Wesley Longman.
ROA, Guzmán.(2000) Razonamiento Combinatorio en estudiantes con preparación matemática
avanzada. Tesis de doctorado. Granada.
SERRANO, L (1996). Significados institucionales y personales de objetos matemáticos ligados a la
aproximación frecuencial de la enseñanza de la probabilidad. Tesis de doctorado.Granada.
TUKEY,J.W.(1997). Exploratory data anales. Addisson Wesley.
VICENTE, Manzano y Ana, Duran . Anales de psicología (2001, Vol. 17): Comprensión y medida
del concepto de simetría.
135
Módulo
136
5
Pensamiento aleatorio y sistemas de datos