Download Figure 2: Diagrama general de la red bayesiana.

Document related concepts

Red bayesiana wikipedia , lookup

Sistema de tutoría inteligente wikipedia , lookup

Transcript
Eighth LACCEI Latin American and Caribbean Conference for Engineering and Technology (LACCEI’2010)
“Innovation and Development for the Americas”, June 1-4, 2010, Arequipa, Perú
Combinación de Técnicas de Inteligencia Artificial para mejorar
la atención diferenciada del alumno en un Sistema Tutor
Inteligente
Moisés Alaín Mayet Solano
Universidad de las Ciencias Informáticas, La Habana, Cuba, [email protected]
Yoan Martínez Márquez
Universidad de las Ciencias Informáticas, La Habana, Cuba, [email protected]
Reinier Castillo González
Universidad de las Ciencias Informáticas, La Habana, Cuba, [email protected]
Dannier Trinchet Almaguer
Universidad de las Ciencias Informáticas, La Habana, Cuba, [email protected]
RESUMEN
El presente trabajo muestra la combinación de varias técnicas de Inteligencia Artificial (IA) en la creación de un
Sistema Tutor Inteligente (STI) para la enseñanza del idioma inglés. El lograr que un STI funcione como tal y lo
haga de una manera diferenciada a las características de cada estudiante, es un reto, pues en el proceso enseñanzaaprendizaje intervienen muchos factores que son casi imposibles de modelar computacionalmente, como son el
estado de ánimo y la concentración. Sin embargo en la mayoría de los tutores inteligentes se aboga por una
técnica de IA, en este artículo se combinarán 3 de ellas, reglas de producción, redes bayesianas y lógica fuzzy,
para explotar cada una de sus cualidades en cada etapa del aprendizaje del estudiante.
Palabras claves: bayesianas, fuzzy, ia, reglas, sti.
ABSTRACT
This work shows the use of different Artificial Intelligence techniques (AI) in the creation of an Intelligent
Tutoring System (ITS) for teaching English. To make an ITS work as it should, and to do it in a more personal
way, taking into account the characteristics of each student, is a challenge, because in the teaching-learning
process there are many factors involved that are almost impossible to model, for example, the mood and the
concentration. However, in most of the intelligent tutors AI techniques are used, and this article will combine 3 of
them to exploit its strengths in each stage of the learning process.
Keywords: ai, Bayesian, fuzzy, its, rules.
1. INTRODUCCIÓN
En las últimas décadas ha llegado a la rama de la educación los Sistemas Tutores Inteligentes, que se han ido
introduciendo poco a poco en distintos niveles educacionales, ya sean escuelas, universidades o cursos online en
internet. Un STI, “es un sistema de software que utiliza sistemas inteligentes para asistir al estudiante que
requiere de un tutorizado uno a uno y lo guía en su aprendizaje, adicionalmente posee una
representación del conocimiento y una interface que permite la interacción con los estudiantes para que
puedan acceder al mismo” (VanLehn, 1988).
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 1
June 1-4, 2010
Con la introducción de tutores inteligentes en la educación no se pretende reducir el coste efectivo de la aplicación
de teorías y principios de intervención pedagógica, sino que posibilita la exploración de modelos capaces de
adaptarse a cada uno de los alumnos que aprenden con su uso, contribuyendo con la autopreparación en una
temática dada. Los STI pueden utilizarse de diferentes formas al incluirse en el proceso enseñanza-aprendizaje en
cualquier sistema, ya sea con sentido ocupacional o académico.
Con este trabajo se propone una interrelación de técnicas de IA para crear un tutor inteligente para la enseñanza
del idioma inglés. La lengua inglesa tiene una relevancia primordial en el currículo de cualquier profesional. Su
importancia radica en que es el idioma más utilizado para la comunicación entre personas de diferentes partes del
mundo. Su uso se extiende desde los principales eventos académicos y sociales, dígase conferencias
internacionales, cursos de superación y doctorados, hasta las importantes bibliografías y artículos generados por
investigaciones.
Es muy importante que el STI sepa tutorar de forma diferenciada cada alumno y que se ajuste a las habilidades y
conocimiento sobre la materia con que cuenta el tutorado, además de tener en cuenta los nuevos conocimientos
que va adquiriendo a medida que transcurre el proceso de aprendizaje.
2. JUSTIFICACIÓN
Se conoce que la necesidad de la enseñanza del idioma inglés en los diferentes niveles educacionales en
Latinoamérica y el desnivel entre las personas con acceso a la educación y las que no pueden contar con este
derecho. La presente investigación permitirá a partir de algoritmos de Inteligencia Artificial desarrollar un STI
que se adapte constantemente a las características individuales de cada estudiante, mejorando así el proceso
enseñanza-aprendizaje en este tipo de software. El STI podrá ser utilizado en cualquier sistema educacional, así
como forma de autosuperación en otros sectores no educacionales, aportando a la calidad del profesional
latinoamericano.
3. METODOLOGÍA
En otros trabajos se ha abordado el marco de que algoritmos utilizar en la creación de un STI. En este tema se
han hecho buenas propuestas como, [Millán, 2001], [Sierra, 2004] y [Salgueiro, 2005]. En todos ellos se ha
hecho énfasis en la importancia de los tutores inteligentes y que metodología sería la más conveniente. En el caso
que se presenta en este artículo se trata de un diseño para la enseñanza del idioma inglés a estudiantes de
cualquier nivel. El tutor debe ser flexible y acogerse a las particularidades de aprendizaje de cada alumno.
El estudiante deberá someterse a los cuestionarios iniciales, que no son más que tests prediseñados para
determinar el tipo de aprendizaje que prevalece en el alumno. Una vez terminado el proceso anterior teniendo en
cuenta la información arrojada por dicha labor, se le realizarán diagnósticos para determinar el nivel de
conocimiento del idioma inglés, a partir de aquí se le programarán una serie de actividades que se deben cumplir
para poder alcanzar un nivel superior. Luego vencidas dichas labores, al tutorado se le permitirá coordinar una
cita para presentarse al examen final, que será quien le acredite el nivel alcanzado. El proceso se muestra en la
siguiente figura.
Figure 1: Arquitectura del STI propuesto
3.1 REGLAS DE PRODUCCIÓN
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 2
June 1-4, 2010
EnComo se muestra en la figura 1, el estudiante comenzará realizando tests iniciales, que servirán para determinar
estilos de aprendizaje. Estos diagnósticos serán estáticos y predefinidos por un experto, ya que se cuenta en la
rama pedagógica con un gran número de estos.
Los sistemas basados en reglas son los más comúnmente utilizados, debido a su eficiencia y sencillez a la hora de
implementar tareas como la de determinar los resultados de un test.
Las reglas no son más que una proposición lógica que relaciona dos o más enunciados. Se pueden dividir en
premisas y conclusiones.
La estructura de una regla es:
SI <premisa> ENTONCES <conclusión>
Estas estructuras serán utilizadas también a la hora de determinar el formato, nivel y complejidad de los
diagnósticos de idioma, actividades y exámenes que realizarán los alumnos.
Los diagnósticos que se realizarán aunque serán elaborados también con anterioridad por un experto, solo serán
maquetas, pues las preguntas que estos aplicarán serán puestas de forma automáticas por el sistema, así como
también cuál de las maquetas se le pondrá a cada alumno. Para la evaluación de las reglas de producción se tendrá
en cuenta la teoría de cálculo de certeza para un mayor desempeño en el tratamiento de la incertidumbre que
pueda haber en la evaluación del experto. A partir de aquí se creará un perfil del estudiante el cual se irá
actualizando de forma constante con las actividades que debe ir cumpliendo posteriormente el tutorado. Las
actividades y el examen final tendrán características similares a las de los diagnósticos.
3.2 REDES BAYESIANAS
Debido a que el principal interés del trabajo es lograr que el STI diferencie el trabajo con cada alumno se decidió
llevar un perfil de cada estudiante. Dicho perfil estará compuesto por el estilo de aprendizaje que arrojen los tests
iniciales, además de resultados de los diagnósticos iniciales de idioma y el desempeño que vaya teniendo el
tutorado a lo largo del curso. Para el control de toda esa información se decidió usar redes bayesianas.
Las redes bayesianas son un modelo probabilístico multivariado que relaciona variables aleatorias mediante un
grafo dirigido, debido a esto son muy útiles en la estimación de probabilidades ante nuevas evidencias.
En la red se tendrán en cuenta tres variables que serán quienes rijan el proceso de aprendizaje. Teniendo en cuenta
que lo que se desea es la representación del conocimiento en el idioma inglés, según la metodología aplicada, las
variables seleccionadas fueron, el nivel que dependerá de la variable habilidad, esta última tendrá en cuenta las
habilidades básicas del idioma, como son audición, lectura y escritura. La tercera variable es la que mide los
objetivos, que tributarán a vencer una habilidad.
Viendo cada variable por separado, se tendrá que cada objetivo estará representado por la letra O, la misma tendrá
un valor binario:
0, si el objetivo no fue vencido.
O=
1, si el objetivo fue vencido.
La probabilidad de la variable O estará definida por:
donde p es la probabilidad de que se haya vencido el objetivo O. El valor de la x puede ser 0 ó 1.
La variable habilidad se representará con la letra H y estará formada por un par (O, w), donde:
 O es un conjunto de objetivos, O = {O1, ..., On} que serán independientes entre sí.
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 3
June 1-4, 2010
 w = (w1, ..., wn) es el vector de pesos que representa la importancia de cada objetivo en la habilidad a la
que pertenece. De lo anterior se tendrá:
n

wi  1
i 1
Teniendo en cuenta lo antes expuesto una habilidad estará dada de la siguiente forma:
n
H
wO
i
i
i 1
De la conclusión anterior se deriva que la variable aleatoria H está dada por:
P( H 

iS wi )
 p  (1  p
i
iS
k
kS
)
,
para cada S {1, ..., n}, donde Pi = P(Oi = 1), para i = 1, ..., n.
El nivel se nombrará con la letra N y está constituido por un par (H, α), donde:
 H son las habilidades necesarias para vencer un nivel, representadas en un conjunto HT = {H1, ..., Hs},
que serán independientes entre sí.
 z = (z1, ..., zn) es el vector de pesos que representa la importancia de cada habilidad en el cumplimiento
del nivel. Al igual que el caso de las habilidades, de lo anterior se tendrá:
n

zi 1
i 1
Dada la jerarquía diseñada donde un nivel estará compuesto por varias habilidades y a su vez estas por un grupo
de objetivos se puede decir que:
n
H j   wij Oij
j 1
De donde se obtiene que:
P( H j 
iS j
wij ) 
 p  (1  p
ij
iS j
kj )
kS j
,
para cada Sj ⊆ {1, ..., n}, donde pij = P(Oij = 1), para i = 1, ..., n.
Para la representación del conocimiento en un nivel se hará de la siguiente forma:
s
N

zi H i
i 1
Por lo tanto el cálculo de la probabilidad estará dado por:


P N 


s

j 1

z

 j iS j wij   





pij
1  p jk

j 1 
i

S
k

S
j
j

  
s




donde Sj  { 1, ..., nj }.
La red bayesiana quedaría de manera general como se muestra en la siguiente figura.
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 4
June 1-4, 2010
Objetivo 1.1
Figure 2: Diagrama general de la red bayesiana.
3.3 LÓGICA FUZZY
La red bayesiana se actualizará a partir de los valores probabilísticos del cumplimiento de los objetivos, estos
valores serán aportados por los diagnósticos de idiomas que se les aplicarán a los estudiantes y por las diferentes
actividades que el mismo realizará. Cada una de estas evaluaciones medirá el cumplimiento de los objetivos
aplicando técnicas fuzzy, debido a los factores de incertidumbre que estos tipos de evaluaciones tienen.
La también llamada lógica borrosa es una poderosa herramienta a la hora de tratar los diferentes umbrales que
pueden aparecer cuando se realiza una evaluación. De esta manera un estudiante que obtuvo la nota de 4 puntos al
responder 9 preguntas bien, de 10 posibles se puede diferenciar de otro que también alcanzó 4 puntos pero solo
respondiendo 7 preguntas de forma correcta.
Con el uso algoritmos fuzzy se puede precisar con mayor fidelidad qué nivel y qué tipo de ejercicios el tutor le
pondrá a cada estudiante, ajustándose así de una manera un poco más exacta a las cualidades de aprendizaje de
cada tutorado.
Se tendrán como variable lingüística la nota de la evaluación y las etiquetas B (bien), R (regular) y M (mal), para
la evaluación de las T-Normas y S-Normas se utilizará la función de mínimo-máximo. Finalmente la
desfuzzificación se realizará mediante el método del centroide.
En el momento de hacer la inferencia, se tendrán en cuenta tres aspectos importantes a la hora de un estudiante
responder una pregunta:
1. Dificultad: Define el nivel de complejidad que tiene la pregunta. Estará denotado por la letra “a”.
2. Discriminación: Permite diferenciar actitudes antes una pregunta entre estudiantes de un mismo nivel.
Estará denotado por la letra “b”.
3. Adivinanza: Probabilidad de que un estudiante al responder correctamente este adivinando la respuesta.
Estará denotado por la letra “c”.
Teniendo en cuenta lo anterior se tendrá que la probabilidad de que un estudiante responda correctamente una
pregunta utilizando el modelo logístico de tres parámetros es la siguiente:
P( x)  u  1 /   x   c 
1 c
1  e 1.7 b ( x  a )
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 5
June 1-4, 2010
de esta manera se aumentará la certeza a la incertidumbre de saber la nota de un estudiante en una evaluación del
tutor.
4. CONCLUSIONES
Como resultado del trabajo realizado se ha diseñado un STI que aplica tres técnicas de Inteligencia Artificial en
diferentes niveles del proceso de aplicación del mismo, como son las reglas de producción en el momento de
evaluar los tests iniciales y proponer exámenes y actividades, redes bayesianas para conformar el perfil del
estudiante y la lógica fuzzy para la evaluación de los diagnósticos, actividades y exámenes que realizarán los
tutorados.
A partir de la combinación antes dicha, se obtiene un desempeño del STI que se ajustará en mayor medida a otros
propuestos en trabajos anteriores. De esta forma los estudiantes que serán tutorados por la aplicación contarán con
un tutor que trabajará con mayor particularidad en las diferencias y exigencias de aprendizaje de cada uno de los
distintos alumnos.
REFERENCIAS
Anderson, J. R., C. F. Boyle, et al. (1985). Intelligent tutoring systems. 228: 456-462.
Cataldi, Z. and F. Lage (2002). Los Preconceptos de Docentes y Alumnos en el Proceso de EnseñanzaAprendizaje de Computación en carreras de Grado y Postgrado, Aceptado en CBComp.
Cataldi, Z. and F. J. Lage (2009). SISTEMAS TUTORES INTELIGENTES ORIENTADOS A LA
ENSEÑANZA PARA LA COMPRENSIÓN: 4.
Cataldi, Z., F. Salgueiro, et al. (2005). Sistemas tutores inteligentes: los estilos del estudiante para selección del
tutorizado: 66-70.
Cataldi, Z., F. Salgueiro, et al. (2005). Sistemas tutores inteligentes: los estilos del estudiante para selección del
tutorizado: 66-70.
ChÁVez, M., G. Casas, et al. (2009). PREDICCIÓN DE MUTACIONES EN SECUENCIAS DE LA PROTEÍNA
TRANSCRIPTASA INVERSA DEL VIH USANDO NUEVOS MÉTODOS PARA APRENDIZAJE
ESTRUCTURAL DE REDES BAYESIANAS. 5.
Chávez, M. C., G. Casas, et al. (2009). Uso de redes bayesianas obtenidas mediante Optimización de Enjambre de
Partículas para el diagnóstico de la Hipertensión Arterial. 30: 52.
Clancey, W. J. (1981). Methodology for building an intelligent tutoring system, Stanford University Stanford,
CA, USA.
de la Computación, Á. and I. Artificial Sistema bayesiano para modelado del alumno.
de Sistemas Inteligentes, L. SISTEMAS INTELIGENTES PARA EL MODELADO DEL TUTOR.
Gertner, A. S., C. Conati, et al. (1998). Procedural help in Andes: Generating hints using a Bayesian network
student model, JOHN WILEY & SONS LTD: 106-111.
Hernández Sampieri, R., C. Fernández Collado, et al. (2006). Metodología de la investigación.
Hume, G., J. Michael, et al. (1996). Hinting as a tactic in one-on-one tutoring, Lawrence Erlbaum Associates
(Taylor & Francis Group). 5: 23-47.
Hume, G. D. (1995). Using Student Modelling to Determine When and How to Hint in an Intelligent Tutoring
System, Citeseer.
Klir, G. J. and B. Yuan (1995). Fuzzy sets and fuzzy logic: theory and applications, Prentice Hall Upper Saddle
River, NJ.
Merrill, D. C., B. J. Reiser, et al. (1992). Effective tutoring techniques: A comparison of human tutors and
intelligent tutoring systems, Lawrence Erlbaum Associates (Taylor & Francis Group). 2: 277-305.
Millán, E., J. L. P. de la Cruz, et al. (2001). Modelado del alumno: un enfoque bayesiano. 12: 50-58.
Murray, T. (1999). Authoring intelligent tutoring systems: An analysis of the state of the art, Citeseer. 10: 98-129.
Puga, J. L. and J. G. García (2008). Sistemas de Tutorización Inteligente Basados en Redes Bayesianas. 13: 1325.
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 6
June 1-4, 2010
Salgueiro, F., G. Costa, et al. (2005). Sistemas inteligentes para el modelado del tutor: 63.
Seu, J., R. C. Chang, et al. (1991). Language differences in face-to-face and keyboard-to-keyboard tutoring
sessions.
Sierra, E., R. García–Martínez, et al. (2004). Fundamentos para una metodología de diseño de sistemas tutoriales
inteligentes centrada en la reparación de mecanismos, Aceptado en X CACIC. X Congreso Argentino de
Ciencias de la Computación. Universidad de la Matanza.
Sleeman, D. and J. S. Brown (1982). Intelligent tutoring systems, Academic Press.
Valldeperas, M. (2000). Sistema bayesiano para modelado del alumno, Universidad de Málaga.
VanLehn, K. (1988). Student modeling: 55-78.
Zhou, Y., R. Freedman, et al. (1999). What should the tutor do when the student cannot answer a question.
Autorización y Renuncia
Los autores autorizan a LACCEI para publicar el escrito en las memorias de la conferencia. LACCEI o los
editores no son responsables ni por el contenido ni por las implicaciones de lo que esta expresado en el escrito.
8th Latin American and Caribbean Conference for Engineering and Technology
Arequipa, Perú
WE1- 7
June 1-4, 2010