Download titulo propuesta
Document related concepts
Transcript
UNIVERSIDAD DISTRITAL “Francisco José de Caldas” Facultad Tecnológica Formato para Propuesta de Proyecto de Grado de Ingeniería en Control Electrónico e Instrumentación. TITULO PROPUESTA DESARROLLO DE SOFTWARE PARA EL APRENDIZAJE DE REDES NEURONALES EN EL LABORATORIO DE ELECTRONICA DE LA FACULTAD TECNOLOGICA PROPONENTE JULIAN GACHARNA BOHORQUEZ DIRECTOR FRANK GIRALDO REFERENCIA AL CONSEJO El empleo de Software con propósitos académicos, es una herramienta que esta siendo utilizado en las universidades del mundo entero como complemento a las clases tradicionales, permitiendo al estudiante asimilar, reforzar e interiorizar conceptos vistos en clase, así mismo llevar a la practica ideas generadas por el mismo estudiante, permitiéndole además tener un concepto mas global de los temas vistos en la materia. Al desarrollar un software de aprendizaje en Redes Neuronales en el Laboratorio de Electrónica de la Facultad Tecnológica, estaríamos enriqueciendo la experiencia académica de los estudiantes de Control Electrónico e Instrumentación. HOJA DE ACEPTACIÓN Observaciones _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _______________________________ Representante Consejo Curricular _______________________________ Director del Proyecto _______________________________ Vo.Bo. Metodología Fecha de Presentación 30 de Octubre de 2009 1.0. INFORMACIÓN GENERAL DEL PROYECTO Título: DESARROLLO DE SOFTWARE PARA EL APRENDIZAJE DE REDES NEURONALES EN EL LABORATORIO DE ELECTRONICA DE LA FACULTAD TECNOLOGICA Estudiante Proponente: JULIAN GACHARNA BOHORQUEZ Total de Estudiantes (número): 1 Línea de Investigación: CONTROL Tipo de Entidad: UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS Universidad Pública: X Universidad Privada: Instituto de Investigación Público: Centro de Investigación Privado: Organizaciones Gubernamentales: ONG: Empresa, Centro Empresarial o Gremio de la Producción: Dirección: Calle 74 sur Nº 68 A - 20 Teléfono: 7150388 Fax: 7150388 Correo Electrónico: Sede de la Entidad: Ciudad Bolívar Nit: 899999230 Ciudad: Bogotá Departamento: Cundinamarca Tipo de contribuyente: Entidad de derecho público estado: X Entidad de economía mixta Entidad industrial y comercial del Lugar de Ejecución del Proyecto: UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD TECNOLOGICA Ciudad: Bogotá Departamento: Cundinamarca Duración del Proyecto (meses): 8 meses Tipo de Proyecto: Desarrollo tecnológico Investigación Básica: Investigación Aplicada: X Desarrollo Tecnológico o Experimental: Valor total del Proyecto: 1’250.000= Descriptores / Palabras claves: Desarrollo, Software, Aprendizaje, Redes Neuronales, Facultad Tecnológica Observaciones 2.0 RESUMEN EJECUTIVO Al desarrollar un software con propósitos académicos se incrementaría el nivel de comprensión y asimilación de conceptos para los estudiantes de control de último semestre. El alumno que utilice este software tendrá la posibilidad de explorar las diferentes opciones que el programa le ofrece: un tutoríal de uso e introducción a la interfaz general, recorrido por cada uno de los temas que contiene el programa separados por capítulos, quizes para cada uno de los temas y evaluaciones completas de los conceptos estudiados, glosario de términos y repasos de los temas. Al final de cada tema el alumno estará en capacidad de realizar, por medio de un simulador una serie de practicas programadas. Para el desarrollo de este proyecto se estableció un periodo de 8 meses, y un presupuesto de $1’250.000. 3.0 DESCRIPCIÓN DEL PROYECTO 3.1 Planteamiento del Problema La universidad Distrital Francisco José de Caldas facultad Tecnológica, ubicada en la Calle 75 Nº 68ª 51 sur, Barrio la Candelaria, cuenta con siete proyectos curriculares entre los cuales se encuentra la Ingeniería en Control Electrónico e Instrumentación. Este proyecto curricular cuenta con diferentes laboratorios de avanzada tecnología para el desarrollo de las prácticas que se llevaran a cabo durante el desarrollo de la carrera. A través de esta carrera el estudiante recorre las diferentes áreas del control, como son: Control lineal, el control no lineal, el control digital, y por último se explora otro tipo de sistemas tales como las redes neuronales artificiales, la lógica difusa, la inteligencia artificial y los sistemas expertos. En la metodología de control tradicional hay una amplia gama de ejemplos y proyectos, a nivel académico e industrial, que permiten observar su aplicación e implementación, así como su desarrollo a nivel matemático. Con las redes neuronales, así como con otras metodologías no tradicionales de control, debido en parte a que son áreas en etapa de estudio y experimentación, se carece de herramientas que faciliten la comprensión de los conceptos relacionados, así como el desarrollo de actividades y laboratorios que permitan realizar implementaciones en casos reales. 3.2 Impacto esperado Una vez se encuentre desarrollado el software en el laboratorio de Electrónica de la Facultad Tecnológica, se espera un incremento del interés de los estudiantes de otros semestres en el tema, así como un aumento en el nivel de aprendizaje de los alumnos de ultimo semestre, elevando los estándares educativos de la Facultad, permitiendo cuantificar el nivel de conocimientos de los alumnos. Es el punto de partida para generación de grupos de investigación, desarrollos tecnológicos para posteriores proyectos de grado, que a su vez se verán reflejados en la industria. 3.3 Usuarios directos e indirectos potenciales de los resultados de la investigación: Los usuarios directos del sistema serian los estudiantes de último semestre de Ingeniería en Control Electrónico e Instrumentación de la Facultad Tecnológica de la Universidad Distrital Francisco José De Caldas. Los usuarios potenciales indirectos serian los estudiantes de otros semestres de Ingeniería en Control Electrónico e Instrumentación, estudiantes de carreras afines, el personal docente, grupos de investigación, y estudiantes de último semestre de Tecnología Electrónica, para los cuales este proyecto representaría una motivación para escoger la especialización de control en un futuro. 3.4 Marco teórico y estado del arte MARCO TEORICO INTRODUCCIÓN. Las Redes Neuronales Artificiales (ANNs de Artificial Neural Networks) fueron originalmente una simulación abstracta de los sistemas nerviosos biológicos, formados por un conjunto de unidades llamadas "neuronas" o "nodos" conectadas unas con otras. Estas conexiones tienen una gran semejanza con las dendrítas y los axones en los sistemas nerviosos biológicos. El Primer modelo de red neuronal fue propuesto en 1943 por McCulloch y Pitts en términos de un modelo computacional de "actividad nerviosa". El modelo de McCulloch-Pitts es un modelo binario, y cada neurona tiene un escalón o umbral prefijado. Este primer modelo sirvió de ejemplo para los modelos posteriores de Jhon Von Neumann, Marvin Minsky, Frank Rosenblatt, y muchos otros. Una primera clasificación de los modelos de ANNs podría ser, atendiendo a su similitud con la realidad biológica: - Los modelos de tipo biológico. Este comprende las redes que tratan de simular los sistemas neuronales biológicos así como las funciones auditivas o algunas funciones básicas de la visión. - El modelo dirigido a aplicación. Estos modelos no tienen porque guardar similitud con los sistemas biológicos. Sus arquitecturas están fuertemente ligadas a las necesidades de las aplicaciones para las que son diseñados. Redes Neuronales de tipo Biológico Se estima que el cerebro humano contiene más de cien mil millones de neuronas y sinápsis en el sistema nervioso humano. Estudios sobre la anatomía del cerebro humano concluyen que hay más de 1000 sinápsis a la entrada y a la salida de cada neurona. Es importante notar que aunque el tiempo de conmutación de la neurona (unos pocos milisegundos) es casi un millón de veces menor que en las actuales elementos de las computadoras, ellas tienen una conectividad miles de veces superior que las actuales supercomputadoras. El objetivo principal de de las redes neuronales de tipo biológico es desarrollar un elemento sintético para verificar las hipótesis que conciernen a los sistemas biológicos. Las neuronas y las conexiones entre ellas (sinápsis) constituyen la clave para el procesado de la información La mayor parte de las neuronas poseen una estructura de árbol llamadas dendritas que reciben las señales de entrada que vienen de otras neuronas a través de las uniones llamadas sinápsis. Algunas neuronas se comunican solo con las cercanas, mientras que otras se conectan con miles. Hay tres partes en una neurona: 1. el cuerpo de la neurona, 2. ramas de extensión llamadas dendrítas para recibir las entradas, y 3. un axón que lleva la salida de la neurona a las desdirías de otras neuronas. La forma que dos neuronas interactúan no está totalmente conocida, dependiendo además de cada neurona. En general, una neurona envía su salida a otras por su axón. El axón lleva la información por medio de diferencias de potencial, u ondas de corriente, que depende del potencial de la neurona. Este proceso es a menudo modelado como una regla de propagación representada por la función de red u(.). La neurona recoge las señales por su sinápsis sumando todas las influencias excitadoras e inhibidoras. Si las influencias excitadoras positivas dominan, entonces la neurona da una señal positiva y manda este mensaje a otras neuronas por sus sinápsis de salida. En este sentido la neurona puede ser modelada como una simple función escalón f(.). Redes Neuronales para aplicaciones concretas. Las ANNs dirigidas a aplicación están en general poco ligadas a las redes neuronales biológicas. Ya que el conocimiento que se posee sobre el sistema nervioso en general no es completo, se han de definir otras funcionalidades y estructuras de conexión distintas a las vistas desde la perspectiva biológica. Las características principales de este tipo de ANNs son los siguientes: 1. Auto Organización y Adaptatividad: utilizan algoritmos de aprendizaje adaptativo y auto organización, por lo que ofrecen posibilidades de procesado robusto y adaptativo (véase entrenamiento adaptativo y redes auto organizativas). 2. Procesado No Lineal: aumenta la capacidad de la red de aproximar, clasificar y su inmunidad frente al ruido. 3. Procesado paralelo: normalmente se usa un gran número de células de procesado por el alto nivel de interconectividad. Estas características juegan un importante papel en las ANNs aplicadas al procesado de señal e imagen. Una red para una determinada aplicación presenta una arquitectura muy concreta, que comprende elementos de procesado adaptativo masivo paralelo combinadas con estructuras de interconexión de red jerárquica. Taxonomía de las Redes Neuronales Existen dos fases en toda aplicación de las redes neuronales: la fase de aprendizaje o entrenamiento y la fase de prueba. En la fase de entrenamiento, se usa un conjunto de datos o patrones de entrenamiento para determinar los pesos (parámetros de diseño) que definen el modelo neuronal. Una vez entrenado este modelo, se usará en la llamada fase de prueba o funcionamiento directo, en la que se procesan los patrones de prueba que constituyen la entrada habitual de la red, analizándose de esta manera las prestaciones definitivas de la red. • Fase de Prueba: los parámetros de diseño de la red neuronal se han obtenido a partir de unos patrones representativos de las entradas que se denominan patrones de entrenamiento. Los resultados pueden ser tanto calculados de una vez como adaptados iterativamente, según el tipo de red neuronal, y en función de las ecuaciones dinámicas de prueba. Una vez calculados los pesos de la red, los valores de las neuronas de la última capa, se comparan con la salida deseada para determinar la validez del diseño. • Fase de Aprendizaje: una característica de las redes neuronales es su capacidad de aprender. Aprenden por la actualización o cambio de los pesos sinápticos que caracterizan a las conexiones. Los pesos son adaptados de acuerdo a la información extraída de los patrones de entrenamiento nuevos que se van presentando. Normalmente, los pesos óptimos se obtienen optimizando (minimizando o maximizando) alguna "función de energía". Las aplicaciones del mundo real deben acometer dos tipos diferentes de requisitos en el procesado. En un caso, se requiere la prueba en tiempo real pero el entrenamiento ha de realizarse "fuera de linea". En otras ocasiones, se requieren las dos procesos, el de prueba y el de entrenamiento en tiempo real. Estos dos requisitos implican velocidades de proceso muy diferentes, que afectan a los algoritmos y hardware usados. Atendiendo al tipo de entrenamiento, una posible taxonomía de las redes neuronales es: Redes Neuronales Fijo Red de Hamming Red de Hopfield No supervisado Mapa de características Aprendizaje competitivo Supervisado Basadas en decisión Perceptrón ADALINE (LMS) Perceptrón Multicapa Modelos Temporales Dinámicos Modelos Ocultos de Markov Redes Neuronales Supervisadas y no Supervisadas Las redes neuronales se clasifican comúnmente en términos de sus correspondientes algoritmos o métodos de entrenamiento: redes de pesos fijos, redes no supervisadas, y redes de entrenamiento supervisado. Para las redes de pesos fijos no existe ningún tipo de entrenamiento. Reglas de entrenamiento Supervisado Las redes de entrenamiento supervisado han sido los modelos de redes más desarrolladas desde inicios de estos diseños. Los datos para el entrenamiento están constituidos por varios pares de patrones de entrenamiento de entrada y de salida. El hecho de conocer la salida implica que el entrenamiento se beneficia la supervisión de un maestro. Dado un nuevo patrón de entrenamiento, por ejemplo, (m+1)-ésimo, los pesos serán adaptados de la siguiente forma: Se puede ver un diagrama esquemático de un sistema de entrenamiento supervisado en la siguiente figura: Reglas de entrenamiento No Supervisado Para los modelos de entrenamiento No Supervisado, el conjunto de datos de entrenamiento consiste sólo en los patrones de entrada. Por lo tanto, la red es entrenada sin el beneficio de un maestro. La red aprende a adaptarse basada en las experiencias recogidas de los patrones de entrenamiento anteriores. Este es un esquema típico de un sistema "No Supervisado": Ejemplos típicos son La Regla de Aprendizaje de Hebb, y la Regla de Aprendizaje Competitiva. Un ejemplo del primero consiste en reforzar el peso que conecta dos nodos que se excitan simultáneamente. Como ejemplo de aprendizaje competitivo, si un patrón nuevo se determina que pertenece a una clase reconocida previamente, entonces la inclusión de este nuevo patrón a esta clase matizará la representación de la misma. Si el patrón de la entrada se determinó que no pertenece a ninguna de las clases reconocidas anteriormente, entonces la estructura y los pesos de la NN serán ajustados para reconocer la nueva clase. Funciones de Base y Activación Una red neuronal típica se puede caracterizar por las descripciones funcionales de la red de conexión y la red de activación. Cada célula (unidad de proceso), suministra un valor a su salida. Este valor se propaga a través de la red de conexiones unidirecionales hacia otras células de la red. Asociada a cada conexión hay un peso sináptico denominado por { }, que determina el efecto de la célula j-ésima sobre la célula i-ésima. Las entradas a la célula i-ésima que provienen de las otras células son acumuladas junto con el umbral externo , para dar el valor de red . La forma de hacerlo lo determina matemáticamente la función de base f para dar un valor de activación . La salida final y se puede expresar como una función de la entrada y los pesos. Función de Base (Función de Red) Para un estudio analítico, las redes de conexión son matemáticamente representadas por la función de base u(w,x), donde w es la matriz de pesos, y x el vector de entrada. La función de base tiene dos formas típicas: • Función Lineal de Base (LBF) es una función de tipo hiperplano. Esto es, una función de primer orden. El valor de red es una combinación lineal de las entradas, • Función de base Radial (RBF) es una función de tipo hiperesférico. Esto implica una función de base de segundo orden no lineal. El valor de red representa la distancia a un determinado patrón de referencia, La función de segundo orden se puede extender a otra más general llamada función de base elíptica. Función de Activación (Función de neurona) El valor de red, expresado por la función de base, u(w,x), será inmediatamente transformada por una función de activación no lineal. Por ejemplo, las funciones de activación más comunes son la función paso, rampa o sigmoidal y gausiana. En particular, • Función sigmoidal • Función gausiana MARCO TECNOLÓGICO En varias universidades de Colombia se esta estudiando este tema en la actualidad, no solo en el área de electrónica. Estas son algunas de las universidades que actualmente desarrollan proyectos relacionados con las redes neuronales: Facultad de Ingeniería Eléctrica de la Universidad Tecnológica de Pereira Grupo de Biología Computacional de la Universidad Nacional de Colombia Grupo de investigación y desarrollo en inteligencia artificial de la Universidad Nacional de Colombia Facultad de ingeniería industriales de la universidad de los Andes. Universidad Pontificia Bolivariana Seccional Bucaramanga. Grupo de microelectrónica y control de la universidad de Antioquia. 3.5 Objetivos 3.5.1 3.5.2 General Desarrollar un software que permita a los estudiantes de Ingeniería en Control Electrónico e instrumentación un aprendizaje inicial de las redes neuronales. Específicos Desarrollar un software que permita el estudio de los conceptos relacionados con las redes neuronales. Diseñar un sistema que permita al alumno ser evaluado de forma efectiva por el programa. Diseñar prácticas con el fin de que el alumno pueda desarrollar sus habilidades. 3.6 Alternativa de Solución La alternativa de solución es desarrollar un programa para ser instalado en el laboratorio de electrónica. Dicho software deberá tener las siguientes características. Deberá tener un tutor interactivo que permita al estudiante conocer el funcionamiento del programa, el modo de utilizarlo y de responder las evaluaciones. En un index se mostraran los diferentes temas disponibles para estudio, desde el cual se podrá acceder a cada uno de ellos. Al final de cada tema presentara un quiz con algunas preguntas. Al final de cada capitulo presentara una evaluación de todos los contenidos Como aportes extras tendrá un glosario de los términos comúnmente utilizados. En la parte de practicas se tendrán programadas una serie de prácticas por medio de un simulador, que le permita de modo grafico e interactivo diseñar una red neuronal básica. Como complemento a las prácticas, se podría tener un hardware adicional, por ejemplo una cámara con iluminación controlada que permita realizar practicas de reconocimiento de patrones ópticos, colores, formas, letras, etc. tendrá una documentación propia de instalación del software, ayuda en pantalla y manual de prácticas. 3.7 Metodología Propuesta Investigar antecedentes Documentación a profundidad de redes neuronales Selección de plataforma de funcionamiento. Selección de lenguaje de programación (compilador) Documentación sobre el uso del lenguaje de programación. Estructuración del contenido teórico del programa. Planteamiento y diseño del simulador. Integración del simulador con el programa principal. Diseño del tutorial. Diseño de las ayudas. Realización de la documentación del software. Planteamiento de las practicas a realizar Documentación de las prácticas. Realización de la guía de prácticas. Compilación del programa principal. Realización de pruebas y depuración implementación. Informe final 3.8 Resultados Esperados Al termino de este proyecto esperamos haber dotado a la facultad de una herramienta muy valiosa para el aprendizaje de las redes neuronales, que posea gran aceptación entre el cuerpo estudiantil y docente de la universidad, que permita a corto y mediano plazo el mejoramiento de los estándares académicos de la facultad. 3.9 Estrategia de Comunicación Para dar a conocer este tipo de investigación, realizaremos un artículo presentado al consejo curricular además de una sustentación pública al mismo. 4.0 PRESUPUESTO PRESUPUESTO GLOBAL DE LA PROPUESTA POR FUENTES DE FINANCIACIÓN (En miles de $) FUENTES TOTAL Univ. Colciencias Contrapartida Distrital RUBROS PERSONAL EQUIPO MATERIALES SALIDAS DE CAMPO VIAJES BIBLIOGRAFÍA SOFTWARE PUBLICACIONES SERVICIOS TÉCNICOS CONSTRUCCIONES MANTENIMIENTO ADMINISTRACIÓN TOTAL 300.000 300.000 400.000 550.000 400.000 550.000 1’250.000 1’250.000 DESCRIPCIÓN DE LOS EQUIPOS QUE SE PLANEA ADQUIRIR (En miles de $) EQUIPO JUSTIFICACIÓN RECURSOS Colciencias Contrapartida TOTAL TOTAL DESCRIPCIÓN Y CUANTIFICACIÓN DE LOS EQUIPOS DE USO PROPIO (En miles de $) EQUIPO Computador Portátil Software impresora TOTAL VALOR (CONTRAPARTIDA) 3’200.000 400.000 200.000 3’800.000 HOJA DE VIDA (RESUMEN) 1. ESTUDIANTE O DIRECTOR Apellidos: GACHARNA BOHORQUEZ Nombre: JULIAN Fecha de Nacimiento: 25 junio 1980 Nacionalidad: COLOMBIANO Correo Electrónico: [email protected] Tel/Fax: 300 2685511