Download la luz del pasado

Document related concepts

Traducción asistida por computadora wikipedia , lookup

Procesamiento de lenguajes naturales wikipedia , lookup

Systran wikipedia , lookup

Historia de la construcción de los compiladores wikipedia , lookup

Traducción automática wikipedia , lookup

Transcript
LA LUZ DEL PASADO
A lo largo de ocho ediciones, COMPUTADORAS ha insistido en la idea de
hacer software local y desarrollar al máximo la investigación en este sector.
Este argumento fue ampliamente demostrado por el científico boliviano Iván
Guzmán de Rojas, cuyo trabajo no sólo es un aporte tecnológico inusitado sino
un magnífico ejemplo del rescate de la identidad cultural a través del software.
Jamás la informática latinoamericana miró en esta dirección: la posibilidad de
hablar un lenguaje nuestro y permitir que las computadoras dejen de ser cajas
de plástico y silicón, extrañas a nuestra cultura. Inspirándonos en nuestra
propia realidad y necesidades, se pueden hallar soluciones, indagando
creativamente nuestra historia, aún por descubrir. Es indispensable el apoyo
de todo tipo a la investigación nacional. “No esperamos que la palta caiga por
madura”.
Editor: EDUARDO CARRASCO ZULOAGA - Diseño Gráfico: CARLOS SOTOMAYOR -Colaboradores: EMILIO
Seso
boliviano
CASTAÑON PASQUEL, EDUARDO TOLEDO,
JUAN ACEVEDO,
XAVIER UGARRIZA, GONZALO ROJAS, JOSE
GONZALEZ, LUZ MARIA CORREA, GABRIELA FERNANDEZ - Arte Final: ERLO CORTEZ -Fotografía: VICTOR CH.
VARGAS
Iván Guzmán de Rojas rescató el aymara y su identidad cultural con el
software.
Por EDUARDO CARRASCO – Fotos FREDDY ALBORTA
A Iván Guzmán de Rojas se le puede encontrar caminando por las empinadas
callecitas de La Paz, con su inconfundible saco de alpaca y un maletín que él
define como el de un “vendedor judío”. Por estas mismas calles llegamos a su
moderno departamento de estilo colonial y cuadros que tienen para él un
significado muy profundo. Son nada menos que las pinturas del famoso pintor
Cecilio Guzmán de Rojas, su padre, fundador de la Escuela Boliviana de Artes.
“Renovó la plástica boliviana introduciendo una temática propia: su paisaje, su
folclore, su gente....Pintó al indio fuerte, digno como la esperanza, proyectando
el futuro con la potencial más fuerte que había. En mi época de estudiante
acompañé a mi padre por el altiplano. Allí aprendí a tratar a la gente del
campo, a aceptar sus limitaciones y respetar sus valores”. Estas reminiscencias
de su infancia, lo acercaron al conocimiento de la cultura aymara. “Además –
dice- soy paceño y le tengo un especial aprecio a lo que es nuestro”. Ingeniero
industrial en 1959, realizó un posgrado de física-matemática en Alemania
Federal. Incursiona en el campo de la automatización y de la inteligencia
artificial, diez años después, trabajando en la casa Siemens (Alemania). A su
regreso sirvió en la Universidad Nacional de San Andrés, donde organizó un
centro de estudios de ciencias para la investigación. Posteriormente creó el
Centro Nacional de Cómputo (CENACO), donde dio paso a un departamento
de investigación científica. “Irónicamente, durante el gobierno de Ovando y
Torres que se suponían de izquierda, fui echado de la universidad, y después
por un gobierno totalmente opuesto, que se suponía afirmaba los valores
nacionales fui igualmente boicoteado, hasta que tuve que salir del país”. Viaja a
Costa Rica, donde asesora al gobierno en la concepción de un sistema
automatizado para administrar y manejar la reforma agraria, sistema que ya
había aplicado en Bolivia. La presidenta Lidia Geiler lo nombró su
representante ante la Comisión de Reforma Educativa, último intento de
Guzmán por aportar dentro de las estructuras formales del sistema. Su
extraordinario invento, el ATAMIRI, que significa intérprete en aymara,
utilizando este idioma como puente para la traducción de cinco idiomas. Fue el
fruto de una investigación de seis años sobre las posibilidades de enseñanza
de las matemáticas en aymara (ver recuadro). Es un evento sin precedentes
en la historia de la computación mundial. Acosado por las multinacionales y la
prensa internacional, este hombre piensa ante todo crear un semillero
latinoamericano con sede en Bolivia.
COMPUTADORAS: ¿Cómo nace su interés por desarrollar una informática
nacional?
GUZMAN: Cuando fui echado de la universidad comprendí que ahí no podía
nacer un proceso de cambio cultural y educacional. Me he dado cuenta de que
si va a haber un verdadero proceso de transformación, revitalizando nuestros
valores culturales deberá nacer reconociendo los valores de nuestros
ancestros. Hay razones objetivas: en la sabiduría de nuestros ancestros está
la armonía del buen tratamiento de lo ecológico, la agricultura, los medios de
producción, el arte, las tradiciones, que a través de muchos milenios se han
integrado deteriorándose, perdiéndose. Pero yo creo que si hacemos un
esfuerzo por redescubrir eso,
vamos a encontrar caminos de mucha
creatividad, sin ponernos reñidos con la técnica, la ciencia moderna. Todo lo
contrario, actualizar los valores éticos, estéticos y de convivencia que vienen de
nuestra tradición ancestral. Han de ser la fuente de un verdadero movimiento
de regeneración cultural y, por lo tanto, han de tener matices políticos de
mucho mayor importancia y trascendencia que los planteamientos de las
diferentes corrientes ideológicas actuales. En última instancia, estas últimas
tienen su origen en los problemas que han surgido en Europa, o quizás ahora
en la confrontación entre las grandes potencias.
COMPUTADORAS:
Hay quienes afirman que la tendencia de desarrollo
latinoamericano es la castellanización con la consecuente desaparición de
nuestras culturas nativas.
GUZMÁN: Esa es una reflexión válida. Yo quisiera, por razones
sentimentales, responder “no, qué ¡barbaridad! Hay que recuperar los valores
autóctonos”. Yo quise, en forma objetiva con el realismo de un ingeniero,
obtener una respuesta. Para ello inicié una investigación sobre las limitaciones
que tiene el aymará para la enseñanza de las matemáticas, por ejemplo. En
uno de mis artículos hacía la pregunta: ¿qué pasa con el idioma aymará en la
enseñanza de la aritmética y en general de las matemáticas? Para este fin, me
dediqué a investigar en qué forma en el aymará se pueden formular premisas y
conclusiones, por ejemplo, para demostrar teoremas. Quise ver si
sintácticamente este idioma maneja términos como las conjunciones
castellanas que nos permiten construir las funciones lógicas.
O sea enunciar proposiciones lógicas bien formadas y en base a esas
proposiciones tener premisas que nos llevan a una conclusión. Para este fin,
consulté con gente que ha estudiado la gramática aymará y además textos
antiguos de hace 400 años como el de Ludovico Bertoni o Diego de Torres
Rubio, que tiene copiosa información sobre el vocabulario y gramática aymará.
Al principio me quedé estupefacto, porque no es fácil de encontrar
equivalencias entre las conjunciones del castellano y los sufijos con que se
forman proposiciones lógicas en aymará. Existe una gran variedad de sufijos y
combinaciones sufijales para este fin que en algunos casos son equivalentes a
las conjunciones en castellano y en otros no. Para poder crear un sistema de
equivalencias es necesario que exista una sintaxis apta para crear
proposiciones lógicas. Si no existe, olvidémonos, el aymará no sirve para
enseñar. Para ello utilicé el método de las tablas de verdad, método de
“verdad” o “falso” (a través de símbolos) y vi cuáles eran las funciones que
correspondían a las del castellano en los sufijos del aymará. Para mi sorpresa,
inicialmente el trabajo mostró que no se podían construir tablas de verdad
bivalentes en forma consistente con los sufijos del aymará.
Entonces me lancé a una hipótesis de trabajo un poco conjetural si se quiere:
No será que en el aymará existe una estructura lógica no-aristotélica (es decir,
que rompe con el principio de que todo enunciado debe ser verdadero o falso)
y que más bien su sintaxis admite sistemáticamente un tercer valor de verdad,
de manera que dichas tablas se deberían usar no con dos valores como las de
Bull, sino con tres valores como las del logista polaco Jan Lukasiewicz. Este
hace unos 50 años, sacó un trabajo sobre la lógica trivalente, creando tablas de
verdad trivalentes. Para mi sorpresa, el método de análisis con tablas
trivalentes explicaba perfectamente el comportamiento de los sufijos del
aymará con que se construyen proposiciones lógicas en su sintaxis. Este
trabajo lo divulgué un poco a través de conferencias y llamó la atención a un
científico del Centro de Investigaciones para el Desarrollo del Canadá, el que
me estimuló para que publicara una monografía de tipo preliminar que
difundiera esta idea.
Este trabajo me dio una respuesta inicial: el aymará es muy importante para
enseñar lógica y matemáticas. Es un idioma que tiene una estructura realmente
apta para la educación, por lo tanto, se lo debería estudiar, revitalizar y tomar
más en serio desde el punto de vista pedagógico. Ese fue el primer paso de mi
trabajo de investigación.
COMPUTADORAS: ¿ Y cómo dio a luz al revolucionario ATAMIRI?
GUZMÁN: Cuando vi que el trabajo de investigación sobre la lógica aymará
tenía respuesta y era estimulante para mí. En ese momento retorné a mi país
dispuesto a cerrar mi consultoría o reducirla al mínimo, porque no sólo vivo de
la consultoría sino que ésta me da acceso a equipos de cómputo que necesito
para la investigación y que de otro modo, no tendría. He recibido la
colaboración de dos empresas de Seguros (irónicamente) para poder llevar a
cabo el trabajo en mis horas libres, etc. Así mismo, la compañía representante
de Wang que me ha proporcionado tipos de máquina para crear los
diccionarios y hacer demostraciones, etc.
En este último año me he dedicado estrictamente a programar este paquete
que se llama ATAMIRI, y que en aymará quiere decir “interprete”. Además le
doy la sigla de interpretación: “Autómata”, “traductor”, “arborítico”, “multilingüe”,
“interactivo”, “recursivo”, “inteligente”. Porque efectivamente es un modelo de
inteligencia artificial que cumple requisitos.
COMPUTADORAS. El lenguaje común se va enriqueciendo permanentemente.
Los literatos y los escritores van integrado a la lengua expresiones y formas
idiomáticas nuevas. Arguedas, por ejemplo, en su momento integró toda una
serie de formas idiomáticas ¿Cómo contempla el ATAMIRI este fenómeno?
GUZMÁN. El ATAMIRI ACTÚA IGUAL QUE UN INTÉRPRETE
PROFESIONAL. Si Ud. Quiere traducir, por ejemplo “ojos que no ven, corazón
que no siente” al inglés, tendría que decir “out of sigt, out of mind”, que no tiene
nada que ver con las palabras “ojos” y “corazón” en castellano.
Ahora esa traducción que no es término a término, ¿cómo la hace una
persona? Sencillamente memorizando todo el refrán. Este ATAMIRI no es un
traductor de diccionario término a término, es un modelo de inteligencia artificial
que bajo determinadas situaciones y, gracias a la lógica que posee, puede
discriminar cuando tiene que proceder con la sintaxis formal o cuando tiene que
acudir simplemente a formas idiomáticas y refranes que, obviamente, tienen
que estar en su diccionario. Es igual que Ud. No puede recurrir a un refrán que
no la ha aprendido antes.
COMPUTADORAS: Ud. Me está hablando de inteligencia artificial. Por qué no
enfatiza un poco este aspecto.
GUZMÁN. Yo creo que la razón por la que han fracasado muchos proyectos
es, precisamente, porque lo que se buscaba era la traducción automática. En
cambio, si uno se plantea un softwar más bien enfocándolo como un modelo de
inteligencia artificial, que tenga primero: la propiedad de discriminar en base a
criterios que, en lo posible, se la dan a nivel de diccionario y no a nivel de
programa. Segundo, tiene que tener la facultad de aprender: La experiencia le
va a permitir encontrar un término adecuado en su función sintáctica y
semántica en nuevas situaciones que no estaban previstas. Esa es la base de
un traductor. En tercer lugar el modelo tiene que tener la capacidad para
resolver ciertos problemas de ambigüedad propias del lenguaje humano, del
lenguaje natural. Para que eso sea posible, el programa tiene que tener la
flexibilidad necesaria para que sea el traductor humano el que decida, sin que
tenga que perder tiempo y se vea perjudicado su trabajo.
COMPUTADORAS: ¿Por qué es inusitado a nivel mundial?
GUZMÁN: Es considerado el primer modelo multilingüe de traducción. Existen
tres modelos bilingües de traducción, más o menos serios, en el mundo. Uno
que fue desarrollado por un grupo de estudiosos en Grenoble que hace la
traducción ruso-francés. Es uno de los más avanzados. Hay otro que fue
desarrollado por una compañía en Utah (EEUU) que se llama Automatic
Language Processing Systems que fue un proyecto ligado a la universidad de
los mormones, y después de un fracaso en la universidad se creó una empresa
que siguió la investigación y ahora tienen un traductor bilingüe del inglés al
francés. Tiene aún muchas dificultades pero ya es una herramienta bastante
interesante para el traductor profesional. Luego hay otro sistema que el año
pasado ha sido anunciado en la Feria Internacional de Hannover sobre
inteligencia artificial en Alemania, que ha sido desarrollado por una empresa
que se llama LOGOS. Es un traductor del alemán al inglés, y entiendo que
están trabajando ahora del inglés al alemán.
Todos estos traductores son bilingües, unidireccionales y tienen la gramática
de ambos idiomas y las reglas de transformación entre ambos en el programa.
En cambio, mi sistema y, gracias a que es multilingüe, de muy bajo costo y de
altísima velocidad, tiene la peculiaridad de que las gramáticas específicas de
los idiomas no están en el programa sino en un diccionario sintáctico referido a
la terminología del aymará. La única gramática que está en el programa es la
del aymará, que es la que usa constantemente, más ciertas reglas de
transformación con los diccionarios externos que son sintácticos. Esta es la
novedad, además, hay un diccionario donde se han codificado las estructuras
sintácticas con las reglas que se han obtenido de formalizar la sintaxis del
aymará.
COMPUTADORAS: Usted hablo de que Wang se había adelantado a decir que
su lenguaje puede servir como un lenguaje puente tanto para la gente de
cómputo como para los científicos.
GUZMÁN: Para mí ha sido una sorpresa ver que mi trabajo de investigación ha
tenido mayor receptividad en los centros de investigación de cuestiones
electrónicas, de inteligencia artificial o de desarrollo de software, y no así entre
los lingüistas, que son muy escépticos frente a mi trabajo. Ni qué hablar de la
gente dedicada a la gramática tradicional, que jamás podrá aceptar que la
gramática sea formalizada en términos algebraicos.
Sin embargo, para mí es muy estimulante que un centro de investigaciones
como el de Wang considere que las técnicas que he desarrollado y el análisis
formal que he hecho del lenguaje aymará tiene grandes posibilidades de servir
como una interfase entre el lenguaje natura y el lenguaje algorítmico que usa la
máquina. Lo que se quiere, en el futuro, es llegar a un tipo de procesador
electrónico que sea totalmente abierto al ser humano en su lenguaje natural y
que no le exija como hoy, el dominar la jerga que si no es uno especialista,
crea una barrera de comunicación con el procesador. Si existe un lenguaje
humano, que en este caso sería la formalización sintáctica del aymará, que
puede servir de interfase, se abre una posibilidad muy bonita para crear
sistemas de comunicación en lenguaje natural con un procesador.
Otro aspecto que un estudioso me ha hecho notar, es que he logrado una
expresión algebraica de una lógica trivalente. Al haber formalizado los sufijos
del aymará he definido, lo que se llama en términos matemáticos, un “anillo
algebraico” que es más poderoso que el álgebra de Bull y que podría servir en
el futuro para crear circuitos electrónicos que trabajen con este tipo de álgebra.
Podría tener mucho más poder de inferencia que una máquina bulliana, o sea
una máquina que trabaje con este nuevo anillo podría tener la capacidad de
resolver problemas de inferencia de una manera que hasta ahora no se ha
planteado.
COMPUTADORAS: ¿Cuáles son las críticas a ATAMIRI más consistentes que
usted respeta y considera?
GUZMÁN: En este momento el ATAMIRI tiene limitaciones objetivas y hay que
reconocerlas. Una primera limitación tiene que ver más con la falta e recursos
para poder hacerlo. Es que su diccionario es pobre, tengo 8.000 entradas en
inglés, 8000 en castellano, unas 7000 en francés y alemán y unas 2000 en
aymara. Si uno quiere hacer una traducción técnica de documentos
especializados, necesita un diccionario de por lo menos unas 60.000 a 80.000
entradas y con una gran cantidad de términos técnicos, modismos y giros
idiomáticos. Esta es una limitación salvable. Ya he dicho que con cada nueva
traducción el sistema va aprendiendo nuevos términos, se los enseña el
traductor. De modo que en cuestión de meses, ese problema sería salvable. En
relación a otros modelos,, mi diccionario es muy reducido. Entiendo que hay
modelos que están trabajando con 100.000 entradas (Logos, Grenoble).
Otro problema, que es más grave porque no es por limitación de recursos sino
u problema de mayor investigación. La formalización que he realizado, como se
refiere a las categorías sintácticas del aymará, no es accesible al lingüista o al
gramático. De modo que sí se quiere que este software sirva como una
herramienta de investigación, obliga a aprender a un sistema referido al
aymará. Lo cual yo considero ventajoso porque un sistema muy poderoso, pero
que es visto como una desventaja desde el punto de vista de marketing del
producto por la reticencia que tienen las personas, especialmente los lingüistas,
a renunciar a la terminología y la jerga que ya han aprendido y tener que
aceptar una cosa totalmente tirada de los cabellos que nunca han antes. Se
trata entonces de un proceso de reeducación. Mi sistema va a obligar a un
replanteo del estudio de la gramática para comenzar. En términos de una
gramática ancestral es muy lindo para nosotros. Pero en otras partes es visto
con mucho escepticismo el que se tenga que aprender aymará para entender
un sistema de computarizado eficaz.
COMPUTADORAS: ¿ Y en cuanto al quechua?
GUZMÁN: Yo del quechua conozco muy poco. He leído algunos trabajos, por
ejemplo, el Middendorf y también un trabajo de una lingüista cuzqueña. El
quechua es un fenómeno muy interesante, es un idioma que tiene propiedades
muy parecidas al aymará, es una lengua que tiene la misma fonética, una
sintaxis aglutinante con sufijos y tiene, yo diría, un 30% de vocabulario común
con el aymará, o sea palabras como wawa, warma, inti, kantam toas esas
palabras son válidas para ambas lenguas. Lo curioso es que, y eso habría que
estudiarlo en algún momento, los mismos sufijos (morfémicamente idénticos)
cumplen funciones diferentes en el quechua. Es como si se hubiera producido
un cortocircuito en la computadora y se hubieran desplazado los términos de
una matriz y alguien haya hecho correr el programa y se hubiese creado un
nuevo lenguaje. Más o menos así me lo imagino.
Sin embargo, yo creo que sería muy interesante hacer una investigación con
los mismos métodos con alguien que conozca el quechua y tenga más
información de la que yo tengo.
EL COMERCIO
Lima, martes 19 de agosto de 1986
PRESENTAN UN SISTEMA ELECTRÓNICO DE TRADUCCIÓN
Un sistema electrónico que permite traducir 50 mil palabras por hora, será
presentado hoy por un ingeniero boliviano en la sede de la Junta del Acuerdo
de Cartagena, en Lima.
Iván Guzmán de Rojas inventó en 1979 el sistema “atamiri” que, dijo, encierra
los principios lógicos que lo convierten en germen auténtico de la llamada
“inteligencia artificial”.
El sistema de traducción simultánea por computadora, desarrollado por el
boliviano a partir del aymará, “no sustituye al traductor, pero le brinda gran
apoyo al entregar un borrador que necesita sólo pocas correcciones”.
La demostración que hará hoy ante los embajadores y jefes de organismos
internacionales acreditados como observadores ante la Junta del Acuerdo de
Cartagena, ha sido programada considerando que su trabajo en las tecnologías
de punta es una prueba de la capacidad y competencia de los investigadores
de la subregión.
El “Atamiri” puede traducir a cinco idiomas.
EL ESPECTADOR
Dirección Carlos Cano Martínez
BOGOTA, Lunes 15 de julio de 1985
EL AYMARÁ, LENGUAJE MILENARIO, INGRESA A LA INFORMÁTICA
El problema de la representación formal del lenguaje humano, de modo apto para manejarse
en la computadora, es crucial para los sistemas de informática más avanzados.
Pareciera insólito que justamente un lenguaje de nuestro ancestro indo americano resulte dar
las pautas de diseño para el primer prototipo de sistema traductor multilingüe que funciona en
una computadora. Este sorprendente desarrollo tecnológico ha sido demostrado ante
especialistas de informática y lingüística en uno de los simposios más novedosos: Informática y
Sociedad de las Américas, que tuvo lugar en el marco del 45 Congreso Internacional de
Americanistas realizado recientemente en la Universidad de los Andes.
El ingeniero boliviano Iván Guzmán de Rojas, miembro de la Academia Nacional de Ciencias
de Bolivia, bajo los auspicios de la Unesco, presentó su sistema Atamiri para el deleite de los
americanistas. Su presentación teórica fue seguida en una demostración práctica en la
computadora, en que utilizando como puente sintáctico una representación formal del aymará,
logró traducir oraciones complejas del castellano simultáneamente al aymará, al inglés, al
alemán al francés y al portugués. La calidad de las traducciones en algunos casos era
perfecta, en otros presentaba algunos errores de concordancia y de selección de términos. El
programa permite corregir errores por intervención humana, de modo interactivo con la
máquina. El sistema es capaz de aprender nuevas palabras y expresiones sin tener que
modificar el programa. La calidad del borrador traducido que genera el sistema es lo
suficientemente buena como para asegurar un aumento de productividad a pesar de las tareas
de afinamiento, por parte del traductor profesional, requerido para obtener el texto final.
Guzmán de Rojas se encuentra preparando una operación piloto de traducción masiva de
documentos técnicos en la cual se optimizará el sistema elevando su nivel lexicográfico en
terminología técnica. Esta operación se efectuará inicialmente en Panamá, donde el autor ha
encontrado una gran acogida y demanda para su sistema, por tratarse del país latinoamericano
que más trabaja en un ambiente multilingüe, debido a la actividad del canal.
En una debatida sesión del simposio fue controvertida la cuestión de si la representación formal
del aymará, que utiliza Guzmán de Rojas, es realmente el aymará actualmente hablado
alrededor del lago Titicaca en Bolivia y Perú; se sugirió designar el lenguaje formal por
Guzmanio para evitar confusiones. El autor argumentó que todo modelo se va acercando por
aproximaciones sucesivas al fenómeno real; considera injusto negar el origen conceptual de su
sistema, en el que juegan un papel decisivo las categorías sintácticas posiciónales del aymará,
gracias a las cuales él pudo obtener una representación matricial susceptible de manejarse
eficientemente con los algoritmos del álgebra lineal; este aspecto hace que su sistema sea
diferente e las representaciones basadas en estructuras arborescentes en boga.
Efectivamente, no sólo los especialistas en materia de traducción automática en los Estados
Unidos y Canadá, sino también los participantes en el simposio, quedaron favorablemente
impresionados por la forma eficaz con que actúan los algoritmos del sistema Atamiri; oraciones
de 10 a 15 palabras son traducidad a cinco idiomas en cuestión de un segundo.
El potencial de esta tecnología desarrollada en La Paz, ha sido reconocido internacionalmente,
y como latinoamericanos nos enorgullecemos del logro obtenido, a pesar de los modestos
recursos de que se dispuso para el desarrollo de un trabajo de investigación que compite con
otros proyectos en traducción automática en Estados Unidos, Europa y Japón, generosamente
dotados.
También celebramos que así se ha demostrado cuán relevante puede ser la informática como
herramienta para la investigación de nuestra cultura americana, representando un aporte
significativo el empeño que se concretó en Bogotá de incluir la informática como actividad
multidisciplinaria en los congresos de americanistas.