Download hacia una tipología de definiciones basada en el modelo analítico

Document related concepts

Predicable wikipedia, lookup

Oración (gramática) wikipedia, lookup

Sustancia (Aristóteles) wikipedia, lookup

Predicado (lógica) wikipedia, lookup

Ontología (informática) wikipedia, lookup

Transcript
HACIA UNA TIPOLOGÍA DE DEFINICIONES BASADA EN EL MODELO
ANALÍTICO
César Antonio Aguilar
Gerardo Sierra Martínez
Grupo de Ingeniería Lingüística
Instituto de Ingeniería, UNAM
Torre de Ingeniería, Cubículo 3, Basamento,
Ciudad Universitaria
México DF.
C. P. 04510
E-mails: {caguilar, gsierram}@iingen.unam.mx
WEB Page: http://iling.torreingenieria.unam.mx
1. Introducción
La delimitación de una tipología de definiciones ha sido un problema abordado
principalmente por la filosofía, la lexicografía y la terminología. En términos generales,
una tipología de definiciones equivale a una clasificación o taxonomía que considera
rasgos distintivos tales como el método seguido para formularlas, la clase de
información conceptual que pueden expresar, sus unidades constitutivas, etc.
El primer autor que ha planteado el modelo prototípico de una definición ha sido
Aristóteles (Candel 1998, Modrack 2001), reconocido con el nombre de definición
analítica. Si bien este modelo se ha mantenido hasta la fecha como patrón canónico,
Sager y Ndi-Kimbi (1995), e igualmente Lara (2001, 2004) consideran la existencia de
otros patrones de construcción identificables en textos científicos y técnicos.
Siguiendo las observaciones hechas por Sager y Ndi-Kimbi, así como las de
Lara, en este trabajo se propone una taxonomía de definiciones localizadas dentro de
contextos definitorios (Alarcón 2003), la cual toma como base para su clasificación la
presencia o ausencia de sus dos unidades básicas: género próximo y diferencia
específica. En concreto, dicha taxonomía se compone de 4 tipos: analíticas,
sinonímicas, funcionales y extensionales.
La estructura a seguir en este trabajo es la siguiente. En el apartado 2 se da una
descripción, grosso modo, sobre lo que es una definición analítica. En el apartado 3 se
establece una distinción entre definiciones, explicaciones y descripciones. En el
apartado 4 se delinea la tipología de definiciones a partir de su ubicación en un contexto
definitorio, junto con la descripción de sus características. En el apartado 5 se muestran
algunos ejemplos obtenidos de dos corpus de documentos técnicos. Finalmente, en el
apartado 6 se ofrecen algunas consideraciones sobre la tipología aquí planteada.
2. La definición analítica
Tanto la lexicografía y la terminología parten del modelo analítico para formular su
concepción sobre lo que es una definición. Para Aristóteles, la definición representa la
formulación lingüística de un conocimiento científico obtenido a partir de una
demostración (Candel 1998). Tal formulación tiene como fin responder a la pregunta
¿qué cosa es X?
En aras de responder a esta pregunta, la definición se compone de dos
elementos: género próximo y diferencia específica. El género próximo es el elemento
que indica, a través de una relación semántica de hiperonimia, a qué clase pertenece
una entidad referida por un vocablo o un término. En contraparte, la diferencia
específica es el elemento que expone cuáles son las propiedades particulares de dicha
entidad respecto a su clase, estableciendo una serie de relaciones semánticas tales como
las de hiponimia, meronomia, holonimia, télica1 y otras.
Un rasgo a destacar en la definición analítica es su estrecha relación con
estructuras sintácticas de índole predicativa (Bäck 2000, Modrak 2001). Para
Aristóteles, una predicación, más que una estructura lingüística, es una proposición
lógica que permite expresar un conocimiento verdadero sobre las propiedades
esenciales de una entidad (Allan 2004).
Ahondando en esta cuestión, Bäck (2000) observa que para Aristóteles el verbo
ser adquiere un valor importante, ya que le permite expresar de forma descriptiva cuál
es el tipo de existencia que asume un sujeto conforme a las características que puedan
predicarse de él en un contexto dado. Así, p. e., una predicación del tipo Sócrates es
mortal, debe ser entendida como Sócrates existe (o tiene su existencia) como mortal (en
este momento). Para Tugendhat (2003), de hecho, este valor que adquiere la
predicación permite suponer que Aristóteles, más que desarrollar un modelo lógico de
representación del conocimiento, en realidad propone una semántica formal sustentada
en dos elementos:
I. Los términos de la predicación.
II. El verbo ser con un sentido de existencia (y, mutatis mutandis, cualquier
verbo que pueda predicar algo sobre las cualidades de un objeto), el cual
manifiesta la forma de existencia que asumen tales términos en una
situación dada.
Cercanos a esta visión sobre las relaciones que se dan entre la definición analítica y la
predicación, Sager y Ndi-Kimbi (1995), situados desde una perspectiva terminológica,
explican que dentro de textos científicos y técnicos es posible reconocer por lo menos
dos variantes:
a) Una variante constituida a partir de un patrón básico aquellos asociado al
verbo ser, en donde se configura una estructura del tipo X [es un] Y + Z,
en donde X es un término a definir, Y es un concepto superior (género
próximo), y Z es un complemento que caracteriza al término de manera
individual (diferencia específica), p. e.: el número de KC es un factor
determinante de los valores de los coeficientes hidrodinámicos.
b) Patrones complejos: aquellos que en un plano sintáctico se configuran a
partir de un enunciado que introduce una oración de relativo siguiendo
una estructura del tipo: X [es un] Y [(que/la cual/el cual/cuyo) + verbo]
+ Z, en donde X es un término a definir, Y es un concepto superior
(género próximo), y Z es un complemento (diferencia específica)
introducido por una partícula de relativo, así como un verbo que indica
algún rasgo particular de dicho término. Por ejemplo: un programa es
una secuencia de instrucciones que sirve para resolver un problema.
1
Por relación télica se entiende, de acuerdo con Pustejovsky (1991), aquella relación léxico-semántica
que describe cuál es el propósito o función que tiene una entidad, p. e., una computadora {sirve para /se
emplea/permite} hacer operaciones lógicas y matemáticas.
A partir de estos patrones descritos por Sager y Ndi-Kimbi, derivados del modelo
analítico, puede hacerse una distinción entre una definición canónica de aquello que
puede ser considerado como una explicación o una descripción.
3. Definiciones, explicaciones y definiciones
Pozzi (2006) plantea que definiciones, explicaciones y descripciones son estructuras
lingüísticas útiles para expresar información conceptual asociada a un término. La
diferencia entre estas tres estructuras es, por una parte su patrón de codificación en
lengua natural, y por otra la clase de información que presentan. Tomando en cuenta
estas dos diferencias, se pueden describir dichas estructuras del siguiente modo:



Definición. Se trata de un enunciado con una secuencia sujeto +
predicado, el cual configura una definición analítica compuesta por un
género próximo y una diferencia específica.
Explicación. Se trata de una clase de texto destinado a clarificar las
causas, el contexto y las consecuencias de una entidad o de un evento.
Igualmente, en algunos casos se consideran también las reglas o leyes
que subyacen. Un rasgo distintivo que Pozzi ha identificado en su
análisis de documentos médicos (2006), es la presuposición de que el
lector cuenta con un mínimo conocimiento sobre el tema a tratar.
Descripción. Se trata de una representación detallada y ordenada sobre
lo que es una entidad o un evento específico, usando para ello unidades
tales como frases nominales definidas, partículas deícticas (pronombres,
adjetivos o adverbios), mecanismos de repetición, entre los más
relevantes2.
Contrastando las características que presentan definiciones, explicaciones y
descripciones, se observa que en el caso de las primeras, éstas se configuran dentro de
un plano gramatical en forma de predicaciones, siguiendo en esto el comportamiento
descrito por Sager y Ndi-Kimbi.
Respecto a las explicaciones y descripciones, ambas tienden a estructurarse
como textos que pueden ser breves o extensos, los cuales mantienen una cohesión
temática relacionada con la información conceptual que se asocia a un término. Dicha
información conceptual puede asociar al término con otros dentro de una misma
explicación o descripción, por lo que más que dar una síntesis sobre un concepto —
que es el caso de la definición—, lo que se busca es clarificar de la manera más precisa
el concepto representado por el término dentro de un campo de conocimiento.
Retomando el hecho de que las definiciones gramaticalmente se codifican en
predicaciones, para este trabajo se ha considerado como definición canónica aquella
que presente tres rasgos mínimos:
I. Contar con una estructura predicativa sujeto + predicado, o alguna
variante posible.
II. Hacer explícita una relación entre un género próximo y una diferencia
específica.
III. Proporcionar una síntesis respecto de la información conceptual que se
asocia a dicha definición.
2
Al respecto, puede verse a Lyons (1983).
4. Definiciones situadas en contextos definitorios
Como se ha señalado al principio, a partir del modelo analítico se han derivado varias
propuestas por formular una taxonomía de definiciones posibles, entre las cuales
pueden destacarse las que proponen Robinson (1965), Sager y Ndi-Kimbi (1995), Lara
(1997, 2004), Pearson (1998), por mencionar algunas.
Tomando en cuenta estas propuestas, Sierra et al (2003, 2006) han desarrollado
una tipología de definiciones derivada del modelo analítico, con miras a identificar
automáticamente sus patrones de constitución en textos, específicamente dentro de un
contexto definitorio (CD), el cual equivale a un fragmento discursivo en donde se
introducen y asocian un término con una definición. Para establecer dicha asociación,
se emplean una serie de conectores lingüísticos tales como predicaciones verbales,
patrones pragmáticos y marcas tipográficas (Alarcón 2003).
Existen dos rasgos importantes que permiten reconocer distintos tipos de
definiciones posibles en CDs:
a) La clase de verbo que opera como núcleo de una predicación que ligue a
un término con su definición.
b) La presencia o ausencia explícita del género próximo y la diferencia
específica.
En el caso del primer rasgo, Aguilar et al (2004), junto con Sierra et al (2008) han
analizado desde un enfoque sintáctico de qué forma la predicación influye en la
selección de la clase de definición asociable a un término. Con relación al segundo
rasgo, en este trabajo se describe de qué manera influyen tanto el género próximo como
la diferencia específica en la configuración de tales clases de definiciones.
Básicamente, se reconocen 4 tipos de definiciones:




Definición analítica: se da una definición de este tipo cuando el género
próximo y la diferencia específica aparecen de manera explícita dentro
de una definición.
Definición sinonímica: se da cuando en una definición sólo se hace
explícito el género próximo, de tal manera que el género próximo
establece una equivalencia conceptual con el término que es definido.
Definición funcional: se da cuando sólo se hace explícita la diferencia
específica, la cual ofrece una definición de un concepto a partir de su
uso o aplicación en una situación dada.
Definición extensional: se da cuando sólo se hace explícita la diferencia
específica, la cual presenta una definición que enumera los componentes
que conforman un objeto representado por el término a definir. Esta
enumeración de componentes sigue un orden basado en relaciones del
que van de un todo hacia las partes, o de las partes hacia el todo
Junto con esta formulación explícita que se haga del género próximo y/o de la
diferencia específica, estas 4 clases de definiciones mantienen relación con el verbo que
configura la predicación que las asocia con un término.
Dependiendo del verbo que opere como núcleo de tal predicación, se observa un
patrón sintáctico en donde el género próximo y la diferencia específica se sitúan en
posiciones de sujeto, objeto o predicado. Por ejemplo, cuando la predicación se
construye en torno al verbo ser, se observa un patrón sujeto + predicado, en donde el
sujeto representa al término a definir, y el predicado introduce la definición, p. e.: [Un
algoritmo] Sujeto es [un conjunto de instrucciones para una computadora] Predicado.
En contraparte, verbos como definir, considerar, entender, interpretar, etc., fijan
un patrón del tipo sujeto + objeto + predicado, haciendo explícito quién es el autor de la
definición, situado en posición de sujeto, mientras que el término a definir pasa a
ocupar la posición de objeto, p. e.: [Turing] Sujeto define [algoritmo] Objeto [un conjunto
de instrucciones para una computadora] Predicado.
Un hecho que se observa en los dos ejemplos, es que el género próximo aparece
representado en forma de frase nominal, mientras que la diferencia específica puede
expresarse en forma de algún tipo de frase (p. e., prepositiva, adjetiva o adverbial), o de
oración de relativo introducida por un pronombre (que/la cual/el cual/cuyo, quien, etc.).
En lo que se refiere a las definiciones sinonímicas, la predicación introduce una
definición que únicamente hace explícito el género próximo, sin considerar ningún tipo
de diferencia específica. El género próximo establece una relación de equivalencia con
el término a definir en un nivel conceptual, p. e.: [un maremoto] Sujeto equivale a [un
tsunami] Predicado.
Para el caso de las definiciones funcionales, se reconoce únicamente la presencia
explícita de la diferencia específica, la cual describe como rasgo distintivo de un objeto
su función u operabilidad en un contexto dado, p. e.: [una computadora] Sujeto sirve
para [procesar problemas y resultados lógicos, matemáticos y/o estadísticos] Predicado.
Finalmente, respecto a las definiciones extensionales, la predicación introduce
una definición en donde se hace explícita la diferencia específica (sin mencionar el
género próximo). La clase de información conceptual asociada a estas definiciones
puede ser de dos tipos: a) enumeración de las partes o componentes que integran un
objeto; b) listado de todos aquellos objetos que conforman un conjunto, p. e.: [una
computadora] Sujeto cuenta con [un hardware, un software, así como una serie de
unidades periféricas] Predicado.
5. Ejemplos obtenidos de corpus técnicos
Partiendo de esta tipología de definiciones, se han realizado algunos experimentos de
extracción automática en dos corpus de documentos técnicos: el Corpus Lingüístico de
Ingeniería o CLI (Medina et al 2004), y el Corpus de Informática en Español o CIE
(L’Homme y Drouin 2006).
Respecto al CLI, se trata de un corpus lingüístico conformado por documentos
especializados en formato plano (.TXT), orientados hacia distintas áreas de ingeniería,
desarrollado por el Grupo de Ingeniería Lingüística (GIL), que cuenta con alrededor de
500, 000 palabras3. Por su parte, el Groupe Éklectic, afiliado al departamento de
lingüística y traducción de la Universidad de Montreal, ha compilado y organizado el
CIE, el cual es un corpus de documentos técnicos cuyo contenido va dirigido hacia las
áreas de informática y ciencias de la computación4.
Para realizar el proceso de reconocimiento de patrones asociados a definiciones,
se usó una herramienta diseñada en lenguaje Python, la cual es una variante de un
sistema para búsqueda de operadores metalingüísticos en inglés diseñado por
3
Para mayores detalles sobre el CLI véase el sitio WEB www.iling.unam.mx/index.php.
Para mayores detalles sobre este corpus, puede consultarse el sitio WEB del grupo Écklectic:
http://olst.ling.umontreal.ca/
4
Rodríguez (2004)5. Tal herramienta ejecuta las búsquedas en archivos electrónicos a
partir patrones lingüísticos asociados a definiciones.
Posterior a esta búsqueda, se realizó una revisión manual que permitió determinar
cuáles eran los mejores candidatos a definiciones canónicas, descartando aquellos que
no lo fueran.
Entre los patrones lingüísticos asociados a definiciones que hacían explícito tanto
el género próximo como la diferencia específica se han reconocido dos: aquellas
definiciones ligadas a predicaciones primarias (p. e., con el verbo ser), y aquellas que
se ligaban a predicaciones secundarias (p. e., verbos como definir, concebir, entender, y
otros similares). Ejemplos de patrones vinculados a predicaciones primarias son:
5.1. El contenedor refrigerado es [una forma especializada] Género próximo [de
transporte de perecederos] Diferencia específica.
5.2. Un esquema XML representa [el significado] Género
información recibida desde una aplicación] Diferencia específica.
próximo
[de la
5.3. Escalada deslizante de gestionabilidad se refiere a [los diferentes
niveles de administración] Género próximo [que los servidores en su
infraestructura requieren] Diferencia específica.
Los ejemplos anteriores pueden contrastarse con otros patrones en donde la definición
analítica aparece ligada a una predicación secundaria:
5.4. Carlos Godino define la arquitectura naval como [la ciencia] Género
próximo [que trata de los conocimientos necesarios para la construcción de
los buques] Diferencia específica.
5.5. Podemos considerar las computadoras programables modernas como
[la evolución] Género próximo [de sistemas antiguos de cálculo o de
ordenación] Diferencia especifica.
5.6. Se conoce como reenganche rápido a [la operación] Género próximo [de
cierre de un interruptor después de una falla definición] Diferencia específica.
Respecto a las definiciones sinonímicas, el patrón que asumen las definiciones al ser
introducidas por una predicación equivale a una secuencia conformada por una frase
nominal junto con sus modificadores. Ejemplos de esto son:
5.7. La tensión de base se llama [tensión de unidad] Género próximo.
5.8. La tensión de tierra V equivale a [la máxima diferencia del potencial]
Género próximo.
5.9. La fuerza proporcional a la aceleración se nombra [fuerza de inercia]
Género próximo.
En el caso de las definiciones funcionales, éstas pueden aparecer asociadas a
predicaciones primarias, ofreciendo una descripción sobre el tipo de operación que
5
En el sitio WEB: http://turing.iimas.unam.mx/~crodriguezp/cdrom/index.html, pueden verse más
detalles respecto a esta herramienta de búsqueda.
puede desempeñar un la entidad referida por un término, o bien puede indicar en qué
contexto se realiza tal operación. En este tipo de definiciones, sólo se hace explícita la
diferencia específica.
5.10. La técnica de velocimetría de imágenes de partícula permite
[medir la velocidad de un campo de flujo bi o tri dimensional] Diferencia
específica.
5.11. La PDA permite [una captura de información más rápida y ágil]
Diferencia específica.
5.12. Una clase escrita en COBOL puede servir [de base para otra
implementada con C# o Visual Basic] Diferencia específica.
Finalmente, las definiciones extensionales se vinculan regularmente a predicaciones
primarias, cuyo predicado únicamente expresa una diferencia específica que enumera o
enlista una serie de componentes o de partes que integran una entidad. Otra variante
sería la enumeración de los miembros que conforman un conjunto, de acuerdo con la
relación todo/parte que proponen Vossen y Copestake (1993). Véanse los siguientes
ejemplos:
5.13. El circuito carrier puede consistir de [dos o tres alambres de línea o de
un alambre con retorno a tierra] Diferencia específica.
5.14. El apartarrayos tipo autovalvular consiste de [varias chapas de
explosores conectados en serie] Diferencia específica.
5.15. La Terminal de Contenedores cuenta con [dos muelles de atraque, el
muelle del Bufadero y el muelle del Dique del Este] Diferencia específica.
6. Consideraciones finales
A grandes rasgos, en este trabajo se ha delineado una propuesta de tipología de
definiciones, las cuales han sido derivadas del modelo analítico desarollado por
Aristóteles. Considerando al modelo analítico como un patrón canónico, resulta viable
generar nuevas clases de definiciones a partir de dos rasgos:
a) La presencia/ausencia explícita del género próximo o la diferencia
específica dentro de una definición situada en un CD.
b) El tipo de predicación que asocie a tal definición con su correspondiente
término.
Estos dos rasgos permiten reconocer de qué manera tanto el género próximo como la
diferencia específica son expresadas a través de frases y oraciones, lo que resulta útil
para realizar tareas automáticas de definiciones en textos científicos.
Si bien en este trabajo se ha hecho una descripción resumida de tales patrones, es
posible vislumbrar algunas vías a seguir para la aplicación de esta tipología en tareas de
búsqueda automática:



Delinear una gramática que dé cuenta de los patrones de frase
recurrentes en las 4 clases de definiciones deducibles de la tipología
propuesta.
Evaluar estadísticamente cuál es el grado de asociación existente entre
predicaciones y definiciones, de modo que, dado cierto tipo de
predicación, se pueda establecer un umbral de probabilidad para
identificar la clase de definición que se une a dicha predicación.
Contrastar los datos que se obtengan con los que arrojen experimentos
similares obtenidos de otros corpus de documentos técnicos y
científicos.
Referencias

Bibliografía general
Aguilar, César, Alarcón, Rodrigo, Rodríguez, Carlos y Sierra, Gerardo (2004):
“Reconocimiento y clasificación de patrones verbales definitorios en corpus
especializados”, en Cabre T., Estopà R. y Tebé C. (eds.), La terminología en el
siglo XXI, Barcelona, IULA-UPF: 259-269.
Alarcón, Rodrigo (2003): Análisis lingüístico de contextos definitorios en textos de
especialidad, tesis de licenciatura, México, UNAM.
Aristóteles (1998): Tratados de lógica (Organon), traducción y edición de M. Candel
Sanmartín, 2 tomos, Madrid, Gredos.
Bäck, Allan (2000): Aristotle`s Theory of Predication, Leiden/Boston, Brill.
Lara, Luis Fernando (2001): Ensayos de teoría semántica, México,
COLMEX.
Lara, Luis Fernando (2004): De la definición lexicográfica, México, COLMEX.
Lyons, John (1983): Lenguaje, significado y contexto, Barcelona, Paidós.
Modrak, Deborah K. W. (2001): Aristotle’s Theory of Language and Meaning,
Cambridge, Cambridge University Press.
Pearson, Jennifer (1998): Terms in Context, Philadelphia, John Benjamins.
Pozzi, María (2006): “Estudio de los diferentes tipos de descripción de conceptos
especializados de acuerdo con las diferentes necesidades comunicativas del
destinatario final: un estudio de caso en el campo de la cardiología”, en Cabre
T., Estopà R. y Tebé C. (eds.), La terminología en el siglo XXI, Barcelona,
IULA-UPF: 629-642.
Pustejovsky, James (1991): “The Generative Lexicon”, Computational Linguistics,
17(4): 409-441.
Rodríguez, Carlos (2004): Metalinguistic Information Extraction from specialized texts
to enrich computational lexicons. Tesis de Doctorado, Barcelona, Universidad
Pompeu Fabra.
Sager, Juan C. y Ndi-Kimbi, August (1995): “The conceptual structure of
terminological definitions and their linguistic realisations”, Terminology 2(1):
87-106.
Sierra, Gerardo, Alarcón, Rodrigo, Medina, Alfonso y Aguilar, César (2003b):
“Definitional Contexts Extraction from Specialised Texts”, en LewandowskaTomaszczyk, B. (ed.), PALC 2003 Proceedings: Language, Corpora and ELearning, Frankfurt, Peter Lang Publish: 21-31.
Sierra, Gerardo, Alarcón, Rodrigo, Aguilar, César y Barrón, Alberto (2006): “Towards
the Elaboration of a Corpus of Definitional Contexts”, en Corino E., Marello C.
y Onesti C. (eds.), Proccedings of XII EURALEX Internacional Congress,
Alessandria, Edizioni dell’Orso: 229-240.
Sierra, Gerardo, Alarcón, Rodrigo, Aguilar, César y Bach, Carme (2008): “Definitional
Verbal Patterns for Semantic Relation Extraction”, en Auger A. y Barrière C.
(eds.), Pattern-based Approaches to Semantic Relation Extraction. Special issue
of Terminology, 14(1): 74–98.
Tugendhat, Ernst (2003): Introducción a la filosofía analítica, traducción de Navarro J.,
Barcelona, Gedisa.
Vossen, Piek y Copestake, Anne (1993): “Defaults in Lexical Representation”, en
Briscoe T., Paiva V. y Copestake A. (eds.), Inheritance, Defaults and the
Lexicon, Cambridge, Cambridge University Press: 246-274.

Corpus de consulta
Medina A. Sierra G. Garduño G. Méndez C. Saldaña R. (2004): “CLI: An Open
Linguistic Corpus for Engineering”, en De Ita, G. Fuentes, O. Galindo, M,
(eds.), Proceedings of IX Ibero-American Workshop on Artificial Intelligence,
Puebla, México, BUAP: 203-208.
L’Homme, Marie-Claude y Drouin, Patrick (2006): Corpus de Informática para el
español, Groupe Éklectick- OLST, Montréal, Université de Montréal. Sitio
electrónico: www.olst.umontreal.ca.