Download 3_Analisis_semantico

Document related concepts

Traducción automática mediante transferencia wikipedia , lookup

Léxico wikipedia , lookup

Oración (gramática) wikipedia , lookup

Semántica lingüística wikipedia , lookup

Etiquetado gramatical wikipedia , lookup

Transcript
LINGÜÍSTICA COMPUTACIONAL
UNIDAD 2. ANÁLISIS SEMÁNTICO
Ana María Tangarife Patiño
ANÁLISIS SEMÁNTICO




El análisis semántico está encaminado a la resolución de
problemas con respecto a los sentidos de las palabras o las
expresiones usadas de manera automática
Dentro de la LC la semántica pretender estructurar
representaciones automáticas del lenguaje natural en
máquinas a partir de plantillas de sentido para ejecutar
inferencias.
Permite expresar significados lingüísticos, enlazar
información gramatical con otras clases, procesar significados,
validar equivalencias.
A partir de clasificaciones y categorizaciones de distintos
elementos de la lengua, se generan esquemas conceptuales
para realizar inferencias


Traducción automática
Recuperación de información
RELACIONES SEMÁNTICAS



Se definen a partir de roles temáticos en donde
se representan cada uno de los componentes de la
oración.
Son graficadas a partir de un marco de casos
partiendo de la premisa de que un grupo de estos
casos es suficiente para modelar el lenguaje.
Estos marcos se han hecho principalmente para
los verbos.
CLASIFICACIONES VERBALES
Determinar verbos que corresponden al mismo
prototipo.
 LPPO: Lógica de Predicados de Primer
Orden

Parte de la lógica matemática estableciendo una
lógica preposicional empleando variables,
predicados y cuantificadores.
 Se establecen reglas de formación de oraciones y de
inferencia que siguen axiomas lógicos.


Gramática de casos de Fillmore

Relaciones entre el verbo y demás elementos de la
oración a partir de las cuales se establecen roles
semánticos.
MODELOS DE ANÁLISIS SEMÁNTICO
LÓGICA DE PREDICADOS DE PRIMER ORDEN


Sirve para representar el lenguaje de manera formal
Hace uso de:
Reglas de formación o fórmulas
 Reglas de inferencia
 Axiomas lógicos







Emplea variables, predicados y cuantificadores (lógica
proposicional o lógica simbólica), usando los
siguientes símbolos:
Negación ( )
Conjunción ( )
Disyunción ( )
Implicación ( )
Coimplicación ( )
MODELOS DE ANÁLISIS SEMÁNTICO
LÓGICA DE PREDICADOS DE PRIMER ORDEN
MODELOS DE ANÁLISIS SEMÁNTICO
CÁLCULO DE LAMBA



Formalismo matemático, base de la computación.
Permite construir fórmulas semánticas a partir
de representaciones sintácticas.
Unas expresiones X representan un algoritmo y
su entrada, la expresión Y está sujeta a una serie
de reglas de reescritura.
MODELOS DE ANÁLISIS SEMÁNTICO
GRAMÁTICA SINTAGMÁTICA NUCLEAR




Representación gráfica matemática de
información sintáctica y semántica.
Usa grafos para representar información
lingüística como secuencia de características.
Incluye principales reglas gramaticales basados
en entradas léxicas (palabras o frases) que son
marcadas en forma jerárquica.
Cada entrada léxica contiene información
fonética (PHON) y sintáctico-semántica
(SYNSEM).
MODELOS DE ANÁLISIS SEMÁNTICO
GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO
MODELOS DE ANÁLISIS SEMÁNTICO
GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO
MODELOS DE ANÁLISIS SEMÁNTICO
MRS MINIMAL RECURSION SEMANTICS


Usa para representaciones en las cuales se
presenten problemas de ambigüedades.
Este modelo parte del enfoque de que una
estructura mínima del lenguaje representa y
describe léxica y semánticamente la lengua
general.
MODELOS DE ANÁLISIS SEMÁNTICO
MTT MEANING TEXT THEORY

Representa reglas lingüísticas de acuerdo a
significados específicos en un texto.
Usa patrones de manejo para combinar un
lexema con otros objetos.
 Permite representar equivalentes gráficos que
son legibles por computador puesto que se basan
en redes semánticas..


Este modelo establece una correspondencia entre
posibles significados y un conjunto de posibles
textos.
AMBIGUACIÓN Y DESAMBIGUACIÓN
Ambigüedad: Que puede entenderse de varios
modos o admitir distintas interpretaciones y
dar, por consiguiente, motivo a dudas,
incertidumbre o confusión.
 Este es un problema mayor puesto que es difícil
representar todas las variables que pueden
presentarse en el lenguaje natural.
 Se presenta cuando ocurren diferentes
fenómenos, que podrían resolverse en contexto,
pero que es necesario prever en la
implementación de herramientas
computacionales.

FENÓMENOS DE AMBIGÜEDAD


Significados o sentidos de palabras o expresiones
de acuerdo a contextos particulares de
conocimiento.
Puede presentarse por las siguientes situaciones:


Palabra que tiene más de un significado de acuerdo a
la categoría o al tiempo gramatical
Sinonimia


Homonimia


Dos o más palabras que representan el mismo concepto
Dos o más palabras con la misma forma gráfica y distinto
significado según el contexto
Polisemia

Una palabra cuyo sentido varía según el contexto
PROBLEMAS EN EL TRATAMIENTO AUTOMÁTICO
QUE TIENEN QUE VER CON LA AMBIGÜEDAD



Dudas, incertidumbre o confusión.
En sistemas automáticos de representación de
conocimiento es necesario minimizar estos problemas
representando los casos más comunes en el lenguaje
natural para proveerle a la máquina métodos que le
permitan inferir sobre posibles sentidos y decidir las
respuestas más adecuadas
Otra clasificación de tipos de ambigüedad:
Léxica
Sintáctica
Semántica
 Textual
 Pragmática
 Referencial.




La desambigüación se realiza principalmente en
tareas de:
Traducción automática
 Recuperación de información



Solución: determinar automáticamente los
sentidos de una palabra de acuerdo a contextos
específicos.
Para lograr esto se llevan a cabo diferentes
métodos que están basados bien sea en el
conocimiento, en el corpus o métodos híbridos.
MÉTODOS BASADOS EN CONOCIMIENTO
Los métodos basados en conocimiento utilizan
herramientas como diccionarios, tesauros,
ontologías.
 Ayudan a especificar los sentidos de acuerdo a
usos particulares de las palabras en contextos
específicos (lenguaje natural o lenguaje
especializado).
 El propósito de estas herramientas es proveer de
significados, definiciones y ejemplos típicos de
uso de las palabras.
 Ejemplo: Wordnet

MÉTODOS BASADOS EN CORPUS



Usan conjuntos de datos que proveen ejemplos de
oraciones y de usos de las palabras de tal forma que
puedan utilizarse en algoritmos de aprendizaje
automático.
Estos métodos están divididos en dos tipos: corpus
etiquetado y corpus no etiquetado.
Corpus etiquetado:
Clasificadores para darle sentido apropiado a una palabra
dentro de un contexto determinado.
 Se encuentran automáticamente relaciones o patrones
entre las palabras y luego evalúan y comparan los sentidos
para realizar la desambiguación correcta
 Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones.


Corpus no etiquetado:

Patrones que se definen para armar grupos de palabras con
características comunes que se relacionan de alguna
manera.
MÉTODOS COMBINADOS
GENERACIÓN AUTOMÁTICA DE ESQUEMAS
CONCEPTUALES



Permiten la interacción en lenguaje natural entre el
usuario y el computador.
Facilitan tareas de recuperación y extracción
automática de textos en corpus específicos, así como
otros modelos o sistemas de etiquetaje, análisis y
desambiguación
Algunas herramientas:







Extracción automática de contextos definitorios:
http://swesum.nada.kth.se/index-eng.html
Anotaciones semánticas
Ayuda en la escritura (corrección)
Extracción automática de terminología
Indexación automática
Data mining textual
Patrones y tendencias del discurso
ESQUEMAS PRECONCEPTUALES


Representaciones gráficas y textuales que
permiten una interpretación cercana a la
realidad conceptual de un dominio.
Identifica las características estructurales y
dinámicas de una lengua, ofreciendo a cada
elemento una única categoría gramatical, lo que
permitiría una mayor precisión de sentidos.
ESQUEMAS PRECONCEPTUALES
Identificación
Nombre
Predicado
tiene
tiene
Objeto
Agente 1
Verbo
Verbo
Agente 2
UN-LECEP

Lenguaje controlado en español para la
especificación de esquemas preconceptuales,
generación de plantillas para la escritura de
dichos esquemas.
RETOS…
Implementación y desarrollo de esquemas o
categorías conceptuales en dominios específicos
 Aplicaciones que no queden restringidas a la
aplicación en otras lenguas. Hace falta más
desarrollo y divulgación de aplicaciones en lengua
castellana.
 Construcción de ontologías que faciliten la
estructuración y haga una marcación semántica
de los documentos en la web a través del uso de
términos específicos y la representación de las
relaciones conceptuales entre ellos.
 Utilización de métodos de análisis combinados
(estadísticos y cualitativos)

REFERENCIAS

http://www3.unileon.es/dp/dfh/Milka/LCII/Intro_LCA.pdf

http://rua.ua.es/dspace/bitstream/10045/3346/1/PLN_37_44.
pdf

http://www.sepln.org/revistaSEPLN/revista/27/27articulo33.pdf

http://ccc.inaoep.mx/~mmontesg/tesis%20estudiantes/Tesis
Maestria-AaronPancardo.pdf

http://www.revista.unal.edu.co/index.php/formayfuncion/ar
ticle/viewFile/17290/18129

http://tecnolengua.uma.es/doc2/resla98.pdf