Download Sistemas Conversacionales en Español Hablado

Document related concepts
no text concepts found
Transcript
Objetivos del Proyecto DIME
Sistemas Conversacionales en
Español Hablado:
Una reflexión desde el proyecto DIME
Dr. Luis A. Pineda
IIMAS, UNAM, México
Mayo, 2006
Construcción
de sistemas conversacionales
– En español hablado
– Multimodales (e.g. Interfaz gráfica, robots
móviles)
Basados en la definición de Modelos de diálogos
Base empírica:
– Fonética & prosodia
– Inf. léxica, sintáctica & semántica
– Inf. pragmática
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Contenido
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMSL
Predicción de actos del habla
Reconocimiento de voz
Participantes
Contenido
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Reconocimiento de voz
Participantes
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Modelos de diálogos
situación conversacional
– Estado informacional
– Orientada hacia una modalidad
– Conjunto de intenciones específicas
– Conjunto de actos del habla que expresan
dichas intenciones
– Conjunto de acciones lingüísticas (actos
retóricos) o motoras que las satisfacen
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Situación conversacional
La
El Proyecto DIME, DCC-IIMAS, UNAM 2006
si-1
SpAct:RhtAct
si
SpAct:RhtAct
si+1
En cada situación sólo un pequeño conjunto
de intenciones es relevante
El Proyecto DIME, DCC-IIMAS, UNAM 2006
1
Situación conversacional
Situación conversacional
Input SpAct
si-1
SpAct:RhtAct
si
SpAct:RhtAct
SpAct:RhtAct
si-1
si+1
si
SpAct:RhtAct
si+1
RhtAct
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El modelo básico
MD = Sistema Intérprete
Modelo
de la conversación:
– Conjunto de modelos de diálogos
Modelo de diálogo:
– Conjunto de situaciones
– Relaciones entre situaciones: pares acto
del habla y acto retórico
Especificación declarativa a partir del
análisis de la tarea
Modelos de diálogo
(Exp. Reg.)
Acto
del
Habla
Acto
Retórico
Intérprete
Red de transición aumentada
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Generación (acción)
Actos retóricos básicos
(Específicos a la modalidad)
Acto
Retórico
Intérprete
Texto
(acción)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Platicando con Golem!
turno
Part.
1
s
2
u
3
s
4
u
5
s
Acto Retórico
Saludo
Presentación
Oferta
- S/N
Texto
Bienvenido
Este es el departamento de ciencias de la
computación
¿Quieres una visita guiada?
Si, por favor
Introducción
El departamento tiene las áreas de inteligencia
artificial, reconocimiento de patrones y lenguajes
de programación
Opción
- abierta
- que
¿Qué área quieres vistar?
Inteligencia
Confirmación
Acto motor
Introducción
Okey, vamos a inteligencia artificial
El robot se desplaza a IA
Esta es el área de inteligencia artificial; podemos
hacer la visita por personal académico, ara o
proyectos
Opción
- abierta
- como ¿Cómo quieres hacer la visita?
El Proyecto DIME, DCC-IIMAS, UNAM 2006
2
Platicando con Golem!
turno
Part.
6
u
7
s
8
u
9
s
Part.
11
s
Por proyectos
12
u
Presentación
En inteligencia artificial se desarrollan los
proyectos DIME y GOLEM
13
s
Elaboración
Las tareas principales son la creación de
prototipos con manejadores de diálogos
inteligentes con entrada y salida hablada en
español, y visión por computadora
Terminamos con proyectos de inteligencia
artificial
¿Quieres seguir visitando inteligencia artificial?
Texto
Por proys
Error
Solicitud- repetición
Notificación
Opción- s/n
10
Platicando con Golem!
turno
Acto Retórico
u
Perdón... No te entendí!
¿Podrías repetirlo?
Okey
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Acto Retórico
Introducción
Texto
Inteligencia artificial tiene personal académico y
áreas
Opción
- abierta
- como Cómo quieres visitar inteligencia artificial
Por áreas
Presentación
Elaboración
Notificación
Opción
- s/n
14
u
15
s
En inteligencia artificial se investiga en sistemas
multimodales inteligentes, gramáticas
computacionales del español, razonamiento
gráfico y creatividad
Y también visión por computadora
Terminamos con área de inteligencia artificial
¿Quieres seguir visitando inteligencia artificial?
no
Notificación
Agradecimiento
Opción
- s/n
Terminamos con inteligencia artificial
Gracias por visitar inteligencia artificial
¿Quieres seguir visitando el departamento?
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Platicando con Golem!
turno
Part.
16
u
17
s
Acto Retórico
Texto
No, gracias
Agradecimiento
Despedida
Gracias por el departamento de ciencias de la
computación
Hasta luego
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Contenido
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMSL
Predicción de actos del habla
Reconocimiento de voz
Participantes
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El proyecto PLOW
(James Allen & Lucian
Galescu)
Galescu)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
3
Tipos de Modelos de Diálogo
Modelos de diálogos
predicativos
Proposicional:
– Intenciones concretas
– Interpretación de actos del habla: Claves léxicas &
modelos del lenguaje (e.g. Estocásticos y/o
expresiones Regulares)
Predicativos:
SpAct(H,C):RhtAct(H,C)
f(H,C)
si
– Intenciones específicadas dinámicamente
– La interpretación de actos del habla depende del
discurso (historia) y del contexto (indexical)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Interfaz gráfica
Contenido
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Reconocimiento de voz
Participantes
Home Designer
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Corpus DIME
15
sujetos
26 diálogos útiles
880 palabras por diálogo
185 elocuciones
115 turnos
14 minutos
1120 palabras (tipos)
Alófonos (T54)
D12, utt3: u: ¿Puedes mover la estufa hacia la izquierda?
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
4
Sílabas fonéticas
Palabras (ortográfica)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Break indices de ToBI
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Part of Speech (P.O.S.)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
D12, utt3: u: ¿Puedes mover la estufa hacia la izquierda?
Contenido
Modelos
Etiquetación prosódica con INTSINT
M T
L
H
L
U H
D
B
H
H
L
El Proyecto DIME, DCC-IIMAS, UNAM 2006
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Reconocimiento de voz
Participantes
El Proyecto DIME, DCC-IIMAS, UNAM 2006
5
Estructura del diálogo
DIMEDIME-DAMSL
Los
DIME:
– Diálogos Inteligentes Multimodales en
Español
DAMLS:
– Dialog Act Markup in Several Layers
– Se asume que los actos del habla son
diálogos se modelan como una
secuencia de transacciones
Cada transacción involucra dos planos:
– Obligaciones conversacionales
– Conocimiento compartido “Common
ground”:
independientes del contexto de la
transacción!
Acuerdo
Entendimiento
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Estructura de la transacción
Especificación
de la intención:
– Usuario expresa intención
– Sistema interpreta intención
Satisfacción de la intención:
– Sistema proporciona información o
realiza acción
– Sistema solicita confirmación
– Usuario confirma y acepta acción
Balance de obligaciones
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Balance de obligaciones
Especificación de intención principal (usuario)
– Crea una obligación (cargo)
Interpretación de la intención (sistema)
– Transacciones de interpretación (pueden ser varias)
– Compromiso (cargo)
Acción principal (sistema):
– Acción multimodal (crédito, crédito)
– Solicitud de confirmación (cargo)
Interpretación de la acción (usuario)
– Multimodal interpretation (visual)
– Action confirmation (cargo)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Especificación de intención principal (usuario)
– Crea una obligación (cargo)
Interpretación de la intención (sistema)
– Transacciones de interpretación (pueden ser varias)
– Compromiso (cargo)
Acción principal (sistema):
– Acción multimodal (crédito, crédito)
– Solicitud de confirmación (cargo)
Interpretación de la acción (usuario)
– Multimodal interpretation (visual)
– Action confirmation (cargo)
Balance de acuerdo
Especificación de acción principal (sujeto)
– Crea una obligación (cargo)
Intention interpretation (sistema)
– Interpretation transactions (pueden ser muchas)
– Se debe aceptar (crédito)
Main information or action act (sistema):
– Multimodal action (cargo)
– Request action confirmation (cargo)
Action interpretation (sujeto):
– Multimodal interpretation (visual)
– Action acceptance (crédito)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
6
La estructura básica
Balance de obligaciones
Especificación de intención principal (usuario)
– Crea una obligación (cargo)
Interpretación de la intención (sistema)
– Transacciones de interpretación (pueden ser varias)
– Se debe aceptar (crédito)
Acción principal (sistema):
– Acción multimodal (cargo)
– Solicitud de confirmación (cargo)
Interpretación de la acción (usuario)
– Multimodal interpretation (visual)
– Action confirmation (crédito)
Intención principa (usaurio)
– utt25 :
después <sil> me puedes poner <sil> [e]l el
extractor de aire encima de la <sil> de la estufa
Interpretación de la intención (sistema)
Satisfacción de la intención (sistema):
– utt26 : s: okey
– utt27 : s: realiza acción
así está bien ?
Interpretación de la acción (usuario):
– Multimodal interpretation (visual)
– utt28 : u: sí
– utt29 : así está bien
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
La estructura básica
Intención principal (usuario)
DIMEDIME-DAMLS tags
después <sil> me puedes poner <sil> [e]l el
extractor de aire encima de la <sil> de la estufa (dir-accion)
después <sil> me puedes poner <sil> [e]l el (cargo)
extractor de aire encima de la <sil> de la estufa
Interpretación de la intención (sistema)
– utt26 : s: okey (cargo)
Satisfacción de la intención (sistema):
– utt27 : s: realiza acción (crédito, crédito)
así está bien ? (cargo)
Interpretación de la acción (usuario):
– Multimodal interpretation (visual)
– utt28 : u: sí
– utt29 : así está bien (crédito)
Intención principal (usuario)
– utt25 :
– utt25 :
Interpretación de intención (sistema)
– utt26 : s: okey (compromiso)
Satisfacción de la intención (sistema):
– utt27 : <ruido> <no-vocal> (mueve-obj)
así está bien ? (sol-inf)
Interpretación de la acción (usuario):
– Multimodal interpretation (visual)
– utt28 : u: sí
– utt29 :
así está bien (resp)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Estructura de acuerdo
Intención principal (usuario)
DIMEDIME-DAMSL tags
– utt25 :
después <sil> me puedes poner <sil> [e]l el
extractor de aire encima de la <sil> de la estufa (cargo)
Interpretación de la intención (sistema)
– utt26 : s: okey (crédito)
Satisfacción de la intención (sistema):
– utt27 : <ruido> <no-vocal> (cargo)
así está bien ? (cargo)
Action interpretation (subject):
Intención principal (sujeto)
– utt25 :
después <sil> me puedes poner <sil> [e]l el
extractor de aire encima de la <sil> de la estufa
Intention interpretation (sistema)
– utt26 : s: okey (acepta 25)
Satisfacción de la intención (sistema):
– utt27 : <ruido> <no-vocal> (afirm)
así está bien ?
Action interpretation (subject):
– Multimodal interpretation (visual)
– Interpretación multimodal (visual)
– utt28 : u: sí
– utt28 : u: sí
– utt29 :
así está bien (crédito (2))
El Proyecto DIME, DCC-IIMAS, UNAM 2006
– utt29 :
así está bien (acepta 27, afirm)
El Proyecto DIME, DCC-IIMAS, UNAM 2006
7
DIMEDIME-DAMSL tags (obligaciones)
48 u
me puedes mover la <sil> la alacena que está <sil> en la
pared de la izquierda hacia arriba del refrigerador ?
49 s
50 u
51
52 s
53
54 u
55 s
<no-vocal> en la pared de la izquierda ?
DIMEDIME-DAMLS tags (acuerdo)
dir-accion
48 u
me puedes mover la <sil> la alacena que está <sil> en la
pared de la izquierda hacia arriba del refrigerador ?
sol-inf
49 s
50 u
51
52 s
53
54 u
55 s
56
57 u
58
<no-vocal> en la pared de la izquierda ?
si
resp 49
ésta
okey
dónde quieres que la ponga ?
sol-inf
arriba del frigobar
resp 53
compromiso
okey
56
<s performs action> ahí está bien ?
57 u
58
si
mueve-obj
sol-inf
si
ésta
afirm
okey
ack
dónde quieres que la ponga ?
afirm
okey
acepta 48
<ruido> (s performs action) ahí está bien ?
ahí está bien
afirm/acepta 56
El Proyecto DIME, DCC-IIMAS, UNAM 2006
DIMEDIME-DAMSL
Contenido
DIME-DAMLS
– Conversación: secuencia de transacciones
– Estructura de la transacción
Especificación de la intención
Satisfacción de la intención
– Balance en los planos de obligaciones y
acuerdo
– Muy metida: Varinia Estrada
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Sistema de reconocimiento de voz
Participantes
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
DIMEDIME-DAMSL tags (obligaciones)
me puedes mover la <sil> la alacena que está <sil> en la
pared de la izquierda hacia arriba del refrigerador ?
49 s
50 u
51
52 s
53
54 u
55 s
<no-vocal> en la pared de la izquierda ?
56
<s performs action> ahí está bien ?
57 u
58
DIMEDIME-DAMLS tags (acuerdo)
dir-accion
48 u
me puedes mover la <sil> la alacena que está <sil> en la
pared de la izquierda hacia arriba del refrigerador ?
sol-inf
49 s
50 u
51
52 s
53
54 u
55 s
56
57 u
58
<no-vocal> en la pared de la izquierda ?
si
resp 49
ésta
okey
sol-inf
dónde quieres que la ponga ?
resp 53
arriba del frigobar
compromiso
okey
mueve-obj
sol-inf
si
ahí está bien
afirm
si
El Proyecto DIME, DCC-IIMAS, UNAM 2006
48 u
espera 48
arriba del frigobar
resp 56
ahí está bien
espera 48
resp 56
El Proyecto DIME, DCC-IIMAS, UNAM 2006
espera 48
si
ésta
afirm
okey
ack
dónde quieres que la ponga ?
espera 48
arriba del frigobar
afirm
okey
acepta 48
<ruido> (s performs action) ahí está bien ?
afirm
si
ahí está bien
afirm/acepta 56
El Proyecto DIME, DCC-IIMAS, UNAM 2006
8
¿Cómo identificamos el acto del habla?
Predicción de actos del habla
Construcción
Input SpAct
SpAct(H,C):RhtAct(H,C)
f(H,C)
si
de árboles de decisión
Predictores:
– Tonos (INTSINT)
– Duraciones (diferentes unidades)
– Fronteras entre unidades (Break Indices)
Objetivo (Target):
– Etiquetas DIME-DAMSL
Herramientas:
Tesis
CART-Style (J4)
doctoral: Sergio Coria
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Modelos de diálogos
Sistemas conversacionales
predicativos
Input SpAct
Definición
SpAct(H,C):RhtAct(H,C)
f(H,C)
si
Especificación de situaciones:
– Tipos de actos del habla
– Información léxica (parseo superficial)
– La semántica está dada por los roles y funciones
(atributos y valores) de la situación en la que se
realiza la interpretación
modelos básicos
Aprendizaje
Interpretación
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Reconocimiento de voz
Contenido
Modelos
de diálogos
El estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Reconocimiento de voz
Participantes
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Es
indispensable contar con tecnología de
reconocimiento de voz:
– Abierta
– Adaptable
Uso
de herramientas tecnológicas de punta
Creación de recursos lingüísticos para cada
lengua
El Proyecto DIME, DCC-IIMAS, UNAM 2006
9
Reconocimiento de voz en el
proyecto DIME
El Corpus DIMEx100
– Creación de modelos acústicos
– Creación de diccionarios de pronunciación
– Creación de modelos de lenguaje
El sistema Sphinx
– Entrenamiento
– Decodificación
– Validación
Corpus DIMEx100
Estructura:
– 100 hablantes
– 5,010 frases diferentes
–50 específicas por hablantes
–10 comunes a los 100 hablantes
– 6,000 *.wav archivos
Coordinación
y control de calidad:
– Hayde Castellanos
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Niveles de Transcripción
T22:
Fonémas básicos del español (México)
T44:
– T22
– Cierres de oclusivas y africadas sordas
– Aproximantes
– Acentos y paravocales
– Codas silábicas neutralizantes
T54
T56:
T44 + otros alófonos comunes
en la definición de Mexbet de
Javier Cuétara
Basados
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
T44
T22
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
10
Contenido
El Reconocedor para el
español de México
del
Proyecto DIME
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Modelos
de diálogos
estado del arte...
El Corpus DIME
El esquema DIME-DAMLS
Predicción de actos del habla
Reconocimiento de voz
Participantes
El
El Proyecto DIME, DCC-IIMAS, UNAM 2006
Participantes
Coordinador:
Luis Pineda
Participantes:
– Hayde Castellanos, Sergio Coria, Varinia
Estrada, Fernanda López, Ivonne López, Isabel
López, Iván Moreno, Patricia Pérez Pavón
Colaboradores UNAM:
– Javier Cuétara, Carlos Rodríguez
Muchas gracias!
Colaboradores externos:
– James Allen, Joaquím Llisterri, Montserrat
Riera, Ivan Meza, Lucian Galescu, Luis
Villaseñor
Financiamiento:
NSF/CONACyT 39380-U
El Proyecto DIME, DCC-IIMAS, UNAM 2006
El Proyecto DIME, DCC-IIMAS, UNAM 2006
11