Download Andrés Osvaldo Porta y María Cristina Messineo

Document related concepts

Idioma coahuilteco wikipedia , lookup

Gramática del pipil wikipedia , lookup

Diátesis (gramática) wikipedia , lookup

Idioma nukak wikipedia , lookup

Voz gramatical wikipedia , lookup

Transcript
Capítulo 132: 1065-1071
Descripción de la morfología verbal del toba
utilizando lenguajes lineales libres de contexto
Andrés Osvaldo Porta y María Cristina Messineo
En Víctor M. Castel y Liliana Cubo de Severino, Editores (2010)
La renovación de la palabra en el bicentenario de la Argentina.
Los colores de la mirada lingüística.
Mendoza: Editorial FFyL, UNCuyo.
ISBN 978-950-774-193-7
La renovación de la palabra / 1066
Descripción de la morfología verbal del toba
utilizando lenguajes lineales libres de contexto
Andrés Osvaldo Porta y María Cristina Messineo
Universidad de Buenos Aires y CONICET
Buenos Aires, Argentina
[email protected]; [email protected]
Resumen
Se identifican los lenguajes lineales libres de contexto como los pertinentes para el modelado de la
morfosintaxis de las formas verbales finitas del toba (guaycurú). Estos lenguajes forman una clase
entre la de los lenguajes regulares y los libres de contexto y de allí el valor de la descripción.
Introducción
Chomsky (1957) demostró que la sintaxis de lenguajes naturales no puede ser modelada por medio
de los autómatas que aceptan los lenguajes regulares. Se puede, sin embargo, intentar modelar
eficientemente la morfología de gran cantidad de lenguas utilizando estos autómatas. Johnson (1972)
y Kaplan y Kay (1994) demostraron, independientemente, que los formalismos fonológicos generativos
usuales para componentes no cíclicos de la morfofonología de las lenguas naturales tienen una
potencia expresiva equivalente a la de traductores de estados finitos. Sin embargo, estos modelos
presentan algunas limitaciones para tratar de manera natural ciertos fenómenos morfofonológicos
presentes en muchas lenguas naturales. Existen muchos lenguajes naturales que tienen morfologías
que hacen uso conjunto de la sufijación y de la prefijación y para los cuales existen interdependencias
entre los dos tipos de afijos. Estos procesos no pueden ser modelados de manera óptima por medio de
autómatas finitos. Consideremos, como ejemplo, el adjetivo derivado enlatable. Para obtener la
derivación del mismo a partir del nombre lata se debe suponer la existencia de dos ítems léxicos
diferentes obtenidos al marcar lata para cada una de las instancias. El autómata1 que modela esto
sería:
Fig1: esquema de la generación de lata y enlatable
Así, se agregan ítems léxicos produciéndose un aumento artificial y desmedido del léxico (Sproat,
1992).
El problema de la independencia entre prefijo y sufijo es muy común en las lenguas aborígenes
americanas. Una gran cantidad de lenguajes presentan sistemas morfologicos que utiliza prefijos y
sufijos con fenómenos de interdependencia entre los mismos.
El toba es una lengua de la familia Guaycurú, hablada en el Chaco argentino y paraguayo, con una
cantidad aproximada de entre 30.000 y 50.000 hablantes (Messineo, 2003). Presenta tres sets de
marcadores de personas. El marcador empleado es en ciertas ocasiones determinado por el grado de
afectación por la acción de la persona que la realiza. En (1) la aglutinación del sufijo de reflexivo
(-lat) obliga, en (b), la marcación de la persona activa con sufijos de la clase correspondiente a la voz
media porque el agente es afectado por la acción.
(1) (a) y-
alawat
3Activa -matar
Lit:¨el mata”
(b) n- alawat -l’at
3Media- matar -reflexivo
Lit:¨el se suicida”
En los procesos de derivación de nombres que se muestran en (2) y (3) a partir de verbos se utilizan
sufijos. Los nombres llevan prefijos que son marcadores persona poseedora de nombres.
Castel y Cubo, Editores (2010)
1067 / Descripción de la morfología verbal del toba utilizando lenguajes lineales libres de contexto
(2) l- edaGan -at
3Pos- escribir- Instr
”lápiz (de el)”
(3) ne- peGagenataGan -aGa
4pos- enseñar -Ag
”la maestra (de alguien)”
En relación al ejemplo anterior debe observarse que en el toba una clase muy grande de
sustantivos debe llevar marca de poseedor obligatoria.
En el maká, lengua de la familia mataguaya hablada en el Paraguay, los verbos derivados de otros
por medio del sufijo transitivizador-causativizador -inen, se exige la marcación de persona con el
prefijo en caso ergativo (Gerzenstein, 1994). Eso se ilustra en el ejemplo (4):
(4) he- wel
Suj1- subir
Lit:”Yo subo(intr.)”
hi- wel -inen
n -a’
y- as
A1- subir caus dem -masc po1- hijo
Lit:”Yo hago subir a mi hijo”
Similares procesos se observan en otras lenguas de las mismas familias y en otras como, por
ejemplo, la tupí-guaraní. La propuesta de Creider, Hankamerz y Wood (1995) consiste en modelar la
morfosintaxis de este tipo de lenguas por medio de autómatas no determinísticos de dos cabezales que
son los aceptores de los lenguajes lineales libres de contexto, con lo cual se liberan del requerimiento
de lectura de izquierda a derecha.
Lenguajes lineales libres de contexto y autómatas finitos no determinísticos de dos cabezales
Los lenguajes lineales libres de contexto son lenguajes generados por gramáticas cuyas
producciones son de alguna de las formas:
1. Aa
2. ABb
3. AaB
donde las símbolos en mayúsculas representan no terminarles y los símbolos en minúscula son
terminarles.
Estos lenguajes tienen propiedades expresivas superiores a la de los lenguajes regulares. En efecto
si consideremos el ejemplo (5)
(5) La gramática G = (N,Σ, P, S)
N = {S,A}
Σ ={a, b}
P : S → aA
A → Sb
S→λ
se tiene que G es una gramática lineal libre de contexto que genera al lenguaje y además que
Δ = L(G) = {anbn|n ≥ 0} es, por el lema de pumping para lenguajes regulares, no regular.
Por otra parte están propiamente incluídos en los lenguajes libres de contexto. Se puede,
demostrar, por medio de un lema de pumping para lenguajes lineales, que el lenguaje:
ΔΔ={st| s,t en Δ} no es lineal.
Rosenberg (1967) demostró que los dispositivos aceptores de los lenguajes lineales libres de
contexto son los autómatas finitos de dos cintas no determinísticos.
Estos autómatas constan de dos cintas independientes, en cada transición se lee solamente una de
las cintas. Si no hay transición en una cinta, la cabeza de lectura asociada no se mueve. Cuando
ambas cintas han sido procesadas, si el autómata está en un estado final, el string se acepta. Así si
una palabra se considera compuesta por prefijos, una raíz y sufijos.
pn +. . . + p1 + [raiz] + s1 +. . . + sn
Separando las dos cadenas se obtienen:
Andrés Osvaldo Porta y María Cristina Messineo
La renovación de la palabra / 1068
pn + . . . + p1
y
s1 +. . . + sn
El autómata lee una cinta que contiene los prefijos y otra que contiene los sufijos y equipado de
dos cintas puede analizar la buena formación de una palabra partiendo la posición inicial que se
muestra en la Fig2.
Fig2: Posición inicial de una autómata de dos cintas.
En relación al ejemplo la el autómata de dos cintas que modela la derivación de enlatable puede ser:
Fig3: Autómata que de dos cintas para generar enlatable. Las transiciones en negro y en rojo indican
transiciones de los cabezales que leen sufijos y prefijos, respectivamente.
Descripción de la morfología verbal del toba usando autómatas finitos de dos cabezas
La lengua toba pertenece, junto con el pilagá, el mocoví y el caduveo a la familia lingüística
guaycurú. En la actualidad, el toba se habla en la región del Gran Chaco (Argentina, Bolivia y
Paraguay) y en asentamientos permanentes denominados barrios en las ciudades de Resistencia,
Presidencia Roque Sáenz Peña, Rosario, Santa Fe, Buenos Aires y La Plata (Argentina).
El toba, es una lengua que desde el punto de vista de su tipología morfológica presenta
características de lengua aglutinante polisintética. En Messineo (2003) se muestra por medio del
análisis verbo “sanadatema” que en el verbo es posible codificar participantes y relaciones
gramaticales, de tal manera que una sola palabra puede expresar una oración completa.
(5) s- anat(a)
-d -em -a
1A- aconsejar- 2- dat- ben
Lit: “Yo te aconsejo”
El verbo constituye la clase de palabra morfológicamente más compleja. Las categorías
gramaticales de persona se prefijan al tema verbal y señalan persona, persona/número y caso
semántico. Se utilizan sufijos para marcar el plural de algunas personas como así también otras
categorías gramaticales como el aspecto, la dirección-locación de la acción, la marca de reflexivo y de
reciproco y el modo desiderativo. El verbo no tiene marca de tiempo.
Una de los rasgos caracteristicos del toba es el sistema de marcación Activo-Inactivo en los prefijos
verbales (Messineo[2003] y Klein [1978]). Existen en esta lengua dos sets de prefijos verbales que
marcan acción:
1. Tipo I (In): codifica participantes inactivos, objeto de verbos transitivos y pacientes de verbos
intransitivos.
2. Tipo II (Ac): señala participantes activos, sujeto de verbos transitivos e intransitivos.
Activo afectado (M): codifica la presencia de un participante activo afectado por la acción a la que hace
referencia el verbo.
Castel y Cubo, Editores (2010)
1069 / Descripción de la morfología verbal del toba utilizando lenguajes lineales libres de contexto
Análisis del paradigma verbal de primera y segunda persona
Consideraremos en primer lugar el caso de la primer y segunda persona por ser más sencillos. Para
la primera y segunda personas los marcadores son:
I (inactivo) II Activo II Activo afectado
1.SG 3(V)- s(V)- ñ(V)2.SG ?ad- ?aw- ?an1.PL qad- s(V)- ˜n(V)2.PL qad-. . . -i qaw-. . . -i qan-. . . -i
A partir de esto construimos los autómatas que modelan la marcación con cada uno de estos
paradigmas. Teniendo en consideración que la aplicación del reflexivo obliga la marcación con prefijos
del tipo II, Activo afectado; los procesos de derivación de verbo a nombre y viceversa (ver ejemplos),
como asi también la flexión de la tercera persona (que será considerada más adelante) se tiene que,
desde el punto de vista computacional, es más natural una descripción de la morfología del toba en
términos de autómatas de dos cabezas. Detallamos a continuación los diferentes afijos que se
aglutinan al verbo, según el box que ocupan.
1. Caus dados por los sufijos causativos y sus alomorfos se aglutinan inmediatamente después de la
raíz verbal. Se han contabilizado hasta 4 aglutinaciones sucesivas de sufijos, estos no tienen
influencia en la clase de prefijo marcador de persona utilizado en cuanto cuando el análisis se
restringe a la primera y segunda personas..
(6) seque’e: yo como.
sequiaGan: yo le doy de comer
2. Pl: sufijos plurales, ocupan el box2.
3. Asp: los sufijos que marcan aspecto ocurren antes que los que marcan lugar y dirección y después
de las marcas de plural de agente y de los causativos. Estos sufijos pueden marcar aspecto puntual ((V)n), aspecto durativo (-ta), aspecto progresivo (-tak y alomorfos), aspecto iterativo (-i?)
4. Dir: los sufijos direccionales marcan la dirección de la acción
a) hacia el interior: −wek
b) hacia afuera: −wo
c) hacia arriba: −šigem
d) hacia abajo: −ñi
e) hacia el agua: −aGasom
f ) hacia el fuego:−waq
5. Loc: los sufijos locativos expresan la ubicación relativa de los referentes argumentales.
Su box es contiguo y posterior al de los direccionales
a) sobre: −lek
b) en el interior de: −gi
c) debajo (escondido) de −?ot
d) debajo (a la vista) de: −asop
e) en un lugar determinado: −a
f ) al lado: −at
g) lugar a poca distancia: −i
h) orientado a: −ge
i ) enfrentado, opuesto: −get
6. Recp: sufijo que indica acción recíproca: (V )aat, la aplicación de este sufijo implica el uso de prefijos
de persona correspondiente al tipo de Activo afectado.
7. Refl: sufijo de acción reflexiva, es decir la acción del verbo cae sobre la persona que realiza la
acción: lat. Al igual que el sufijo anterior implica el uso de un marcador del tipo Activo Afectado.
8. Neg: prefijo de negación, sa-, ocupa el primer box en la palabra, contiguo y antecediendo al de la
marca de persona.
Teniendo en cuenta el orden y las mutuas restricciones entre los sufijos y prefijos construímos un
autómata tentativo para describir la morfología verbal del toba para la primera y la segunda persona.
Este autómata se muestra en la Fig4. Obsérvese que la marca de persona se determina casi en última
instancia (con el cabezal que lee prefijos) para tener en cuenta la acción de los reflexivos y recíprocos.
Andrés Osvaldo Porta y María Cristina Messineo
La renovación de la palabra / 1070
Fig4: Diagrama de estados del autómata de dos cintas que modela la primer y segunda personas
verbales del toba. Las transiciones en negro y rojo, indican transiciones del cabezal que lee sufijos y
prefijos, respectivamente.
Análisis del paradigma de tercera persona
El caso del modelado para la tercera persona parece ser más complicado en el toba y en todas las
lenguas de la familia guaycurú. Aquí la transitividad del verbo parece jugar un importante papel en la
selección de la marca. Los marcadores correspondientes son Messineo [2003]:
Tr: i-/y- para verbos transitivos y sujetos de algunos intransitivos
In: d(V) para verbos tipicamente intransitivos.
M: n sujetos de verbos medios.
La sucesiva aplicación de los causativos parece actuar aquí, según la interpretación de Buckwalter,
como haciendo un switchching en la transitividad del verbo original. Esto se puede observar en los
ejemplos (7) y (8), Buckwalter[2001:350):
(7) VI de- quee
(8)
come
VT i- qui -aGan
le da de comer
VI de- qui--aGanataGan
da de comer
VT i-
qui -aGanataGanaGan
le manda dar de comer
VI de
qui -aGanaGanataGan
manda dar de comer
VI do- ochi
duerme
VT i- ochi -aqchit
le hace dormir
VI do- ochi -aqtaGan
hace dormir
VT i- ochi –aqtaGanaGan
le manda hacer dormir
VI do-ochi -aqtaGanataGan manda hacer dormir
Para modelar este comportamiento con nuestros autómatas de dos cabezales definimos dos
recorridos determinados por la transitividad del verbo resultante después de la adjunción de los
causativos. Estos recorridos quedan definidos por la paridad de la cantidad de causativos aglutinados.
A partir de la tercera persona también se forma la tercera persona de actor indefinido a partir de un
prefijo, qa-, que es anterior y contiguo a la marca de tercera persona usual y posterior a la marca de
negación sa-.
El resto de la derivación, incluyendo el comportamiento con respecto a los sufijos de reflexivo y
acción recíproca, se modela igual que con las otras personas.
En este caso se hace más evidente la conveniencia de trabajar con autómatas de dos cabezales,
pues de otra manera tendríamos que trabajar con mayor cantidad de estados o agregar más elementos
al léxico para modelar el comportamiento de la derivación verbal con causativos que es un proceso
muy productivo en las lenguas chaqueñas.
Castel y Cubo, Editores (2010)
1071 / Descripción de la morfología verbal del toba utilizando lenguajes lineales libres de contexto
Fig5: Diagrama de estados del autómata de dos cintas que modela la tercer persona verbal de verbos
intransitivos en toba. Las transiciones en negro y rojo, indican transiciones del cabezal que lee
sufijos y prefijos, respectivamente.
Para ilustrar el funcionamiento de este dispositivo, consideraremos el siguiente ejemplo:
(9) qaikiaGanataGanaGanaGasomgi: (alguien) le manda dar de comer dentro del agua
La sucesión de estados que corresponden a este autómata se muestran en la Fig6:
Fig6
Notas
1 Supondremos que el lector maneja las definiciones bácicas de la teoría de lenguajes regulares y autómatas finitos. Vease, por
ejemplo, Hopcroft (1979) para una introducción.
2 Abreviaturas: Asp:aspecto; ben:benefactivo; Caus: causativos; dat:dativo; dem:demostrativo; Neg:negación; Pl: plural; Pos:
posesivo; PrAc:prefijo actor (M:medi;In:intrasitivo;Tr:transitivos); recip:recíproco;refl:reflexivo
Referencias
Antworth, Evan L.(1990) PC-KIMMO: a two-level processor for morphological analysis.Nº 16 in Occasional
publications in academic computing. Dallas: Summer Institute of Linguistics.
Buckwalter, Alberto (2001) Vocabulario toba. Formosa / Indiana, Equipo Menonita.
Chomsky, Noam (1957) Syntactic structures. The Hague: Mouton.
Creider, Chet, Hankamer, Jorge y Wood, Derick (1995) “Preset two-head automata and morphological analysis of
natural language”. International Journal of Computer Mathematics, 1029-0265, Volume 58, Issue 1, pp. 1-18.
Gesrzestein, A.(1994) Lengua maká. Estudio descriptivo. Buenos Aires: Instituto de Lingüística, Facultad de
Filosofía y Letras, U.B.A. (Colección “Nuestra América”. Serie Archivo de lenguas Indoamericanas.
Hopcroft J. and Ullman J.(1979) Introduction to Automata Theory, Languages and Computation. Addison-Wesley.
Johnson, C. Douglas (1972) Formal Aspects of Phonological Description. The Hague: Mouton.
Kaplan, Ronald M. and Martin Kay (1994) “Regular models of phonological rule systems”. Computational Linguistics
20 (3):331-378
Klein, Harriet Manelis (1978) Una gramática de la lengua toba: morfología verbal y nominal. Montevideo:
Universidad de la Republica (ed. en ingles 1974).
Messineo, Cristina (2003) Lengua toba (guaycurú). Aspectos gramaticales y discursivos. LINCOM Studies in Native
American Linguistics 48. München: LINCOM EUROPA Academic Publisher.
Sproat, R.(1992) Morphology and Computation. The MIT Press.
Andrés Osvaldo Porta y María Cristina Messineo