Corpus lingüístico
Un corpus lingüístico es un conjunto amplio y estructurado de ejemplos reales de uso de la lengua. Estos ejemplos pueden ser textos (lo más común) o muestras orales (generalmente transcritas). Un corpus lingüístico es un conjunto de textos relativamente grande, creado independientemente de sus posibles fines de uso. Es decir, en cuanto a su estructura, variedad y complejidad, un corpus debe reflejar una lengua o su modalidad de la forma más exacta posible y, en cuanto a su uso, preocuparse que su representación sea real. Los córpora tienen similitudes con los textos porque están compuestos por ellos; por otro lado, no son textos en sí, porque, a diferencia de los mismos, no tiene sentido analizarlos en su totalidad. Un texto tiene un principio y un fin y es, en mayor o menor grado, cohesivo y coherente, mientras que un corpus carece de tales características por no poseer una estructura, sino sólo una composición. Por esta razón conviene analizar un corpus recurriendo a herramientas y metodología propias.Debido a su tamaño, accesibilidad, información lingüística y enciclopédica, muy alta fiabilidad y otras particularidades, la complicación de córpora ha llegado a ser uno de los principales, si no el principal, método e instrumento de la investigación de la lengua en la lingüística general.La necesidad de trabajar las muestras recogidas de forma eficaz y económica (teniendo en cuenta su enorme extensión), ha alentado el desarrollo de una de las ramas con más futuro de la lingüística contemporánea: la lingüística computacional. Actualmente los córpora se recogen y almacenan de manera electrónica.