Descripción del Proyecto/ Project Summary

INGRACOMLEN es un proyecto financiado por el Ministerio de Economía y Competitividad y el Fondo Europeo de Desarrollo Regional: FFI2015-69978-P (MINECO/FEDER, UE), Programa Estatal de Fomento de la Investigación Científica y Técnica de Excelencia, Subprograma Estatal de Generación de Conocimiento.

Este proyecto se centra en uno de los supuestos básicos de la lingüística: el dogma de la equicomplejidad lingüística.

A la pregunta de si todas las lenguas son igual de complejas, la lingüística del siglo XX ha respondido con el principio de la invariabilidad en el nivel de complejidad, defendiendo la hipótesis del equilibrio, que afirma que la complejidad total de una lengua es invariante porque las sub-complejidades en sub-sistemas lingüísticos se compensan. Esta idea de la equi-complejidad, vista durante décadas como un axioma indiscutible de la lingüística, ha empezado a ser cuestionada explícitamente en los últimos años.

Son muchos los modelos que se han propuesto para confirmar o rebatir la hipótesis de la equi-complejidad lingüística. Las herramientas, criterios o medidas para cuantificar el nivel de complejidad de las lenguas son muy variados y dependen de los intereses concretos de la investigación que se realice y de la definición de complejidad que se adopte. De momento, no hay una solución clara para cuantificar la complejidad de las lenguas y cada uno de los modelos propuestos presenta ventajas e inconvenientes.

El objetivo central de nuestro proyecto es demostrar la diferencia en los niveles de complejidad de las lenguas naturales proporcionando un método objetivo para calcular la complejidad lingüística. Proponemos una solución interdisciplinar que recurre a un modelo computacional sólidamente definido que permite cuantificar el coste/dificultad en el proceso de adquisición de distintas lenguas, mostrando que no es idéntico en todas ellas. El modelo computacional que proponemos está inspirado en el proceso de adquisición del lenguaje y se incluye en el ámbito de la inferencia gramatical, subdisciplina del aprendizaje automático.

El modelo que proponemos constituye una alternativa a los métodos que se han utilizado para calcular la complejidad lingüística y presenta, respecto a ellos, las siguientes ventajas: su interdisciplinariedad, combina ideas procedentes de la lingüística con modelos computacionales; su motivación, es un modelo computacional basado en cómo los humanos adquieren el lenguaje; sus resultados, ofrece resultados experimentales cuantificables; su capacidad para realizar análisis croslingüísticos.

Teniendo en cuenta las características del modelo propuesto, con su implementación esperamos mostrar que las lenguas varían en su nivel de complejidad; que es posible diseñar herramientas para cuantificar la complejidad lingüística; y que la diferencia en el nivel de complejidad lingüística –y su medición— es relevante para el conocimiento de las lenguas naturales.


INGRACOMLEN is a research project supported by the Ministerio de Economía y Competitividad and the Fondo Europeo de Desarrollo Regional under the project number FFI2015-69978-P (MINECO/FEDER, UE) of the Programa Estatal de Fomento de la Investigación Científica y Técnica de Excelencia, Subprograma Estatal de Generación de Conocimiento.

This project focuses on one of the basic assumptions of linguistics: the linguistic equi-complexity dogma.

When asked if all languages are equally complex, twentieth century most theoretical linguists has answered with the principle of invariance in the level of complexity, defending the equilibrium hypothesis, which states that the total complexity of a language is fixed because sub-complexities in linguistic sub-systems trade off. This idea of equi-complexity, seen for decades as an indisputable axiom of linguistics, has begun to be explicitly questioned in recent years.

Many models have been proposed to confirm or refute the hypothesis of linguistic equi-complexity. The tools, criteria and measures to quantify the level of complexity of languages vary and depend both on the specific research interests and on the definition of complexity adopted. Currently, there is no clear solution to quantify the complexity of languages and each of the proposed models has advantages and disadvantages.

The main objective of our project is to show the differences in the levels of complexity of natural languages by providing an objective and meaningful method to calculate linguistic complexity. To achieve this goal, we propose an interdisciplinary solution that uses a solidly defined computational model to quantify the cost/difficulty in the process of acquisition of different languages, showing that it is not identical in all cases. The computational model we propose is inspired by the process of language acquisition and is included in the field of grammatical inference, a machine learning subdiscipline.

The model we propose can be seen as an alternative to the methods that have been used so far to calculate the linguistic complexity and presents, with respect to them, the following advantages: its interdisciplinary, the model combines ideas from linguistics with computational models; its motivation, the tool we propose is a computational model based on how humans acquire language; its results, it provides quantifiable experimental results; its ability to perform crosslinguistic analysis.

Given the referred characteristics of the proposed model, with its implementation we expect to show that languages vary in their level of complexity; that it is possible to design tools to quantify the linguistic complexity; and that the difference in the level of complexity of languages -and its measurement- is relevant to the understanding of natural languages.

Anuncios