Asociación para la Promoción de las Lenguas vía la Lexicografía y el Open Data

Los datos que proponemos

La caracterización de una lengua o un dialecto

Se definirá un idioma categóricamente, internamente, para tres valores resultantes de diferentes sistemas de codificación IETF:

Así se obtiene una aproximación exhaustiva para la descripción de una lengua sea cual sea.

La caracterización de una palabra o una locución

En cada lengua tendremos la información siguiente para los términos almacenados:

Además, para los verbos se proporcionarán tablas de conjugación.

Organización del trabajo

Se propondrán descargas de tantos archivos para una lengua como tablas haya en la base para expresar todas las relaciones entre los datos. El identificador une los diferentes valores de cada ficha para conseguir la mayor eficacia con el menor tamaño. De hecho, por poner un ejemplo, hay que tener en cuenta que en francés existen unas 350.000 palabras o expresiones, mientras que en español hay unas 570.000.

Fuera de las sociedades privadas, en el caso de editores como Larousse, deberíamos convertirnos en la mayor fuente de recursos de datos lexicográficos y semánticos.

Solo emplearemos como fuentes los trabajos de personas reconocidas competentes en la materia:

El trabajo será íntegramente colaborativo y no necesitará controles, a posteriori, del contenido como otros sistemas del tipo de Wikipedia, dado que lo llevarán a cabo voluntarios competentes. Todo esto contribuirá a la simplificación y a la síntesis de su estructura.