No soy lingüista y mucho menos aún (si es que se puede) especializado en lingüística histórica ni comparativa. Esto es una aclaración importante porque estoy seguro de que esta inexperiencia lleva asociada a lo largo de todo el proyecto una ingente cantidad de deficiencias, de errores, ora metodológicos, ora sencillamente derivados de la ignorancia que, aparte de la osadía, aporta poco.
No pretendo minusvalorar el trabajo de los lingüistas que están especializados en este ámbito tan complejo de la lingüística histórica y mi intrusismo es, o pretende ser, bienintencionado. No dudo de su profesionalidad ni de la validez de su método, que pretende incluso dotarse de aparataje científico.
Pongo, parcialmente y con muchos reparos, no obstante, en duda la portabilidad del método científico desde otras disciplinas a la lingüística (histórica, prehistórica y/o comparada) pues si bien es cierto que se ha dotado de herramientas como la glotocronología o la fabricación estimativa de protolenguajes, no lo es menos que el sesgo en muchos de los investigadores así como la propia interferencia del investigador (somos lenguaje) hace que no siempre puedan defender la dureza de sus afirmaciones.
En cuanto a los apartados de gramática de cada una de las lenguas, parto de la base de que no tengo la capacidad para poner en cuestión la información que encuentro, lo que sería de gran importancia si este fuese un trabajo científico.
Tampoco soy traductor. Esto es aún más grave, si cabe, pues mucha información la traduzco con la mejor de mis intenciones, en la mayoría de los casos de inglés, idioma del cual tengo un nivel calificable como fluido. Procuro ser cuidadoso con las traducciones, pero asumo muchos, pero muchos, errores de traducción.
La apuesta por una Clasificación Filogenética de las Lenguas del Mundo parte de un error metodológico: No es posible afirmar nada sin especular (en muchos casos mucho) acerca de la filiación lingüística desde un pasado no muy lejano. Tengo en cuenta que estoy ignorando a menudo la exigencia de reconstrucción del protolenguaje que tienen en mente los lingüistas históricos o comparativos.
En cuanto a clasificaciones macrolingüísticas, sigo las hipótesis taxonómicas bastante especulativas de Joseph Greenberg, Merritt Ruhlen, Michael Fortescue (y otros, dependiendo de las ramas en cuestión) que en ocasiones se vinculan con clasificaciones de ADN, realizando aventuradas correlaciones entre genética poblacional y genética lingüística, lo que no deja de ser viable, pero, como digo, aventurado cuando menos, amén de experimentos de dudosa fiabilidad como la "comparación masiva" de palabras o cognados que ignoran procesos derivados de pertenencia de idiomas a grupos de área lingüística o sprachbund.
En varias ocasiones, la información disponible parece ser tremendamente sesgada. Asumo que no siempre encuentro la información neutral y no puedo abordar la investigación que requeriría la contrastación del material encontrado. No obstante, procuro siempre buscar información de diversas fuentes que aporten puntos de vista diferentes, preferiblemente, opuestos, para intentar discernir qué es más plausible o verosímil, asumiendo, repito, la imposibilidad de alcanzar la certeza.
Cuando algunas lenguas parecen estar muy vinculadas y la comunidad lingüística no parece alcanzar un consenso con respecto al estatus de las diferentes variedades dialectales, opto por caminos fáciles como agruparlas en macrolenguajes que permite ser inclusivo sin tomar una decisión infundada.
No entro en temas nacionalistas y mucho menos étnicos. A pesar de las ganas que, en ocasiones, me entran de aferrarme a defensas de algunas lenguas, procuro ignorar mi querencia para no producir sesgos que, sé, no podré evitar por completo. El vínculo de lenguas con nación, que enarbola perfectamente la frase "Lengua es un dialecto con cañones", es algo que no puedo ignorar, puesto que muchas veces la información puramente lingüística va a ser relacionada con etnias (sobre todo en las lenguas pre-históricas o pre-literarias) y con las naciones que tienden a normalizar e imponer variedades lingüísticas dominantes. Prefiero utilizar, en casos poco claros, la denominación variedad dialectal, en lugar de dialecto o lengua, pues parece una clasificación más suave e inclusiva.
No afirmo que conservar las lenguas sea mejor o peor que no hacerlo. Prefiero personalmente que se queden, que no desaparezcan (por lo menos al rápido ritmo al que lo están haciendo actualmente), pero debatir sobre si son superfluas para la comunicación humana, o no lo son, no es parte de este proyecto.
El primer objetivo del Proyecto, inicialmente, es el de llenar el contenido del árbol filogenético que albergará información de unas 10.000 lenguas. Organizadas de manera sistemática, almacenando el mismo tipo de información por cada una de ellas. Así como de las distintas ramas, subgrupos y otras entidades lingüísticas semejantes.
Este proyecto es tan sólo el fruto de mi curiosidad, sin más pretensión que la de especular (sí, sí, especular) una hipotética clasificación filogenética de todas las lenguas del mundo tomando como fuente algunas otras especulaciones e investigaciones más o menos contrastadas. La "obsesión" taxonómica me lleva a intentar realizar lo imposible e, incluso añadiría, lo improbable.
Prescindo de metodologías estrictas (no digo con ello que sean innecesarias para la lingüística histórica o comparada) al realizar la clasificación aferrándome a fuentes que, en muchos casos, son cercanas a lo que entenderíamos por opiniones fundamentadas, más que certezas.
No es un trabajo de investigación directa ni indirecta: Es un trabajo de reordenación de información. En muchos casos, esa información es reordenada siguiendo criterios de otras fuentes y en algunos, incluso, se aventuran agrupaciones especulativas.
Las fuentes y la documentación utilizada es citada únicamente de manera global, y de manera particular en cada una de las ramas y/o familias lingüísticas y, por supuesto, cada lengua lleva su correspondiente apartado de fuentes utilizadas o consultadas, que dista mucho de ser exhaustivo ni mucho menos considerado cierto o completamente contrastado. En muy contadas excepciones se cita la fuente vinculándola directamente con el contenido extraído de ella. Existen muchos casos en los que la fuente es, ya de por sí, poco fiable o muy indirecta. Intento encontrar fuentes directas o de alta fiabilidad así como contrastar en la medida de lo factible las fuentes indirectas (especialmente me refiero al contenido en Wikipedia. En muchos casos, las fuentes son consultadas y luego se genera un texto propio de la información agrupada extraída de las mismas.
La plantilla por lengua (y por rama/familia) es una división arbitraria que contempla las divisiones que he decidido que me interesan, pero podría, por supuesto, haber sido diferente. Hay bastantes casos en los que la información disponible no se adapta cómodamente a la plantilla, pero he preferido mantener la homogeneidad de la clasificación salvo muy contadas excepciones.
Este proyecto está inconcluso. Puedo asegurar, sin temor a equivocarme, que siempre estará inconcluso. Tanto en profundidad como en amplitud, el proyecto supera con creces lo que puede acometer un único ser humano y quizá, incluso, un sinnúmero de seres humanos coordinados.
Sin embargo, cada cierta cantidad de información acumulada, algún ramo del árbol se da por concluido, sabiendo que, en realidad, tampoco lo está.