Una familia de lenguas o familia lingüística es un grupo de idiomas con un origen histórico común y emparentados filogenéticamente, es decir, parecen derivar de una lengua más antigua o lengua madre común (protolengua).
Familias de lenguas | |||||||
---|---|---|---|---|---|---|---|
Mayores familias de lenguas | |||||||
Agrupaciones geográficas de lenguas | |||||||
Americanas | Caucásicas | Papúes
Aisladas y otras |
Las familias se originan cuando una lengua, denominada «protolengua de la familia», da lugar a diferentes idiomas por un proceso de diversificación dialectal. Las lenguas de una familia usualmente son ininteligibles entre sí, aunque en la mayoría de los casos conservan parecidos fonéticos y gramaticales. Cuando las similitudes entre los idiomas son claras, es posible reconstruir su origen común, e incluso la protolengua de la que derivan, mediante los métodos de la lingüística histórica.
La comparación sistemática de las lenguas del mundo mediante los métodos de la lingüística histórica ha permitido probar que la mayoría de las lenguas no son lenguas aisladas filogenéticamente, sino que entre ellas forman grupos o familias. Frecuentemente dentro de una familia es posible reconstruir fidedignamente el origen común o «protolengua madre» de dicha familia. El estudio sistemático de muchas familias ha permitido reconstruir las diversas protolenguas o lenguas ancestrales que por diversificación habrían dado lugar a diversas familias. Dicha reconstrucción parte de las similitudes observadas entre las lenguas de una misma familia y trata de determinar qué palabras o características gramaticales son el resultado de la herencia del ancestro lingüístico común o protolengua.
El ancestro común a la mayoría de familias no es conocido o conocido solo de forma directa en pocas ocasiones, ya que el registro histórico de la mayoría de las lenguas es muy corto. Sin embargo, es posible recuperar muchas de las características del ancestro común de lenguas relacionadas aplicando el método comparativo —un procedimiento de reconstrucción desarrollado en el siglo XIX por la escuela neogramática en la que destaca el lingüista August Schleicher—. Las familias de lenguas pueden ser subdivididas en unidades menores, normalmente denominadas “ramas” (la historia de una familia de lenguas se representa frecuentemente como un árbol filogenético).
El ancestro común de una familia (o una rama) se conoce como «protolengua». Por ejemplo, la protolengua reconstruida de la bien conocida familia indoeuropea es llamada protoindoeuropeo (de la que no se conservan restos escritos, puesto que fue usada antes de la invención de la escritura). A veces una protolengua puede ser identificada con una lengua conocida. Así, los dialectos provinciales del latín («latín vulgar») fueron origen de las lenguas romances modernas. Es decir, la lengua «protorromance» es más o menos idéntica al latín (aunque no idéntica al latín culto de los escritores clásicos). Los dialectos del antiguo nórdico son la protolengua del noruego, el sueco, el danés y el islandés. De ahí que dichas protolenguas resulten de una «reconstrucción» que los lingüistas intentan a partir de datos conocidos.
De manera tentativa, cuando no existen datos tan buenos sobre una lengua, se emplean preliminarmente varios sistemas de comparación lingüística basados especialmente en listas de palabras, mediante tratamiento estadístico. Entre estas técnicas están la glotocronología o más generalmente la lexicoestadística. En esta última línea se trabaja en el proyecto de comparación sistemática ASJP[1] que puede sugerir vías de comparación sistemática entre lenguas poco documentadas, así como esclarecer la estructura interna de las familias de lenguas y que proporciona una aproximación del árbol filogenético global con más de 4000 lenguas.[2]
Las lenguas que no pueden ser clasificadas con seguridad en ninguna familia son llamadas lenguas aisladas. Existen varios motivos por los que una lengua se clasifica como aislada:
Una lengua aislada es de hecho una familia de lenguas con un solo miembro.[3] Lyle Campbell cifra el número de lenguas aisladas conocidas, incluyendo algunas extinguidas, en 129.[3]
Las estimaciones glotocronológicas han mostrado que la mayoría de las familias lingüísticas bien establecidas se han diversificado en los últimos 50 siglos. Se entiende que una familia está bien establecida cuando existe consenso en que dichas lenguas forman un grupo y se ha podido reconstruir razonablemente la protolengua originaria. Mientras que las familias peor establecidas, o incluso polémicas, y las macrofamilias parecen tener tiempos de diversificación más grandes. Eso refleja dos hechos:
La distribución geográfica de las familias es el reflejo del devenir histórico de sus hablantes. Así, la mayor parte de las grandes familias de lenguas parece haberse expandido gracias a «revoluciones» agrícolas o tecnológicas de algún otro tipo. La revolución neolítica provocó la expansión de las lenguas afroasiáticas en África y Oriente Medio, las lenguas sino-tibetanas en Extremo Oriente y, de acuerdo con la teoría de Renfrew, la expansión de las lenguas indoeuropeas en Eurasia occidental.
La mejora de las técnicas de navegación permitió a los hablantes de las lenguas austronesias expandirse desde la isla de Taiwán por toda Oceanía, llegando incluso a Madagascar, frente al continente africano. El imperialismo europeo llevó las lenguas indoeuropeas a América y a numerosas áreas de África, Oceanía y, en menor medida, Asia. Al parecer, el uso del hierro y otras tecnologías habría permitido a las lenguas Níger-Congo llegar a imponerse en África desplazando a los hablantes de otras familias ahora poco numerosas, como las lenguas nilo-saharianas o las lenguas joisanas.[4][5]
En la actualidad, las dos mayores familias lingüísticas por número de hablantes, las lenguas indoeuropeas y las lenguas sino-tibetanas, juntas suman un número de hablantes equivalente al 75 % de la humanidad.[6] Por otro lado, entre las lenguas indígenas de América, por ejemplo, muchas familias de lenguas apenas superan los pocos miles de hablantes.
La siguiente tabla resume las principales familias del mundo según el número de hablantes:[7]
Familia / Agrupación |
Número de lenguas |
Hablantes (1980)[8] | Hablantes (2000)[9] | ||
---|---|---|---|---|---|
Mill. | % | Mill. | % | ||
Indoeuropea | 386 | 2500 | 49,8 | 3000 | 49,9 |
Sinotibetana | 272 | 1088 | 21,7 | 1240 | 20,6 |
Austronesia | 1212 | 269 | 5,4 | 300 | 5,0 |
Afroasiática | 338 | 250 | 5,0 | 400 | 6,7 |
Níger-Congo | 1354 | 206 | 4,1 | 235 | 3,9 |
Dravídica | 70 | 165 | 3,3 | 185 | 3,1 |
Japónica | 12 | 126 | 2,5 | 127 | 2,1 |
Altaicas | 60 | 115 | 2,3 | 164 | 2,7 |
Austroasiática | 173 | 75 | 1,5 | 100 | 1,7 |
Daica (Tai) | 158 | 75 | 1,5 | 93 | 1,5 |
Coreana[10] | 1 | 60 | 1,2 | 75 | 1,2 |
Nilo-sahariana | 186 | 28 | 0,56 | 28 | 0,47 |
Urálica | 33 | 24 | 0,48 | 20 | 0,33 |
L. de América | 985 | 22 | 0,45 | 22 | 0,37 |
Cáucaso | 38 | 7,8 | 0,16 | 8,0 | 0,13 |
Miao-yao | 15 | 5,6 | 0,11 | 10 | 0,17 |
Indopacífica | 734 | 3,5 | 0,070 | 3,0 | 0,050 |
Joisana | 37 | 0,3 | 0,006 | 0,3 | 0,005 |
L. de Australia | 262 | 0,03 | 0,001 | 0,03 | 0,0005 |
Paleosiberiana | 8 | 0,018 | 0,0004 | 0,015 | 0,0002 |
Otras aisladas | 296 | 2,0 | 0,040 | 2,0 | 0,033 |
TOTAL | 6533 | 5022 | 100% | 7012 | 100% |
El número de lenguas sobre el que se basan las cifras anteriores es de 6533, entre las que se incluyen 310 lenguas extintas (sin hablantes actualmente), 71 pidgins y criollos que suman cerca de 2 millones de hablantes. Además se conocen unas 75 lenguas de señas que no son contabilizadas por no tratarse de lenguas orales adscritas a ninguna familia de la lista anterior.
Están agrupadas geográficamente sin tener en cuenta las relaciones entre familias. En la siguiente lista, cada uno de los puntos es una familia de lenguas conocida. Las denominaciones geográficas de los títulos son solamente para mantener un orden y facilitar la lectura. Las relaciones geográficas son convenientes para tal objetivo, pero no representan ningún tipo de intento de crear «superfamilias» filogenéticas.
Desde antiguo se reconoció que las lenguas semíticas del Oriente próximo y la península arábiga estaban genéticamente emperentadas, cosa que se explicaba en términos semi-míticos juzgando que los pueblos semitas eran descendientes comunes de Sem. La clasificación extensiva de las lenguas del África subsahariana empezó en el siglo XIX sobre la base de datos lingüísticos y datos etnográficos, dominados por una visión racista y supremacista de la variedad humana. El estudio plenamente científico y exento de prejuicios racistas empezó propiamente en el siglo XX. El trabajo de Joseph Greenberg, en la actualidad aceptado en líneas generales por la mayoría de los africanistas, agrupa a las lenguas del continente africano en cuatro grandes macrofamilias:
Subsisten discrepancias menores sobre las agrupaciones internas de estos grupos, y sobre la clasificación de algunas lenguas cordofanas. Se ha realizado un importante trabajo comparativo sobre la mayoría de las subfamilias dentro de las lenguas afroasiáticas y de las lenguas Níger-Congo. Se han propuesto varias reconstrucciones razonablemente completas del protoafroasiático, del protonilosahariano, aunque el sistema fonológico reconstruido por diversos autores puede llegar a diferir considerablemente, lo cual indica que todavía se necesita mayor clarificación sobre el parentesco y las características de dichas lenguas.
Durante la Edad Media europea se reconoció el parentesco evidente entre algunas lenguas (las lenguas románicas, las lenguas celtas, las lenguas germánicas, las lenguas eslavas, etc.). Sin embargo, no se sospechó de que todos estos grupos estaban en última instancia emparentados hasta mucho más tarde. Hacia finales del siglo XVIII el juez británico Williams Jones propuso seriamente la idea de que el latín, el griego, el germánico, el celta, el sánscrito y el persa estaban emparentados. Esta fue la primera identificación de la familia indoeuropea en una forma cercana a como la conocemos hoy en día. Durante el siglo XIX el desarrollo del método comparativo permitió identificar otras familias.
En la actualidad Europa es el continente menos diverso desde el punto de vista lingüístico. Esto se debe básicamente a las migraciones indoeuropeas durante el neolítico, y la posterior formación de imperios cuyos hablantes usaban lenguas indoeuropeas, que acabaron con la mayoría de las lenguas preindoeuropeas del continenente, con excepciones como el vasco, el finés, el húngaro y diversas lenguas del Cáucaso. El Cáucaso, por otra parte, es una región montañosa mucho más diversa que el resto de Europa. Por otro lado, Eurasia central es una región bastante más diversa que Europa (excepto el Cáucaso), con varias grandes familias de lenguas. Las familias generalmente aceptadas hoy en día incluyen:
En el Extremo Oriente se encuentra la segunda familia por número de hablantes (macrofamilia sino-tibetana) y la familia más amplia del mundo por número de lenguas (familia austronesia). Una lista de las familis generalmente aceptadas de la región es la siguiente:
Muchos autores presuponen que en última instancia todas las lenguas australianas podrían estar remotamente emparentadas dado el relativo aislamiento de Australia respecto a otras regiones. La investigación de las lenguas australianas reconoce entre 228 y 262 lenguas. La mayoría de ellas unas 160 pertenecen a una familia filogenética bien identificada (familia pama-ñung), el resto de lenguas pertenecen a más o menos una docena de pequeñas familias, de las cuales la mitad serían de hecho lenguas aisladas. No existen pruebas establecidas del parentesco de todas las lenguas australianas, ya que los métodos de la lingüística histórica solo funcionan bien para tiempos de diversificación de unos pocos milenios. Si en verdad todas las lenguas australianas están en último término emparentadas no se conoce con seguridad por más que algunos consideren razonable dicha conjetura. La clasificación básica de las lenguas australianas es por tanto:
Nueva Guinea es la región lingüísticamente más diversa del planeta, ya que, en su territorio, se hablan entre 750 y 900 lenguas. No existe un acuerdo completo sobre el número de familias diferentes existentes, y los trabajos comparativos revelan que el número de unidades filogenéticas válidas identificadas es enorme, por lo que no se puede considerar que las lenguas papúes constituyan una única familia. Y, aunque varios autores han sugerido que, en último término, todas las lenguas papúes están relacionadas, esto no se ha probado satisfactoriamente debido a la enorme diversidad de estas lenguas.
Si se atiende al número de familias incontrovertiblemente identificadas o bien establecidas, existirían más de 60 familias lingüísticas en Nueva Guinea (ver por ejemplo clasificación del WALS); de estas, cerca de una docena serían realmente lenguas aisladas y las otras 50 familias propiamente dichas. Es posible que el número de familias bien establecidas pueda reducirse a un número inferior, como sugieren las clasificaciones tentativas de Ross y Wurm, pero hoy por hoy esas clasificaciones son tentativas. Greenberg considera que las familias papúes constituyen un subgrupo genéticamente válido dentro de las lenguas indopacíficas, pero dicha clasificación es altamente especulativa y ha sido ampliamente criticada.
La clasificación de las lenguas de América es probablemente una de las áreas más controvertidas de la clasificación filogenética de las lenguas. Las propuestas van desde más de siete docenas de unidades filogenéticas, hasta solo tres unidades para todo el continente.
El primer trabajo suficientemente ambicioso de clasificación de las lenguas de Norteamérica fue el llevado a cabo por John Wesley Powell, que reconoció más de una cincuentena de grupos filogenéticos. Edward Sapir hizo algunas propuestas controvertidas tendentes a reducir el número de grupos, tratando de identificar relaciones entre los grupos de Powell. Algunas propuestas de Sapir han ganado aceptación, pero la mayoría han sido desechadas. Una clasificación «conservadora» al estilo de Powell basada en evidencia disponible actualmente reconoce los siguientes grupos:
El trabajo comparativo sobre estas lenguas podría llevar a reducir el número de grupos, aunque ese trabajo de buscar parentescos lejanos entre familias bien establecidas es complicado, porque los grupos anteriores solo parecen muy remotamente relacionados unos con otros, y los posibles parentescos resultan en general muy discutibles e inseguros.
En Sudamérica existen siete grandes familias por número de lenguas: la familia tupí (76 lenguas), la familia arawak (64 lenguas), la hipotética macrofamilia macro-gê (32 lenguas), la familia caribe (32 lenguas), la macrofamilia pano-tacana (33 lenguas), la familia chibcha (26 lenguas) y la familia tucana (22 lenguas). Por número de hablantes son importantes familias o macrolenguas formadas por un número reducido de lenguas que alcanzaron gran difusión: quechua, aimara, idioma guaraní y mapuche. Una lista más o menos completa del resto de pequeñas familias de lenguas es la siguiente:
Normalmente el nombre de familia lingüística se reserva para un grupo de lenguas cuyo parentesco histórico y origen común no resulta polémico. En general, cuando el trabajo lingüístico está avanzado hasta el punto de haber reconstruido algunos miles de términos de la protolengua originaria, se considera fuera de toda duda que las lenguas forman una familia. Comparaciones arqueológicas y especulaciones lingüísticas y estadísticas nos sugieren que los ancestros reconstruidos no se remontan más allá de 5000 o 7000 años. Para períodos de diferenciación mayores, el cambio lingüístico es tan profundo que difícilmente pueden encontrarse o demostrarse parentescos genéticos (de la misma manera que las pruebas de parentesco genético entre familias biológicas de personas solo pueden aplicarse a personas muy estrechamente relacionadas).
Sin embargo, más allá del nivel de familia, se encuentran algunas similitudes aisladas que permiten especular que muchas de las familias de lenguas identificadas podrían agruparse en macrofamilias o superfamilias tentativas, usando métodos menos exigentes que la reconstrucción de la protolengua. Diferentes lingüistas han propuesto algunas agrupaciones de familias lingüísticas en superfamilias. Muchas han sido propuestas en base al método de Morris Swadesh. Ninguna tiene una aceptación amplia como grupo filogenético de lenguas, pero algunas, como la familia amerindia, la papú, la australiana, la joisán y la paleosiberiana, resultan prácticas como agrupaciones geográficas de familias pequeñas con características comunes.
Una lengua aislada es una lengua natural para la que no se ha probado ningún parentesco con otra lengua viva o muerta. Presumiblemente, una lengua aislada es aquella que no pertenece a ninguna familia de lenguas propiamente dicha (es decir, ella es la única miembro de su familia). El ainu, el euskera, el buruchasqui o burushaski y el sumerio son ejemplos de lenguas clasificadas frecuentemente como aisladas. También en América existen lenguas aisladas, como el mapuche (América del Sur), el purépecha (México) o el zuñi (Estados Unidos).
Entre las lenguas de señas también pueden establecerse conexiones históricas claras, en muchos casos la historia está además documentada. Así, por ejemplo, la moderna lengua de señas francesa, la lengua de señas norteamericana y la lengua de señas mexicana han evolucionado a partir de variantes de la misma lengua: la antigua lengua de señas francesa (usada por la comunidad de sordos de París durante el siglo XVIII). En cambio, la lengua de señas británica no tiene parentesco con la lengua de señas norteamericana, aun cuando los británicos y los norteamericanos oyentes usan variantes del inglés. Es decir, un señante (usuario de lengua de señas) de lengua de señas norteamericana tendrá menos dificultad para comunicarse con un señante de lengua de señas francesa que con un señante de lengua de señas británica.
La siguiente lista incluye algunas familias conocidas de lenguas de señas:
Algunas lenguas de señas son lenguas aisladas: