Glotocronología

La glotocronología es una técnica para calcular la separación temporal o divergencia entre dos lenguas que se suponen emparentadas.

Está basada en el porcentaje de palabras o cognados que son substituidos por otras palabras a lo largo del tiempo. Morris Swadesh, basándose en datos de diferentes familias lingüísticas, cuya historia es conocida por documentos, estimó que debido a cambios internos y aportaciones externas, aproximadamente el 14% de las palabras básicas del vocabulario de una lengua serán sustituidas cada mil años.

La glotocronología es un método de estudio cuyos resultados no pueden ser precisos. No obstante, está propuesta para la investigación de la evolución de aquellas lenguas que carecen de textos escritos, por lo que hay que descartar el método comparativo, usado para la reconstrucción del indoeuropeo y buscar alternativas de investigación.

Glotocronología de Swadesh

Supuestos básicos

Explícitamente los dos supuestos fuertes en los que se basa el método glotocronológico son:

  1. La tasa de substitución léxica es aproximadamente constante si consideramos períodos muy largos, al menos para el léxico del llamado vocabulario básico.
  2. La tasa de substitución léxica es aproximadamente uniforme entre todas las lenguas del mundo, al menos para el vocabulario básico.

En forma de ecuación, estos dos supuestos se pueden expresar de la siguiente manera. Si llamamos P(t) al porcentaje esperado de palabras básicas que retiene una lengua después del período t,[1] entonces el primer supuesto puede escribirse en forma matemática como:

 \frac{dP(t)}{dt} = -\alpha P(t)

O equivalentemente si integramos la ecuación diferencial anterior:

 P(t) = 100\cdot e^{-\alpha t}

El segundo supuesto lleva a que α debe ser una constante universal para todas las lenguas del mundo, que se debe calibrar a partir de datos experimentales de reemplazo de vocabulario básico en las lenguas con largos registros escritos. Las estimaciones sugieren que después de 10 siglos de evolución histórica el promedio, medido para varias familias de lenguas, está en torno al 14% del vocabulario básico, esto lleva a la siguiente estimación de α:

 \alpha = - \ln\left(1-\frac{14}{100}\right) \approx 0,1508 \cdot \mbox{milenio}^{-1}

A partir de esa estimación, el tiempo de separación Ts (medido en milenios) puede estimarse comparando el porcentaje de cognados retenidos pC (expresado en tanto por uno) como:

 T_s = \frac{\log(p_C)}{\log(p_0)} , de una lengua con su lengua madre,  T_s \approx \frac{\log(p_C)}{2\cdot \log(p_0)} , de dos lenguas hermanas

Donde p0 = 0.86 (= 86%) es el porcentaje de retención por milenio estimado por Swadesh (= 100% - 14%). El tiempo calcuado así ha sido comparado con el del carbono 14 en materia biológica, usado en arqueología. Con el método se podría calcular la fecha en que dos o más lenguas emparentadas habrían formado un tronco común. Efectivamente, los dos métodos se parecen, pero difieren en un hecho esencial: la desintegración del C14 siempre es constante. No hay nada que lo cambie, ni el calor, ni el frío ni reacciones con otros elementos químicos.

Calibración

Distribución de probabilidad para el número de cognados de la lista de Swadesh retenidos tras un milenio, bajo la hipótesis de que todas las palabras de la lista tienen la misma tasa de retención y esta es constante en el tiempo e igual a p = 0,86. La esperanza matemática para el número de cognados es 86 (se obtendría este valor exacto para 11,4% de las ocasiones), pero existe una probabilidad no nula de obtener un valor ligeramente diferente de cognados en un caso real.

Morris Swadesh estimó que la tasa de reemplazo en la lista de 100 términos de vocabulario básico que desarrolló estaba entorno al 14%, por lo que la tasa de retención es p0 = 0.86 (= 86%). Más tarde, Robert Lees cambió el valor medio, calculándolo en el 80.5% cada milenio. Otros lingüistas han estimado tasas de retención de 92-95% eliminando los préstamos y centrándose sólo en el reemplazo "nativo" dentro de la lengua.

Puede demostrarse sin embargo que si la lista está formada por términos de diferente estabilidad (tasa de cambio individual) entonces la tasa de cambio de la lista, no puede ser constante, sino decreciente a medida que las palabras más volátiles o inestables van siendo reemplazadas, la proporción de palabras retenidas más estables va aumentado (en proporción a las palabras retenidas), este hecho ha sido analizado en diversas modificaciones posteriores de la glotocronología.

Las fluctuaciones estadísticas también pueden ser importantes ya que el número de cognadas retenidas sigue una distribución binomial del tipo:

P_k = \begin{pmatrix} 100 \\ k\end{pmatrix}p^k (1-p)^{100-k}

Para diferentes valores de la tasa de rentención se puede ver que el valor esperado del tiempo de separación se separa del valor teórico:

Autor Tasa de rentención
p\,
Tasa de cambio
1-p\,
Tiempo de separación
(teórico)
Tiempo de separación
(promedio) \mu\,
Tiempo de separación
(desv. est.) \sigma\,
M. Swadesh 0,86 0,14 1000
años
1005
años
8,51
años
R. Lees 0,805 0,195 1000
años
1006
años
7,22
años
0,93 0,07 1000
años
1005
años
12,0
años

Críticas

La metodología original ha sido repetidamente criticada. Eugenio Coseriu (1962), por ejemplo, aportó algunos datos tomados de las lenguas románicas que ilustraban que su uso podía conducir a inexactitudes importantes. Las principales objeciones que se han planteado contra la formulación de Swadesh son siguientes:

  1. La constante de retención no es universal, varía según el tiempo, la lengua y el significado de la palabra incluida en la lista.
  2. El modelo del árbol genealógico (Stammbaummodel) no es del todo claro. Las lenguas a menudo se influyen posteriormente a su separación, mientras que la asunción glotocronológica original es que este contacto posterior no se da o es poco significativo (en ambos casos eso parece no ser cierto).
  3. Las cambios de sonido podrían provocar que no sea posible reconocer dos cognados (por ejemplo, fr. chef e ing. head) o que se cometa el error de asumir como cognados palabras que verdaderamente no están emparentadas (por ejemplo, ing. day y esp. día).
  4. En algunas lenguas hay múltiples sinónimos para una de las palabras del significado básico. Para solucionar este problema, se ha sugerido utilizar el equivalente coloquial más común, la palabra más frecuente o escoger una al azar.
  5. Un par de palabras pueden ser cognados parciales, como esp. sol y fr. soleil. En estos casos se propone utilizar estos ítemes como cognados o asignar fracciones en lugar de números enteros.
  6. En algunas lenguas, el vocabulario básico contiene préstamos lingüísticos. En estos casos, la palabra no se toma en cuenta.
  7. En algunas lenguas faltan una o más palabras del vocabulario básico. En estos casos, el número de palabras de la lista se reduce según corresponda.

Glotocronología modificada

La glotocronología clásica propuesta por Morris Swadesh fue severamente criticada en los años 1960 y 1970, al punto que fue desechada por muchos lingüistas. Algunas de las críticas fueron abordadas ya en esos años y se propusieron modificaciones que salvaban algunas de las críticas total o parcialmente. La reconsideración de las críticas hizo surgir una visión intermedia entre el rechazo completo al valor de la glotocronología y el entusiasmo con que fue recibida inicialmente. Los proponentes de la glotocronología modificada sostienen que con importantes modificaciones la idea de usar el recuento del número de cognados resulta útil par estudiar la diversificación de las familias lingüísticas y estimar tiempos de separación.

Van der Merwe (1966) estudió el efecto de la inhomogeneidad en las tasas de reemplazo, dividiendo la lista de vocabulario en varios grupos y cada grupo con su propia tasa. Esa modificación tiene el efecto de que a largo plazo la tasa de reemplazo media disminuye, ya que al principio las palabras con mayor tasa de cambio desaparecen y pasado un tiempo la proporción de palabras con tasas de reemplazo más lenta aumentan en proporción. Dyen, James y Cole (1967) estudiaron el efecto de permitir que cada significado tenga su propia tasa de cambio. Si se divide la lista de vocabulario básico en dos grupos con N1 y N2 palabras entonces la tasa de cambio efectiva \lambda_t\,satisface:

(N_1+N_2)e^{-\lambda_t t} = N_1 e^{-\lambda_1 t} + N_2 e^{-\lambda_2 t}

Por lo que la tasa efectiva dependiente del tiempo se puede escribir como:

\lambda_t = -\frac{1}{t}\ln\left( n_1 e^{-\lambda_1 t} + n_2 e^{-\lambda_2 t} \right)
\approx \left(n_1\lambda_1 + n_2\lambda_2\right) -\frac{n_1 n_2}{2}(\lambda_1 - \lambda_2)^2 t + \frac{n_1 n_2}{6}(n_1-n_2)(\lambda_1-\lambda_2)^3 t^2 + \dots

Donde:

n_1 = \frac{N_1}{N_1+N_2},\ n_2 = \frac{N_2}{N_1+N_2}, indican la proporción de palabras en el grupo 1 y de palabras en el grupo 2.
\lambda_1,\lambda_2\, son las tasas de cambio para palabras de cada grupo.

Puede verse que \lambda_t\, para tiempos de separación pequeños t \approx 0 se comporta como el promedio de la tasa de variación de ambos grupos.

Finalmente Kruskal, Dyen y Black estudiaron simultáneamente la estimación de divergencia con el tiempo además de la tasa de reemplazo. Sankoff (1973) sugirió introducir un parámetro de préstamo y permitió la ocurrencia de sinónimos. La combinación de varias de esas mejoras se considera en Sankoff.[2] A partir de un trabajo de Sankoff sobre la divergencia genética de poblaciones en un contexto biológico, Embleton (1981) deriva una versión simplificada en el contexto lingüístico. Esta autora mostró mediante un cierto número de simulaciones que usar este modelo proporciona buenos resultados. Colateralmente, las mejoras en la metodología estadística en un campo diferente, el estudio de los cambios en el ADN a lo largo del tiempo, ha generado trabajos que usan esos resultados en el contexto lingüístico y han renovado el interés en la glotocronología. Todos esos métodos son más robustos que los empleados anteriormente y permiten calibrar puntos en el árbol filogenético a partir de acontecimientos históricos fechables, interpolando de manera continua las tasas de cambio entre ellos. El resultado es que la asunción de una tasa de cambio constante ya no es necesaria.[3]

Método de Stárostin

Otro intento de introducir modificaciones en la glotocronología tradicional fue llevado a cabo por el lingüista ruso Serguéi Stárostin, que propuso que las siguiente modificaciones:

T_s = \sqrt \frac{\ln(p_c)}{-L_c}

Que reemplaza a la fórmula del Swadesh

T_s = \frac{\ln(p_c)}{\ln(p_0)}

Antigüedad de algunas familias

Se han hecho algunos cálculos estimativos de la antigüedad de algunas familias de lenguas. Entre las familias con antigüedades o profundidades temporales inferiores a 5.000 años (50 siglos) aparecen la práctica totalidad de las familias bien establecidas para las que se han podido reconstruir adecuadamente (RA) los aspectos cruciales de la protolengua, además de algunas otras familias donde el parentesco entre las lenguas resulta poco controvertido:[4][5]

Para algunas macrofamilias (MF) y familias más controvertidas en que la reconstrucción ha encontrado más dificultades (DR),[6] se tienen profundidades temporales superiores a 50 siglos:

Véase también

Referencias

  1. Téngase en cuenta que dicho porcentaje sólo puede ser un valor esperado, dada la naturaleza aleatoria del proceso de substitución léxica, existe una pequeña probabilidad de que en un caso concreto el porcentaje real difiera ligeramente de dicho valor esperado.
  2. Sankoff, "Fully Parameterised Lexicostatistics", 1972.
  3. Gray & Atkinson 2003
  4. Søren Wichmann, 2008, Annexes
  5. Swadesh, Morris (1963). Nuevo Ensayo de Glotocronología Yutonahua. Anales del INAH 15:263-302.
  6. Existen diversos tipos de "dificultades en la reconstrucción": (DR-a) No se dispone todavía de una reconstrucción adecuada, (DR-b) la lista de términos reconstruidos apenas supera los 100 términos, (DR-c) Existen reconstrucciones por parte de diferentes autores con discrepancias notables.

Bibliografía

This article is issued from Wikipedia - version of the Sunday, December 27, 2015. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.