Un grupo de investigadores del Big Data Institute de la Universidad de Oxford han dado un gran paso hacia el mapeo de la totalidad de las relaciones genéticas entre humanos. Esta investigación, que ha sido publicada en Science, revela cómo los individuos de todo el mundo están relacionados entre sí, con un detalle sin precedentes

La obtención de grandes cantidades de datos genéticos ha supuesto un gran paso en la Medicina. Sin embargo, tales conjuntos de datos genómicos son muy heterogéneos debido a las diferentes métodos de obtención. Las muestras de diversas épocas, ubicaciones geográficas y poblaciones se procesan, secuencian y analizan utilizando una variedad de técnicas. Los conjuntos de datos resultantes contienen una variación genuina pero también patrones complejos de ausencia y error. Esto dificulta la combinación de datos y dificulta los esfuerzos para generar una imagen más completa de la variación genómica humana.

Tal y como apunta uno de los investigadores del estudio, Anthony Wilder Wohn, han construido “un gran árbol genealógico para toda la humanidad que modela tan exactamente cómo podemos la historia que generó toda la variación genética que encontramos en los humanos hoy en día. Esta genealogía nos permite ver cómo la secuencia genética de cada persona se relaciona con las demás, a lo largo de todos los puntos del genoma”, ha explicado en un comunicado de prensa.

Metodología del estudio

El estudio integró datos sobre genomas humanos modernos y antiguos de ocho bases de datos diferentes e incluyó un total de 3.609 secuencias genómicas individuales de 215 poblaciones. Los genomas antiguos incluían muestras encontradas en todo el mundo con edades que oscilaban entre 1.000 y más de 100.000 años y los algoritmos predijeron dónde deben estar presentes los ancestros comunes en los árboles evolutivos para explicar los patrones de variación genética. La red resultante contenía casi 27 millones de antepasados.

Después de agregar datos de ubicación en estos genomas de muestra, los autores usaron la red para estimar dónde habían vivido los ancestros comunes predichos. Los resultados recuperaron con éxito eventos clave en la historia de la evolución humana, incluida la migración fuera de África.

Usando simulaciones y análisis empíricos, la investigación demostró la capacidad de recuperar relaciones entre individuos y poblaciones, así como identificar descendientes de muestras antiguas. Calcularon la distribución del tiempo hasta el ancestro común más reciente entre las 215 poblaciones de los conjuntos de datos constituyentes, revelando patrones consistentes con una variación sustancial en el tamaño histórico de la población y evidencia de mezcla arcaica en humanos modernos.

La secuencia del árbol también ofrece información sobre patrones de mutación recurrente y error de secuenciación en conjuntos de datos genéticos de uso común. Asimismo, los datos muestran señales generalizadas de error de secuenciación, así como un pequeño subconjunto de sitios variantes que parecen ser erróneos.

De cara al futuro, el equipo de investigación planea hacerlo aún más completo al continuar incorporando datos genéticos a medida que estén disponibles. Debido a que las secuencias de árboles almacenan datos de una manera muy eficiente, el conjunto de datos podría acomodar fácilmente millones de genomas adicionales.


También te puede interesar…