La Ciencia Detrás del Pareo de ADN y su Progreso

Qué sucede exactamente cuando enviamos una muestra de ADN para ser analizada y recibimos un listado de parientes? Y cómo podemos confiar plenamente que los resultados son reales? En este artículo exploramos los procesos detrás de este tipo de estudios genéticos y la utilización del método científico para formular hipótesis, descartar falsos positivos y desarrollar nuevos algoritmos.

El proceso de extracción y envío de muestras de ADN

Cuando compramos un test de ADN, los pasos a seguir suelen ser similares:

  1. Luego de pagar, un kit con instrucciones nos llega por correo.
  2. Tomamos una muestra de saliva y la enviamos de vuela al laboratorio, generalmente en un sobre ofrecido por la misma empresa e incluído en el kit.
  3. Nuestra muestra de ADN es analizada en más de 700.000 marcadores genéticos.
  4. En unas 6 a 8 semanas, los resultados de nuestro test arriban por correo electrónico.

Cómo es que nuestra muestra se convierte de pronto en un mapa de posibles relaciones de parentesco? De dónde han salido esos primos lejanos?

Qué es el pareo de ADN y cómo se estima

La mayoría de las compañías que testean ADN, como Ancestry o 23andMe, cuentan en su equipo con científicos especializados que regularmente investigan y publican los resultados extraídos de sus enormes bases de datos. Uno de los principales focos de análisis a través de ADN es el cálculo de estimaciones étnicas, realizadas a partir de diferentes modelos estadísticos basados en estudios científicos que escogen (o crean) y aplican algoritmos para calcular ascendencia.

Qué es lo que calculan los algoritmos? Muchas cosas. Entre ellas, “DNA matching“, o “pareo de ADN“. Cuando una persona envía su muestra, unos 700.000 marcadores genéticos son comparados con aquellos de personas que han tomado anteriormente el test. En el caso de Ancestry, esta comparación se hace con más de un millón de personas, buscando fragmentos de ADN compartidos con parientes.

El pareo de ADN permite, entre otras cosas:

  • Validar lineas de ancestría;
  • Conocer más acerca de nuestros ancestros;
  • Colaborar para “derribar paredes” en una investigación.

Para mejorar los resultados de los pareos de ADN, las compañías utilizan diferentes métodos. Pero qué es, exactamente, el pareo, y por qué es tan valioso en genealogía?

El pareo de ADN se trata básicamente de una comparación entre tus resultados y los resultados de todas las demás personas en la base de datos de la compañía que hace el test. La meta es estimar el grado de relación genética entre dos (o más) personas a través del ADN compartido. Como todos compartimos gran cantidad de material genético con padres, hermanos o primos, los tests permiten buscar estos parentescos a través de ADN.

En esta tabla se pueden ver los porcentajes de ADN compartidos (en promedio, la variabilidad es grande porque la forma en que el ADN se recombina es aleatoria) para los diferentes niveles de parentesco:

Relación
Porcentaje de ADN compartido
Rango
Mellizo idéntico100%N/A

Padre / Hijo

Hermanos

50%Varía dependiendo del tipo de relación

Abuelos / Nietos

Tíos / Sobrinos

Medio Hermanos

25%Varía dependiendo del tipo de relación
Primos 1ros12.5%7.3% – 13.8%
Primos 2dos6.25%3.3% – 8.51%
Primos 3ros3.13%2.85% – 5.04%

Esta tabla deja al descubierto que a medida que las relaciones se distancian, la cantidad de ADN compartido se reduce drásticamente. Pero si comparamos lo anterior con la cantidad de parientes vivos al nivel de primos 6tos o 7mos, vemos que las probabilidades de encontrar personas relacionadas, siempre que tengamos buenas formas de calcular, no son tan malas:

Este tipo de relación es una de las más frecuentes en los resultados de estos kits. Aunque no compartamos mucho ADN con nuestros primos 7mos, como tenemos tantos es probable que encontremos al menos algunas pistas sobre nuestra genealogía común.

Herencia y pareo de ADN

Como heredamos 50% de ADN de cada progenitor, pero lo que incluye ese 50% es aleatorio, dos hermanos pueden compartir más o menos material genético (mi hermana y yo, por ejemplo, compartimos alrededor de 35%).

Lo mismo sucede con primos, a medida que el ADN se recombina, los segmentos que tendremos en común no serán siempre iguales, en cantidad o contenido, con pocos segmentos “intactos” cuanto más nos alejamos del presente:

Recombinación de ADN para parentesco. Cómo se heredan bloques de cada progenitor, y por qué dos primos 4tos pueden tener ADN tan diferente. Cortesía de Ancestry.

El pareo de ADN busca estas fracciones o segmentos de ADN que tú y tu primo han heredado de un ancestro común. De esta forma se evidencia que los dos tienen una relación genealógica.

ADN Idéntico por Estado (IBS) o por Descendencia (IBD)

Cuando dos personas comparten ADN por tener un ancestro común, el mismo se llama IBD, o ADN identico por descendecia. Es decir que un segmento es idéntico en dos personas porque ambas lo han heredado del mismo ascendente.

Para encontrar el IBD de dos personas, lo que se comparan son las bases de los segmentos de ADN. Por ejemplo, el segmento en color es compartido, o idéntico, mientras que el resto de las bases es diferente:

ADN Idéntico por Descendencia

Puede que el segmento de ADN sea idéntico por otros motivos, por ejemplo si todos los humanos (o todas las personas de una región) lo comparten – en ese caso sería IBS, o “ADN Idéntico por Estado“. La mayoría de nuestro ADN es similar, o igual.

Es por ello que el la siguiente tarea, cuando lo que queremos hacer es crear mapas de parentesco, es comprobar quelos segmentos que estamos comparando sean efectivamente idénticos debido a la presencia de un ancestro común.

La búsqueda de métodos para garantizar efectivamente que un segmento sea IBD se encuentra también en constante desarrollo y se trata de uno de los más interesantes problemas de genética – tanto como la habilidad de definir las regiones geogréficas de nuestros ancestros con más especificidad.

Cuando tomamos un test de ADN, lo primero que se hace en el laboratorio es distinguir los IBS de IBD, en un primer momento a través de la longitud de los segmentos (en general, los IBS tienden a ser más cortos, y los IBD más largos), y luego a partir de su distribución. A medida que las compañías acumulan datos de personas, esta diferenciación se hace más fácil.

Cuando dos personas comparten IBD, suelen hacerlo en diferentes lugares del genoma (este es un indicador que estamos frente a IBD y no IBS, que suele concentrarse en áreas particulares). A través de sumulaciones, investigadores han podido comprobar que, efectivamente, la distribución de los segmentos en el genoma tiene correlación con la ascendencia. Si quitamos de la fórmula los segmentos que sabemos son IBD, la relación entre dos personas se vuelve más evidente.

Distribución de segmentos de ADN en IBS y IBD

Para garantizar que los métodos sean efectivos, es necesario evaluar constantemente los resultados. Hay grupos que reciben más pares que otros? Hay personas con supuestas conexiones genéticas que no tienen relación genealógica? Estas son algunas de las preguntas que permiten que la disciplina se perfeccione.

Estos avances son posibles gracias al gran tamaño de las bases de datos construídas a partir de muestras de ADN.

Por lo que es de esperar que, a medida que estas bases crezcan y los métodos se perfeccionen, los resultados serán más y más específicos y confiables – y no excesivo suponer un futuro donde un análisis de ADN puede desvelar la historia completa de nuestros parientes.

Artículos sobre inmigración a latinoamérica, barcos de inmigrantes, personajes ilustres, historias familiares y más.

Cómo crear árboles genealógicos, buscar partidas de nacimiento, bautismo, matrimonio y defunción, cómo consultar censos históricos, qué es la genealogía, y mucho más.