¿Son racistas las bases de datos genéticas?

La mayoría de estudios genéticos se han hecho por y para estudiar la ascendencia europea. La falta de diversidad genética en los datos puede estar afectando gravemente a los resultados de nuestros estudios.

por Juan García-Bernalt Diego

La ciencia es cara y está, en muchos casos, limitada a tecnologías del primer mundo. Lo que es peor, hasta hace poco, era mayoritariamente masculina y blanca. Esto último, por suerte, está cambiando a pasos agigantados en los últimos años. Ahora, la mayor parte de equipos científicos son diversos y, mismamente en el año 2020, fueron dos mujeres las que ganaron el premio Nobel de Química, por la técnica de edición genética CRISPR (si quieres saber más sobre CRISPR, quizás te interese la entrada Cine en una molécula de ADN). Aún queda mucho camino por recorrer, especialmente según se asciende en la escala laboral, pero vamos en la dirección adecuada. Sin embargo, esas desigualdades, ¿se pueden haber colado también en nuestros datos?¿con qué consecuencias?

Un buen ejemplo, son las bases de datos de genes humanos, para las cuales la mayoría de estudios se han hecho en occidente, centrándose en población de ascendencia europea. Esta nula o limitada representación de otras etnias, puede llegar a impedir que conozcamos bien el funcionamiento genético de numerosas enfermedades. Y, como siempre, el efecto de estas desigualdades será más patente en aquellas poblaciones más desfavorecidas, por las que la financiación científica, que no la ciencia, se interesan menos. El investigador Giorgio Sirugo y sus colaboradores, estudiaron este efecto en el año 2019, publicando sus resultados en la prestigiosa revista Cell

Miremos primero los datos concretos. En el catálogo de GWAS (del inglés Genomic Wide Association Study), una base de datos que recoge estudios en los que se asocian variaciones genéticas con distintas enfermedades, sobre todo por comparación de mutaciones en una letra concreta del ADN (conocidas como SNPs, de los que ya hablamos en Malaria y evolución). Se vio que en estas bases de datos más del 50% de los estudios se centraban en población de ascendencia europea. Si se comparaba el número de individuos estudiados, no el número de estudios, ese porcentaje subía a casi el 80%. Teniendo en cuenta que Asia representa casi el 60% de la población mundial y África el 17%, según los datos de Statista (https://es.statista.com/estadisticas/634787/distribucion-de-la-poblacion-mundial-en–por-continente/) es evidente que esas bases de datos no son fiel representación de la población mundial.

Uno podría pensar ¿y qué más da? Mientras haya datos de todas las etnias, aunque la distribución esté poco equilibrada, yo puedo estudiar lo que quiera. La respuesta rápida a esa pregunta es que no da igual, el tamaño muestral influye mucho cuando se estudian eventos, en este caso mutaciones, que tienen una frecuencia de aparición en muchas ocasiones de 1 caso cada 100.000 individuos, o incluso menos. La respuesta larga, y un poco más precisa, es que depende del tipo de enfermedad de la que hablemos.

En función de cuál sea el componente genético de una enfermedad, distinguimos tres categorías: Enfermedades mendelianas, enfermedades oligogénicas y enfermedades poligénicas. 

Las enfermedades mendelianas son aquellas en las que interviene un único gen. Ese gen tiene por tanto un tamaño de efecto grande, la probabilidad de padecer la enfermedad si tienes la variante del gen correspondiente es muy alta. En ese caso, da igual de qué población estemos hablando, en general las mutaciones que causan este tipo de enfermedades las causan en cualquiera de ellas, por lo que los datos de nuestras bases son altamente transferibles. Habría que hacer una excepción a esta regla, y son aquellas mutaciones que son causantes de enfermedades mendelianas, pero que solo se dan en una determinada población. En este caso el tamaño del efecto sigue siendo muy grande, pero si no tenemos datos suficientes de la etnia en la que se da la mutación, no podremos evaluarlas correctamente. 

Un ejemplo clásico de enfermedad mendeliana es la fibrosis quística, que provoca la acumulación de líquido mucoso en pulmones, intestino y otras áreas del cuerpo. Es común entre europeos (~1 por cada 2000 individuos) pero menos en Afroamericanos (~1 por cada 17.000) está causada por una mutación puntual en un gen. Esta mutación es responsable del 70% de los casos en europeos, pero solo el 29% en africanos. Se conoce que hay al menos otras 2000 mutaciones raras que pueden causar esta enfermedad, pero como los estudios se han realizado en su mayoría en europeos, no se sabe cuál o cuáles de ellas son responsables de los casos en africanos. De hecho podría haber más mutaciones que afecten a población africana que ni siquiera se conozcan.

A medida que el número de genes implicados en una enfermedad aumenta, podemos hablar de enfermedades oligogénicas, en las que están implicados unos pocos genes; o poligénicas, en las que están implicados muchos genes. Cuantos más genes contribuyan, el tamaño del efecto que cada gen particular tiene en ellas se va reduciendo, y el estudio se va haciendo mucho más complejo. A medida que aumenta ese número, tener gran cantidad de datos de las diferentes etnias se va haciendo cada vez más importante y, por tanto, los desiguales datos que tenemos ahora, serán poco transferibles para estudiar lo que realmente está pasando. 

A esto se suma que entran en juego conceptos genéticos mucho más complejos, entre los que destaca el “desequilibrio de ligamiento”. Todos tenemos dos copias de cada gen, que pueden ser diferentes o iguales. Imaginemos dos genes, uno para el que tenemos dos copias iguales (homozigoto, en términos genéticos) que llamaremos AA y otro para el que tenemos dos copias distintas (heterozigoto), Bb. Nosotros le pasamos una copia de cada uno a nuestros hijos, por tanto, la probabilidad teórica de heredar A y B es el 50% y heredar A y b también es el 50%. Pero en genética las cosas no suelen ser tan fáciles y en muchas ocasiones nos encontramos que hay genes que se asocian y se heredan “juntos”, haciendo, por ejemplo, que la probabilidad de heredar A y B suba al 75%, mientras que A y b baje al 25%. Esto es el “desequilibrio de ligamiento”. Este fenómeno puede reducir nuestra capacidad de asociar una determinada mutación a una enfermedad, al no saber cual de todas esas mutaciones que se asocian al heredarse es la causante de una enfermedad, si lo son todas, si son solo algunas, cuánto contribuye cada una,….

Cuando las poblaciones, a lo largo de su evolución, sufren lo que se conoce como cuellos de botella poblacionales, momentos en los que se reduce mucho la población y, en consecuencia, aumentan las relaciones consanguíneas (que le pregunten a los Islandeses y su app para evitar echar un polvete con tu primo), estos fenómenos de desequilibrio de ligamiento se hacen mucho más extensos, afectando a muchos más genes. Por ello, la población africana, donde se originó la humanidad y que ha migrado menos, tiene menos asociaciones de este tipo en sus genes, mientras que poblaciones como las del norte europeo, que han pasado por muchos más cuellos de botella, tienen muchas más.

En definitiva, no es sólo una cuestión moral (que lo es) que la ciencia deba ser equitativa y justa. Sino que mientras no hagamos accesible la ciencia por igual a todo el mundo, no vamos a ser capaces de responder muchas preguntas que tenemos a día de hoy, ni mejorar el pronóstico de numerosas enfermedades. Esas respuestas nos afectan a todos, por lo que todos deberíamos tener la oportunidad de intentar contestar a las preguntas.

Referencia

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s