Por Agustín B. Ávila Casanueva /Gaceta UNAM
Se ha avanzado mucho en la secuenciación y nuestra capacidad de ensamble de genomas, pero en números este trabajo podría parecer modesto. Pongámosle un poco de contexto a lo anterior. El proyecto del genoma humano inició en 1990, y 10 años –y casi tres mil millones de dólares– después, en el 2000, el entonces presidente de Estados Unidos, Bill Clinton, y el primer ministro británico, Tony Blair, anunciaron conjuntamente que se había terminado el primer borrador de la secuencia del genoma humano. Para 2003 se anunció que el proyecto había llegado a su fin, habiendo secuenciado 92 por ciento del genoma humano. La semana pasada –casi 20 años después– el 31 de marzo del 2022, tres artículos en un número especial de la revista Science reportan el modesto ocho por ciento restante.
No obstante, más que modesto, es un ocho por ciento bastante complicado. “Son zonas de alta complejidad”, explica el Dr. Diego Cortez, investigador del Centro de Ciencias Genómicas (CCG) y experto en genómica humana, y a lo que se refiere es que son “regiones de secuencias altamente repetitivas y muy variables”. Repetitivo y variable suena a oxímoron, pero, en realidad, hay ciertas partes de nuestro genoma que se repiten mucho y cada una se repite a su propia manera. Tanto el tipo de repetición, como su longitud y posición exacta van cambiando dentro de las puntas de nuestros cromosomas (telómeros), así como en sus puntos de anclaje (centrómeros).
“Por lo tanto, las secuencias cortas no nos sirven en estos casos”, sentencia el Dr. Luis Lozano, técnico académico y experto en ensamble de genomas del CCG. Y aclara: “Los primeros ensambles del genoma humano se lograron con secuencias cortas (de varios cientos o algunos pocos miles de bases)”. Las bases a las que hace referencia son las nitrogenadas, las As, Ts, Cs y Gs que conforman cualquier genoma. Y en el caso del genoma humano, tenemos cerca de tres mil 100 millones de estas bases dentro de nuestras células. Así que ocho por ciento son cerca de 200 millones de bases, 200 millones de bases que se repiten variablemente. Ensamblar estas bases, es decir, ponerlas en orden, de cabo a rabo, con secuencias cortas, resulta imposible. Sería como intentar armar el cielo de La noche estrellada, de Van Gogh, con piezas del tamaño de un pixel.
Lecturas largas, posibles
Ahora contamos con técnicas de secuenciación que llegan a las decenas de miles o incluso cientos de miles de bases por lecturas. “Con estas lecturas largas, las herramientas bioinformáticas ya pueden poner orden a estas secuencias repetitivas” comenta el Dr. Lozano. Pero tecnologías más poderosas de secuenciación y ensamble de genomas no fueron las únicas herramientas utilizadas. El genoma que se secuenció en esta ocasión proviene del embrión de un embarazo molar –una mola hidatiforme–, un tipo de embarazo no viable en el que el embrión, en lugar de tener una copia de su genoma de parte del padre y una de parte de la madre, tiene las dos copias del mismo progenitor. En este caso, de su mamá, haciendo que este genoma carezca de cromosoma Y.
Esto también influyó a que la secuenciación y ensamble fueran más sencillas porque, justamente al tener las dos copias del genoma idénticas, la variación se reduce. De esta manera, el consorcio T2T (Telómero a Telómero por sus siglas en inglés, algo así como de cabo a rabo) dirigido por el Dr. Adam Phillippy y la Dra. Karen Miga, junto con colegas de Estados Unidos, Europa y Rusia, lograron obtener un genoma completo y con una tasa de error muy pequeña. Pero, bueno, una cosa es la secuencia y su orden y otra es qué encontraron en ese ocho por ciento.
Aún nos falta por discutir y dejar en claro las cuestiones éticas, legales y de seguridad… tenemos mucho trabajo por delante y debemos centrarnos en realizarlo de la mejor manera”
Mashaal Sohail
Investigadora del Centro de Ciencias Genómicas
No todo era secuencias repetidas. “¡Incluso encontraron genes!”, subraya sorprendido el Dr. Cortez, y añade: “genes que parecen muy importantes, relacionados con nuestro sistema inmune”. Además de tener nueva información que nos ayudará a comprender mejor procesos como el envejecimiento –analizando los telómeros– y la segregación de ADN –analizando los centrómeros–. Pero para empezar a responder otro tipo de preguntas, aún nos faltan más datos. “Para conocer cómo evolucionan los telómeros necesitaríamos tener genomas completos de neandertales o chimpancés”, propone.
Otro punto de interés que ahora podremos estudiar con mayor detalle son las duplicaciones segmentales, que forman parte de estas secuencias repetidas. “En el resto de los mamíferos, cuando una secuencia se duplica, normalmente queda pegada al lado de la original”, afirma, “pero en los primates, incluidos nosotros los humanos, estas duplicaciones suelen cambiar de posición en el genoma, incluso pueden moverse a otro cromosoma”. Y al cambiarse de posición, puede cambiar también su regulación, es decir, el momento en el desarrollo y el tipo de tejido en el que estas secuencias se encuentran activas. Estas secuencias pueden haber sido esenciales para grandes cambios evolutivos.
Buenas noticias
Por el momento, tener la secuencia completa de un genoma humano son buenas noticias, pero seguimos teniendo mucha investigación por delante. “Contamos con más información, pero aún no tenemos más respuestas”, dice la Dra. Mashaal Sohail, investigadora del CCG y experta en genómica humana. “Si nuestro genoma es como un libro”, indica, “entonces, hasta el momento, la investigación científica no había hecho uso del libro completo”. La experta nos recuerda también que “tenemos limitaciones económicas; no todo el mundo puede conseguir este tipo de secuencias”.
Lo anterior es relevante porque no debemos de olvidar que la secuencia que se obtuvo fue la de un genoma. Si bien no aspiramos a secuenciar con esta profundidad a las más de siete mil millones de personas que habitan este planeta, sí necesitamos más información poblacional sobre estas secuencias repetidas y variables. “Debemos de pensar en la diversidad”, propone, y agrega: “Para conocer mejor la historia, procesos biogeográficos, procesos evolutivos e historias de algunas enfermedades o síndromes, necesitamos más secuencias”.
Esa propuesta no está limitada solamente por la cuestión económica. Para poder estudiar de buena manera la diversidad en las secuencias genómicas humanas “aún nos falta por discutir y dejar en claro las cuestiones éticas, legales y de seguridad”, previene. Recientemente la genómica humana se ha volcado a estudiar poblaciones indígenas de diversas partes del mundo y la preocupación sobre qué pasará con esas secuencias, a quién pertenecen y quién decide qué tipo de investigación se puede hacer con ellas va en aumento. Y mientras más profundamente logramos indagar dentro del genoma humano, más profundamente debemos de tener en cuenta estas cuestiones. No ser partícipes de una ciencia que sea extractivista, sino que construya en conjunto con las personas con las que está colaborando.
“Sí debemos de celebrar, es un gran logro histórico”, concluye la Dra. Sohail, “pero todavía tenemos mucho trabajo por delante y debemos centrarnos en realizarlo de la mejor manera”. El genoma humano es, sin duda, el genoma mejor estudiado y anotado de un organismo complejo, y aún estamos lejos de entenderlo por completo. Probablemente nunca lo haremos, pues con cada generación, seguimos cambiando, mutando, evolucionando y multiplicándonos. Y lo mismo sucede con nuestras maneras de estudiar e investigar el genoma.