Miles de genes nuevos están ocultos dentro de la “materia oscura” de nuestro genoma.
Anteriormente se pensaba que period ruido resultante de la evolución, un nuevo estudio descubrió que algunos de estos pequeños fragmentos de ADN pueden producir miniproteínas, lo que podría abrir un nuevo universo de tratamientos, desde vacunas hasta inmunoterapias para cánceres cerebrales mortales.
La preimpresión, que aún no ha sido revisada por pares, es la última de un consorcio world que busca nuevos genes potenciales. Desde el Proyecto Genoma Humano Completado su primer borrador a principios de siglo, los científicos han intentado descifrar el libro genético de la vida. Enterrada dentro de las cuatro letras genéticas (A, T, C y G) y las proteínas que codifican hay una gran cantidad de información que podría ayudar a abordar nuestros enemigos médicos más frustrantes, como el cáncer.
Los hallazgos iniciales del Proyecto Genoma Humano fueron una sorpresa. Los científicos encontraron menos de 30.000 genes que construyen nuestro cuerpo y lo mantienen en funcionamiento, aproximadamente un tercio de lo predicho anteriormente. Ahora, aproximadamente 20 años después, a medida que las tecnologías que secuencian nuestro ADN o mapean proteínas se han vuelto cada vez más sofisticadas, los científicos se preguntan: “¿Qué nos hemos perdido??”
El nuevo estudio llenó el vacío al profundizar en porciones relativamente inexploradas del genoma. Estas partes, llamadas “no codificantes”, aún no se han vinculado a ninguna proteína. Combinando varios conjuntos de datos existentes, el equipo se centró en miles de nuevos genes potenciales que producen aproximadamente 3.000 miniproteínas.
Queda por probar si estas proteínas son funcionales, pero los estudios iniciales sugieren que algunas están involucradas en un cáncer cerebral infantil mortal. El equipo está lanzando sus herramientas y resultados a la comunidad científica en common para una mayor exploración. La plataforma no se limita sólo a descifrar el genoma humano; también puede profundizar en el modelo genético de otros animales y plantas.
Aunque persisten los misterios, los resultados “ayudan a proporcionar una imagen más completa de la parte codificante del genoma”, afirmó Ami Bhatt de la Universidad de Stanford. dijo Ciencia.
¿Qué hay en un gen?
Un genoma es como un libro sin puntuación. Secuenciar uno es relativamente fácil hoy en día, gracias a Costos más baratos y mayor eficiencia.. Encontrarle sentido es otra cuestión.
Desde el Proyecto Genoma Humano, los científicos han buscado en nuestro modelo genético las “palabras” o genes que producen proteínas. Estas palabras de ADN se dividen en codones de tres letras, cada uno de los cuales codifica un aminoácido específico: el componente básico de una proteína.
Un gen, cuando se activa, se transcribe en ARN mensajero. Estas moléculas transportan información genética desde el ADN a la fábrica de producción de proteínas de la célula, llamada ribosoma. Imagínelo como un panecillo rebanado, con una molécula de ARN atravesándolo como un trozo de tocino.
Al definir un gen por primera vez, los científicos se centran en marcos de lectura abiertos. Están formados por secuencias de ADN específicas que dictan dónde comienza y dónde termina un gen. Como una función de búsqueda, el marco escanea el genoma en busca de genes potenciales, que luego se validan con experimentos de laboratorio basados en innumerables criterios. Estos incluyen si pueden producir proteínas de cierto tamaño: más de 100 aminoácidos. Las secuencias que cumplen con la marca se compilan en GENCODEuna base de datos internacional de genes oficialmente reconocidos.
Los genes que codifican proteínas han atraído la mayor atención porque ayudan a comprender las enfermedades e inspiran formas de tratarlas. Pero gran parte de nuestro genoma es “no codificante”, en el sentido de que grandes secciones de él no producen ninguna proteína conocida.
Durante años, estos fragmentos de ADN se consideraron basura: los restos difuntos de nuestro pasado evolutivo. Sin embargo, estudios recientes han comenzado a revelar valores ocultos. Algunos bits regulan cuándo se activan o desactivan los genes. Otros, como los telómeros, protegen contra la degradación del ADN a medida que se duplicate durante la división celular y previenen el envejecimiento.
Aún así, el dogma period que estas secuencias no producen proteínas.
Una nueva lente
Se están acumulando pruebas recientes de que las áreas no codificantes tienen segmentos productores de proteínas que afectan la salud.
un estudio descubrió que una pequeña sección faltante en áreas supuestamente no codificantes causaba problemas intestinales hereditarios en los bebés. En ratones modificados genéticamente para imitar el mismo problema, la restauración del fragmento de ADN (aún no definido como gen) redujo sus síntomas. Los resultados resaltan la necesidad de ir más allá de los genes codificadores de proteínas conocidos para explicar los hallazgos clínicos, escribieron los autores.
Estos fragmentos, denominados marcos de lectura abiertos no canónicos (ncORF) o “quizás genes”, han aparecido en tipos de células humanas y enfermedades, lo que sugiere que tienen funciones fisiológicas.
En 2022, el consorcio detrás del nuevo estudio comenzó a echar un vistazo a funciones potencialescon la esperanza de ampliar nuestro vocabulario genético. En lugar de secuenciar el genoma, observaron conjuntos de datos que secuenciaban el ARN mientras se convertía en proteínas en el ribosoma.
El método captura la producción actual del genoma, incluso las cadenas de aminoácidos extremadamente cortas que normalmente se consideran demasiado pequeñas para producir proteínas. Su búsqueda produjo un catálogo de más de 7.000 “quizás genes” humanos, algunos de los cuales producían microproteínas que finalmente se detectaron dentro de las células cancerosas y cardíacas.
Pero en common, en ese momento “no nos centramos en las cuestiones de expresión o funcionalidad de las proteínas”, escribió el equipo. Por lo tanto, ampliaron su colaboración en el nuevo estudio, dando la bienvenida a especialistas en ciencia de las proteínas de más de 20 instituciones de todo el mundo para dar sentido a los “genes-quizás”.
También incluyeron varios recursos que proporcionan bases de datos de proteínas de varios experimentos, como el Organización del proteoma humano y el Atlas de péptidos—Y se agregaron datos de experimentos publicados que utilizan el sistema inmunológico humano para detectar fragmentos de proteínas.
En complete, el equipo analizó más de 7.000 “quizás genes” de una variedad de células: líneas celulares sanas, cancerosas y también inmortales cultivadas en el laboratorio. Al menos una cuarta parte de estos “quizás genes” se tradujeron en más de 3.000 miniproteínas. Son mucho más pequeñas que las proteínas normales y tienen una composición de aminoácidos única. También parecen estar más en sintonía con partes del sistema inmunológico, lo que significa que podrían ayudar a los científicos a desarrollar vacunas, tratamientos autoinmunes o inmunoterapias.
Es posible que algunas de estas miniproteínas recién descubiertas no tengan ningún papel biológico. Pero el estudio ofrece a los científicos una nueva forma de interpretar funciones potenciales. Para el management de calidad, el equipo organizó cada miniproteína en un nivel diferente, según la cantidad de evidencia de los experimentos, y las integró en una base de datos existente para que otros lo exploren.
Recién estamos comenzando a investigar la materia oscura de nuestro genoma. Quedan muchas preguntas.
“Una capacidad única de nuestra colaboración entre múltiples consorcios es la capacidad de desarrollar consenso sobre los desafíos clave” que creemos que necesitan respuestas, escribió el equipo.
Por ejemplo, algunos experimentos utilizaron células cancerosas, lo que significa que ciertos “genes-quizás” podrían estar activos sólo en esas células, pero no en las normales. ¿Deberían llamarse genes?
A partir de aquí, el aprendizaje profundo y otros métodos de IA pueden ayudar a acelerar el análisis. Aunque la anotación de genes está “históricamente arraigada en la inspección guide” de los datos, escribieron los autores, la IA puede analizar múltiples conjuntos de datos mucho más rápido, aunque sólo sea como un primer paso para encontrar nuevos genes.
¿Cuántos podrían descubrir los científicos? “50.000 está en el ámbito de las posibilidades”, autor del estudio Thomas Martínez dijo Ciencia.
Crédito de la imagen: Miroslaw Miras de Pixabay