Durante más de 100 años, los científicos han utilizado la cristalografía de rayos X para determinar la estructura de materiales cristalinos como metales, rocas y cerámicas.
Esta técnica funciona mejor cuando el cristal está intacto, pero en muchos casos, los científicos sólo tienen una versión en polvo del materials, que contiene fragmentos aleatorios del cristal. Esto hace que sea más difícil reconstruir la estructura common.
Los químicos del MIT han ideado un nuevo modelo de IA generativa que puede hacer mucho más fácil determinar las estructuras de estos cristales en polvo. El modelo de predicción podría ayudar a los investigadores a caracterizar materiales para su uso en baterías, imanes y muchas otras aplicaciones.
“La estructura es lo primero que hay que saber para cualquier materials. Es importante para la superconductividad, es importante para los imanes, es importante para saber qué energía fotovoltaica creaste. Es importante para cualquier aplicación que se pueda imaginar que esté centrada en materiales”, cube Danna Freedman, profesora de química Frederick George Keyes en el MIT.
Freedman y Jure Leskovec, profesor de informática en la Universidad de Stanford, son los autores principales del nuevo estudio, que aparece hoy en el Revista de la Sociedad Química Estadounidense. El estudiante graduado del MIT Eric Riesel y el estudiante universitario de la Universidad de Yale Tsach Mackey son los autores principales del artículo.
Patrones distintivos
Los materiales cristalinos, que incluyen metales y la mayoría de los demás materiales sólidos inorgánicos, están hechos de redes que constan de muchas unidades idénticas y repetidas. Estas unidades pueden considerarse como “cajas” con una forma y tamaño distintivos, con átomos dispuestos precisamente dentro de ellas.
Cuando se emiten rayos X a estas redes, difractan los átomos con diferentes ángulos e intensidades, revelando información sobre las posiciones de los átomos y los enlaces entre ellos. Desde principios del siglo XX, esta técnica se ha utilizado para analizar materiales, incluidas moléculas biológicas que tienen una estructura cristalina, como el ADN y algunas proteínas.
Para los materiales que existen sólo como cristal en polvo, resolver estas estructuras se vuelve mucho más difícil porque los fragmentos no llevan la estructura tridimensional completa del cristal unique.
“La pink precisa todavía existe, porque lo que llamamos polvo es en realidad una colección de microcristales. Entonces, tienes la misma pink que un cristal grande, pero están en una orientación completamente aleatoria”, cube Freedman.
Para miles de estos materiales, existen patrones de difracción de rayos X, pero siguen sin resolverse. Para intentar descifrar las estructuras de estos materiales, Freedman y sus colegas entrenaron un modelo de aprendizaje automático con datos de una base de datos llamada Supplies Undertaking, que contiene más de 150.000 materiales. Primero, introdujeron decenas de miles de estos materiales en un modelo existente que puede simular cómo se verían los patrones de difracción de rayos X. Luego, utilizaron esos patrones para entrenar su modelo de IA, al que llamaron Crystalyze, para predecir estructuras basadas en los patrones de rayos X.
El modelo divide el proceso de predicción de estructuras en varias subtareas. Primero, determina el tamaño y la forma de la “caja” de la pink y qué átomos entrarán en ella. Luego, predice la disposición de los átomos dentro de la caja. Para cada patrón de difracción, el modelo genera varias estructuras posibles, que pueden probarse introduciendo las estructuras en un modelo que determina los patrones de difracción para una estructura determinada.
“Nuestro modelo es IA generativa, lo que significa que genera algo que no ha visto antes y que nos permite generar varias conjeturas diferentes”, afirma Riesel. “Podemos hacer cientos de conjeturas y luego predecir cómo debería verse el patrón de polvo según nuestras conjeturas. Y luego, si la entrada se ve exactamente igual a la salida, entonces sabremos que lo hicimos bien”.
Resolviendo estructuras desconocidas
Los investigadores probaron el modelo en varios miles de patrones de difracción simulados del Proyecto Materiales. También lo probaron en más de 100 patrones de difracción experimentales de la base de datos RRUFF, que contiene datos de difracción de rayos X en polvo para casi 14.000 minerales cristalinos naturales, que no habían incluido en los datos de entrenamiento. Con estos datos, el modelo fue preciso aproximadamente el 67 por ciento de las veces. Luego, comenzaron a probar el modelo en patrones de difracción que no se habían resuelto antes. Estos datos provienen del Archivo de Difracción de Polvo, que contiene datos de difracción de más de 400.000 materiales resueltos y no resueltos.
Utilizando su modelo, los investigadores idearon estructuras para más de 100 de estos patrones previamente no resueltos. También utilizaron su modelo para descubrir estructuras para tres materiales que el laboratorio de Freedman creó forzando elementos que no reaccionan a la presión atmosférica para formar compuestos bajo alta presión. Este enfoque se puede utilizar para generar nuevos materiales que tengan estructuras cristalinas y propiedades físicas radicalmente diferentes, aunque su composición química sea la misma.
El grafito y el diamante, ambos hechos de carbono puro, son ejemplos de dichos materiales. Los materiales que Freedman ha desarrollado, cada uno de los cuales contiene bismuto y otro elemento, podrían ser útiles en el diseño de nuevos materiales para imanes permanentes.
“Encontramos muchos materiales nuevos a partir de datos existentes y, lo más importante, resolvimos tres estructuras desconocidas en nuestro laboratorio que comprenden las primeras nuevas fases binarias de esas combinaciones de elementos”, cube Freedman.
Ser capaz de determinar las estructuras de materiales cristalinos en polvo podría ayudar a los investigadores que trabajan en casi cualquier campo relacionado con materiales, según el equipo del MIT, que publicó una interfaz net para el modelo en cristalyze.org.
La investigación fue financiada por el Departamento de Energía de EE. UU. y la Fundación Nacional de Ciencias.