
/
Únase a Danielle Belgrave y Ben Lorica para una discusión sobre la IA en la atención médica. Danielle es vicepresidente de IA y aprendizaje automático en GSK (anteriormente GlaxoSmithKline). Ella y Ben discuten el uso de IA y el aprendizaje automático para obtener mejores diagnósticos que reflejen las diferencias entre los pacientes. Escuche para aprender sobre los desafíos de trabajar con datos de salud, un campo donde hay demasiados datos y muy poco, y donde las alucinaciones tienen graves consecuencias. Y si está entusiasmado con la atención médica, también descubrirá cómo los desarrolladores de IA pueden ingresar al campo.
Verificar Otros episodios de este podcast en la plataforma de aprendizaje O’Reilly.
Sobre el IA generativa en el mundo actual podcast: En 2023, Chatgpt puso a AI en la agenda de todos. En 2025, el desafío será convertir esas agendas en realidad. En IA generativa en el mundo actualBen Lorica entrevista a líderes que están construyendo con IA. Aprenda de su experiencia para ayudar a poner a la IA a trabajar en su empresa.
Puntos de interés
- 0:00: Introducción a Danielle Belgrave, vicepresidente de IA y aprendizaje automático en GSK. Danielle es nuestra primera invitada que representa a Massive Pharma. Será interesante ver cómo las personas en la farmacia están utilizando tecnologías de IA.
- 0:49: Mi interés en el aprendizaje automático para la atención médica comenzó hace 15 años. Mi doctorado estaba en comprender la heterogeneidad del paciente en la enfermedad relacionada con el asma. Esto fue antes de los registros electrónicos de atención médica. Al aprovechar diferentes tipos de datos, datos genómicos y biomarcadores de niños, y al ver cómo desarrollaron el asma y las enfermedades alérgicas, desarrollé marcos de modelado causales y modelos gráficos para ver si podíamos identificar quién respondería a qué tratamientos. Esto period bastante novedoso en ese momento. Identificamos cinco tipos diferentes de asma. Si podemos entender la heterogeneidad en el asma, un desafío mayor es comprender la heterogeneidad en la salud psychological. La concept period tratar de comprender la heterogeneidad con el tiempo en pacientes con ansiedad.
- 4:12: Cuando fui a DeepMind, trabajé en la cartera de atención médica. Tenía mucha curiosidad sobre cómo entender cosas como Mimic, que tenían registros de atención médica electrónica y datos de imágenes. La concept period aprovechar herramientas como el aprendizaje activo para minimizar la cantidad de datos que toma de los pacientes. También publicamos trabajos para mejorar la diversidad de conjuntos de datos.
- 5:19: Cuando llegué a GSK, fue una oportunidad emocionante para hacer tecnología y salud. La salud es uno de los paisajes más desafiantes en los que podemos trabajar. La biología humana es muy complicada. Hay tanta variación aleatoria. Es sorprendente comprender la biología, la genómica, la progresión de la enfermedad y tener un impacto en cómo se administran los medicamentos a los pacientes.
- 6:15: Mi papel es liderar la IA/ML para el desarrollo clínico. ¿Cómo podemos entender la heterogeneidad en los pacientes para optimizar el reclutamiento de ensayos clínicos y asegurarnos de que los pacientes adecuados tengan el tratamiento adecuado?
- 6:56: ¿Dónde crea AI el mayor valor en GSK hoy? Esa puede ser IA tradicional y IA generativa.
- 7:23: Uso todo indistintamente, aunque hay distinciones. Lo realmente importante es centrarse en el problema que estamos tratando de resolver y centrarnos en los datos. ¿Cómo generamos datos significativos? ¿Cómo pensamos sobre la implementación?
- 8:07: Y todos los Q&A y el equipo rojo.
- 8:20: Es difícil señalar cuál es el caso de uso más impactante. Cuando pienso en los problemas que me importan, pienso en oncología, enfermedad pulmonar, hepatitis, todos estos son problemas muy impactantes, y son problemas en los que trabajamos activamente. Si tuviera que resaltar una cosa, es la interacción entre cuando estamos viendo datos de secuenciación de genoma entero y analizando datos moleculares e intentando traducirlo en patología computacional. Al observar esos tipos de datos y comprender la heterogeneidad en ese nivel, obtenemos una representación biológica más profunda de diferentes subgrupos y comprendemos los mecanismos de acción para la respuesta a las drogas.
- 9:35: No es escalable hacerlo para las personas, por lo que estoy interesado en cómo traducimos a través de diferentes tipos o modalidades de datos. Tomando una biopsia, ahí es donde estamos entrando en el campo de la inteligencia synthetic. ¿Cómo traducimos entre genómica y mirando una muestra de tejido?
- 10:25: Si pensamos en el impacto de la tubería clínica, el segundo ejemplo sería usar IA generativa para descubrir medicamentos, identificación objetivo. Esos a menudo son experimentos en silico. Tenemos modelos de perturbación. ¿Podemos perturbar las células? ¿Podemos crear incrustaciones que nos darán representaciones de la respuesta al paciente?
- 11:13: Estamos generando datos a escala. Queremos identificar objetivos más rápidamente para la experimentación mediante la clasificación de la probabilidad de éxito.
- 11:36: Has mencionado mucho la multimodalidad. Esto incluye visión por computadora, imágenes. ¿Qué otras modalidades?
- 11:53: Datos de texto, registros de salud, respuestas a lo largo del tiempo, biomarcadores de sangre, datos de RNA-seq. La cantidad de datos que se han generado es bastante increíble. Estas son todas las diferentes modalidades de datos con diferentes estructuras, diferentes formas de corregir el ruido, los efectos por lotes y la comprensión de los sistemas humanos.
- 12:51: Cuando te encuentras con tus antiguos colegas en Deepmind, ¿qué tipo de solicitudes les das?
- 13:14: Olvídate de los chatbots. Gran parte del trabajo que está sucediendo en torno a modelos de idiomas grandes, pensando en LLM como herramientas de productividad que pueden ayudar. Pero también ha habido mucha exploración en torno a la construcción de marcos más grandes donde podemos hacer inferencia. El desafío es alrededor de los datos. Los datos de salud son muy escasos. Ese es uno de los desafíos. ¿Cómo ajustamos los modelos a soluciones específicas o áreas de enfermedad específicas o modalidades específicas de datos? Ha habido mucho trabajo en modelos de base para patología computacional o bases para la estructura de una sola celda. Si tuviera un deseo, estaría buscando datos pequeños y ¿cómo tiene representaciones sólidas de pacientes cuando tiene pequeños conjuntos de datos? Estamos generando grandes cantidades de datos sobre pequeños números de pacientes. Este es un gran desafío metodológico. Esa es la estrella del norte.
- 15:12: Cuando describe el uso de estos modelos de base para generar datos sintéticos, ¿qué barandillas pone en su lugar para evitar la alucinación?
- 15:30: Hemos tenido un equipo de IA responsable desde 2019. Es importante pensar en esas barandillas, especialmente en la salud, donde las recompensas son altas, pero también lo son las apuestas. Una de las cosas que el equipo ha implementado son los principios de IA, pero también usamos tarjetas modelo. Tenemos formuladores de políticas que entienden las consecuencias del trabajo; También tenemos equipos de ingeniería. Hay un equipo que parece precisamente comprender las alucinaciones con el modelo de idioma que hemos creado internamente, llamado Jules.1 Ha habido mucho trabajo mirando métricas de alucinación y precisión para esos modelos. También colaboramos en cosas como la interpretabilidad y la construcción de tuberías reutilizables para la IA responsable. ¿Cómo podemos identificar los puntos ciegos en nuestro análisis?
- 17:42: El año pasado, mucha gente comenzó a hacer ajuste, trapo y graprag; ¿Asumo que haces todo esto?
- 18:05: El trapo ocurre mucho en el equipo de IA responsable. Hemos creado un gráfico de conocimiento. Ese fue uno de los primeros gráficos de conocimiento, antes de que me uniera. Es mantenido por otro equipo en este momento. Tenemos un equipo de plataformas que se ocupa de toda la escala y la implementación en toda la empresa. Herramientas como el gráfico de conocimiento no son solo AI/ML. También Jules, se mantiene fuera de AI/ML. Es emocionante cuando ves estas soluciones escala.
- 20:02: El término de Buzzy este año son agentes e incluso múltiples agentes. ¿Cuál es el estado de IA de agente dentro de GSK?
- 20:18: Hemos estado trabajando en esto durante bastante tiempo, especialmente dentro del contexto de modelos de idiomas grandes. Nos permite aprovechar muchos de los datos que tenemos internamente, como los datos clínicos. Los agentes se basan en esos tipos de datos y las diferentes modalidades de las preguntas que tenemos. Hemos creado agentes para datos genéticos o datos experimentales de laboratorio. Un agente orquestal en Jules puede combinar esos diferentes agentes para dibujar inferencias. Ese paisaje de los agentes es realmente importante y relevante. Nos da modelos refinados sobre preguntas y tipos de modalidades individuales.
- 21:28: Aludiste a la medicina personalizada. Hemos estado hablando de eso durante mucho tiempo. ¿Puedes darnos una actualización? ¿Cómo acelerará la IA?
- 21:54: Este es un campo del que soy realmente optimista. Hemos tenido mucho impacto; A veces, cuando tienes la nariz en el vidrio, no la ves. Pero hemos recorrido un largo camino. Primero, a través de datos: tenemos exponencialmente más datos de los que teníamos hace 15 años. En segundo lugar, Calcule el poder: cuando comencé mi doctorado, el hecho de que tenía una GPU fue increíble. La escala de cálculo se ha acelerado. Y también ha habido mucha influencia de la ciencia. Ha habido un premio Nobel para el plegamiento de proteínas. La comprensión de la biología humana es algo en lo que hemos empujado la aguja. Muchos de los premios Nobel se trataban de comprender los mecanismos biológicos, comprender la ciencia básica. Actualmente estamos en bloques de construcción hacia eso. Tomó años llegar de comprender el ribosoma para comprender el mecanismo para el VIH.
- 23:55: En AI para la atención médica, hemos visto impactos más inmediatos. Solo el hecho de comprender algo heterogéneo: si ambos obtenemos un diagnóstico de asma, eso tendrá diferentes manifestaciones, diferentes desencadenantes. Esa comprensión de la heterogeneidad en cosas como la salud psychological: somos diferentes; Las cosas deben ser tratadas de manera diferente. También tenemos el ecosistema, donde podemos tener un impacto. Podemos afectar los ensayos clínicos. Estamos en la tubería de drogas.
- 25:39: Una de las piezas de trabajo que hemos publicado ha sido la comprensión de las diferencias en respuesta al medicamento para la hepatitis B.
- 26:01: Estás en el Reino Unido, tienes el NHS. En los EE. UU., Todavía tenemos el problema de silo de datos: va a su atención primaria y luego a un especialista, y tienen que comunicarse usando registros y fax. ¿Cómo puedo ser optimista cuando los sistemas ni siquiera se hablan?
- 26:36: Esa es un área donde la IA puede ayudar. No es un problema en el que trabajo, pero ¿cómo podemos optimizar el flujo de trabajo? Es un problema de sistemas.
- 26:59: Todos asociamos la privacidad de los datos con la atención médica. Cuando las personas hablan sobre la privacidad de los datos, obtienen ciencia ficción, con cifrado homomórfico y aprendizaje federado. ¿Qué es la realidad? ¿Qué hay en tu caja de herramientas diarias?
- 27:34: Estas herramientas no están necesariamente en mi caja de herramientas diarias. Pharma está fuertemente regulado; Hay mucha transparencia en torno a los datos que recopilamos, los modelos que construimos. Hay plataformas y sistemas y formas de ingerir datos. Si tiene una colaboración, a menudo trabaja con un entorno de investigación confiable. Los datos no necesariamente se van. Hacemos análisis de datos en su entorno de investigación confiable, nos aseguramos de que todo se protect la privacidad y respetemos las barandillas.
- 29:11: Nuestros oyentes son principalmente desarrolladores de software program. Pueden preguntarse cómo ingresan a este campo sin ningún entorno en la ciencia. ¿Pueden usar LLM para acelerar el aprendizaje? Si intentaba vender un desarrollador de ML para unirse a su equipo, ¿qué tipo de antecedentes necesitan?
- 29:51: Necesitas una pasión por los problemas que estás resolviendo. Esa es una de las cosas que me gustan de GSK. No sabemos todo sobre la biología, pero tenemos muy buenos colaboradores.
- 30:20: ¿Nuestros oyentes necesitan tomar bioquímica? Química orgánica?
- 30:24: No, solo necesitas hablar con los científicos. Conozca a los científicos, escuche sus problemas. No trabajamos en silos como investigadores de IA. Trabajamos con los científicos. Muchos de nuestros colaboradores son médicos y se han unido a GSK porque quieren tener un mayor impacto.
Notas al pie
- No debe confundirse con el reciente anuncio de codificación de agente de Google.