27.1 C
Colombia
lunes, julio 7, 2025

Deepmind’s Thoughts Evolution: Empoderando modelos de idiomas grandes para la resolución de problemas del mundo actual


En los últimos años, la inteligencia synthetic (IA) se ha convertido en una herramienta práctica para impulsar la innovación en todas las industrias. A la vanguardia de este progreso hay grandes modelos de lenguaje (LLM) conocidos por su capacidad para comprender y generar lenguaje humano. Si bien los LLM se desempeñan bien en tareas como la IA conversacional y la creación de contenido, a menudo luchan con desafíos complejos del mundo actual que requieren razonamiento y planificación estructurados.

Por ejemplo, si le pide a LLM que planifique un viaje de negocios de varias ciudades que implique coordinar los horarios de vuelo, los horarios de las reuniones, las limitaciones presupuestarias y el descanso adecuado, pueden proporcionar sugerencias para aspectos individuales. Sin embargo, a menudo enfrentan desafíos en la integración de estos aspectos para equilibrar efectivamente las prioridades competitivas. Esta limitación se vuelve aún más evidente a medida que los LLM se utilizan cada vez más para construir agentes de IA capaces de resolver problemas del mundo actual de forma autónoma.

Google Deepmind ha desarrollado recientemente una solución para abordar este problema. Inspirado en la selección pure, este enfoque, conocido como Evolución de la menterefina las estrategias de resolución de problemas a través de la adaptación iterativa. Al guiar a los LLM en tiempo actual, les permite abordar tareas complejas del mundo actual de manera efectiva y adaptarse a escenarios dinámicos. En este artículo, exploraremos cómo funciona este método innovador, sus aplicaciones potenciales y qué significa para el futuro de la resolución de problemas impulsada por la IA.

¿Por qué LLMS lucha con un razonamiento y planificación complejos?

Los LLM están capacitados para predecir la siguiente palabra en una oración analizando patrones en conjuntos de datos de texto grandes, como libros, artículos y contenido en línea. Esto les permite generar respuestas que parecen lógicas y contextualmente apropiadas. Sin embargo, esta capacitación se basa en reconocer patrones en lugar de comprender el significado. Como resultado, los LLM pueden producir texto que parezca lógico pero lucha con tareas que requieren un razonamiento más profundo o una planificación estructurada.

La limitación central radica en cómo LLMS procesa la información. Se centran en probabilidades o patrones en lugar de lógica, lo que significa que pueden manejar tareas aisladas, como sugerir opciones de vuelo o recomendaciones de resort, pero falla cuando estas tareas deben integrarse en un plan cohesivo. Esto también les dificulta mantener el contexto con el tiempo. Las tareas complejas a menudo requieren realizar un seguimiento de las decisiones anteriores y la adaptación a medida que surge una nueva información. Sin embargo, los LLM tienden a perder el enfoque en las interacciones extendidas, lo que lleva a resultados fragmentados o inconsistentes.

Cómo funciona la evolución psychological

La evolución de la mente de Deepmind aborda estas deficiencias adoptando principios de la evolución pure. En lugar de producir una sola respuesta a una consulta compleja, este enfoque genera múltiples soluciones potenciales, las refina iterativamente y selecciona el mejor resultado a través de un proceso de evaluación estructurado. Por ejemplo, considere concepts de lluvia de concepts para un proyecto. Algunas concepts son geniales, otras menos. El equipo evalúa todas las concepts, manteniendo las mejores y descartando el resto. Luego mejoran las mejores concepts, introducen nuevas variaciones y repiten el proceso hasta que lleguen a la mejor solución. La evolución psychological aplica este principio a LLMS.

Aquí hay un desglose de cómo funciona:

  1. Generación: El proceso comienza con la LLM creando múltiples respuestas a un problema dado. Por ejemplo, en una tarea de planificación de viajes, el modelo puede redactar varios itinerarios basados ​​en el presupuesto, el tiempo y las preferencias de los usuarios.
  2. Evaluación: Cada solución se evalúa con una función de aptitud, una medida de qué tan bien satisface los requisitos de las tareas. Las respuestas de baja calidad se descartan, mientras que los candidatos más prometedores avanzan a la siguiente etapa.
  3. Refinamiento: Una innovación única de la evolución psychological es el diálogo entre dos personas dentro de la LLM: el autor y el crítico. El autor propone soluciones, mientras que el crítico identifica fallas y ofrece comentarios. Este diálogo estructurado refleja cómo los humanos refinan las concepts a través de la crítica y la revisión. Por ejemplo, si el autor sugiere un plan de viaje que incluye una visita al restaurante que excede el presupuesto, el crítico señala esto. Luego, el autor revisa el plan para abordar las preocupaciones del crítico. Este proceso permite a LLMS realizar un análisis profundo que no podía realizar previamente utilizando otras técnicas de indicación.
  4. Optimización iterativa: Las soluciones refinadas experimentan una evaluación y recombinación adicionales para producir soluciones refinadas.

Al repetir este ciclo, la evolución de la mente mejora de manera iterativa la calidad de las soluciones, lo que permite a los LLM abordar desafíos complejos de manera más efectiva.

Evolución de la mente en acción

DeepMind probó este enfoque en puntos de referencia como Planador de viajes y Plan pure. Usando este enfoque, Géminis de Google logró una tasa de éxito del 95.2% en TravelPlanner, que es una mejora sobresaliente de una línea de base del 5.6%. Con el Gemini Professional más avanzado, las tasas de éxito aumentaron a casi el 99.9%. Este desempeño transformador muestra la efectividad de la evolución psychological para abordar los desafíos prácticos.

Curiosamente, la efectividad del modelo crece con la complejidad de la tarea. Por ejemplo, mientras que los métodos de paso único lucharon con los itinerarios de varios días que involucran múltiples ciudades, la evolución psychological superó constantemente, manteniendo altas tasas de éxito incluso cuando aumentó el número de limitaciones.

Desafíos y direcciones futuras

A pesar de su éxito, la evolución psychological no está exenta de limitaciones. El enfoque requiere recursos computacionales significativos debido a la evaluación iterativa y los procesos de refinamiento. Por ejemplo, resolver una tarea de planificación de viajes con la evolución psychological consumió tres millones de tokens y 167 llamadas API, sustancialmente más que los métodos convencionales. Sin embargo, el enfoque sigue siendo más eficiente que las estrategias de fuerza bruta como la búsqueda exhaustiva.

Además, el diseño de funciones de acondicionamiento físico efectivas para ciertas tareas podría ser una tarea desafiante. La investigación futura puede centrarse en optimizar la eficiencia computacional y ampliar la aplicabilidad de la técnica a una gama más amplia de problemas, como la escritura creativa o la compleja toma de decisiones.

Otra área interesante para la exploración es la integración de evaluadores específicos del dominio. Por ejemplo, en el diagnóstico médico, incorporar el conocimiento de los expertos en la función de aptitud podría mejorar aún más la precisión y confiabilidad del modelo.

Aplicaciones más allá de la planificación

Aunque la evolución psychological se evalúa principalmente en las tareas de planificación, podría aplicarse a varios dominios, incluida la escritura creativa, el descubrimiento científico e incluso la generación de códigos. Por ejemplo, los investigadores han introducido un punto de referencia llamado Stegpoet, que desafía al modelo a codificar mensajes ocultos dentro de los poemas. Aunque esta tarea sigue siendo difícil, la evolución psychological excede los métodos tradicionales al lograr tasas de éxito de hasta 79.2%.

La capacidad de adaptar y evolucionar soluciones en lenguaje pure abre nuevas posibilidades para abordar problemas que son difíciles de formalizar, como mejorar los flujos de trabajo o generar diseños innovadores de productos. Al emplear el poder de los algoritmos evolutivos, Thoughts Evolution proporciona un marco versatile y escalable para mejorar las capacidades de resolución de problemas de los LLM.

El resultado remaining

La evolución psychological de Deepmind introduce una forma práctica y efectiva de superar las limitaciones clave en LLM. Mediante el uso de un refinamiento iterativo inspirado en la selección pure, mejora la capacidad de estos modelos para manejar tareas complejas y de varios pasos que requieren razonamiento y planificación estructurados. El enfoque ya ha mostrado un éxito significativo en escenarios desafiantes como la planificación de viajes y demuestra promesa en diversos dominios, incluida la escritura creativa, la investigación científica y la generación de códigos. Si bien los desafíos como los altos costos computacionales y la necesidad de funciones de acondicionamiento físico bien diseñadas permanecen, el enfoque proporciona un marco escalable para mejorar las capacidades de IA. La evolución de la mente prepara el escenario para sistemas de IA más potentes capaces de razonar y planificar para resolver los desafíos del mundo actual.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles