25.4 C
Colombia
lunes, julio 7, 2025

Tendencias de radar a seguir: diciembre de 2024 – O’Reilly


¡Es fin de año para Radar! Esperamos que todos nuestros lectores disfruten de las vacaciones. Aquí hay una predicción para 2025:

¿Es este el last del camino para mejorar el rendimiento del LLM mediante el escalamiento del número de parámetros o de los datos de entrenamiento? Nadie lo sabe todavía. Independientemente de la respuesta, esperamos que el interés se desplace hacia modelos más pequeños. De mala gana permitiremos que el modelo de parámetros de 70 mil millones se califique como “pequeño”, pero en realidad nos referimos a 20 mil millones de parámetros o menos. Estos modelos resultarán más fáciles de utilizar para las empresas que desarrollan aplicaciones habilitadas para IA: su ejecución no costará tanto y será más sencillo de ajustar para aplicaciones especializadas. Muy pocas aplicaciones necesitarán un modelo de lenguaje completamente common.

Aprende más rápido. Profundiza más. Ver más lejos.

Inteligencia synthetic

  • El proyecto OpenGPT-X tiene liberado su modelo de lenguaje grande abierto, Teuken-7B. Este modelo es importante porque admite 24 idiomas europeos y está diseñado para cumplir con la legislación europea. Está disponible en AbrazosCara.
  • OLMo 2 es un modelo de lenguaje pequeño, completamente abierto y recién lanzado que viene en tamaños 7B y 13B. Ambas versiones cuentan con el mejor desempeño de su grupo.
  • NVidia ha anunciado fugatoun nuevo modelo generativo de conversión de texto a audio que puede crear tipos de sonidos completamente nuevos. Lo posicionan como una herramienta para los creadores.
  • antrópico tiene anunciado la vista previa del desarrollador de su Protocolo de contexto modelo. MCP permite a Claude Desktop comunicarse de forma segura con otros recursos. El servidor MCP limita los servicios que están expuestos a Claude, filtra las solicitudes de Claude y evita que los datos queden expuestos a través de Web.
  • OpenScholar es un código abierto Modelo de lenguaje diseñado para apoyar la investigación científica.. Es significativamente más preciso que GPT-4o y su funcionamiento es más económico. Utiliza RAG para acceder a una gran base de datos de artículos científicos de acceso abierto, lo que garantiza que las citas sean precisas.
  • Meta se ha asociado con VSParticle para crear nuevos materiales a partir de instrucciones generadas por IA. Se están centrando en materiales nanoporosos, que podrían ser catalizadores para descomponer el CO2 en productos útiles.
  • La perplejidad ha introducido Compras dentro de la aplicación: los usuarios pueden buscar algo y luego hacer que Perplexity lo compre. Es el primer ejemplo ampliamente disponible de un agente de IA que cambia el estado del mundo físico.
  • Las investigaciones han demostrado que Los modelos de IA generativa tienen sus propios estilos distintivos.no muy diferente de los escritores humanos. El análisis estilístico puede identificar la fuente de un texto con el modelo que lo generó.
  • Mistral ha liberado Pixtral grandeun modelo multimodal de parámetros 124B con un rendimiento de referencia a la par de las últimas versiones de otros modelos fronterizos.
  • Mozilla Voz común El proyecto recopila muestras de voz en idiomas distintos del inglés angloamericano para ayudar a los desarrolladores a crear aplicaciones habilitadas para voz utilizando otros idiomas y dialectos. El proyecto es de código abierto.
  • Interpretabilidad mecanicista es un área de investigación que utiliza IA para examinar lo que sucede dentro de cada capa de un modelo de lenguaje grande. Proporciona un camino hacia la interpretabilidad de la IA: la capacidad de comprender por qué una IA produce cualquier resultado que genera y, posiblemente, controlar ese resultado.
  • Los teléfonos Pixel de Google podrán monitorear conversaciones telefónicas para detectar estafas en tiempo actual. El procesamiento se realiza íntegramente por teléfono. La función está desactivada de forma predeterminada y se puede habilitar por llamada. Otra característica nueva detecta stalkerware, aplicaciones que recopilan datos sin el consentimiento o conocimiento del usuario.
  • El conjunto de datos Widespread Corpus para entrenar modelos de lenguaje grandes ahora está abierto y disponible en Hugging Face. El conjunto de datos contiene más de tokens 2T tomados de fuentes con “licencias permitidas” y documenta la procedencia de cada fuente.
  • El modelo más nuevo de OpenAIOrion, es una mejora con respecto a GPT-4. ¿Pero es una mejora significativa? Aparentemente no. Este puede ser el last del camino para mejorar los LLM haciéndolos más grandes. (¿Y Orion es GPT-5?)
  • FronteraMatemáticas es un nuevo punto de referencia de IA que se basa en problemas matemáticos muy difíciles. En este punto, ningún modelo de lenguaje obtiene una puntuación superior al 2% (Gemini 1.5 Professional).
  • Separar los instrumentos en una interpretación musical. Es difícil, pero es posible. Aquí hay una obra maestra sin IA de procesamiento de señal que intenta hacerlo. ¿Podemos volver a convertir una interpretación en partitura?
  • Commonplace Intelligence ha publicado dev-herciosun nuevo modelo para síntesis de voz en tiempo actual. Fue entrenado exclusivamente con audio y puede participar en conversaciones sin guión sin el uso de texto.
  • Microsoft Magentic-One Es un sistema agente generalista que es capaz de realizar tareas complejas. Magentic-One es fuente abierta para investigadores y desarrolladores. Microsoft también ha lanzado AutoGenBenchuna herramienta de código abierto para evaluar el rendimiento de sistemas agentes.
  • Forja de cadena es una nueva herramienta visible para ingeniería rápida. Se puede utilizar para probar indicaciones con múltiples modelos y evaluar la calidad de la respuesta.
  • La IA estaba acostumbrada a envejecer Tom Hanks y Robin Wright en una nueva película que permitirá a los actores interpretar a sus personajes a lo largo de 60 años.
  • antrópico tiene liberado Claudio 3.5 haikusuna nueva versión de su modelo más pequeño y rápido. La compañía afirma que su rendimiento en muchos puntos de referencia es superior al Claude 3 Opus, su modelo líder anterior. Anthropic también ha aumentado significativamente el precio por usar Haiku.
  • OpenAI ha introducido resultados previstos. Si el resultado de un mensaje se conoce de antemano (por ejemplo, si le solicita a GPT que modifique un archivo), puede cargar el resultado esperado con el mensaje y GPT realizará los cambios necesarios. Las salidas previstas reducen la latencia; aparentemente no reducen el costo.
  • Afortunadamente, Psiquiatría de IA No tiene nada que ver con psicoanalizar a pacientes humanos. Es una herramienta forense para el análisis publish mortem de fallas de IA que permite a los investigadores recuperar el modelo exacto que estaba en uso cuando ocurrió la falla.
  • SmolLM2 es un nuevo modelo de lenguaje pequeño, diseñado para ejecutarse en dispositivos. Viene en versiones de parámetros 135M, 360M y 1.7B. Los primeros informes dicen que su rendimiento es impresionante.
  • vllm es un marco para prestar servicios a los LLM. Funciona con la mayoría de los modelos de lenguaje en Hugging Face. No sólo pretende ser más easy, sino que también reclamos obtener importantes beneficios de rendimiento y costos mediante el uso de un almacén de valores clave para almacenar en caché los tokens de entrada.
  • Gráficos de llamas de IA muestre a los desarrolladores qué están haciendo sus modelos en detalle. Si le preocupa el rendimiento o el uso de energía, son revolucionarios.
  • de google Proyecto Jarvis Se informa que es la respuesta de la compañía a la API de uso informático de Anthropic. Jarvis se hace cargo de un navegador (presumiblemente Chrome) para realizar tareas en nombre del usuario.
  • La capacidad de NotebookLM para generar un podcast a partir de documentos es impresionante. ¿Pueden otros modelos hacer lo mismo? CuadernoLlama es un proyecto de código abierto que genera podcasts utilizando los modelos Llama.

Programación

  • bpftune es una utilidad que ajusta constantemente el rendimiento del sistema Linux utilizando datos de observabilidad de BPF. Tiene “cero configurables” (sin configuración) y gastos generales bajos, y es lo suficientemente inteligente como para mantenerse alejado de las configuraciones que ha realizado un administrador del sistema. Aparentemente no utiliza IA.
  • kyanos es una nueva herramienta de análisis de purple de código abierto basada en eBPF. Debido a que tiene acceso a los datos de eBPF, puede filtrar paquetes por proceso o por servicio y puede brindar información precisa sobre la latencia de los paquetes.
  • VMware Fusion y VMware Workstation ahora son gratuitos a todos los usuarios, incluidos los usuarios comerciales. Broadcom continuará desarrollando los productos pero dejará de brindar soporte para la resolución de problemas a los usuarios.
  • código abierto es una familia de modelos de lenguaje para generar código. Es completamente de código abierto y los datos de capacitación, la canalización de datos, los resultados de la capacitación y los protocolos de capacitación están disponibles además del código. Su intención es fomentar una mayor experimentación e investigación sobre la generación de código.
  • Mergiraf es una herramienta para resolver conflictos de fusión de Git mediante la comprensión de lenguajes de programación comunes (incluidos Java, Rust y Go) y formatos de archivo (incluidos JSON, HTML, XML y YAML). Los autores afirman que se pueden agregar nuevos idiomas fácilmente.
  • Se ha publicado una propuesta para C++ segurouna nueva versión de C++ que incorporará funciones de seguridad de la memoria.
  • Cadena de datos es una biblioteca de Python para trabajar con datos estructurados en el contexto de la inteligencia synthetic. Está diseñado para crear canalizaciones de datos y manipular datos a escala.
  • ¿Sin código GitHub? Chispa de GitHub permite a los usuarios crear pequeñas “microaplicaciones” o chispas, sin escribir ningún código. Lo que puede ser más importante que la ausencia de código es la ausencia de implementación; Las chispas se implementan en la infraestructura de GitHub y se accede a ellas a través de la internet.
  • Usando Git para hacer una copia de seguridad del directorio /and so on de Linux Es obvio, una vez que lo piensas.
  • Ráctor es un framework Actor para Rust, lo que significa que puedes programar en Rust como si fuera Erlang. Estoy impresionado por el “Hola mundo” más largo y complicado que jamás haya visto.
  • Kubernetes es un plataforma para construir plataformas. Y las plataformas deben servir tanto a los equipos de desarrollo como a los de operaciones.
  • GitHub Copilot ahora puede usar Modelos distintos a GPT. Los usuarios pueden seleccionar Claude Sonnet o Gemini además de diferentes modelos de OpenAI. Otras características nuevas incluyen revisión automática de código, un asistente de actualización para Java, edición de múltiples archivos y algo llamado Spark que suena algo así como Claude’s Artifacts.
  • ¿Es seguro su código generado por IA? No. No es possible que dejemos de usar herramientas como Copilot y Cursor, pero debemos comprender el desafío: los modelos de IA se entrenaron con código disponible públicamente. La mayoría del código disponible públicamente tiene vulnerabilidades. Esos se reflejarán en la producción de la IA.
  • ¿Java necesita otra herramienta de compilación? Molino está esperando para hacerse cargo. Mill afirma ser entre 5 y 10 veces más rápido que Maven, y entre 2 y 4 veces más rápido que Gradle.
  • Anfión es un conjunto de herramientas de código abierto para generar todas las formas de audio, incluida la música y el habla.

Seguridad

Robots

  • Grasso es un Robotic de basura impulsado por IA: un robotic móvil hecho de basura. Utiliza Llava-v1.6-mistral-7B para comprender la información visible de su cámara y Mistral-7B para indicaciones y respuestas. (No comprende ni genera habla).
  • Meta ha lanzado varios proyectos nuevos para percepción táctilun elemento essential en la construcción de robots impulsados ​​por IA que puedan interactuar con el mundo actual. Digit 360 es un dedo digital táctil, Sparsh es un codificador de datos táctiles y Digit Plexus es una plataforma para construir manos artificiales.
  • Ata dos micro robots poco inteligentes (robots de cerdas) junto con una correa corta y versatile y adquieren la capacidad de resolver problemas sencillos.

Internet

  • ¿Quieres ejecutar Linux en tu navegador? Puede. WebVM Es una máquina digital que se ejecuta en un navegador. Puede que Linux en el navegador no sea tan interesante; es más importante como otro ejemplo de las habilidades de Wasm.

Realidad Digital

  • ¿Quieres hablar con Rosa Parks o Abraham Lincoln? Intentar ACTIVAR XRuna herramienta que combina realidad digital e inteligencia synthetic generativa. Si esto es realmente historia es una pregunta interesante; El autobús del ejemplo de Rosa Parks parece un autobús europeo moderno, no un autobús americano de los años cincuenta.

Computación cuántica

  • DeepMind de Google ha desarrollado alfaqubitun sistema de IA que detecta errores en sistemas cuánticos. La corrección de errores ha logrado enormes avances durante el último año, pero sigue siendo un problema importante en la computación cuántica.

Biología



Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles