A pesar del anuncio de Anthrope de Claude 3.7 soneto, el ritmo vertiginoso de los principales anuncios de IA pareció disminuir hasta febrero. Eso nos dio algo de tiempo para mirar otros temas. Aparecieron dos publicaciones importantes sobre la programación: “We’s Destroying Software program” de Salvatore Sanfilippo y el mazo de diapositivas de Rob Pike “On Bloat”. Son sorprendentemente similares. Ninguno menciona AI; Ambos abordan la pregunta de por qué nuestro {hardware} se está volviendo cada vez más rápido, pero nuestras aplicaciones no lo son. También hemos notado el regreso de Pebble, el primer reloj inteligente y una lámpara de mesa impulsada por la IA de Apple Analysis que parece que provino del logotipo de Pixar. Diversión, tal vez, pero no lo busques en las tiendas de Apple.
Inteligencia synthetic
- Anthrope ha liberado Claude 3.7 soneto, el primer modelo de razonamiento de la compañía. Es un “modelo híbrido”; Puede decir si desea habilitar su capacidad de razonamiento. También puede controlar su “presupuesto” de pensamiento limitando el número de tokens que genera para el proceso de razonamiento.
- El Area del agente informático es una plataforma para pruebas de agentes de crowdsourced. Permite a cualquiera ejecutar un agente usando dos modelos de IA diferentes, observar lo que está haciendo el agente y calificar los resultados. Los resultados se resumen en una tabla de clasificación; En este momento, el soneto Claude 3.5 está en la parte superior.
- Google está desarrollando un “co-científico“Eso sugiere hipótesis para que los científicos investiguen. Las hipótesis se basan en los objetivos, concepts e investigaciones anteriores del científico. La compañía busca investigadores para ayudar con las pruebas.
- Github tiene actualizado Modo de agente para copiloto. Ahora iterará en el código de errores hasta que entregue resultados correctos y puede agregar nuevas subtareas al unique si son necesarios para lograr el objetivo del usuario.
- Abierto es un nuevo proyecto Eso tiene la intención de crear una reproducción completamente abierta de Deepseek R1. Además del código y los pesos, este proyecto lanzará todas las herramientas y datos sintéticos utilizados para entrenar el modelo.
- Moshi es un nuevo modelo de lenguaje conversacional (habla a voz) que escucha constantemente y puede manejar interjecciones como “Uh Huh” sin confundirse.
- Ganso de nombre en código es un nuevo código abierto estructura para Desarrollo de AI de agente aplicaciones. Utiliza el protocolo de contexto modelo de Anthrope para comunicarse con sistemas que tienen datos, y puede descubrir nuevas fuentes de datos sobre la marcha.
- La Universidad de Surrey construirá un Modelo de idioma para el lenguaje de señas. Un enfoque será la traducción entre el lenguaje hablado y el lenguaje de señas. El objetivo es garantizar que la comunidad sorda no se quede atrás por la explosión de las herramientas de IA.
- Galileo es un conjunto de herramientas de agente para detectar cuando un modelo de IA es alucinante. Es particularmente importante para los sistemas de agente, donde un error de un agente conduce al mal comportamiento de otros aguas abajo.
- Un grupo de investigadores liberado S1un modelo de razonamiento de 32B con un rendimiento cercano a las cosas. S1 cuesta solo $ 6 para entrenar. Un conjunto muy pequeño de datos de entrenamiento (solo 1,000 muestras de razonamiento) demostró ser suficiente cuando el modelo se vio obligado a tomarse un tiempo further para el razonamiento.
- Algunos investigadores publicaron Cómo escalar su modeloUn libro sobre cómo escalar modelos de idiomas grandes. El libro es aparentemente documentación interna de Google Deepmind.
- OpenAi tiene liberado O3-Mini, un modelo de lenguaje pequeño y rentable basado en su modelo de razonamiento O3 (aún inédito).
- Antrópico tiene desplegado es Clasificador constitucional para pruebas adversas por parte del público. El clasificador es un sistema que protege los modelos de Claude de los jailbreaks e intenta lograr que Claude responda preguntas que no están permitidas. Los primeros resultados se ven muy bien.
- El lección para aprender de Deepseek R1 es que, dado un buen modelo de base, es menos difícil de lo que muchos pensaron desarrollar un modelo de razonamiento. En los próximos meses, espere muchas alternativas abiertas.
- Operai ha introducido DeepResearchuna aplicación basada en su modelo O3 que reclama la capacidad de sintetizar grandes cantidades de información y realizar tareas de investigación de varios pasos.
- Sam Altman ha reconocido que Operai está en el “lado equivocado de la historia“En cuanto a la IA de código abierto, pero también dijo que abordar los problemas no period una alta prioridad.
- Alibaba tiene lanzado QWEN2.5-Maxotro modelo de idioma grande con rendimiento en el mismo nivel que el soneto GPT-4 y Claude 3.5. Se puede acceder a través de Chat de qwen O la nube de Alibaba.
- Laboratorio de transformadores es una herramienta para experimentar, entrenamiento, ajuste fino y modelos de programación LLM localmente. Todavía se está instalando, pero parece Ollama con esteroides.
- smolgpt es “una implementación mínima de Pytorch para capacitar a su propia pequeña LLM desde cero”.
- Sí, Microsoft se queja de que Deepseek usó OpenAI para generar datos de entrenamiento sintético. Esas objeciones no impidieron hacer Deepseek disponible en Azure.
- Dos compositores Colaboró con Géminis de Google para crear La paradoja gemelauna obra para una orquesta sinfónica clásica.
- Alibaba tiene liberado Dos “puntos de management” a sus modelos, QWEN2.5-7B-INSTRUCT-1M y QWEN2.5-14B-INSTRUCT-1M. Estos modelos tienen grandes ventanas de contexto de 1 m-token. Alibaba también ha obtenido su marco de inferencia, que la compañía afirma que es de tres a siete veces más rápido.
- Tinyzero Reproduce el R1 Zero de Deepseek, un modelo de razonamiento con parámetros 3B. Costo de capacitación de Tinyzero por debajo de US $ 30. Podrías descargar Tinyzero, pero también puedes hacer el tuyo por menos del costo de una noche. ¿Necesitamos modelos caros?
Programación
- Tanagram es prometedor Un conjunto de herramientas para ayudar a los desarrolladores a comprender y trabajar con bases de código complejas. Hasta ahora, solo hay demostraciones, pero suena interesante.
- Harper Reed descripción Su flujo de trabajo para programar con IA. Desarrollar un flujo de trabajo es esencial para usar AI de manera efectiva, y Harper ha dado la descripción más exhaustiva que hemos visto.
- Como Linux, Ruby on Rails puede correr en el navegador. Este hack usa webensembly.
- Arranque de Linux Dentro de un PDF en cromo. Las implementaciones de PDF admiten JavaScript; C se puede compilar en un subconjunto de JavaScript (ASM.JS), lo que significa que un emulador RISC-V puede compilarse a JavaScript y ejecutar en un PDF en el navegador, que luego ejecuta Linux. Un truco asombroso.
- OCR4All Proporciona software program de reconocimiento de caracteres ópticos gratuitos y de código abierto. ¿Deberías necesitarlo?
- ¿Por qué el software program no funciona más rápido que hace 20 o 30 años, a pesar de las computadoras mucho más rápidas? Rob Pike tiene algunas concepts sobre Management de hinchazón.
- Como su nombre lo indica, Registros de decisión arquitectónica (ADRS) Seize una decisión sobre la arquitectura de software program y la razón de la decisión. Con demasiada frecuencia, esta información no se captura. Es possible que sea más importante en la period del desarrollo de software program asistido por AI-AI.
- Jank es un nuevo lenguaje de programación de propósito common. Es un dialecto de Clojure que incorpora concepts de muchos otros idiomas, incluidos C ++ y Rust, y se basa en la parte superior del LLVM.
- Aquí hay un conjunto de Patrones para construir tiempo actual Características en aplicaciones.
- Publish de Salvatore “Antirez” Sanfilippo “,”Estamos destruyendo software program“Es una lectura obligada. (No cube nada sobre la IA). Comienza “estamos destruyendo el software program al no tener en cuenta la complejidad”.
- Guion es una biblioteca GO que hace posible realizar una programación related a la concha en Go. Su mayor contribución es la capacidad de crear tuberías; También tiene funciones GO que son similares a GREP, Discover, Head, Tail y otros comandos de Shell Frequent.
Seguridad
- Los actores de amenaza alineados con Rusia están señal de orientaciónla aplicación de mensajería segura, con ataques de phishing que vinculan las cuentas de los usuarios con dispositivos hostiles. Un grupo envía códigos QR que parecer legítimo pero enlace a un dispositivo bajo su management; Otro se hace pasar por una aplicación utilizada por el ejército de Ucrania. La mejor protección es actualizar a la última versión de Sign.
- Dos nuevas vulnerabilidades En OpenSsh se han encontrado. Uno expone los servidores de apertura a los ataques de hombre en el medio; El otro puede conducir a ataques de denegación de servicio. Se ha lanzado una actualización; instalarlo.
- Pista oscura es un nuevo ataque contra los modelos de idiomas de razonamiento. Es posible crear aplicaciones personalizadas (como las de la tienda GPT) con “desencadenantes ocultos” que modifican el proceso de razonamiento.
- Un nuevo tipo de ataque de la cadena de suministro implica obtener AWS S3 abandonado cubos que aún contienen bibliotecas que se descargan con frecuencia. El nuevo propietario puede insertar malware en las bibliotecas; El propietario unique, que abandonó el balde, no puede parchear las bibliotecas corruptas.
- La seguridad está bloqueando la adopción de AIparticularmente en industrias muy reguladas. Eso es comprensible; Muchas de las preguntas que hacemos sobre sistemas seguros no pueden ser respondidas adecuadamente para la IA.
- El equipo de AI Pink de Microsoft ha publicado Lecciones de Pink Teaming 100 Technology AI Productos. Es una lectura esencial para cualquier persona interesada en construir un sistema de IA seguro.
- AI se está acostumbrando a Enviar solicitudes de funciones falsas e informes de errores sobre proyectos de código abierto. Muchos de estos pueden ser inadvertidos, pero independientemente de la causa, está generando problemas para los mantenedores de software program.
- Linux tiene una serie de herramientas para detectar RootKits y otros malware. Chkrootkit y LMD (Linux Malware Detect) Vale la pena su atención.
- Bandido de tiempo es un nuevo jailbreak para los modelos GPT. El ataque hace que el modelo pierda la noción del pasado, el presente y el futuro. Esencialmente, le preguntas a GPT cómo alguien en el pasado haría algo que solo se puede hacer en el presente. No está claro si este ataque funciona en otros modelos.
- Cuando el precio de Bitcoin sube, también lo hace la frecuencia de criptojacking: Computadoras de secuestro para formar botnets criptográficos. Se afirma que por cada dólar de criptografía que se extrae, la víctima incurre en $ 53 en costos de nubes.
- A nueva puerta trasera a VPNS ha sido descubierto en la naturaleza, dando a los atacantes acceso a redes corporativas. Estas puertas traseras permanecen latentes hasta que se activan por un “paquete mágico” especialmente construido, lo que hace que sean difíciles de detectar.
Internet
- A medida que más personas soliciten a la IA las recomendaciones de productos, los especialistas en advertising and marketing deberán optimizar la percepción del producto por los modelos de idiomas. ¿Llmo reemplaza search engine optimisation? La optimización para un LLM puede ser la próxima generación de search engine optimisation.
- Este artículo Le cube cómo optar por no participar en Gemini en Gmail y otras aplicaciones de Google Workspace. Es posible deshabilitar Gemini selectivamente. Desafortunadamente, requiere que tenga acceso a la consola del administrador.
- JavaScript’s Temporal ¡El objeto está empezando a aparecer en los navegadores! El temporal es un reemplazo para el objeto de fecha inadecuado. Permite a los programadores trabajar de manera efectiva con fechas y tiempos.
- Nota marginal es un motor de búsqueda de código abierto que prioriza resorts no comerciales.
Computación cuántica
- Microsoft ha creado un cuestiones topológicas en un nuevo ficha cuántica. Si bien su chip actualmente tiene solo 8 qubits, Microsoft afirma que puede escalar a millones de qubits. Poner tantos qubits en un chip contribuiría en gran medida al problema de mover datos cuánticos entre chips.
- La startup canadiense Xanadu ha construido un Computadora cuántica usando fotónica. Actualmente tiene 12 qubits, pero la compañía cree que puede escalar a sistemas más grandes.
Robótica
Devices
- Devoluciones de guijarros? ¿Recuerdas el reloj inteligente Pebble que estaba disponible mucho antes de Apple’s Watch? Volverá, tal vez. Y será hackable.
- Algo que todos necesitamos: un equipo de ingeniería en Apple desarrolló un Lámpara de mesa impulsada por IA. No está disponible en una tienda de Apple cerca de usted.