27.3 C
Colombia
sábado, julio 5, 2025

Tendencias de radar a seguir: noviembre de 2024 – O’Reilly


Octubre tuvo muchos lanzamientos de modelos de idiomas. Los modelos de tamaño mediano, e incluso los modelos pequeños, están alcanzando en rendimiento a modelos de vanguardia como el GPT-4.5o. Pero el lanzamiento que nos sorprendió a todos no fue un modelo de lenguaje: fue la API de uso de computadora de Claude. El uso de la computadora le permite enseñarle a Claude cómo usar una computadora: cómo ejecutar una aplicación, hacer clic en los botones y usar un shell o un editor. Tiene muchos problemas, y la seguridad no es el menor de ellos, pero seguramente mejorará. Enviar capturas de pantalla a Claude para que pueda calcular dónde hacer clic es, en el mejor de los casos, complicado y, sin duda, hay mejores soluciones (como el uso de herramientas de accesibilidad). Sin embargo, el uso de la computadora nos permite vislumbrar un futuro en el que trabajaremos con agentes que puedan planificar y ejecutar operaciones complejas de varios pasos.

AI

  • Pequeños modelos de lenguaje es un programa educativo que enseña a niños pequeños sobre probabilidad, inteligencia synthetic y temas relacionados. Es divertido y divertido y puede permitir a los niños construir sus propios modelos sencillos.
  • Grafana y NVIDIA están trabajando en un modelo de lenguaje grande para la observabilidadaparentemente dado el extraño nombre LLo11yPop. El modelo tiene como objetivo responder preguntas en lenguaje pure sobre el estado y el rendimiento del sistema basándose en datos de telemetría.
  • Google es fuente abierta SynthID, un sistema para marcar texto con marcas de agua para que los documentos generados por IA puedan rastrearse hasta el LLM que los generó. Las marcas de agua no afectan la precisión ni la calidad de los documentos generados. Las marcas de agua SynthID resisten algunas manipulaciones, incluida la edición.
  • Mistral tiene liberado dos nuevos modelos, Ministral 3B y Ministral 8B. Estos son modelos pequeños, diseñados para funcionar en sistemas “de borde” con recursos limitados. A diferencia de muchos de los modelos pequeños anteriores de Mistral, estos no son de código abierto.
  • Anthropic ha añadido un “uso de la computadora”API a Claude. El uso de la computadora permite que el modelo tome el management de la computadora y la use para buscar datos leyendo la pantalla, haciendo clic en botones y otras funciones, y escribiendo. Actualmente está en versión beta.
  • Luz de la luna es un nuevo modelo de voz a texto de código abierto que ha sido optimizado para dispositivos pequeños con recursos limitados. Afirma tener una precisión equivalente a Whisper, a cinco veces la velocidad.
  • meta es lanzando un conjunto de datos gratuito nombrado Materiales abiertos 2024 para ayudar a los científicos de materiales a descubrir nuevos materiales.
  • Anthropic ha publicado algunos herramientas por trabajar con Claude en GitHub. En este punto, las herramientas para ayudar a analizar datos financieros y construir agentes de atención al cliente están disponibles.
  • NVIDIA tiene lanzado silenciosamente Llama-3.1-Nemotron-70B-Instruct-HFun modelo de lenguaje que supera tanto a GPT-4o como a Claude 3.5 en los puntos de referencia. Este modelo se basa en Llama de código abierto y es relativamente pequeño (70 mil millones de parámetros).
  • NotebookLM ha entusiasmado a todos con su capacidad para generar podcasts. Google ha ido un paso más allá añadiendo herramientas que dan a los usuarios más management sobre lo que dicen los participantes del podcast digital.
  • La alfabetización en datos es la nueva habilidad de supervivencia: Lo sabemos desde hace algún tiempo, pero es muy fácil olvidarlo, especialmente en la period de la IA.
  • La Open Supply Initiative tiene un “humilde” definición para IA de código abierto. La definición reconoce cuatro categorías distintas de datos: abiertos, públicos, obtenibles y no compartibles.
  • ¿El entrenamiento de modelos de IA requiere enormes centros de datos? PrimeIntellect es entrenar un modelo 10B utilizando recursos distribuidos y aportados.
  • OpenAI ha publicado Enjambreuna plataforma para crear agentes de IA, en GitHub. Advierten que Swarm es experimental y que no responderán a las solicitudes de extracción. No dudes en unirte al experimento.
  • OpenAI también ha lanzado Lienzouna herramienta interactiva para escribir código y texto con GPT-4o. El lienzo es related al de Claude. Artefactos.
  • Dos de los recién liberados Llama 3.2 Los modelos (90B y 11B) son multimodales. El modelo 11B funcionará cómodamente en una computadora portátil. Meta también ha lanzado el API de pila de llamasun conjunto de API para ayudar a los desarrolladores a crear aplicaciones de IA generativa.
  • OpenAI tiene anunciado una API en tiempo pseudo-real. Su objetivo es permitir la creación de aplicaciones de voz realistas, incluida la capacidad de interrumpir la IA en el flujo de la conversación.
  • ¿Se convertirán las gafas impulsadas por IA en el próximo dispositivo de consumo de gran éxito? El prototipo Orion de Meta podría ser la interfaz de usuario splendid para la IA. No se trata de juegos; se trata de preguntarle a la IA sobre las cosas que ves. Ahora bien, si solo se pueden fabricar a un precio decente.
  • Los avatares de IA están entrevistando a candidatos para puestos de trabajo. Esto no va a salir bien…
  • El Instituto Allen ha desarrollado un pequeño modelo de lenguaje llamado Molmo que afirmar Tiene un rendimiento equivalente al GPT-4o.
  • Inteligencia humanauna organización fundada por Rumman Chowdhury, ha ofrecido una premio a los desarrolladores que crean un modelo de visión de IA que puede detectar imágenes en línea basadas en el odio.
  • Hoy en día, no sorprende que una computadora pueda jugar al ajedrez y otros juegos de mesa. ¿Pero tenis de mesa? Quizás prefieras el video hacia papel.
  • El familia qwen de modelos de lenguaje, que van desde 0.5B a 72B de parámetros, está recibiendo críticas impresionantes. Incluso los más grandes pueden hacerse para ejecutar en GPU más antiguasno sólo los H100 y A100.
  • Ahora una IA puede “probar” que es humana. Un modelo de visión por computadora basado en inteligencia synthetic ha demostrado la capacidad de vencer El último CAPTCHA de Google (reCAPTCHAv2) el 100% del tiempo.
  • La IA abierta ahora se está expandiendo acceso a su modo de voz avanzado a más usuarios. El modo de voz avanzado hace que ChatGPT sea verdaderamente conversacional: puedes interrumpirlo a mitad de una frase y responde a tu tono de voz.
  • Planificación del movimiento neuronal Es una técnica basada en redes neuronales que permite a los robots planificar y ejecutar tareas en entornos desconocidos.

Programación

  • C++ seguro propone extensiones al lenguaje C++ para hacerlo memoria segura. Los errores en la seguridad de la memoria han sido durante mucho tiempo la mayor fuente de vulnerabilidades de seguridad.
  • Microsoft ve GenAIOps como un “cambio de paradigma” para TI. Será cada vez más necesario a medida que el software program incorpore IA y los equipos de TI deban convertirse en especialistas en infraestructura de IA. Un aspecto de GenAIOps será la recopilación, curación y limpieza de conjuntos de datos.
  • Huly es una plataforma de código abierto para la gestión de proyectos.
  • mecanografiado es un nuevo sistema para escribir textos científicos (y otros). Tiene capacidades equivalentes a LaTeX, pero la sintaxis es mucho más easy, related a Markdown.
  • Microsoft ha iniciado un proyecto que hará que Linux eBPF disponible en Home windows. En el mundo Linux, eBPF ha demostrado ser invaluable para herramientas de observabilidad, seguridad y cumplimiento. Home windows eBPF será appropriate con código de bytes con Linux.
  • Python 3.13 ha sido liberado. Los cambios más importantes son un nuevo REPL que presenta edición multilínea y soporte de shade; una opción experimental para desactivar el bloqueo world del intérprete (GIL); y un compilador experimental justo a tiempo.
  • ziggy es un nuevo lenguaje para la serialización de datos. No es un lenguaje de programación de propósito common; Es un lenguaje especializado para definir esquemas de datos de forma precisa y sencilla.
  • lo nuevo de microsoft La iniciativa de seguridad primero está ligada a sus esfuerzos de ingeniería de plataforma.. La ingeniería de plataforma limita la cantidad de herramientas que los desarrolladores deben utilizar, lo que a su vez scale back la cantidad de código que debe protegerse y mantenerse.
  • El CNCF Centro de artefactos es un fuente para configuraciones nativas de la nube, complementos y otro software program para crear una infraestructura nativa de la nube. No es un repositorio tipo GitHub; enlaza con las fuentes de los artefactos en lugar de almacenarlos.
  • quiero correr Linux en un Intel 4004¿una CPU de 1971? Tardará casi 5 días en arrancar. Lo que es más sorprendente es que en realidad se ejecuta en un emulador que se ejecuta en el 4004.

Seguridad

  • No sorprende que la inyección rápida funcione bien con la increíble API de uso informático de Anthropic. La documentación de Anthropic advierte sobre muchas vulnerabilidades. Así que tampoco es sorprendente que alguien haya seguido adelante y lo intenté. No dejes de experimentar, pero ten cuidado.
  • improvisador es un ataque contra modelos de lenguaje grandes que utiliza un mensaje malicioso para forzar al modelo a exfiltrar datos de charlas anteriores.
  • Una fuente importante de vulnerabilidades de seguridad es el código que incluye secretos (nombres de cuentas y contraseñas, certificados, and many others.) de HashiCorp. Radar de bóveda escanea el software program, incluidos repositorios y solicitudes de extracción, para detectar secretos que han sido expuestos.
  • Los investigadores de seguridad de Mandiant han descubierto que el 70% de las vulnerabilidades que fueron explotadas el año pasado fueron de día cero, es decir, nuevas vulnerabilidades que no se habían informado anteriormente. Una vez descubiertas, las vulnerabilidades se convierten casi de inmediato en armas y se utilizan como ataques.
  • OpenAI tiene cerrar las cuentas de actores de amenazas que utilizan GPT para una serie de actividades que incluyen el desarrollo de malware, la generación y propagación de información errónea y el phishing. Sería sorprendente que no se hubieran producido abusos similares con otros modelos.
  • Las últimas actualizaciones de seguridad de GitLab DIRECCIÓN una vulnerabilidad que permite a los atacantes activar canalizaciones de CI/CD en cualquier rama de un repositorio.
  • Los estudiantes tienen conectado Las gafas inteligentes Ray-Ban de Meta a un sitio de búsqueda de imágenes invasivo. Luego utilizan modelos de lenguaje para recopilar datos de varias bases de datos que contienen información private, como direcciones.
  • Cloudflare ha bloqueado una serie de ataques distribuidos de denegación de servicio (DDoS), incluido uno con un velocidad máxima de 3,8 terabits por segundoel más alto jamás registrado.
  • En revisiones de incidentesno discuta elementos de acción en respuesta al incidente. La revisión del incidente trata sobre el aprendizaje y la comprensión; hablar de soluciones lo descarrilará. Las soluciones siempre se pueden discutir más adelante y serán mejores si se basan en un entendimiento firme.
  • Hace tiempo que sabemos que los requisitos para cambiar las contraseñas eran una mala práctica. NIST es ahora proponiendo normas eso eliminaría los requisitos de composición de contraseñas, como una letra mayúscula, un número y un carácter en un alfabeto no latino.
  • A ataque de inyección rápida contra la memoria a largo plazo de GPT permite al atacante enviar todas las entradas y salidas de un usuario a un servidor arbitrario. Este ataque es persistente; permanece en la memoria a largo plazo de GPT. En este punto, se ha remediado parcialmente.
  • Kaspersky, que está cerrando sus operaciones en EE.UU., ha eliminado su software program de los ordenadores de los usuarios de EE.UU. y instalado UltraAV de Pango Group y (en algunos casos) UltraVPN sin el permiso de los usuarios. El comportamiento de Kaspersky plantea la pregunta: ¿Cuándo se convierte un proveedor de antimalware en malware?

Internet

  • Los vídeos de XOXO 2024 han sido al corriente. Molly White y Erin Kissane son especialmente recomendables.
  • ¿Necesitamos otro marco net React? Los desarrolladores de Uno Eso creo. Uno promete ser sencillo, obstinado y prioritario en lo native.
  • Tom Coates tiene anunciado la formación de la Fundación Internet Socialuna organización dedicada a ayudar a que las redes federadas crezcan de manera saludable.
  • Problemas en el mundo de WordPress: WordPress.org tiene obstruido Motor WPun importante proveedor de internet hosting para usuarios de WordPress, acceda a sus recursos. El drama sobreviene, se intensifica y se vuelve cada vez más merciless.

{Hardware}

  • ARM ha cancelado la licencia que permite a Qualcomm producir el procesador Snapdragon, que es la base de la mayoría de teléfonos móviles. ¿Es esta una oportunidad para RISC-V?
  • hay un nuevo microprocesador RISC-V Eso no está hecho de silicona. Es versatile, de bajo consumo y capaz de ejecutar cargas de trabajo de IA (aunque a velocidades relativamente bajas).
  • Bunnie Huang nos deja con la aterradora comprensión de que Construir una bomba en un pequeño dispositivo IoT no sólo es factible—Es relativamente fácil y económico.

Biología

Aprende más rápido. Profundiza más. Ver más lejos.



Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles