Julio fue un gran mes para el lanzamiento de modelos: hay nuevos modelos grandes de Mistral y Meta, modelos multilingües más pequeños de Mistral y DeepL, otro modelo de Mistral que se especializa en generación de código y una versión pequeña de GPT-4o. El mundo de la seguridad vio otro desastre en la cadena de suministro de software program cuando CrowdStrike lanzó una mala actualización de software program que deshabilitó muchas máquinas con Home windows en todo el mundo. Si bien el lanzamiento de CrowdStrike no fue “hostil”, estrictamente hablando, demuestra que no existe una diferencia actual entre un ataque hostil o un error que inhabilita su infraestructura de TI. También estamos viendo un aumento en el tráfico de malware, junto con informes falsos de vulnerabilidad en CVE.
Inteligencia synthetic
- de google AlphaProof y geometría alfa resolvió cuatro de los seis problemas de la Olimpiada de Matemáticas, una actuación que le habría valido una medalla de plata en una competición actual. Esto es, con diferencia, lo mejor que jamás haya logrado una IA. Sin embargo, period significativamente más lento que los humanos.
- Mistral ha liberado Mistral Grande 2un modelo de 123 mil millones de parámetros que (como otros modelos) afirma tener un rendimiento related al GPT-4o. Es particularmente fuerte en la generación de código. Mistral también destaca sus capacidades multilingües. Grande 2 está disponible en abrazando la cara.
- Fb/Meta tiene liberado Llama 3.1, un modelo de 405 mil millones de parámetros que afirma tener un rendimiento superior al GPT-4 y Claude 3.5 Sonnet (al menos en los puntos de referencia). Es semiabierto: el código fuente y los pesos están disponibles, pero no los datos de entrenamiento, y existen restricciones en su uso.
- Google ha desarrollado Nuevas técnicas para predecir el tiempo. que combinan IA y modelado físico tradicional. El nuevo modelo produce predicciones a largo plazo más precisas y cut back el consumo de energía.
- Es un buen día para lanzar modelos. Mistral nemo es un pequeño modelo de lenguaje multilingüe de código abierto. Tiene una ventana de contexto grande (128K) y funciona bien en inglés, francés, alemán, español, italiano, portugués, chino, japonés, coreano, árabe e hindi.
- GPT-4o Miniuna versión pequeña del buque insignia GPT-4o de OpenAI, ya está disponible. El rendimiento de Mini supera al GPT-3.5 Turbo y es mucho menos costoso por token. OpenAI también afirma que GPT es resistente a jailbreaks y a inyecciones rápidas. Expertos en seguridad discrepar.
- El último modelo de lenguaje grande de DeepL, que está capacitado para especializarse en traducción, supera Google Translate y GPT-4 para tareas de traducción.
- Mistral ha liberado Mamba Codestralun nuevo modelo para la generación de código que utiliza el nuevo Tipo de serpiente venenosa arquitectura en lugar de Transformers. Mamba es significativamente más rápido que Transformers y escala linealmente con el tamaño de la entrada.
- RTNetun nuevo tipo de pink neuronal, aparece para tomar decisiones como lo haría un humano.
- Andrej Karpathy reproduce GPT-2 (el modelo completo de 1,6 mil millones de parámetros) en 24 horas por menos de $700.
- Una startup llamada Ganancia de texto ha construido un modelo de lenguaje que detecta discurso de odio en los 24 idiomas de la Unión Europea.
- Maggie Appleton presenta un excelente argumento sobre el papel de la IA a la hora de permitir “desarrolladores descalzos”: Programadores no profesionales que resuelven problemas reales e importantes que no están en la escala necesaria para interesar a la industria del software program.
- Microsoft ha lanzado GráficoRAG en GitHub. GraphRAG es un conjunto de herramientas para generación aumentada de recuperación (RAG) que utiliza tecnología de gráficos en lugar de incrustaciones de vectores para almacenar y recuperar documentos.
- Con indicaciones adecuadas, los modelos de lenguaje grandes pueden detectar imágenes falsas profundas casi tan bien como el software program personalizado. Los LLM también pueden decir por qué creen que una imagen es falsa.
- Figma, la herramienta colaborativa de diseño on-line, ha presentado IA para diseñadores. Las herramientas sirven para buscar concepts, explorar diferentes direcciones y automatizar tareas repetitivas. Estas funciones se encuentran actualmente en versión beta y son gratuitas para todos los usuarios hasta fin de año.
- Toys “R” Us ha creado un comercial que fue en gran parte generado por SORAla IA de generación de vídeo de OpenAI.
- Proyectos Claude se suma a las capacidades de Anthropic. Le permite cargar documentos y otros datos que se comparten en todos los chats asociados con el proyecto. Puedes compartir proyectos con otras personas de tu equipo. (Solo planes Group y Professional).
- ¿Es este el fin de la GPU? Los investigadores tienen desarrollado una manera de entrenar modelos de lenguaje sin multiplicación de matrices (MatMul), por lo que requiere mucha menos energía. Sus modelos también requieren menos memoria y funcionan de manera related a los modelos entrenados con MatMul.
Programación
- Inrupt, una empresa que comercializa software program de construcción al aire libre Sólido protocolo, ha anunciado una billetera de datos para almacenar y compartir datos personales de forma segura.
- El Juego de cartas Unix Pipe ¡Debería haber existido hace mucho tiempo!
- eBPFque pronto será appropriate con Home windows, proporciona una función de ejecución segura del kernel. Si hubiera estado disponible, habría evitado los fallos de CrowdStrike.
- PythonMono permite Programas Python para ejecutar código JavaScript y viceversa. También le da a Python la capacidad de ejecutar módulos WebAssembly (Wasm).
- 1 JPM (1 Java Mission Supervisor) presenta un enfoque diferente para la gestión de compilaciones. Es un archivo único de código fuente de Java, que usted edita para reflejar las dependencias de su proyecto y otras personalizaciones. Es una alternativa interesante al ampliamente utilizado y odiado Maven.
- Un artículo académico analiza Patrones de diseño para aplicaciones de baja latencia en C++.. Si bien se centra en el comercio de alta frecuencia, las concepts contenidas en este documento son sin duda útiles para muchos tipos de aplicaciones.
- El Wiki Principios es una gran fuente de información y discusión sobre los principios de diseño de software program. Parece ser nuevo; ayúdalo a crecer!
- Julia Evans (@b0̷rk) ofrece algunos buenos recordatorios de por qué es útil el management del trabajo de shell—Uno de los cuales es terminar un programa que no responde a CTRL-C.
- marimo es un cuaderno de Python que se ejecuta completamente en el navegador usando Wasm y Pyodide. Los elementos del Pocket book, incluidos los elementos de la interfaz de usuario, se ejecutan automáticamente cada vez que los modifica o interactúa con ellos.
Seguridad
- El principio de privilegio mínimo en el management de acceso es essential, pero en la práctica rara vez se implementa bien. ¿Puede la IA hacer un mejor trabajo? de determinar quién debe acceder a qué y cuándo?
- A mala actualización de CrowdStrike provocó que muchos sistemas Home windows fallaran, provocando graves interrupciones en el servicio de aerolíneas, hospitales y otras organizaciones. La seguridad de la cadena de suministro no se trata sólo de código abierto; Los proveedores comerciales también son un problema.
- Actualización de 2024 de Cloudflare a su informe de seguridad de aplicaciones afirma que está viendo un aumento sustancial en el tráfico malicioso, que ahora representa aproximadamente el 7% de todo el tráfico. El tráfico de bots es un contribuyente importante.
- Un análisis de un ataque a la cadena de suministro de software program muestra cómo El código malicioso se esconde en imágenes aparentemente normales.. La ingeniería de estos ataques es cada vez más sofisticada.
- RADIO Explosivo es un nuevo ataque de intermediario contra el protocolo RADIUS ampliamente utilizado para autenticación, autorización y contabilidad. Entre otras cosas, RADIUS se utiliza para la autenticación mediante VPN, ISP y Wi-Fi.
- Ente autenticación es un autenticador de código abierto que proporciona 2FA, copias de seguridad cifradas en la nube y sincronización multiplataforma. Su criptografía ha sido auditada externamente.
- Un recién descubierto vulnerabilidad en OpenSSH permite la ejecución remota de código no autenticado. Si no se mantiene actualizado sobre los parches, es hora de comenzar.
- El sistema CVE, que informa y archiva las vulnerabilidades de seguridad, se ha utilizado cada vez más para informes de vulnerabilidad falsos. Algunos de estos son errores de buena fe, pero un número cada vez mayor proviene de cazarrecompensas y otros que intentan enriquecer sus currículums.
- Hipervínculos secuestrables son un problema. Estos enlaces tienen URL mal escritas, URL de marcador de posición para sitios que aún no existen y más. Estos errores frecuentemente no se solucionan antes de que el sitio entre en funcionamiento. Cualquiera que descubra estos enlaces puede registrar su nombre de dominio y crear un sitio hostil.
- CaracolCarga es un ataque sorprendente contra la privacidad en línea. Después de que un usuario descarga el malware (que no hace nada abiertamente hostil), SnailLoad monitorea la latencia de Web. Pequeñas variaciones en la latencia se utilizan como firmas para detectar qué medios está utilizando el usuario.
Net
- Google abandona su plan de eliminar el soporte de cookies de terceros en Chrome. En su lugar, habrá controles configurables por el usuario para el uso de cookies. Si bien los defensores de la privacidad se oponen a abandonar el plan para eliminar las cookies, es justo informar que los defensores de la privacidad también se han opuesto a las alternativas propuestas por Google.
- El Salón de la Vergüenza tiene un catálogo de patrones oscuros que los diseñadores net utilizan para engañar o manipular a los usuarios. Ya sea usted un desarrollador net o un usuario, es una buena concept familiarizarse con los tipos de abusos que existen.
- WebVM es una emulación digital de Linux que se ejecuta en el navegador. Es Residencia en una capa de emulación x86 escrita en WebAssembly.
- Transferir pensamiento es una plataforma de código abierto para desarrollando WebXR (VR, AR, cualquier otro tipo de experiencias R).
- El Navegador Mariquita El proyecto está recibiendo mucha atención. Es un intento de crear un navegador net appropriate con estándares completamente desde cero, sin depender del código de Google u otros proveedores. No se espera una versión alfa hasta 2026.
- mordedura de luna es el segundo lenguaje nuevo diseñado específicamente para WebAssembly. Está inspirado en Rust, pero diseñado para combinar bien con la semántica de Wasm.
Computación cuántica
- PsiQuantum, una startup de computación cuántica, planea construir un computadora cuántica de un millón de qubits dentro de 10 años. A diferencia de otros equipos cuánticos, que se han centrado en la construcción de sistemas pequeños, PsiQuantum está saltando directamente a una computadora que es capaz de realizar un trabajo útil.
- No es una computadora cuántica private, sino el quokka es un emulador de computadora cuántica private con 30 qubits tolerantes a fallos. Es una plataforma para aprender a programar computadoras cuánticas útiles antes de tener las reales.
Robótica
- Un perro robótico con aspiradoras en sus pies Se puede utilizar para limpiar playas.
- Entrenando robots humanoides para bailar puede mejorar su trabajo con humanos. Se vuelven más capaces de aprender nuevos movimientos y gestos.
- Los investigadores están trabajando en robots que aprender escuchando. Aunque el audio proporciona pistas importantes para muchas tareas que se pide a los robots que realicen, rara vez se utiliza como fuente de datos de entrenamiento.
{Hardware}
- Tentorrent ha desarrollado un nuevo conjunto de chips de IA que son mucho menos costosos que los de NVIDIA. Están disponibles como tarjetas PCIe o como componentes de estaciones de trabajo completas.