Una nueva empresa, Cogito profundoha surgido de sigilo con una familia de modelos de IA abiertos que se pueden cambiar entre los modos de “razonamiento” y no razonamiento.
Modelos de razonamiento como OpenAi’s O1 han mostrado una gran promesa en dominios como las matemáticas y la física, gracias a su capacidad de verificar de manera efectiva trabajando a través de problemas complejos paso a paso. Sin embargo, este razonamiento tiene un costo: mayor informática y latencia. Es por eso laboratorios como antrópico Están buscando arquitecturas de modelos “híbridas” que combinan componentes de razonamiento con elementos estándar que no sean de condición. Los modelos híbridos pueden responder rápidamente preguntas simples mientras pasan un tiempo adicional considerando consultas más desafiantes.
Todos los modelos de Deep Cogito, llamados Cogito 1, son modelos híbridos. Cogito afirma que superan a los mejores modelos abiertos del mismo tamaño, incluidos los modelos de Meta y Startup de IA china Veterano.
“Cada modelo puede responder directamente […] o autorreflexión antes de responder (como los modelos de razonamiento) “, la compañía explicado en una publicación de weblog. “[All] fueron desarrollados por un pequeño equipo en aproximadamente 75 días “.
Los modelos Cogito 1 varían de 3 mil millones de parámetros a 70 mil millones de parámetros, y Cogito cube que los modelos que varían hasta 671 mil millones de parámetros se unirán a ellos en las próximas semanas y meses. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, con más parámetros que generalmente son mejores.
Cogito 1 no se desarrolló desde cero, para ser claro. Deep Cogito construyó sobre Meta’s Open Llama y los modelos Qwen de Alibaba para crear los suyos. La compañía cube que aplicó nuevos enfoques de capacitación para aumentar el rendimiento de los modelos base y permitir un razonamiento alternable.
Según los resultados de la evaluación comparativa interna de Cogito, el modelo de Cogito 1 más grande, Cogito 70B, con el razonamiento supera el modelo de razonamiento R1 de Deepseek en algunas evaluaciones de matemáticas y idiomas. Cogito 70B con el razonamiento desactivado también Eclipses Meta Llama 4 Scouts lanzado recientemente en LiveBench, una prueba de IA de uso normal.
Cada modelo Cogito 1 está disponible para descargar o usar a través de API en los proveedores de nubes, AI y AI juntos.

“Actualmente, todavía estamos en las primeras etapas de [our] Curva de escala, habiendo usado solo una fracción de cómputo típicamente reservada para el modelo de lenguaje grande tradicional después de la capacitación/entrenamiento continuo “, escribió Cogito en su publicación de weblog.” En el futuro, estamos investigando enfoques complementarios posteriores a la capacitación para la superación private “.
Según las presentaciones del estado de CaliforniaDeep Cogito, con sede en San Francisco, se fundó en junio de 2024. Página de LinkedIn Enumera dos cofundadores, Drishan Arora y Dhruv Malhotra. Malhotra fue anteriormente gerente de productos en Google AI Lab Deepmind, donde trabajó en tecnología de búsqueda generativa. Arora period ingeniera de software program senior en Google.
Deep Cogito, cuyos patrocinadores incluyen South Park Commons, Según PitchbookAmbicioso tiene como objetivo construir “Superinteligencia normal”. Los fundadores de la compañía entienden la frase que significa AI que puede realizar tareas mejor que la mayoría de los humanos y “descubrir capacidades completamente nuevas que aún no hemos imaginado”.