Érase una vez, la llamada Tech Clarion fue “teléfonos celulares para todos ” – y de hecho, las comunicaciones móviles han revolucionado los negocios (y el mundo). Hoy, el equivalente de esa llamada es dar acceso a todos a ai aplicaciones. Pero el poder actual de la IA es aprovecharla para las necesidades específicas de las empresas y las organizaciones. El camino ardiendo por la startup china Deepseek demuestra cómo AI puede ser aprovechado por todos, especialmente aquellos con presupuestos limitados, para satisfacer sus necesidades específicas. De hecho, el advenimiento de la IA de menor costo promete cambiar el patrón profundamente arraigado de soluciones de IA a menudo permaneciendo fuera de la vista para muchas pequeñas empresas y organizaciones debido a los requisitos de costos.
Los LLM son, o fueron, un esfuerzo caroque requiere acceso a cantidades masivas de datos, grandes cantidades de computadoras poderosas para procesar los datos, y el tiempo y los recursos invertidos en la capacitación del modelo. Pero esas reglas están cambiando. Operando con un presupuesto reducido, Deepseek desarrolló su propia LLM y una aplicación de tipo CHATGPT para consultas, con una inversión mucho menor que las de sistemas similares construidos por empresas estadounidenses y europeas. El enfoque de Deepseek abre una ventana al desarrollo de LLM para organizaciones más pequeñas que no tienen miles de millones para gastar. De hecho, el día puede no estar muy lejos cuando la mayoría de las pequeñas organizaciones pueden desarrollar sus propios LLM para servir a sus propios propósitos específicos, generalmente proporcionando una solución más efectiva que las LLM generales como ChatGPT.
Mientras debate Sigue sobre el verdadero costo de Deepseek, no es simplemente el costo lo que lo distingue y modelos similares: es el hecho de que se basó en chips menos avanzados y un enfoque más enfocado para la capacitación. Como una empresa china sujeta a restricciones de exportación de EE. UU., Deepseek no pudo acceder al chips nvidia avanzados que generalmente se usan para la computación de servicio pesado requerido para el desarrollo de LLM y, por lo tanto, se vio obligado a usar chips Nvidia H-800 menos potentesque no puede procesar datos de manera tan rápida o eficiente.
Para compensar esa falta de poder, Deepseek adoptó un enfoque diferente, más enfocado y directo para su desarrollo de LLM. En lugar de lanzar montañas de datos en un modelo y confiar en la fuerza de la computación para etiquetar y aplicar los datos, Deepseek redujo el entrenamiento, Utilizando una pequeña cantidad de datos de “inicio en frío” de alta calidad y aplicar IRL (aprendizaje de refuerzo iterativocon el algoritmo aplicando datos a diferentes escenarios y aprendiendo de él). Este enfoque enfocado permite que el modelo aprenda más rápido, con menos errores y menos potencia informática.
Related a la forma en que los padres pueden guiar los movimientos específicos de un bebé, ayudándola a transferir con éxito por primera vez, en lugar de dejar que el bebé lo resuelva solo, o enseñarle al bebé una variedad más amplia de movimiento que, en teoría, podría ayudar a darse la vuelta: los científicos de datos que entrenan estos modelos de IA más enfocados se acercan a lo que es más necesario para ciertas tareas y resultados. Es possible que dichos modelos no tengan una aplicación tan amplia como LLMS como ChatGPT, pero se pueden confiar en aplicaciones específicas y los llevan con precisión y eficiencia. Incluso los críticos de Deepseek admiten que su enfoque simplificado del desarrollo aumentó significativamente la eficiencia, lo que le permite hacer más con mucho menos.
Este enfoque se trata de dar a la IA las mejores entradas para que pueda alcanzar sus hitos de la manera más inteligente y eficiente posible, y puede ser valiosa para cualquier organización que quiera desarrollar una LLM para sus necesidades y tareas específicas. Tal enfoque es cada vez más valioso para las pequeñas empresas y organizaciones. El primer paso es comenzar con los datos correctos. Por ejemplo, una empresa que desea usar IA para ayudar a sus equipos de ventas y advertising and marketing debe capacitar a su modelo en un conjunto de datos cuidadosamente seleccionado que aumenta las conversaciones, estrategias y métricas de ventas. Esto evita que el modelo pierda el tiempo y la potencia informática en información irrelevante. Además, la capacitación debe estructurarse en etapas, asegurando que el modelo domine cada tarea o concepto antes de pasar a la siguiente.
Esto también tiene paralelos al criar un bebé, ya que me he aprendido desde que me convertí en madre hace unos meses. En ambos escenarios, un enfoque guiado y paso a paso evita desperdiciar recursos y cut back la fricción. Finalmente, este enfoque con los modelos de Child People y AI resulta en una mejora iterativa. A medida que el bebé crece, o el modelo aprende más, sus habilidades mejoran. Esto significa que los modelos se pueden refinar y mejorar para manejar mejor las situaciones del mundo actual.
Este enfoque mantiene bajos los costos, evitando que los proyectos de IA se conviertan en un drenaje de recursos, lo que los hace más accesibles para equipos y organizaciones más pequeñas. También conduce a un mejor rendimiento de los modelos de IA más rápidamente; Y, debido a que los modelos no están sobrecargados con datos extraños, también se pueden ajustar para adaptarse a la nueva información y cambiar las necesidades comerciales, clave en los mercados competitivos.
La llegada de Deepseek y el mundo de la IA más eficiente y de menor costo – Aunque inicialmente extendió el pánico en todo el mundo de la IA y los mercados de valores, en common, es un desarrollo positivo para el sector de IA. La mayor eficiencia y los costos más bajos de la IA, al menos para ciertas aplicaciones enfocadas, finalmente darán como resultado un mayor uso de la IA en common, lo que impulsa el crecimiento para todos, desde desarrolladores hasta fabricantes de chips y usuarios finales. De hecho, Deepseek ilustra Paradoja de Jevons – donde más eficiencia probablemente dará como resultado un mayor uso de un recurso, no menos. Como esta tendencia parece continuar, las pequeñas empresas que se centran en usar IA para satisfacer sus necesidades específicas también estarán mejor establecidas para el crecimiento y el éxito.