24.8 C
Colombia
lunes, julio 7, 2025

La oportunidad de inicio con Gabriela de Queiroz – O’Reilly


IA generativa en el mundo real

IA generativa en el mundo actual

AI generativa en el mundo actual: la oportunidad de inicio con Gabriela de Queiroz



Cargando





/

Ben Lorica y Gabriela de Queiroz, directora de IA en Microsoft, hablan sobre las startups: específicamente, las nuevas empresas de IA. ¿Cómo te notas? ¿Cómo se genera tracción actual? ¿Qué están haciendo las startups con los agentes y con protocolos como MCP y A2A? ¿Y qué problemas de seguridad deben observar las startups, especialmente si están utilizando modelos de pesas abiertas?

Verificar Otros episodios de este podcast en la plataforma de aprendizaje O’Reilly.

Sobre el IA generativa en el mundo actual podcast: En 2023, Chatgpt puso a AI en la agenda de todos. En 2025, el desafío será convertir esas agendas en realidad. En IA generativa en el mundo actualBen Lorica entrevista a líderes que están construyendo con IA. Aprenda de su experiencia para ayudar a poner a la IA a trabajar en su empresa.

Puntos de interés

  • 0:00: Introducción a Gabriela de Queiroz, directora de IA en Microsoft.
  • 0:30: Trabajas con muchas startups y fundadores. ¿Cómo han cambiado las oportunidades para las nuevas empresas en IA generativa? ¿Se están expandiendo las oportunidades?
  • 0:56: Absolutamente. La barrera de entrada para fundadores y desarrolladores es mucho más baja. Las startups están explotando, no solo la cantidad, sino también las cosas interesantes que están haciendo.
  • 1:19: Atrapas a los begins cuando todavía están explorando, tratando de construir su MVP. Por lo tanto, las nuevas empresas deben ser más persistentes al tratar de encontrar la diferenciación. Si alguien puede construir un MVP, ¿cómo se distingue?
  • 1:46: En Microsoft, conduzco varias iniciativas estratégicas para ayudar a las nuevas empresas en etapa de crecimiento. También los guía para resolver puntos débiles reales usando nuestras pilas. He diseñado programas para destacar a los fundadores.
  • 3:08: Hago mucho compromiso donde ayudo a las nuevas empresas que van del prototipo o MVP al impacto. Un MVP no es suficiente. Necesito ver un caso de uso actual y necesito ver algo de tracción. Cuando tienen clientes reales, vemos si su MVP está funcionando.
  • 3:49: ¿Estás empezando a ver patrones para ganar tracción? ¿Se están centrando en un dominio específico? ¿O tienen un buen conjunto de datos?
  • 4:02: Si están resolviendo un caso de uso actual en un dominio o nicho específico, aquí es donde los vemos tener éxito. Están resolviendo un dolor actual, no construyendo algo genérico.
  • 4:27: Ambos estamos en San Francisco, y resolver un dolor específico o encontrar un dominio específico significa algo diferente. Los fundadores de Techie pueden construir algo que use sus amigos, pero no hay ingresos.
  • 5:03: Esto sucede en todas partes, pero hay una cultura más grande alrededor de eso aquí. Le digo a los fundadores: “Necesitas mostrarme tracción”. Tenemos varias compañías que comenzaron como código abierto, luego construyeron una capa pagada además del proyecto de código abierto.
  • 5:34: Trabajas con la gente de Azure, por lo que presumiblemente sabes lo que las empresas reales están haciendo con la IA generativa. ¿Puede darnos una concept de qué empresas están comenzando a implementar? ¿Cuál es el nivel de comodidad de la empresa con estas tecnologías?
  • 6:06: Las empresas están un poco detrás de las startups. Las startups son agentes de construcción. Las empresas aún no están allí. Hay mucho levantamiento pesado en la infraestructura de datos que necesitan tener en su lugar. Y sus casos de uso son complejos. Es comparable a Massive Information, donde la empresa tardó más en optimizar su pila.
  • 7:19: ¿Puede describir por qué las empresas necesitan modernizar su pila de datos?
  • 7:42: La realidad no es mágica. Hay mucha complejidad en los datos y cómo se manejan los datos. Hay mucha seguridad y privacidad de datos que las nuevas empresas no están al tanto, pero que son importantes para las empresas. Incluso los tipos de datos: los datos no están bien organizados, hay diferentes equipos que usan diferentes fuentes de datos.
  • 8:28: ¿Es RAG ahora un patrón bien establecido en la empresa?
  • 8:44: Es. Rag es parte del flujo de trabajo de todos.
  • 8:51: Los casos de uso comunes que parecen estar más avanzados son la atención al cliente, la codificación, ¿qué otros cubos pueden agregar?
  • 9:07: La atención al cliente y los boletos se encuentran entre los principales dolores y casos de uso. Y son muy caros. Por lo tanto, es una victoria fácil para las empresas cuando se mudan a los agentes de Genai o AI.
  • 9:48: ¿Estás diciendo que los constructores de herramientas están por delante de los compradores de herramientas?
  • 10:05: Tienes razón. Hablo mucho con agentes de construcción de startups. Discutimos hacia dónde se dirige la industria y cuáles son los desafíos. Si cree que estamos cerca de AGI, intente construir un agente y verá qué tan lejos estamos de AGI. Cuando quieres escalar, hay otro nivel de dificultad. Cuando pido ejemplos y clientes reales, la mayoría aún no está allí.
  • 11:01: Parte de esto es la terminología. La gente usa el término “agente” incluso para un chatbot. Hay mucha confusión. Y las startups están promocionando la noción de múltiples. Llegaremos allí, pero primero comencemos con agentes individuales. Y todavía necesitas un humano en el bucle.
  • 11:40: Sí, hablamos del humano en el bucle todo el tiempo. Incluso las personas que se jactan, cuando les pides que te muestren, todavía no están allí.
  • 12:00: En el frente del agente, si le pedía una breve presentación con tres diapositivas de ejemplos que llamaron su atención, ¿cuál serían?
  • 12:30: Hay una empresa que hace un agente de IA con correos electrónicos y su calendario. Todos usan correo electrónico y calendarios todo el día. Si queremos programar la cena con un grupo de amigos, pero tenemos personas con restricciones dietéticas, tomaría una eternidad encontrar un restaurante que verifique todas las casillas. Hay una compañía que intenta hacer esto automático.
  • 14:22: En los últimos meses, los desarrolladores se han recuperado alrededor de MCP y ahora A2A. Alguien me pidió una lista de servidores Vetted MCP. Si el servidor proviene de la empresa que desarrolló la aplicación, bien. Pero hay miles de servidores, y soy cauteloso. Ya tenemos problemas de la cadena de suministro de software program. ¿Está despegando MCP o es una solución temporal?
  • 15:48: Es demasiado pronto para decir que esto es todo. También está el Protocolo de Google (A2A); IBM creó un protocolo; Esta es una discusión continua, y debido a que está evolucionando tan rápido, algo probablemente vendrá en los próximos meses.
  • 16:31: Es muy parecido a Web y los estándares que surgieron de allí. Puede hacerlo formal, o puede simplemente construirlo, cultivarlo y de alguna manera se convierte en un estándar empírico abierto.
  • 17:15: Estamos hablando implícitamente de texto. ¿Ha comenzado a ver casos de uso de casi producción que involucran modelos multimodales?
  • 17:37: Hemos visto algunos casos de uso con multimodalidad, lo cual es más complejo.
  • 17:48: Ahora tiene que expandir su estrategia de datos a todos estos diferentes tipos de datos.
  • 18:07: Volviendo a las diapositivas: si tuviera tres diapositivas, trataría de poner a todos en la misma página sobre lo que es un agente de IA. Todas las grandes empresas tienen sus propias definiciones. Establecía el escenario con mi definición: un sistema que puede tomar medidas en la mitad. Entonces diría que si crees que estamos cerca de AGI, intenta construir un agente. Y la tercera diapositiva sería construir un agente, en lugar de un multiagente. Comience con poco, y luego puede escalar, no al revés.
  • 19:44: La orquestación de un agente es una cosa. Mucha gente arroja el término orquestación. Para la ingeniería de datos, la orquestación significa algo específico, y mucho entra en eso, incluso para un solo agente. Para los múltiples, es mucho más complejo. Hay orquestación y también hay comunicación. Un agente puede retener, ignorar o malinterpretar información. Así que quédese con un agente. Haz eso y sigue adelante.
  • 20:33: Lo más importante en el espacio del modelo basic es el razonamiento. ¿Qué se ha abierto el razonamiento para algunas de estas startups? ¿Qué aplicaciones dependen de un modelo mejorado por el razonamiento? ¿Qué modelo debo usar y puedo sobrevivir con un modelo que no razona?
  • 21:15: Todavía no he visto ninguna startup usando razonamiento. Probablemente por lo que estás hablando. Es costoso, es más lento y las startups necesitan ver victorias rápidamente.
  • 21:46: Simplemente solicitan más créditos gratuitos.
  • 21:51: Los créditos gratuitos no son para siempre. Pero ni siquiera es el costo, también es el proceso y la espera. ¿Cuáles son las compensaciones? No he visto a startups hablando conmigo sobre el uso de razonamiento.
  • 22:22: El sólido consejo para cualquiera que construya cualquier cosa es ser modelo agnóstico. Diseñe lo que está haciendo para que pueda usar múltiples modelos o modelos de conmutación. Ahora tenemos modelos de pesas abiertas que se están volviendo más competitivos. El año pasado tuvimos llama; Ahora también tenemos Qwen y Deepseek, con una increíble cadencia de lanzamiento. ¿Estás viendo más startups optando por pesas abiertas?
  • 23:19: Definitivamente. Pero deben tener mucho cuidado cuando usan modelos abiertos debido a la seguridad. Veo muchas empresas que usan Deepseek. Les pregunto sobre la seguridad.
  • 23:43: En el mundo de los pesos abiertos, puede tener modelos derivados. ¿Quién examina los derivados? Los modelos patentados tienen mucho más management. Y hay riesgos de la cadena de suministro, aunque no son exclusivos de los modelos de pesas abiertas. Todos dependemos de las bibliotecas de Python y Python.
  • 25:17: Y con personas que bifurcan modelos derivados. . . Hemos visto esto con productos también; Las personas que construyen productos y son rentables además de los proyectos de código abierto. Personas construidas en una bifurcación de un proyecto de Python o bibliotecas de Python y high of Python y [became] rentable.
  • 25:55: Con los modelos chinos de pesas abiertas, he hablado con personas de seguridad, y no hay nada inherentemente inseguro en usar los pesos. Puede haber diferencias arquitectónicas. Pero si está utilizando uno de los modelos chinos en su API abierta, es posible que tengan que entregar datos. En common, el acceso a los pesos no es un vector de ataque común.
  • 27:03: O puede usar empresas como Microsoft. Tenemos Deepseek R1 disponible en Azure. Pero ha pasado por rigurosos teaming rojo y evaluación de seguridad para mitigar los riesgos.
  • 27:39: Existen diferencias en términos de alineación y teaming rojo entre las empresas occidentales y chinas.
  • 28:26: Para terminar, ¿hay algún paralelo entre lo que está viendo ahora y lo que vimos en la ciencia de datos?
  • 28:40: Es comparable, pero la escala y la velocidad son diferentes. Hay más recursos y accesibilidad. La barrera de entrada es más baja.
  • 29:06: El ciclo de bombo es el mismo. Recuerdas todas las historias sobre “La ciencia de datos es el nuevo trabajo horny”. Pero la tecnología ahora es mucho más accesible, y hay muchas más historias y más emoción.
  • 29:29: En aquel entonces, solo teníamos algunas opciones: Hadoop, Spark. . . No como 100 modelos diferentes. Y no eran accesibles para el público en common.
  • 30:03: En aquel entonces, la gente no necesitaba Hadoop, MapReduce o Spark si no tenían muchos datos. Y ahora, no tiene que usar el LLM más brillante o mejor bencionado; Puede usar un modelo de idioma pequeño.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles