Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
Google Cloud anunció un Número significativo de nuevas características en su Google Cloud Subsequent Evento la semana pasada, con al menos 229 nuevos anuncios.
Enterrado en esa montaña de noticias, que incluían Nuevos chips de IA y AI de agente capacidades, así como actualat de la base de datoscepalleGoogle Cloud también realizó algunos grandes movimientos con su servicio BigQuery Information Warehouse. Entre las nuevas capacidades se encuentra la gobernanza unificada BigQuery, que ayuda a las organizaciones a descubrir, comprender y confiar en sus activos de datos. Las herramientas de gobierno ayudan a abordar las barreras clave para la adopción de la IA asegurando la calidad de los datos, la accesibilidad y la confiabilidad.
Las apuestas son enormes para Google, ya que asume rivales en el espacio de datos empresarial.
BigQuery ha estado en el mercado desde 2011 y ha crecido significativamente en los últimos años, tanto en términos de capacidades como de base de usuarios. Aparentemente, BigQuery también es un gran negocio para Google Cloud. Durante Google Cloud Subsequent, se reveló por primera vez cuán grande es realmente el negocio. Según Google, BigQuery tenía cinco veces el número de clientes de Snowflake y Databricks.
“Este es el primer año en que se nos ha dado permiso para publicar una estadística de clientes, lo cual fue encantador para mí”, dijo a VentureBeat Yasmeen Ahmad, director gerente de análisis de datos en Google Cloud. “Databricks y Snowflake, son el único otro tipo de plataformas de almacén de datos empresariales en el mercado. Tenemos cinco veces más clientes que cualquiera de ellos”.
Cómo Google está mejorando BigQuery para avanzar en la adopción empresarial
Si bien Google Now afirma tener una base de usuarios más extensa que sus rivales, tampoco se quita el pie del fuel. En los últimos meses, y particularmente en Google Cloud Subsequent, el HyperScaler ha anunciado múltiples nuevas capacidades para avanzar en la adopción empresarial.
Un desafío clave para Enterprise AI es tener acceso a los datos correctos que cumple con los acuerdos de nivel de servicio comercial (SLA). Según Gartner Analysis citado por Google, las organizaciones que no permiten y apoyan sus casos de uso de IA a través de una práctica de datos lista para la AI hará que más del 60% de los proyectos de IA no cumplan con SLA de negocios y se abandonen.
Este desafío proviene de tres problemas persistentes que afectan la gestión de datos empresariales:
- Silos de datos fragmentados
- Requisitos que cambian rápidamente
- Culturas de datos organizacionales inconsistentes donde los equipos no comparten un lenguaje común en torno a los datos.
La solución de gobernanza unificada BigQuery de Google representa una desviación significativa de los enfoques tradicionales al incorporar las capacidades de gobernanza directamente dentro de la plataforma BigQuery en lugar de requerir herramientas o procesos separados.
Gobierno unificado de BigQuery: una inmersión técnica profunda
En el núcleo del anuncio de Google se encuentra BigQuery Unified Governance, impulsado por el nuevo catálogo common de BigQuery. A diferencia de los catálogos tradicionales que solo contienen información básica de tabla y columna, el catálogo common integra tres tipos distintos de metadatos:
- Metadatos físicos/técnicos: Definiciones de esquema, tipos de datos y estadísticas de perfiles.
- Metadatos comerciales: Términos de glosario comercial, descripciones y contexto semántico.
- Metadatos de tiempo de ejecución: Patrones de consulta, estadísticas de uso e información específica del formato para tecnologías como Apache Iceberg.
Este enfoque unificado permite que BigQuery mantenga una comprensión integral de los activos de datos en toda la empresa. Lo que hace que el sistema sea particularmente poderoso es cómo Google ha integrado a Gemini, su modelo AI avanzado, directamente en la capa de gobierno a través de lo que llaman el motor de conocimiento.
El motor de conocimiento mejora activamente la gobernanza al descubrir relaciones entre conjuntos de datos, enriquecer metadatos con contexto comercial y monitorear la calidad de los datos automáticamente.
Las capacidades clave incluyen búsqueda semántica con comprensión del lenguaje pure, generación automatizada de metadatos, descubrimiento de relaciones con IA, productos de datos para activos relacionados con el empaque, un glosario comercial, catalogación automática de datos estructurados y no estructurados y detección de anomalías automatizadas.
Olvídate de los puntos de referencia, Enterprise AI es un problema mayor
La estrategia de Google trasciende la competencia del modelo AI.
“Creo que hay demasiado de la industria centrada en ponerse al tanto de esa tabla de clasificación particular person, y en realidad Google está pensando de manera integral sobre el problema”, dijo Ahmad.
Este enfoque integral aborda todo el ciclo de vida de los datos empresariales, respondiendo preguntas críticas como: ¿Cómo se entrega sobre la confianza? ¿Cómo se entrega a escala? ¿Cómo se entrega sobre el gobierno y la seguridad?
Al innovar en cada capa de la pila y reunir estas innovaciones, Google ha creado lo que Ahmad llama un volante de activación de datos en tiempo actual, donde, tan pronto como se capturan los datos, independientemente del tipo o formato o dónde se almacena, hay generación, linaje y calidad de metadatos instantáneos.
Dicho esto, los modelos importan. Ahmad explicó que con el advenimiento de los modelos de pensamiento como Gemini 2.0, ha habido un gran desbloqueo para las plataformas de datos de Google.
“Hace un año, cuando le pidió a Genai que respondiera una pregunta comercial, cualquier cosa que se volviera un poco más compleja, en realidad necesitaría dividirlo en múltiples pasos”, dijo. “De repente, con el modelo de pensamiento, puede idear un plan … no tienes que codificar una forma de construir un plan. Sabe cómo construir planes”.
Como resultado, dijo que ahora puede hacer que un agente de ingeniería de datos cree una tubería que sea tres pasos o 10 pasos. La integración con las capacidades de IA de Google ha transformado lo que es posible con los datos empresariales.
Impacto del mundo actual: cómo las empresas se están beneficiando
Levi Strauss & Firm Ofrece un ejemplo convincente de cómo la gobernanza de datos unificados puede transformar las operaciones comerciales. La compañía de 172 años está utilizando las capacidades de gobernanza de datos de Google a medida que cambia de ser principalmente un negocio mayorista a convertirse en una marca directa al consumidor. En una sesión en Google Cloud Subsequent, Vinay Narayana, que ejecuta datos de datos e ingeniería de plataformas de IA en Levi’s, detalló el caso de uso de su organización.
“Aspiramos a capacitar a nuestros analistas de negocios para que tengan acceso a datos en tiempo actual que también sea preciso”, dijo Narayana. “Antes de embarcarnos en nuestro viaje para construir una nueva plataforma, descubrimos varios desafíos de los usuarios. Nuestros usuarios de negocios no sabían dónde vivían los datos, y si conocían la fuente de datos, no sabían quién lo poseía. Si de alguna manera obtuvieron acceso, no había documentación”.
Levi construyó una plataforma de datos en Google Cloud que organiza productos de datos por dominio empresarial, haciéndolos descubrir a través de Analytics Hub (el mercado de datos de Google). Cada producto de datos se acompaña de documentación detallada, información de linaje y métricas de calidad.
Los resultados han sido impresionantes: “Somos 50 veces más rápidos que nuestra plataforma de datos heredados, y esto está en el extremo inferior. Un número significativo de visualizaciones es 100 veces más rápido”, dijo Narayana. “Tenemos más de 700 usuarios que ya usan la plataforma a diario”.
Otro ejemplo proviene de Verizon, que es utilizar las herramientas de gobernanza de Google como parte de su iniciativa de datos One Verizon para unificar datos previamente aislados en todas las unidades de negocios.
“Este será el almacén de datos de telecomunicaciones más grande de América del Norte que se ejecuta en BigQuery”, Arvind Rajagopalan, AVP de ingeniería de datos, arquitectura y productos en Verizondijo durante una próxima sesión de Google Cloud.
El patrimonio de datos de la compañía es masivo, que comprende 3.500 usuarios que ejecutan aproximadamente 50 millones de consultas, 35,000 tuberías de datos y más de 40 petabytes de datos.
En una sesión de atención en Google Cloud Subsequent, Ahmad también proporcionó muchos otros ejemplos de usuarios. Radisson Lodge Group personalizó su publicidad a escala, capacitando modelos Gemini en datos de BigQuery. Los equipos experimentaron un aumento del 50% en la productividad, mientras que los ingresos de las campañas con IA aumentaron en más del 20%. Gordon Meals Service emigró a BigQuery, asegurando que sus datos estuvieran listos para la IA y el aumento de la adopción de aplicaciones orientadas al cliente en un 96%
¿Cuál es la “gran” diferencia: explorar el panorama competitivo?
Hay múltiples proveedores en el espacio de almacén de datos empresariales, incluidos Databricks, Snowflake, Microsoft con Synapse y Amazon con desplazamiento al rojo. Todos estos proveedores han estado desarrollando diversas formas de integraciones de IA en los últimos años.
Databricks tiene un plataforma de datos de datos integral y ha sido en expansión sus propias capacidades de IAgracias en parte a su adquisición de Mosaic de $ 1.3 mil millones. Amazon Redshift agregó soporte para IA generativa en 2023, con Amazon Q ayudando a los usuarios a construir consultas y obtener mejores respuestas. Por su parte, Snowflake ha estado ocupado desarrollando herramientas y Asociarse con un modelo de lenguaje grande (LLM) Proveedores, incluidos antrópicos.
Cuando se presiona en comparaciones específicamente con las ofertas de Microsoft, Ahmad argumentó que Synapse no es una plataforma de datos empresariales para los tipos de casos de uso para los que los clientes usan BigQuery.
“Creo que hemos superado a toda la industria, porque hemos trabajado en todas las piezas”, dijo. “Tenemos el mejor modelo, por cierto, es el mejor modelo integrado en una pila de datos que comprende cómo funcionan los agentes”.
Esta integración ha impulsado la rápida adopción de capacidades de IA dentro de BigQuery. Según Google, el uso del cliente de los modelos de IA de Google en BigQuery para el análisis multimodal ha aumentado 16 veces año tras año.
Lo que esto significa para las empresas que adoptan la IA
Para las empresas que ya tienen dificultades con la implementación de la IA, el enfoque integrado de Google hacia el gobierno puede ofrecer una ruta más simplificada hacia el éxito que los sistemas de gestión de datos y gestión de datos separados.
La afirmación de Ahmad de que Google ha “saltado” a los competidores en este espacio enfrentará el escrutinio a medida que las organizaciones pongan a trabajar estas nuevas capacidades. Sin embargo, los ejemplos de clientes y los detalles técnicos sugieren que Google ha logrado un progreso significativo para abordar uno de los aspectos más desafiantes de la adopción de IA empresarial.
Para los tomadores de decisiones técnicos que evalúan las plataformas de datos, las preguntas clave serán si este enfoque integrado ofrece un valor adicional suficiente para justificar la migración de las inversiones existentes en plataformas especializadas, como Snowflake o Databricks, y si Google puede mantener su ritmo de innovación precise a medida que responden los competidores.