24.6 C
Colombia
domingo, julio 6, 2025

Google lanza un agente de ciencia de datos de Gemini Free en su plataforma Colab Python


Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Los agentes de IA están de moda, pero ¿qué tal uno enfocado específicamente en analizar, clasificar y sacar conclusiones de grandes volúmenes de datos?

Google agente de ciencias de datos Hace exactamente eso: el nuevo asistente de IA de Gemini 2.0 gratuito que automatiza el análisis de datos ahora está disponible para los usuarios de más de 18 años en países e idiomas seleccionados de forma gratuita.

El asistente está disponible a través de Google Colab, el servicio de ocho años de la compañía para ejecutar el código Python Reside en línea en la cima de las unidades de procesamiento de gráficos (GPU) propiedad del gigante de la búsqueda y su propio, interno Unidades de procesamiento de tensor (TPU).

Inicialmente lanzado para probadores de confianza en diciembre de 2024, Knowledge Science Agent está diseñado para ayudar a los investigadores, científicos de datos y desarrolladores a agilizar sus flujos de trabajo al generar cuadernos Jupyter totalmente funcionales a partir de descripciones de lenguaje pure, todos en el navegador del usuario.

Esta expansión se alinea con los esfuerzos continuos de Google para integrar las características de codificación y ciencia de datos impulsadas por la IA en Colab, basándose en actualizaciones anteriores como la asistencia de codificación de IA conlailizada. Mayo de 2023.

También actúa como una especie de réplica avanzada y tardía para OpenAi’s Análisis de datos avanzados de chatgpt (previamente Intérprete de código), que ahora está integrado en ChatGPT al ejecutar GPT-4.

¿Qué es Google Colab?

Google Colab (abreviatura de Colaboratory) es un entorno de cuaderno Jupyter basado en la nube que permite a los usuarios escribir y ejecutar el código Python directamente en su navegador.

Jupyter Pocket book es una aplicación net de código abierto que permite a los usuarios crear y compartir documentos que contienen código en vivo, ecuaciones, visualizaciones y texto narrativo. Originario del proyecto Ipython en 2014, ahora admite más de 40 lenguajes de programación, incluidos Python, R y Julia. Esta plataforma interactiva se usa ampliamente en la ciencia de datos, la investigación y la educación para tareas como el análisis de datos, la visualización y la enseñanza de los conceptos de programación.

Desde su lanzamiento en 2017, Google Colab se ha convertido en una de las plataformas más utilizadas para la ciencia y la educación de datos de aprendizaje automático (ML).

Como Ori Abramovsky, Knowledge Science lidera en SpectRALOPS.IO, detallado en un Excelente publicación media Desde 2023, la facilidad de uso de Colab y el acceso gratuito a GPU y TPU lo convierten en una opción destacada para muchos desarrolladores e investigadores.

Señaló que la baja barrera de entrada, la integración perfecta con Google Drive y el soporte para TPUS permitieron a su equipo acortar drásticamente los ciclos de entrenamiento mientras trabajaba en modelos de IA.

Sin embargo, Abramovsky también señaló las limitaciones de Colab, como:

  • Límites de tiempo de sesión (especialmente para usuarios de nivel libre).
  • Asignación de recursos impredecible en los tiempos de uso máximo.
  • Falta de características críticascomo la ejecución eficiente de la tubería y la programación avanzada.
  • Apoyar los desafíosya que Google proporciona opciones limitadas para asistencia directa.

A pesar de estos inconvenientes, Abramovsky enfatizó que Colab sigue siendo una de las mejores soluciones de cuaderno sin servidor disponibles, particularmente en las primeras etapas de ML y proyectos de análisis de datos.

Simplificar el análisis de datos con IA

El agente de ciencias de datos se basa en el entorno de cuaderno sin servidor de Colab al eliminar la necesidad de configuración handbook.

Usando la IA de Géminis de Google, los usuarios pueden describir sus objetivos analíticos en inglés easy (“Visualizar las tendencias” “Entrenar un modelo de predicción” “Valores de limpieza faltantes”), y el agente genera cuadernos Colab totalmente ejecutables en respuesta.

Admite a los usuarios por:

  • Análisis de automatización: Genera cuadernos completos y de trabajo en lugar de fragmentos de código aislados.
  • Ahorrar tiempo: Elimina la configuración handbook y la codificación repetitiva.
  • Mejora de la colaboración: Cuenta con funciones de intercambio incorporadas para proyectos basados ​​en equipo.
  • Ofreciendo soluciones modificables: Los usuarios pueden ajustar y personalizar el código generado.

El agente de ciencia de datos ya está acelerando la investigación científica del mundo actual

Según Google, los primeros probadores han informado ahorros de tiempo significativos al usar el agente de ciencia de datos.

Por ejemplo, un científico del Laboratorio Nacional de Lawrence Berkeley que trabaja en emisiones de metano de humedales tropicales estimó que su tiempo de procesamiento de datos cayó de una semana a solo cinco minutos cuando usaba el agente.

La herramienta también se ha desempeñado bien en los puntos de referencia de la industria, clasificando el cuarto en el DABSTEP: punto de referencia del agente de datos para el razonamiento de varios pasos en la cara de abrazopor delante de agentes de IA como React (GPT-4.0), Deepseek, Claude 3.5 Haiku y Llama 3.3 70b.

Sin embargo, los modelos Rival O3-Mini y O1 de OpenAI, así como el soneto Claude 3.5 de Anthrope, ambos superaron al nuevo agente de ciencias de datos Gemini.

Empezando

Los usuarios pueden comenzar a usar el agente de ciencia de datos en Google Colab siguiendo estos pasos:

  1. Abre un nuevo cuaderno de colab.
  2. Subir un conjunto de datos (CSV, JSON, and so on.).
  3. Describe el análisis en lenguaje pure Usando el panel lateral de Géminis.
  4. Ejecutar el cuaderno generado para ver concepts y visualizaciones.

Google proporciona conjuntos de datos de muestras e concepts rápidas para ayudar a los usuarios a explorar sus capacidades, incluidas:

  • Encuesta de desarrollador de desbordamiento de pila: “Visualice los lenguajes de programación más populares”.
  • Conjunto de datos de especies de iris: “Calcule y visualiza las correlaciones de Pearson, Spearman y Kendall”.
  • Conjunto de datos de clasificación de vidrio: “Entrena un clasificador de bosque aleatorio”.

Cada vez que un usuario desea usar el nuevo agente, tendrá que navegar a Colab y hacer clic en “Archivo”, luego “nuevo cuaderno en la unidad”, y el cuaderno resultante se almacenará en su cuenta de Google Drive Cloud.

Mi propio breve uso de demostración fue más mixto

De acuerdo, soy un periodista tecnológico humilde y no un científico de datos, pero mi propio uso del nuevo agente de ciencia de datos de Gemini 2.0 en Colab hasta ahora ha sido menos que fluida.

Subí cinco archivos CSV (valores separados por comas, archivos de hoja de cálculo estándar de Excel o Hojas) y lo pregunté “¿Cuánto estoy gastando cada mes y trimestre en mis servicios públicos?”.

El agente siguió adelante y realizó las siguientes operaciones:

  • Conjuntos de datos fusionadosFecha de manejo y inconsistencias del número de cuenta.
  • Filtrado y limpiado los datosasegurando que solo queden gastos relevantes.
  • Transacciones agrupadas por mes y trimestre para calcular el gasto.
  • Visualizaciones generadascomo gráficos de línea para el análisis de tendencias.
  • Hallazgos resumidos En un informe claro y estructurado.

Antes de la ejecución, Colab solicitó un mensaje de confirmación, recordándome que podría interactuar con las API externas.

Hizo todo esto muy rápida y suavemente en el navegador, en cuestión de segundos. Y fue impresionante verlo funcionar a través del análisis y la programación con descripciones visibles paso a paso de lo que estaba haciendo.

Sin embargo, finalmente generó un gráfico inexacto que muestra solo el gasto de servicios públicos de un mes, sin reconocer que las hojas incluyeron un año completo que vale la pena romper por meses. Cuando le pedí que lo revisara, lo intentó, pero finalmente no pudo producir la cadena de código correcta para responder a mi mensaje.

Intenté desde cero con exactamente el mismo mensaje en un nuevo cuaderno en Google Colab, y produjo un resultado mucho mejor pero aún extraño.

Tendré que intentar solucionarlo un poco más, y como dije, el resultado erróneo inicial puede deberse a mi propia falta de experiencia utilizando herramientas de ciencia de datos.

Precios de colab y características de IA

Si bien Google Colab sigue siendo gratuito, los usuarios que necesitan energía de cálculo adicional pueden actualizarse a los planes pagados:

  • Colab Professional ($ 9.99/mes): 100 unidades de cómputo, GPU más rápidas, más memoria, acceso terminal.
  • Colab Professional+ ($ 49.99/mes): 500 unidades de cómputo, actualizaciones de GPU prioritarias, ejecución de fondo.
  • Colab Enterprise: Integración de Google Cloud, generación de código con IA.
  • Pago: $ 9.99 por 100 unidades de cómputo, $ 49.99 por 500 unidades de cómputo.

Además del agente de ciencia de datos, Google ha ampliado las capacidades de IA dentro de Colab.

Google recopila las indicaciones, el código generado y los comentarios de los usuarios para mejorar sus modelos de IA. Si bien los datos se almacenan por hasta 18 meses, se anonimizan y las solicitudes de eliminación no siempre se pueden cumplir. Se recomienda a los usuarios que no envíen información confidencial o private, ya que los revisores humanos pueden procesar las indicaciones. Además, el código generado por IA debe revisarse cuidadosamente, ya que puede contener imprecisiones.

Comentarios Bienvenido

Google alienta a los usuarios a proporcionar comentarios a través de la comunidad de Discord de Google Labs en el canal #Knowledge-Science-Agent.

Con la automatización impulsada por la IA convirtiéndose en una tendencia clave en la ciencia de datos, el agente de ciencia de datos de Google en Colab podría ayudar a los investigadores y desarrolladores a centrarse más en las concepts y menos en la configuración de codificación. A medida que la herramienta se expande a más usuarios y regiones, será interesante ver cómo da forma al futuro del análisis asistido por AI.


Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles