Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
La gente ahora puede incorporar Fotografías inspiradas en Studio Ghibli generado por chatgpt en sus negocios. Opadai ha agregado el modelo detrás de su herramienta de generación de imágenes muy fashionable, utilizada en ChatGPT, a su API.
El modelo GPT-Picture-1 permitirá a los desarrolladores y empresas “integrar la generación de imágenes de alta calidad y de grado profesional directamente en sus propias herramientas y plataformas”.
“La versatilidad del modelo le permite crear imágenes en diversos estilos, seguir las pautas personalizadas fielmente, aprovechar el conocimiento del mundo y realizar el texto con precisión, desbloqueando innumerables aplicaciones prácticas en múltiples dominios”, dijo Openii en un weblog.
El precio de la API separa tokens para texto e imágenes. Los tokens de entrada de texto, o el texto rápido, costarán $ 5 por 1 millón de tokens. Los tokens de entrada de imagen serán de $ 10 por millón de tokens, mientras que los tokens de salida de imagen, o la imagen generada, serán la friolera de $ 40 por millón de tokens.
Los competidores como la estabilidad ai ofrecen un Sistema basado en crédito para su API donde un crédito es igual a $ 0.01. Uso de su imagen estable insignia Extremely cuesta ocho créditos por generación. Modelo de generación de imágenes de Google, Imagen, CARGAS PAGADOS USUARIOS $ 0.03 por imagen generada usando la API de Géminis.
Generación de imágenes en un solo lugar
OpenAI permitió a los usuarios de ChatGPT a generar y editar imágenes directamente en la interfaz de chat en abril, unos meses después Agregar generación de imágenes a chatgpt a través del modelo GPT-4O.
La compañía dijo que la generación de imágenes en la plataforma de chat “se convirtió rápidamente en una de nuestras características más populares”. Operai dijo que más de 130 millones de usuarios han accedido a la función y crearon 700 millones de fotos solo en la primera semana.
Sin embargo, esta popularidad también presentó a OpenAi algunos desafíos. Los usuarios de las redes sociales descubrieron rápidamente que podían incitar a ChatGPT a generar imágenes inspiradas en el estudio Juggernio de animación japonés Ghibli, y como resultado, mis alimentos en las redes sociales estaban llenas de las mismas fotos durante todo el fin de semana. La tendencia impulsó al CEO de OpenAi Sam Altman para reclamar Las GPU de la compañía “se están derritiendo”.
Operai agregó previamente su modelo de imagen Dall-e 3 en chatgpt. Ese modelo period un modelo de transformador de difusión en lugar de la comprensión multimodal nativa que tiene GPT-4O.
Casos de uso empresarial
Las empresas quieren la capacidad de generar imágenes para sus proyectos, y muchas no quieren abrir una aplicación separada para hacerlo. Al agregar el modelo de imagen a su API, OpenAI permite a las empresas conectar GPT-Picture-1 a sus propios ecosistemas.
Operai dijo que ya ha visto que varias empresas y nuevas empresas usan el modelo para proyectos creativos, productos y experiencias, nombrando varias marcas conocidas en su publicación de weblog.
Según los informes, Canva está explorando formas de integrar GPT-Picture-1 para sus herramientas de estudio de Magic AI y Magic. GoDaddy ya ha comenzado a experimentar con la generación de imágenes para que los clientes creen sus logotipos, y AirTable ahora permite a los equipos de advertising empresarial y creativos administrar fácilmente los flujos de trabajo de activos a escala.
Operai dijo que GPT-Picture-1 obtendrá las mismas barandillas de seguridad en la API que en ChatGPT. La compañía dijo que las imágenes generadas con el modelo incluyen de forma nativa de los metadatos de la Coalición para la procedencia y la autenticidad de contenido (C2PA) que etiqueta el contenido como generado por IA y rastrea la propiedad. Operai es parte de C2PA’s Comité Directivo.
Los usuarios también pueden controlar la moderación de contenido para generar imágenes que mejor se alineen con su marca.
Operai prometió que no utilizará datos de API de clientes, incluidas las imágenes cargadas o generadas por GPT-Picture-1 para entrenar a sus modelos.