Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais
As pessoas agora podem nativamente incorporar Imagens inspiradas no estúdio ghibli gerado pelo chatgpt em seus negócios. Openai Adicionou o modelo por trás de sua ferramenta de geração de imagens muito popular, usada no ChatGPT, à sua API.
O modelo GPT-Image-1 permitirá que desenvolvedores e empresas “integrem geração de imagens de alta qualidade e de nível profissional diretamente em suas próprias ferramentas e plataformas”.
“A versatilidade do modelo permite criar imagens em diversos estilos, seguir fielmente as diretrizes personalizadas, aproveitar o conhecimento mundial e renderizar com precisão o texto – desbloqueando inúmeros aplicativos práticos em vários domínios”, disse o Openai em um post no blog.
O preço da API separa os tokens para texto e imagens. Os tokens de entrada de texto, ou o texto rápido, custarão US $ 5 por 1 milhão de tokens. Os tokens de entrada da imagem serão de US $ 10 por milhão, enquanto os tokens de saída da imagem, ou a imagem gerada, serão um enorme tokens de US $ 40 por milhão.
Concorrentes como a estabilidade ai oferecem um sistema baseado em crédito para sua API onde um crédito é igual a US $ 0,01. O uso de sua imagem estável Ultra custa oito créditos por geração. Modelo de geração de imagem do Google, Imagen, cobranças pagando usuários US $ 0,03 por imagem gerada usando a API Gemini.
Geração de imagens em um só lugar
OpenIAI permitiu que os usuários de chatgpt fosse gerar e editar imagens diretamente na interface de bate -papo em abril, alguns meses depois Adicionando geração de imagem ao chatgpt através do modelo GPT-4O.
A empresa disse que a geração de imagens na plataforma de bate -papo “rapidamente se tornou um dos nossos recursos mais populares”. O Openai disse que mais de 130 milhões de usuários acessaram o recurso e criaram 700 milhões de fotos apenas na primeira semana.
No entanto, essa popularidade também apresentou a OpenAI alguns desafios. Os usuários de mídia social descobriram rapidamente que poderiam levar o Chatgpt a gerar imagens inspiradas no estúdio de animação japonês Ghibli e, como resultado, meus feeds de mídia social foram preenchidos com as mesmas fotos para todo o fim de semana. A tendência provocou o CEO da Openai, Sam Altman reivindicar As GPUs da empresa “estão derretendo”.
Openi anteriormente adicionou seu modelo de imagem Dall-e 3 no chatgpt. Esse modelo era um modelo de transformador de difusão, e não o entendimento multimodal nativo que o GPT-4O possui.
Casos de uso corporativo
As empresas desejam a capacidade de gerar imagens para seus projetos, e muitas não querem abrir um aplicativo separado para fazê -lo. Ao adicionar o modelo de imagem à sua API, o OpenAI permite que as empresas conectem GPT-Image-1 aos seus próprios ecossistemas.
O Openai disse que já viu várias empresas e startups usarem o modelo para projetos, produtos e experiências criativos, nomeando várias marcas conhecidas em sua postagem no blog.
O Canva está explorando maneiras de integrar o GPT-Image-1 para suas ferramentas Canva AI e Magic Studio. O GoDaddy já começou a experimentar a geração de imagens para os clientes criarem seus logotipos, e a Airtable agora permite que as equipes criativas e de marketing corporativo gerenciem facilmente os fluxos de trabalho de ativos em escala.
O Openai disse que o GPT-Image-1 receberá os mesmos corrimãos de segurança na API que no ChatGPT. A empresa disse que as imagens geradas com o modelo incluem metadados da Coalizão para Proveniência e Autenticidade do Conteúdo (C2PA) que rotula o conteúdo como gerado pela IA e rastreia a propriedade. Openai faz parte do C2PA’s Comitê de direção.
Os usuários também podem controlar a moderação do conteúdo para gerar imagens que se alinham melhor à sua marca.
A Openai prometeu que não usará dados da API do cliente, incluindo quaisquer imagens enviadas ou geradas pelo GPT-Image-1 para treinar seus modelos.
Deixe um comentário