E o DALL-E 2, o sistema de IA da OpenAI já está em versão beta. Confira os detalhes da nova fase desse importante software.
Há poucos dias a OpenAI anunciou que o DALL-E 2, o sistema de inteligência artificial que pode gerar imagens a partir de um aviso ou editar e refinar imagens existentes, já está disponível em versão beta e que também irá agilizar o acesso de clientes na lista de espera com o meta de atingir cerca de 1 milhão de pessoas nas próximas semanas.
DALL-E 2, o sistema de IA da OpenAI já está em versão beta
Com esta versão “beta”, o DALL-E 2, que antes era de uso gratuito, passará para uma estrutura de taxas baseada em crédito. Novos usuários receberão um número limitado de créditos que podem ser usados para gerar ou editar uma imagem ou criar uma variação de uma imagem.
A OpenAI anunciou que convidaria mais pessoas para experimentá-lo, pois planeja deixar até 1 milhão de pessoas em sua lista de espera nas próximas semanas, à medida que passa da fase de pesquisa para a fase beta.
Não está claro se o DALL-E estará totalmente disponível ao público, mas espera-se que a expansão seja um grande teste para a plataforma, com muitos pesquisadores monitorando como a tecnologia será mal utilizada.
A OpenAI manteve o DALL-E monitorado de perto por medo de que indivíduos mal-intencionados usem essa ferramenta poderosa para espalhar informações erradas.
Imagine alguém tentando usá-lo para fabricar imagens da guerra na Ucrânia ou criar imagens realistas de desastres naturais que nunca aconteceram.
Além disso, construir uma imagem com a plataforma consome tanta energia que os funcionários da empresa temiam que seus servidores falhassem se muitas pessoas tentassem usá-la ao mesmo tempo.
Além de alguns outros novos recursos, a principal diferença com este segundo modelo é uma grande melhoria na resolução da imagem, latências mais baixas (o tempo que leva para criar a imagem) e um algoritmo mais inteligente para criar as imagens.
O software não só cria uma imagem com um estilo único, como pode adicionar diferentes técnicas artísticas conforme sua solicitação, inserindo estilos de desenho, pintura a óleo, maquete de plasticina, tecelagem de lã, desenhada na parede de uma caverna ou até mesmo como pôster.
Há também formas de incentivar Dall-E a produzir conteúdo que o termo busca filtrar. Enquanto o sangue acionaria o filtro de violência, um usuário poderia digitar “uma poça de ketchup” ou algo semelhante na tentativa de ignorá-lo.
Quando se trata da tecnologia em torno da imagem de IA, parece óbvio que ela pode ser manipulada de várias maneiras: propaganda, notícias falsas e imagens adulteradas vêm à mente como maneiras óbvias.
Para evitar isso, a equipe da OpenAI por trás do Dall-E implementou uma política de segurança para todas as imagens na plataforma que funciona em três etapas.
A primeira etapa é filtrar os dados que incluem uma violação grave. Isso inclui violência, conteúdo sexual e imagens que a equipe consideraria inadequadas.
Além da política de segurança da equipe, eles têm uma política de conteúdo clara que os usuários devem aderir, como Joanne Jang, gerente de produto da DALL-E, diz que a empresa ainda está refinando suas políticas de conteúdo, que agora proíbem o que seria esperado*: criar violência, pornográfico e conteúdo de ódio. A empresa também proíbe imagens de urnas e protestos,
O DALL-E também proíbe retratos de pessoas reais e planeja implementar mais medidas de segurança à medida que seus pesquisadores aprendem como os usuários interagem com o sistema.
Jang disse que:
“No momento, achamos que há muitas incógnitas que gostaríamos de lidar melhor. Planejamos aumentar rapidamente e convidar mais e mais pessoas à medida que ganhamos confiança.”
Especialistas dizem que, embora os algoritmos de imagem já existam há algum tempo, a velocidade, precisão e amplitude do DALL-E representam um avanço notável no campo.
Phillip Isola, professor de ciência da computação do MIT que trabalhou anteriormente com Open AI (mas não é mais afiliado), disse que:
“O que DALL-E faz é capturar um elemento da imaginação humana. Não é realmente diferente de como os humanos podem ler um livro e imaginar coisas, mas é ser capaz de capturar essa inteligência com um algoritmo. Claro, há muitas preocupações sobre como esse tipo de tecnologia pode ser mal utilizado.”