banner

blog

Dec 01, 2023

Quando a IA pode fazer arte

Geradores de imagens como o Dall-E 2 podem produzir imagens em qualquer tema que você desejar em segundos. Alguns criativos estão alarmados, mas outros são céticos em relação ao hype

Quando o artista conceitual e ilustrador RJ Palmer testemunhou pela primeira vez o fotorrealismo refinado das composições produzidas pelo gerador de imagens AI Dall-E 2, sua sensação foi de desconforto. A ferramenta, lançada pela empresa de pesquisa de IA OpenAI, mostrou uma melhoria significativa em relação ao Dall-E de 2021 e foi rapidamente seguida por rivais como Stable Diffusion e Midjourney. Digite qualquer prompt surreal, de Kermit, o sapo no estilo de Edvard Munch, a Gollum, de O Senhor dos Anéis, banqueteando-se com uma fatia de melancia, e essas ferramentas retornarão uma representação surpreendentemente precisa momentos depois.

A internet se divertiu com as oportunidades de criação de memes, com uma conta no Twitter documentando "estranhas gerações Dall-E" acumulando mais de um milhão de seguidores. A Cosmopolitan anunciou a primeira capa de revista gerada por IA do mundo, e os investidores em tecnologia começaram a acenar para a nova era da "IA generativa". Os recursos de geração de imagens já se espalharam para o vídeo, com o lançamento do Google Imagen Video e do Meta Make-A-Video.

Mas as novas proezas artísticas da IA ​​não foram recebidas com tanto entusiasmo por alguns criativos. "A principal preocupação para mim é o que isso fará com o futuro não apenas da minha indústria, mas das indústrias humanas criativas em geral", diz Palmer.

Ao ingerir grandes conjuntos de dados para analisar padrões e construir modelos preditivos, a IA provou ser superior aos humanos em algumas tarefas. É esse nous de trituração de números que levou uma IA a derrotar o campeão mundial de Go em 2016, calculando rapidamente a estratégia de jogo mais vantajosa e sem medo de executar movimentos que teriam provocado escárnios se tivessem vindo de uma pessoa. Mas até recentemente, produzir resultados originais, especialmente trabalhos criativos, era considerado uma atividade distintamente humana.

Melhorias recentes na IA mudaram o dial. Não apenas os geradores de imagens de IA agora podem transpor frases escritas em novas imagens, mas avanços também foram feitos na geração de fala por IA: grandes modelos de linguagem, como GPT-3, atingiram um nível de fluência que convenceu pelo menos um pesquisador do Google recentemente demitido de senciência da máquina. Conecte a obra de Bach e uma IA pode improvisar música mais ou menos no mesmo estilo – com a ressalva de que muitas vezes seria impossível para uma orquestra humana realmente tocar.

Essa classe de tecnologia é conhecida como IA generativa e funciona por meio de um processo conhecido como difusão. Essencialmente, enormes conjuntos de dados são reunidos para treinar a IA e, por meio de um processo técnico, a IA é capaz de criar um novo conteúdo que se assemelhe aos dados de treinamento, mas não seja idêntico. Depois de ver milhões de fotos de cães marcados com a palavra "cachorro", ele é capaz de estabelecer pixels na forma de um filhote totalmente novo que se assemelha ao conjunto de dados o suficiente para que não tenhamos nenhum problema em rotulá-lo de cachorro. Não é perfeito - as ferramentas de imagem AI ainda lutam para renderizar mãos que parecem humanas, as proporções do corpo podem estar erradas e elas têm o hábito de produzir escrita sem sentido.

Embora os usuários da Internet tenham abraçado esse potencial criativo supercarregado – armados com o prompt corretamente refinado, até os novatos podem agora criar telas digitais impressionantes – alguns artistas se recusaram à capacidade de imitação da nova tecnologia. Entre os prompts inseridos nos geradores de imagem Stable Diffusion e Midjourney, muitos marcam o nome de um artista para garantir um estilo esteticamente mais agradável para a imagem resultante. Algo tão mundano quanto uma tigela de laranjas pode se tornar atraente se renderizado no estilo de, digamos, Picasso. Como a IA foi treinada em bilhões de imagens, algumas das quais são obras protegidas por direitos autorais de artistas vivos, ela geralmente pode criar uma aproximação bastante fiel.

Alguns estão indignados com o que consideram roubo de sua marca artística. Greg Rutkowski, um artista conceitual e ilustrador conhecido por suas cenas épicas de fantasia com luz dourada, já foi mencionado em centenas de milhares de prompts usados ​​em Midjourney e Stable Diffusion. "Faz apenas um mês. E daqui a um ano? Provavelmente não conseguirei encontrar meu trabalho porque [a internet] será inundada com arte de IA", disse Rutkowski ao MIT Technology Review. "Isso é preocupante."

COMPARTILHAR