Copyright Storm — Autoria na era da Inteligência Artificial

Vanessa Rosa
8 min readJul 18, 2021

--

Imagem gerada por uma GAN a partir de fotos publicadas no Instagram e em sites especializados — não pretendo vender essa imagem, fiz para ilustrar meu argumento

#thisisnotastorm

Esta imagem não é uma foto de tempestade. Também não é uma pintura de tempestade. Foi gerada com uma técnica de inteligência artificial conhecida como GAN (Generative Adversarial Network). Uma breve explicação simplificada do que são GANs: modelos de estatística e de visão computacional capazes de criar imagens semelhantes a um conjunto de dados — datasets (para o caso debatido neste artigo, digamos apenas que são uma coleção de imagens). Quanto mais semelhantes forem as imagens no dataset, maior a probabilidade de uma GAN ser capaz de criar um resultado semelhante a essas imagens. Os melhores resultados geralmente precisam de milhares de imagens, mas à medida que a tecnologia melhora, cada vez uma quantidade menor é necessária para que as GANs se pareçam com as originais.

Para ilustrar por que fotógrafos e artistas em geral precisam estar atentos aos avanços da inteligência artificial decidi fazer uma provocação: baixei cerca de 6.500 mil imagens de fotógrafos especializados em perseguição de tempestades. Para tal, digitei “storm chasing photography” (fotografia de quem persegue tempestade) no google, encontrei um artigo que destacava 5 desses artistas, entrei em seus sites e baixei todas as fotos que pude. Os sites deixaram bem claro que tais fotos possuem direitos autorais e estão disponíveis para compra de licença. Ainda assim, usando uma simples extensão de navegador, consegui cerca de 1.500 fotos de alta qualidade. Não satisfeita com a quantidade, verifiquei a hashtag “stormchasing” no Instagram e encontrei perfis especializadas no assunto. Em seguida, baixei todas as imagens dessas contas e limpei as poucas não relacionadas a tempestades do meu dataset. A parte mais difícil foi pedir ajuda para instalar um data scrapper do Instagram, que me permitiu baixar todas as fotos de uma conta ou hashtag com apenas um comando.

Mais tempestades de GANs — muitas das imagens parecem pinturas abstratas porque o conjunto de dados era consideravelmente pequeno, não foi treinado por tempo suficiente ou as fotos eram muito diversas. Isso dá um estilo artístico interessante, mas no caso desta imagem esse estilo pertence mais a GAN do que a mim. Depois de um tempo, grande parte da estética GAN começa a ter a mesma aparência.

282 imagens de @cataclysms_of_nature, 682 @willeadesphotography, 457 de @world_of_thunders, 413 de @adamkylejackson e mais. Levei algumas horas para reunir tudo, então enviei o dataset para Runway, uma plataforma muito user friendly que executa algoritmos de IA em computação de nuvem (quer dizer, remotamente) e tem tornado o aprendizado de máquina muito mais acessível para artistas. Em 8 horas, a GAN foi treinada, aprendendo a pintar tempestades enquanto eu dormia feliz. Custa cerca de 30 dólares para gerar essas imagens no Runway, o poder de computação necessário para rodar muitos modelos de IA ainda é muito caro — mas existem opções gratuitas, como o Google Colab, que não tem uma interface intuitiva e precisa de mais conhecimento de programação. Se eu tivesse treinado com 50 mil fotos de tempestades, os resultados provavelmente ficariam igual a uma foto, como esses projetos da Nvidia.

Como artista, a ideia de fazer isso e vender as imagens resultantes como meu próprio trabalho é bastante chocante. Não acho que faça sentido para mim assinar essas imagens como minhas, pois não fui eu que aprendi a fazer essas composições, nem fui eu quem tirou as fotos. Eu mal posso afirmar que selecionei essas imagens, já que as hashtags e os sites que listam os fotógrafos tornaram muito fácil encontrar alguns dos melhores caçadores de tempestades. Existem muitas ferramentas que podem localizar imagens com base na similaridade, então a criação do conjunto de dados também pode ser automatizada com um código bem projetado (eu recomendo altamente o site same.energy!). Para mim, faz muito mais sentido chamar isso de trabalho colaborativo, uma obra de arte crowdsourced, já que a qualidade das imagens finais depende da qualidade do conjunto de dados.

IA é mais do que uma ferramenta, é tão poderosa em suas próprias habilidades de criação que poderíamos chamá-la de colaborador. Mas dar tanto crédito à IA também pode ser complicado, já que sou eu a responsável por alimentar a GAN com trabalhos de outros artistas que não consentiram com isso. E muito provavelmente se sentiriam prejudicados por um sistema generativo baseado em seu trabalho que pode propor o mesmo tipo de produto que eles amam, arriscam a vida para criar e vender: imagens de tempestades. Porém, como o conhecimento sobre esse tipo de técnica não é muito difundido e os dados são fáceis de encontrar na internet, não há incentivos suficientes para a transparência e muito menos para pagar qualquer tipo de royalties pelos dados. Reconhecer os artistas que fazem parte de um dataset deveria ser uma cortesia óbvia, mas se a maioria das pessoas nem mesmo sabe o que é um dataset, como podemos garantir isso?

Fiz um GAN a partir de um vídeo que filmei na Amazônia em 2018 — basta transformar um vídeo em sequência de imagens e enviar para a modelo. Portanto, é fácil criar uma GAN a partir de qualquer vídeo da internet.

No entanto, as questões em torno da IA ​​e de direitos autorais são muito mais complicadas do que a ética dos artistas e sua transparência sobre as práticas dos conjuntos de dados. Modelos mais recentes lançados pela Open AI e outros grupos de pesquisa são treinados em milhões de imagens coletadas da internet. Com as combinações mais recentes do modelo CLIP text2image (ou o próximo modelo ainda no forno, o Dall-E, que promete ainda mais), as pessoas podem apenas fornecer um aviso de texto, como “uma paisagem no estilo de MC Escher” e a IA é capaz de fazer algo original. Os resultados são fascinantes. Os modelos já estão entregando imagens com composições interessantes, fundos complexos, colocando chapéus e enfeites nos lugares certos, interpretando frases abstratas. Digo interpretar porque a qualidade e inventividade das imagens vão muito além do tipo de estatística de pixels fornecida pelos modelos GAN anteriores. Esses modelos mais novos ainda são experimentais e não foram lançados para aplicações comerciais, mas pesquisadores e artistas independentes conseguiram usar o que foi publicado pela Open AI e já estão experimentando. Abaixo algumas das imagens resultaram de frases que eu propus para o CLIP.

‘Uma paisagem ao estilo de MC Escher’. Esta frase foi o imput no google colab montado por @Adverb (Ryan Murdock)
Frase ‘um homem feito de padrões geométricos’ — fiquei realmente impressionada com a interpretação aqui.
‘Uma paisagem no estilo do estúdio Ghibli’ — Eu amo o estúdio Ghibli, me pergunto como essas técnicas irão impactar seus negócios. Os estúdios podem se adaptar rápido o suficiente? Tenho certeza que a Disney / Pixar pode, mas muitos não.

Nossas noções de autoria e copyright fazem pouco sentido com tais técnicas. Parece absurdo que alguém possa ser processado por usar uma imagem comercialmente sem uma licença adequada, mas pode-se treinar um modelo usando um corpo de trabalho de um artista vivo aleatório (portanto, centenas ou milhares de imagens) como um conjunto de dados. Podemos realmente dizer que é uso justo da propriedade intelectual se sabemos que isso terá um impacto econômico para todos os tipos de criadores? As imagens geradas possuem composições e cores semelhantes se comparadas às originais, mas são diferentes (variando de muito semelhantes a uma semelhança abstrata), portanto é bem possível que mesmo o artista inicial não percebesse a ligação com seu próprio trabalho, principalmente se ele não estiver familiarizado com a estética particular dos modelos de IA. É muito difícil impor leis de direitos autorais sobre essas criações. As leis de direitos autorais, como são hoje, muitas vezes também não são benéficas para os artistas, mas abolí-las completamente é provavelmente ainda pior. A regulamentação é muito lenta para acompanhar o progresso da tecnologia e, provavelmente, será ineficaz de qualquer maneira. Regras em demasiado acaba sufocando a inovação para algumas empresas, enquanto outra certamente continuará a pesquisa (veja abaixo o que está acontecendo na China). Portanto, os artistas precisam tentar entender o que a IA é capaz de fazer, porque muito em breve eles começarão a sentir seu impacto em seu próprio mercado.

Um artigo publicado recentemente por um grupo de pesquisa chinês não escondeu as marcas d’água do Shutterstock que apareciam em seus resultados. A Shutterstock, com todos os seus problemas, pelo menos paga royalties para os artistas. Este modelo de negócios mudará.

Quando a fotografia inicialmente se tornou acessível, ela mudou radicalmente as possibilidades de criação de imagens e até mesmo a maneira como os pintores pensavam sobre sua prática. A pintura não morreu por causa da fotografia, mas certamente mudou. À medida que as falsificações (deep fake) de IA se espalham, será essencial ter algum tipo de certificado digital para garantir que uma foto ou vídeo foi realmente filmado com uma câmera em um local em um momento específico. Ganhar dinheiro com o licenciamento de fotos se tornará obsoleto. Como reproduzir qualquer estilo de imagem será uma tarefa simples, artistas podem colocar mais foco no processo, ou nos materiais, performance, ou farão simulações mais complexas em ambientes de realidade mista. Pessoalmente, vejo muito potencial para animação independente e IA. As pessoas encontram suas maneiras de se adaptar, a sociedade muda, mas para muitos profissionais (contadores, advogados, artistas, engenheiros e quase todos os outros), a IA provavelmente trará uma crise em seu mercado de trabalho (Yuval Harari tem falado muito sobre isso).

Minha primeira experiência com IA e narrativa. Todas as imagens foram geradas pelo modelo text2image antes mencionado, então animei o personagem com o “Modelo de movimento de primeira ordem para animação de imagem” e a ferramenta de tela verde da Runway

Todos nós estamos contribuindo para o desenvolvimento de IA hoje em dia. Tudo o que fazemos na internet pode ser usado como dado para treinar algum tipo de modelo de IA. Também usamos plataformas online para nossas próprias necessidades, mas há um claro desequilíbrio entre as pessoas que fornecem seus dados e aquelas, principalmente grandes empresas de tecnologia, que não apenas fornecem, mas coletam grandes quantidades de dados e lucram com isso. Quando artistas carregam conteúdo no Instagram, eles praticamente dão ao Instagram o direito de fazer o que quiserem com ele. O mundo cripto promete proteger os criadores de conteúdo, permitindo que eles sejam os donos legais de tudo o que compartilham, o que me parece um caminho importante a seguir — embora tudo seja muito experimental até agora e as plataformas NFT já estão cheias de copiadores (copy minters) e outros labirintos de direitos autorais.

Mais do que uma mudança tecnológica específica, a percepção das pessoas sobre como conteúdo é criado e espalhado é a chave para garantir um futuro animador para quem vive de criar imagens. Apoio profundamente a abordagem de Gene Kogan sobre IA como inteligência coletiva, como ele destaca o potencial do NFT para colaborações massivas; desde o nível do conjunto de dados, não apenas nas redes sociais, mas também nos arquivos de domínio público (as melhores fontes para criar conjuntos de dados incríveis! temos que agradecer profundamente a equipe destas instituições!), aos programadores e profissionais de marketing e quem mais estiver envolvido num projeto. Isso não significa que artistas não possam mais produzir individualmente, nem que toda pessoa que trabalhe com IA necessariamente precise perceber e vender seu trabalho como uma criação coletiva. Mas se destacarmos a colaboração em vez da competição, podemos ir muito mais longe e viver melhor :) . Com DAOs (Organizações Autônomas Descentralizadas) poderíamos criar a diferentes modelos de organização, mais horizontais.

Acho que é perigoso tratar as imagens geradas por IA da mesma forma que pensamos em qualquer outra ferramenta de criação de imagens, incluindo colagens. Eu adoraria fazer outro longo artigo sobre a história da autoria nas artes e o conceito de gênio, como isso mudou desde a época em que os artistas trabalhavam em guildas cooperativas (e nem mesmo assinavam a obra) para o estereótipo do criador excêntrico e perturbado que é um grande gênio e está isolado de todos os outros. Um equilíbrio entre transparência e privacidade, além de educação e descentralização, é fundamental para evitar os piores resultados do desenvolvimento tecnológico. Não podemos nos dar ao luxo de tratar as tecnologias como caixas pretas. Acho que o melhor que os artistas podem fazer para se proteger e prosperar é realmente prestar atenção ao que são essas tecnologias, aprender sobre elas, desde seus impactos assustadores até seus belos potenciais.

Se você quiser aprender mais sobre IA e criação de arte, recomendo os seguintes sites:

ml4a.net

Towards data science

Artificial images

Runway

Lex Fridman podcast — não tanto para arte, mas para ótimas conversas com cientistas e filósofos (e alguns convidados que não aprecio particularmente, mas ainda vale a pena dar uma olhada!)

E siga artistas e pesquisadores que trabalham com IA no Twitter, que é de longe a plataforma mais atualizada para esse tipo de discussão.

--

--

Vanessa Rosa

va2rosa.com. I'm a weird combination of extremely rational with extremely intense/impulsive. Sometimes I manage to find balance.