Nei Bomfim/ Immersera over
Wombo [incorrect] delivery
Entrega errada do padrão dois-olhos pelo Wombo a prompt que pedia 'Cíclope'; para intrigar, anulei um olho com blackout
Como a Gen AI classe fraca pode salvar e vitaminar o 0.1-Sec-Positioning
Como a Gen AI classe fraca pode salvar e vitaminar o 0.1-Sec-Positioning
Prompts muito bem escritos e criativos — e um tanto de sorte — podem gerar visuais anti-0.1-Sec-Scrolling eficazes; mas só 1 em 9 apps que testei conhecia Cíclopes, tema da Id Visual da Immersera, apesar dos X-Men
O posicionamento da marca — conquistar um lugar nos corações e mentes, conforme Kottler, Ries e Trout — está se transformando do processo analógico, no qual humanos traduzem conceitos em visuais, textos etc., para um processo muito, muito mais dinâmico — e implacável.
Perceber essa mudança é crucial porque as marcas online têm apenas 0,1 segundo para causar uma primeira impressão (Missouri Univ), mais ainda agora, nesta era AImersiva, como a batizei. A capacidade de uma marca de conseguir esse 0.1-Sec-Positioning determinará se ela fisga e arrasa ou se cai no 0.1-Sec-Scrolling. É aí que os visuais entram — e se firmam como padrão absoluto.
A boa notícia nesse contexto é que podemos criar esses visuais 0.1-Sec-Positioning injetando os prompts de Gen AI com “células germinativas,” como chamo um tipo mais trabalhoso, às vezes mais criativo, de prompt-modifiers. Como isso acontece é o que veremos neste artigo.
Eu testei essa criação desses visuais 0.1-Sec-Positioning em nove apps, tanto gratuitos quanto pagos, de DALL-E a Midjourney e Stable Diffusion. Usei minha rede, Immersera, como o objeto de teste, já que nosso positioning é… 0.1-Sec-Positioning. Isso exigiu legal da Gen AI ao desafiá-la com uma missão para lá do positioning: um metaposioning, haha — ou seja, visuais via visuais .
A dificuldade dessa missão piorou porque, lembre-se, Gen AI é atualmente “classe fraca”, um LLM (Large Language Model), em vez de “inteligência.”
Desafio do circo
Como esse Positioning-or-Scrolling acontece naquele flash de 0,1 seg, você precisa simultaneamente:
- 1) Neutralizar essa inércia letal do 0.1-Sec-Scrolling sobre o conteúdo da sua marca — por meio de alguma atração — naquele mesmo 0,1 seg…
- 2) …por meio do quê? Da exibição consistente do seu 0.1-Sec-Positioning — o que implica…
- 3) …que essa atração deve aparecer não vagamente como mera fisga, mas focadamente posicionada para a(s) audiência(s) desejada(s).
Lembrando que todos esses passos devem ser instantâneos e simultâneos. Ou seja, hipnóticos como malabares de circo.
Assim, resulta como inescapável que, se esses três elementos não estiverem simultaneamente presentes e muito bem manipulados, a inércia do scrolling que essa atração de 0,1 seg teria interrompido pode imediatamente retomar seu ritmo — às custas da marca. (Este 0,1 seg é minha interpretação livre do teste de visão da Missouri Univ de 2012. Ele verificou que “os usuários levam menos de dois décimos de segundo para formar uma primeira impressão sobre um site”.Por favor, me conte aqui se você conhece um novo estudo consistente sobre isso).
Ok, positioning certamente vai além desse 0,1 seg quando a marca escapa do scrolling. No entanto, como o acesso online e móvel é absolutamente dominante, sua marca só terá sucesso se for além desse primeiro passo. Ponto.
Portanto, todo o processo de 0.1-Sec-Positioning-or-Scrolling depende totalmente dos visuais, especialmente nesta era de IA imersiva. Comprove isso nos dados abaixo.
Depois de ser o único a acertar o Cíclope no CoPilot, DALL-E beirou o cômico no Canva: respondeu com esses dois-olhos
Visão: 70% de todos os sensores humanos
A coisa toda diz respeito exclusivamente aos visuais por razões evolutivas:
> Nossos olhos concentram cerca de 70% de todos os sensores do corpo;
> 40% do córtex está envolvido no processamento/compreensão de informações visuais;
> 80% de todas as informações chegam até nós através dos olhos;
> Reagimos primeiro aos visuais e os retemos; 93% da comunicação é não-verbal;
> Imagens vão direto para a memória de longo prazo; já palavras vão para a de curto prazo, que retém só cerca de 7 bits.
Além disso, o papel dos visuais — e, bem num strike de boliche, o posicionamento digital, Comms etc. — foi fortemente redesenhado por
1) Uma imersão planetária na tela causada pela pandemia — que obviamente aconteceu principalmente por meio de visuais;
2) O atual paradoxo da AImersão Gen, que consiste numa revolução e padronização simultâneas dos visuais. Esse paradoxo se mostra naquelas fotos supercoloridas de esquilos astronautas, por exemplo. Elas evidentemente são um surrealismo barato de shopping. Considerando a necessidade crucial das marcas de diferenciação e as possibilidades da Gen AI de suprir isso, esse diagnóstico de padronização é um verdadeiro “paradoxo” vermelho piscante.
Visuais: login da marca na sua audiência
Esse surrealismo barato de shopping piora a situação porque já vinha uma enxurrada de imagens repetidas de bancos de imagens que poderíamos chamar de imagens TaNoCo (Table+Notebook+Coffee) — apesar da riqueza fabulosa desses bancos, em muitos casos gratuita ainda por cima. Artigos no Medium enunciam essa enxurrada.
O pecado da preguiça converteu esses recursos numa função “mecânica” pobre, não mais as riquíssimas emocionais esperadas de uma imagem. (Falaremos muito sobre visuais neste blog).
Pelo contrário, todos os dados acima demonstram que devemos realocar visuais/imagens até mesmo de sua função analógica atual de “ilustração”. Ou seja, esse fundamento do 0.1-Sec-Positioning-or-Scrolling converteu visuais no login real da marca no seu público.
Não é de admirar, portanto, que as empresas de IA façam da visão a primeira escolha sobre todos os outros sentidos humanos.
Com base nisso, a atual era AImersiva está convertendo a missão de positioning num processo, digamos, zeta-informado. Esta mudança por si só obviamente não garante um conteúdo visual tocante, como veremos abaixo. Daí a importância da curadoria humana. Mas podemos ter boas surpresas (abaixo).
Primordialidade dos visuais = gigantes de um olho só
Vamos ao teste real e prático.
1- A Immersera precisa se posicionar como especialista em 0.1-Sec-Positioning (por meio de alguns serviços*). Com base nos dados acima, qual poderia ser o agente do metapositioning da Immersera senão os visuais?
2- Aprofundei então a percepção de que precisava de visuais — da identidade visual às imagens dos posts etc. — capazes de injetar em 0,1 seg a sensação dos visuais como os reis da injeção de positioning (sempre aquele maldito metapositioning, haha);
3- Encontrei um ícone para materializar de imediato essa demanda: os fantásticos gigantes de um olho só, os Cíclopes (lembra? Vão dos ferreiros celestiais gregos até os X-Men). “Cíclopes” se traduz por “olho circular”, o que significa foco iterativo e circular — portanto, o visual que atrai para o visual. Você consegue ser indiferente ao olhar único dos Ciclopes?
4- Então, solicitei a nove apps Gen AI fazerem um desenho a lápis clássico de dois rostos de Cíclopes contemporâneos representando a polarização entre positioning e scrolling. Esta opção por um lápis quase franciscano visa distinguir a Immersera daquela enxurrada de supercoloração padronizada etc. Assim, para ajudar a diferenciar o resultado e gerar um positioning ainda mais agudo,
- Projetei os Cíclopes, um, como um garoto comum da periferia brasileira e o outro, como homem/mulher de 35 anos com cabelo cacheado.
- A dupla, que chamei de Takuara e Robson, “obviamente deve ter um olho só”, enfatizei para os nove apps testados.
Cíclope do Midjourney: tão falho como os outros apps menos famosos, também errou ao fornecer caras no padrão dois-olhos
8 a 1
Os nove aplicativos que testei abrangeram desde aqueles associados ao DALL-E (Bing/ CoPilot, Canva) até Midjourney, Stable Diffusion, AI ART Generator, DaVinci AI Photo Gen, Imagine AI Art Generator, Wombo e Wonder AI Art Generator.
SÓ UM desses aplicativos, Bing/ DALL-E, sabia o que eram aqueles malditos Cíclopes — apesar de essas criaturas serem uma atual personagem lucrativa de filmes e jogos. Só que outra plataforma alimentada pelo DALL-E, o Canva, também falhou: entregou uns caras triviais, de dois olhos. Mesma frustração no Stable Diffusion e Midjourney — este timidamente apostou em um terceiro olho.
As coisas pioraram com o Wombo. Eu até o municiei com um Cíclope adequado do DALL-E. O Wombo simplesmente destruiu o legítimo olho único de Robson para lhe tascar duas órbitas oculares. Bem, todos nós sabemos das fraquezas da Gen AI: suas bibliotecas, parâmetros de treinamento e, consequentemente, os pareamentos.
Isso não significa que foi fácil negociar com o Bing CoPilot/DALL-E: tive de escrever várias réplicas de até 2k caracteres (aliás, este blog também incluirá artigos sobre prompts). Finalmente, ele entregou o Cíclope Takuara, o garoto que pisca tanto por causa do scrolling, e Robson, o sujeito de piscada mais lenta graças ao positioning.
Você também pode conferir como o Bing/DALL-E respondeu a uma das minhas réplicas para positioning visual — sempre via visuais — num estilo clássico de lápis. Ele simplesmente introduziu um lápis gigante na imagem (!!): ou seja, converteu o que era uma solicitação de estilo, numa personagem (!!). Sobre Takuara e Robson, você pode ver a versão oficial da dupla na página inicial deste blog.
Posicionamento injetável
Afinal, por que e como “a Gen AI classe fraca pode salvar e vitaminar o 0.1-Sec-Positioning”?
Por causa de sua produtividade astronômica —desde que injetada criativa e precisamente com positioning. Essa injeção precisa é essencial, pois pareamentos e interações intrincados dentro dessas bibliotecas de tamanho zeta podem gerar resultados inesperados — bons (com menos frequência, como sabemos) e outros, alucinados.
De acordo com as regras de cada aplicativo, o statement de posicionamento deve ser cuidadosamente misturada com outros elementos concêntricos (ou seja, quase que redundâncias na busca de precisão) ou excêntricos (adições), sempre com excelência descritiva — claro, com o comprimento permitido por cada app determinando até certo ponto essa excelência;
> clareza;
> manobra cuidadosa de conjunções, cola preciosa para construções verbais detalhadas e intrincadas, numa briga com a síntese. Esse cuidado é crucial sobre as conjunções adversativas, já que IAs podem entender negações como parâmetro afirmativo.
Mantendo a Immersera como exemplo, solicitei um “desenho de Cíclopes em estilo lápis clássico”, adicionando “células germinativas” que vão desde as tão redundantes que chegam a ser ridículas, tipo “órbita de apenas um olho com apenas um olho localizado logo acima do nariz,” até “cara hedonista” (esta só foi no Canva), etc. “Estilo lápis” mais “com o mínimo de traços possível” é uma tentativa de evitar esses resultados indiferenciados e chochos do surrealismo barato de shopping.
Esse processo incluiu vários diferentes prompts e muitas réplicas, às vezes extensas. Mas, como você sabe, por enquanto você perderá em muitos casos.
Um dos dois únicos Cíclopes corretos da safra —um olho—, by CoPilot/DALLE: fiel ao prompt, além de features inesperadas
Surpreendentes nós superalimentados aleatórios
Até você vencer — que é o que acontece quando recebe o que poderíamos chamar de “surpreendentes nós superalimentados aleatórios”. Refiro-me às convergências únicas e altamente aleatórias de pares de texto-imagem com parâmetros de ajuste fino. Exemplifico isso com Takuara e Robson.
A versão da dupla de Cíclopes que escolhi representa 1) Quase todas as “células germinativas” que injetei no prompt e 2) Recursos além dos solicitados.
Por esses “recursos além do solicitado”, quero dizer as inspirações inesperadas que a aparência única de Takuara e Robson provoca. Takuara me parece uma inesperada fusão entre um ancestral ícone africano e um garoto da perifa brasileira. Na polarização 0.1-Sec-Positioning-or-Scrolling, seu piscar frenético representa o 0.1-Sec-Scrolling.
Já Robson inspira um leve hedonismo, que pode ser depreendido de seu rosto largo, quase transcendental e impressão de “câmera lenta” (comparado a Takuara). Seu piscar um pouco mais normal transpira o 0.1-Sec-Positioning— típico de alguém que pára de scrollar justamente porque atraído por uma postagem.
Só que as células germinativas que injetei neste prompt jamais prescreveram “semelhante a um ancestral ícone africano” (Takuara), nem “hedonismo leve etc.” (Robson). Só posteriormente é que, como dito, tentei inutilmente “hedonismo” no Canva. Esses recursos extra-prompt foram, portanto, acidentes felizes: orquestraram uma importante dimensão da percepção — e sempre visual.
Como esses acidentes felizes apareceram? Eles nascem de bibliotecas extensas, de conjuntos de dados a partir de pareamentos texto-imagem e muitos parâmetros (12 bilhões no caso da DALL-E 2, enquanto sua fonte ChatGPT-3 tem 175 bilhões); de um grau significativo do aleatório que surge da apropriação dessas Gen AI por cada app. Tanto que a mesma DALL-E que impressionou via Bing com aprimorados Takuara e Robson, decepcionou com irreconhecíveis Cíclopes de dois olhos (??) no Canva.
Nesse sentido, é interessante experimentar ajustes que os apps oferecem além da grade de estilo pronta para uso. No caso do DALL-E/Bing, o parâmetro Temperatura — de Exato a Criativo e Equilibrado.
E?
Concluindo essas observações, por mais transitórias que sejam (já que esse teste ocorreu do fim de 2023 a maio de 2024), salta como fundamental se reorientar pela prioridade dos visuais no 0.1-Sec-Positioning-or-Scrolling em nossa era AImersiva. Para isso, parece ser importante:
1. Empenhar-se para elaborar prompts excelentes (incluindo emojis etc.): priorizar a clareza (ao ponto da redundância eventualmente ridícula) ao incorporar “células germinativas” inspiradoras; e não economizar nas réplicas;
2. Não esquecer que a atual Gen AI é classe fraca — por isso, ajustar parâmetros e investir esforço e paciência consideráveis;
3. Aceitar riscos em territórios desconhecidos — estímulos inovadores como “punk marketing,” p.ex., e outros podem ajudar por razões pragmáticas.
Ou você ainda prefere surrealismo barato de shopping e fotos TaNoCo? Se puder, comente, por favor.
Na Immersera, baseados na minha sinergia verbo-visual (fui Comms Head de três ministrxs e C.H. consultor da ONU-Mulheres), em minhas certs como IA (USP e Exame) e na expertise da nossa rede, fornecemos consultoria/mentoria em 0.1-Sec-Positioning, conteúdo posicionado, SEO, branding, websites, cases e gerenciamento de crise.)