Dicas de prompts para criação de imagens por IA
A criação de imagens realmente boas para ilustrar diferentes situações, sempre foi tarefa de especialistas. Ainda é, mas hoje em dia uma variedade de ferramentas de IA torna esse trabalho mais acessível e rápido.
Por conta do crescente uso e do bom resultado final que é possível obter, no post de hoje vamos falar um pouco a respeito, seja dando dicas de como passar instruções para conseguir o que se quer, seja explicando conceitos importantes para o alinhamento entre resultado e necessidade, seja ainda esclarecendo alguns pontos importantes, especialmente para quem nunca se aventurou nessa área.
Pronto para começar?
O que é engenharia de prompt?
Se você nunca experimentou interagir com um modelo de IA, resumida e simplificadamente, prompt é o sinal gráfico piscando (frequentemente uma barra vertical), que indica o local que você deve digitar texto para se comunicar, para interagir com o modelo de inteligência artificial em questão.
A partir desse entendimento, engenharia de prompt é o conjunto de técnicas para fornecer instruções descritivas, claras, detalhadas e precisas para que um modelo de inteligência artificial produza uma solução prática e eficiente.
Trocando em miúdos, a engenharia de prompt é saber o quê e como pedir a uma IA que entregue o resultado exato que se quer.
Por que é importante conhecer engenharia de prompt?
Se você não sabe explicar o que quer, a IA não consegue “adivinhar” e te entregar
É bastante comum vermos leigos em fotografia, quando veem o trabalho de grandes fotógrafos, fazendo afirmações do tipo: “Impressionantes essas fotos! Sua câmera deve ser muito boa!”.
A questão não é o equipamento, mas o conhecimento empregado na realização da foto que acaba por distinguir uma que seja incrível, de uma outra qualquer.
Pense em uma cozinha profissional. Entregá-la a quem nunca fritou um simples ovo, não fará com que se tenha um prato delicioso. Ou seja, não se trata da quantidade de equipamentos disponíveis, mas do conhecimento, da experiência e do uso das técnicas mais adequadas ao preparo.
Em qualquer área, é isso que distingue o resultado e não o equipamento que se utiliza. Na fotografia é assim e na criação de imagens usando IA, também.
Conhecer o vocabulário adequado, ajuda? Sim, mas saber como descrever, detalhar, destacar, cada elemento da cena que se quer, também é essencial.
Vamos imaginar que você queira uma imagem de uma jovem chef empolgada em uma cozinha de restaurante e para tanto, peça à IA: “crie uma imagem de mulher cozinhando alegremente na cozinha”.
Diante de um prompt como esse, é provável receber uma imagem como a seguinte:

É um bom resultado, mas não reflete o que queríamos. Ao analisarmos a solicitação e como ela foi interpretada pelo modelo de IA, fica mais fácil compreender os porquês:
|
Roteiro |
Elemento no prompt |
Papel ou função |
Problema ou erro |
|
Ator ou sujeito |
“imagem de mulher” |
Estipula ao modelo o elemento de destaque (ator ou sujeito) na cena |
A solicitação é vaga demais e não dá detalhes de como deve ser / parecer o ator ou sujeito |
|
Ação ou situação da cena |
“cozinhando alegremente” |
Define o que está ocorrendo na cena |
A ação não é específica e não indica exatamente a ação, que poderia ser “preparação dos ingredientes” |
|
Ambiente |
“na cozinha” |
Define o cenário onde a ação / situação acontece |
O cenário é genérico e foi escolhido pelo modelo e com base nos exemplos que recebeu no treinamento. |
|
Estilo |
Não informado |
Responsável por definir a aparência da imagem (realista / fotografia, desenho, pintura, branco e preto, iluminação, etc.) |
Por não ter sido especificado, também fica a critério do modelo e com base no seu treinamento |
|
Propriedades da imagem |
Não informado |
Aspectos como proporção, tamanho, resolução |
Como as demais informações ausentes no roteiro, o modelo faz a escolha |
|
Clima ou atmosfera |
“alegremente” |
Indica o estado ou emoção que ação deve transmitir |
Mesmo transmitindo alguma emoção, poderia ser ainda mais descritiva |
Em linhas gerais, o problema para obter o que imaginamos, foi não descrever melhor o cenário e dar detalhes que são essenciais para contextualizar a cena desejada.
A seguir o prompt descrevendo a cena que queremos, bastante refinado, com detalhes e em inglês (comentaremos adiante), bem como o resultado significativamente diferente.
|
Prompt em inglês |
Tradução do prompt |
|
A realistic, high-resolution 1920x1080 photograph in 16:9 widescreen format of a professional commercial kitchen. In the center foreground, a premium large Molteni professional stove range is prominently featured. Standing behind the stove, is a 40-year-old Caucasian female chef, 1.65m tall, with a joyful expression, wearing a pristine white double-breasted chef's jacket (dolma) and a tall white traditional Toque Blanche hat. She is standing on the kitchen floor, visible from the waist up behind the stove, using a ladle to stir a steaming pot of red sauce on one of the active gas burners. Directly above the island stove, a large stainless steel industrial exhaust hood hangs from the ceiling. In the brightly lit, clean background, three other distinct male chefs in white uniforms are working at their own stations: one on the left is meticulously chopping fresh colorful vegetables on a cutting board; one in the background is operating a large commercial stand mixer kneading dough; and one on the right is carrying a medium-sized stainless steel stockpot. Authentic kitchen atmosphere with copper pots on shelves, warm ambient lighting |
Uma fotografia realista de alta resolução (1920x1080) em formato widescreen 16:9 de uma cozinha comercial profissional. No centro do primeiro plano, destaca-se um grande fogão profissional Molteni de alta qualidade. Atrás do fogão, uma chef caucasiana de 40 anos, com 1,65m de altura, exibe uma expressão alegre, vestindo um impecável casaco de chef branco de abotoamento duplo (dolma) e um alto chapéu branco tradicional (Toque Blanche). Ela está em pé no chão da cozinha, visível da cintura para cima, atrás do fogão, usando uma concha para mexer um molho vermelho fumegante em uma das bocas do fogão a gás. Diretamente acima do fogão, uma grande coifa industrial de aço inoxidável está pendurada no teto. Ao fundo, em um ambiente limpo e bem iluminado, três outros chefs, ambos do sexo masculino e com uniformes brancos, trabalham em seus respectivos postos: um à esquerda corta meticulosamente legumes frescos e coloridos em uma tábua; um ao fundo opera uma grande batedeira industrial, amassando massa; E à direita, uma carrega uma panela de aço inoxidável de tamanho médio. Ambiente de cozinha autêntico com panelas de cobre nas prateleiras, iluminação ambiente aconchegante |
O mesmo prompt foi usado no Gemini e no Copilot e eis o resultado que conseguimos.

Note que apesar das diferenças, as imagens têm muitos pontos em comum. As diferenças, como por exemplo, o posicionamento dos demais cozinheiros ou sua aparência, poderiam tornar o resultado ainda mais próximo, se tivéssemos fornecido tais informações.
No prompt em questão, definimos:
-
Atores – a chef e características físicas dela, mas também os outros três cozinheiros, sem muitos detalhes de aparência física, pois não era importante;
-
Ações – estipulamos com algum detalhamento, as ações que cada ator desempenha. No caso da chef, houve melhor descrição;
-
Ambiente – o ambiente ou cenário no qual a ação acontece, também contém informações que ajudaram a definir como deveria ser;
-
Estilo – foi a primeira informação e determinou o tipo de imagem;
-
Propriedades da imagem – informamos aspectos que são essenciais para o formato final;
-
Clima – as ações dos cozinheiros e o comportamento da protagonista (a chef) na cena, ajudam a criar a atmosfera que a imagem tenta transmitir.
Conforme mencionamos na tabela, tudo o que não é estipulado no prompt, o modelo “decide” com base no seu treinamento. Em outras palavras, o conjunto de imagens de cozinhas profissionais é que determina como ele “imagina” que deve ser uma.
Agora que ficou claro a importância de elaborar um bom prompt, vamos a alguns desafios que certamente ocorrerão em algum momento.
Como corrigir quando a IA "erra"
Criar imagens usando modelos de inteligência artificial é um processo de aprendizado de como deve ser o “diálogo” e o sucessivo refinamento das solicitações feitas. Nem sempre você obterá exatamente o que imaginou logo no primeiro prompt.
Durante os testes para este post, passamos por uma situação muito comum que serve de ótimo aprendizado. Nas primeiras tentativas de gerar a imagem da cozinha do restaurante, a IA cometeu um erro comum de física e perspectiva conhecido como colisão de objetos (clipping). Ou seja, ela “fundiu” a cozinheira ao fogão.

Quando tentamos simplesmente pedir "coloque ela à esquerda do fogão", a IA ignorou o comando por já estar "presa" àquela composição inicial.
Como resolvemos isso?
Tivemos que submeter outro prompt, como se fosse uma nova imagem, dessa vez aplicando uma técnica de “ancoragem espacial” mais rígida. Em vez de focar apenas no que ela estava fazendo, redefinimos a física espacial da cena:
-
Especificamos que ela estava "em pé no chão da cozinha" (standing on the kitchen floor);
-
Deixamos explícito que ela estava "atrás do fogão, visível da cintura para cima" (visible from the waist up behind the stove);
-
Adicionamos a instrução "completamente livre de qualquer colisão ou sobreposição com objetos" (completely clear of any clipping or object collision).
Esse tipo de ajuste no prompt, é o que diferencia um resultado que corresponda – ou muito próximo – às suas expectativas, de um absolutamente frustrante.
Criar imagens com auxílio de IA, é organizar uma cena e todos os elementos que são relevantes nela.
Técnicas básicas para qualquer IA de Imagem
Se você quer conseguir resultados realmente bons em qualquer ferramenta de criação de imagens (Gemini, Midjourney, Copilot, DALL-E, etc.), é essencial ter em mente as regras a seguir.
1. A ordem das palavras importa (muito!)
As IAs leem os prompts da esquerda para a direita e dão muito mais peso para as primeiras palavras:
-
Evite – "Uma imagem de uma floresta com árvores altas tirada no estilo de foto analógica antiga…"
-
Prefira – "Foto analógica antiga de uma floresta com árvores altas…"
Coloque o estilo artístico e o sujeito principal logo no início do prompt
2. Descreva o que você QUER, em vez do que você NÃO QUER
Os modelos de geração de imagens têm muita dificuldade de interpretar termos de negação como "não", "sem" ou "exceto". Se você escrever "uma rua sem carros", há uma grande chance de a IA focar na palavra "carros" e encher a imagem deles.
-
Em vez de – "Um céu sem nuvens" ou "um prato de comida sem carne".
-
Use – "Céu azul completamente limpo" ou "prato de salada cheio de verduras e legumes".
Se algum elemento que não deveria constar da imagem, em vez de solicitar que o remova, refaça o prompt enfatizando o que deseja.
3. Substitua adjetivos abstratos por detalhes concretos
Palavras subjetivas como "bonito", "delicioso", "tecnológico" ou "incrível" não dizem nada de prático para uma IA. Você precisa traduzir essas sensações em elementos visuais.
-
Em vez de – "Uma mesa de escritório muito moderna e tecnológica".
-
Use – "Mesa de escritório com tampo de vidro fosco, um monitor curvo ultrafino aceso mostrando gráficos azuis, teclado mecânico retroiluminado e iluminação em fita LED suave ao fundo".
A forma como algumas IAs interagem até parece que são humanas, mas não são. Conceitos abstratos para elas são apenas definições de dicionário.
4. O “poder” do Idioma. Prefira usar inglês
Se você ficou curioso por qual motivo usamos inglês no exemplo da cozinheira profissional, a razão é puramente técnica. As principais IAs de imagem foram treinadas e "pensam" em inglês.
O treinamento dos modelos é baseado em gigantescos bancos de dados de imagens cujas descrições (alt-texts, legendas e tags) estão predominantemente em inglês. Quando você digita um prompt em português, o sistema faz uma tradução automática rápida, convertendo o prompt para o inglês antes de criar o desenho.
Nessa tradução, perdem-se nuances e particularidades importantes. Termos técnicos de fotografia (como bokeh, depth of field, backlight) ou termos artísticos (como cyberpunk, matte painting, die-cut), funcionam melhor em inglês.
Para resolver isso, escreva sua ideia em português, use o Google Tradutor ou o DeepL para passá-la para o inglês e cole o resultado na ferramenta de IA. Você notará uma melhora imediata na precisão do resultado, especialmente em imagens com mais detalhes.
5. Dicas adicionais
-
Contexto – o contexto da imagem é importante para o clima ou atmosfera que se quer. Detalhar tanto quanto possível com termos concretos (evite o abstrato) o contexto da cena, ajuda o modelo a se concentrar no que realmente importa e diminui a chance de haver detalhes desnecessários;
-
Ação – dar ênfase na ação ou situação que a cena deve exibir, aumenta a probabilidade do modelo gerar uma saída na qual essa perspectiva esteja bem evidente;
-
Exemplos – se você tem uma imagem que já apresenta os principais elementos, use-a como exemplo, alterando cenários, objetos, incluindo os elementos ausentes e outras instruções que forem necessárias;
-
Desmembramento – instruções muito complexas, podem ser desmembradas em instruções menores. Essa prática é especialmente útil se algo der errado. É mais fácil ajustar apenas o trecho do prompt que não foi adequado;
-
Desmembramento – instruções muito complexas, podem ser desmembradas em instruções menores. Essa prática é especialmente útil se algo der errado. É mais fácil ajustar apenas o trecho do prompt que não foi adequado;
-
Refinamentos – se o resultado se afasta do ideal apenas por detalhes, refine o prompt incluindo os aspectos ausentes, sempre informando o que é relevante para a inclusão;
-
Análise – muitos modelos são capazes de analisar imagens. No caso de um resultado errado, peça para a IA analisar a imagem e confrontar com o prompt. Em alguns casos ela é capaz de corrigir o problema sem que seja necessário editar as instruções ou fornecer novas;
-
Checagem – não confie cegamente em textos dentro da imagem. É comum que esses modelos errem letras e números. Para infográficos, gere o fundo e adicione os textos no Canva ou outra ferramenta de edição de imagens.
Refinando prompts que não funcionaram
A imagem gerada não era o que você queria? Não descarte o prompt, nem desista.
Use este checklist para diagnosticar o problema:
-
O resultado veio abstrato/artístico e você queria uma foto?
-
Solução – force termos de câmera no início do prompt. Use marcas e lentes reais: "Fotografia tirada com câmera DSLR de 35mm, foco nítido, fotorrealista".
-
-
Os elementos estão se fundindo de forma bizarra?
-
Solução – use termos de posicionamento bem marcados. Em vez de "um homem e um cachorro perto de um carro", use: "Um homem em pé ao lado esquerdo de um carro estacionado, enquanto segura um cachorro labrador na coleira";
-
-
A IA ignorou uma parte importante da sua instrução?
-
Solução – o prompt pode estar longo demais ou confuso. Reduza frases redundantes ou tente dar mais peso ao termo ignorado repetindo-o de outra forma (ex: se ela esqueceu o "chapéu", adicione detalhes ao chapéu: "usando um chapéu branco de chef alto e tradicional").
-
-
Houve inclusão de elementos que não foram solicitados?
-
Solução – refaça o trecho do prompt relativo à parte da imagem com o erro. Se havia um quadro na parede, descreva-a: “a parede totalmente branca no fundo da sala”
-
4 prompts prontos para você testar agora
Para ajudar você a começar, aqui estão quatro exemplos de prompts testados e refinados para diferentes cenários.
Copie-os e cole-os na sua IA favorita e veja o resultado produzido. Faça alterações com base no que vimos e observe o que acontece, comparando o que cada ferramenta entrega, para decidir qual lhe atende melhor.
1. Cena corporativa realista (foco em ambiente de trabalho)
Ideal para posts de negócios, LinkedIn ou sites institucionais.
|
Prompt em inglês |
Tradução |
|
A professional, high-resolution 16:9 photo of a modern corporate meeting room. A diverse group of three business professionals (one South Asian man in his 30s wearing a smart casual blazer, one Black woman in her 40s in a professional blouse, and one Caucasian man in his 50s) are standing around a sleek wooden conference table. They are looking at a tablet held by the woman, smiling and collaborating. In the background, there are large glass windows with a soft-focus view of a modern city skyline during daytime. Bright, natural lighting, clean corporate aesthetic, professional depth of field. |
Uma foto profissional de alta resolução em formato 16:9 de uma sala de reuniões corporativa moderna. Um grupo diverso de três profissionais de negócios (um homem sul-asiático de 30 anos vestindo blazer esporte fino, uma mulher negra de 40 anos com blusa profissional e um homem caucasiano de 50 anos) está em pé ao redor de uma elegante mesa de conferência de madeira. Eles olham para um tablet segurado pela mulher, sorrindo e colaborando. Ao fundo, grandes janelas de vidro com vista suavemente desfocada de um horizonte de cidade moderna durante o dia. Iluminação natural brilhante, estética corporativa limpa, profundidade de campo profissional. |

2. Cidade Futurista (Conceito Solarpunk / Sustentável)
Excelente para conceitos de inovação, ecologia ou tecnologia do futuro.
|
Prompt em inglês |
Tradução |
|
A vibrant, wide-angle 16:9 concept art illustration of a futuristic eco-friendly city, solarpunk aesthetic. Majestic skyscrapers integrated with lush green vertical gardens, cascading waterfalls on terraces, and glass domes. Futuristic zero-emission electric monorails gliding on elevated tracks between buildings. Clear blue sky with a few fluffy white clouds, warm golden sunlight illuminating the entire scene. Small silhouettes of people walking on elevated pedestrian parks. Highly detailed, optimistic future vision, high-resolution digital painting. |
Uma ilustração vibrante de arte conceitual em grande angular 16:9 de uma cidade futurista ecológica, estética solarpunk. Arranha-céus majestosos integrados com exuberantes jardins verticais, cachoeiras em cascata nos terraços e cúpulas de vidro. Monotrilhos elétricos futuristas de emissão zero deslizando em trilhos elevados entre os prédios. Céu azul limpo com algumas nuvens brancas suaves, luz solar dourada e quente iluminando toda a cena. Silhuetas pequenas de pessoas caminhando em parques de pedestres elevados. Visão de futuro altamente detalhada e otimista, pintura digital de alta resolução. |

3. Conceito visual de tecnologia (estilo infográfico / recursos)
Ótimo para ilustrar posts de tecnologia, IA ou conceitos futuristas e abstratos.
|
Prompt em inglês |
Tradução |
|
A clean, minimalist 3D render in 16:9 format showing an abstract technological concept of Artificial Intelligence resources. In the center, a glowing, translucent glass sphere representing a core processor. Floating around this sphere are sleek, semi-transparent digital glass cards with glowing blue, purple, and gold neon icons representing smart features (a brain icon, a chat bubble icon, a magnifying glass icon, and a coding script icon). Neon light pathways connect the cards to the central sphere. Pure dark metallic background with subtle geometric grid patterns, premium studio lighting, elegant depth of field. |
Uma renderização em 3D limpa e minimalista em formato 16:9 mostrando um conceito tecnológico abstrato de recursos de Inteligência Artificial. No centro, uma esfera de vidro translúcido brilhante representando um processador central. Flutuando ao redor desta esfera estão cartões de vidro digital elegantes e semi-transparentes com ícones neon brilhantes em azul, roxo e dourado representando recursos inteligentes (um ícone de cérebro, um ícone de balão de fala, um ícone de lupa e um ícone de script de programação). Caminhos de luz neon conectam os cartões à esfera central. Fundo metálico escuro puro com padrões sutis de grade geométrica, iluminação de estúdio premium, profundidade de campo elegante. |

4. Macrofotografia criativa (foco em detalhes e texturas)
Um prompt incrível para demonstrar o poder de renderização de texturas e iluminação fina da IA.
|
Prompt em inglês |
Tradução |
|
An extreme close-up macro photograph of a single emerald green leaf covered in tiny, perfect morning dewdrops. Inside the largest dewdrop, there is a miniature, clear reflection of a rising golden sun. The camera lens captures the intricate veins of the leaf with extreme sharpness. The background is a soft, completely blurred bokeh of forest green and golden sunlight circles. Cinematic natural lighting, ultra-detailed, professional macro lens, high-resolution |
Uma fotografia macro de close-up extremo de uma única folha verde-esmeralda coberta por minúsculas e perfeitas gotas de orvalho da manhã. Dentro da maior gota de orvalho, há um reflexo em miniatura e claro de um sol dourado nascendo. A lente da câmera captura as veias intrincadas da folha com extrema nitidez. O fundo é um bokeh suave e completamente desfocado de verde floresta e círculos dourados de luz solar. Iluminação natural cinematográfica, ultra-detalhado, lente macro profissional, alta resolução |

Conclusão
Dominar a criação de imagens por IA não é uma questão de ter a melhor ferramenta, mas de saber estruturar o seu pensamento e traduzi-lo em instruções visuais. Ao separar o seu prompt em partes claras (Ator, Ação, Ambiente, Estilo, Propriedades e Clima), você reduz radicalmente o "fator sorte" e passa a ter controle real sobre o resultado.
Agora é a sua vez! Escolha uma das estruturas que apresentamos aqui, faça os seus testes e descubra o quão longe a sua imaginação (bem descrita) pode levar você.


