Intégrez des formes et des mots subliminaux dans vos images avec ComfyUI, ControlNet et Stable Diffusion

Gaspard Tertrais
4 min readSep 25, 2023

Hello ! Aujourd’hui, je vous montre comment générer des images contenant du texte et des formes subliminaux, comme les images ci-dessous. Ce tutoriel est pour Linux. Cependant, vous pourriez trouver des informations sur la façon de le faire sous Windows ou Mac dans le dépôt Github de ComfyUI.

Result

1. Préparation

Premièrement, vous aurez besoin d’une image de texte ou de forme noire sur un fond blanc que vous utiliserez comme masque. Par exemple, le nom de ma startup Tomorrow Theory:

Masque de texte PNG

2. Préparation de l’environnement (NVIDIA)

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118 xformers

3. Télécharger et installer ComfyUI

Clonez le dépôt Github de ComfyUI.

git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt

4. Télécharger et installer les modèles

Téléchargez les deux modèles :

Vous êtes maintenant prêt à lancer ComfyUI 5.

5. Lancer ComfyUI

À la racine de votre projet, exécutez :

python3 main.py

Votre serveur devrait démarrer sur http://127.0.0.1:8188/

6. Construire le workflow

Si vous êtes familier avec ComfyUI, cela ne sera pas difficile, voyez la capture d’écran du workflow complet ci-dessus.

Si vous n’êtes pas familier avec ComfyUI, vous pouvez trouver le workflow complet sur mon GitHub ici. éléchargez simplement le fichier workflow.json, allez sur ComfyUI, cliquez sur Load dans le navigateur et sélectionnez le fichier workflow.json que vous venez de télécharger.

Assurez-vous que :

  • Load Checkpoint est réglé sur Realistic_Vision_V2.0.safetensors
  • Load ControlNet est réglé sur control_v1p_sd15_qrcode_monster.safetensors

7. Uploadez votre image

Uploadez votre image dans le bloc Load Image.

8. Ajustez le format de l’image de sortie désirée

Dans le bloc Empty Latent Image, ajustez la largeur et la hauteur en fonction du format de votre masque, par exemple, dans mon cas, le format du masque “Tomorrow Theory” est de 962 x 544 (16:9).

Le format du masque et de l’image doit être le même pour obtenir un bon résultat.

Vous pouvez ajuster la taille du lot (batch_size) si vous souhaitez générer plusieurs images en même temps. Sinon, laissez-le à 1.

9. Vérifiez les derniers paramètres

Vérifiez si les valeurs de KSampler et Apply ControlNet (Avancé) correspondent aux captures d’écran ci-dessous.

KSampler
Apply ControlNet (Advanced)

10. Ajoutez vos prompts positifs et négatifs

Ici, j’ai entré comme prompt positif : “plate of sushi” et comme prompt négatif “worst quality poor details unrealistic”.

Vous pouvez ajuster les prompts positifs et négatifs en fonction de vos besoins (je recommande de garder le même prompt négatif pour commencer).

11. Générez votre première image !

Cliquez sur “Queue Prompt” pour commencer à générer votre image.

Votre image apparaîtra dans le bloc Save Image.

12. Ajustez les paramètres pour obtenir les meilleurs résultats

Selon votre masque et le degré de visibilité que vous souhaitez sur l’image finale, vous pouvez modifier la force sous le bloc Apply ControlNet.

J’ai trouvé les meilleurs résultats entre 1.1 et 1.5, essayez de trouver votre sweet spot !

13. Profitez de votre nouveau superpouvoir !

Mmmh sushi

Vous pouvez trouver toutes vos images générées sous ComfyUI/output.

J’espère que vous avez apprécié ce tutoriel, merci de le partager !

--

--

Gaspard Tertrais

Cofounder & CTO @tomorrow_theory #blockchain #ai #futureofwork #software #engineer