Intégrez des formes et des mots subliminaux dans vos images avec ComfyUI, ControlNet et Stable Diffusion
Hello ! Aujourd’hui, je vous montre comment générer des images contenant du texte et des formes subliminaux, comme les images ci-dessous. Ce tutoriel est pour Linux. Cependant, vous pourriez trouver des informations sur la façon de le faire sous Windows ou Mac dans le dépôt Github de ComfyUI.
1. Préparation
Premièrement, vous aurez besoin d’une image de texte ou de forme noire sur un fond blanc que vous utiliserez comme masque. Par exemple, le nom de ma startup Tomorrow Theory:
2. Préparation de l’environnement (NVIDIA)
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118 xformers
3. Télécharger et installer ComfyUI
Clonez le dépôt Github de ComfyUI.
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
4. Télécharger et installer les modèles
Téléchargez les deux modèles :
- Checkpoint: J’utilise Realistic_Vision_V2.0.safetensors, vous pouvez l’obtenir ici et le placer dans ComfyUI/models/checkpoints
- ControlNet: J’utilise control_v1p_sd15_qrcode_monster.safetensors, vous pouvez l’obtenir ici et le placer dans ComfyUI/models/controlnet
Vous êtes maintenant prêt à lancer ComfyUI 5.
5. Lancer ComfyUI
À la racine de votre projet, exécutez :
python3 main.py
Votre serveur devrait démarrer sur http://127.0.0.1:8188/
6. Construire le workflow
Si vous êtes familier avec ComfyUI, cela ne sera pas difficile, voyez la capture d’écran du workflow complet ci-dessus.
Si vous n’êtes pas familier avec ComfyUI, vous pouvez trouver le workflow complet sur mon GitHub ici. éléchargez simplement le fichier workflow.json, allez sur ComfyUI, cliquez sur Load dans le navigateur et sélectionnez le fichier workflow.json que vous venez de télécharger.
Assurez-vous que :
- Load Checkpoint est réglé sur Realistic_Vision_V2.0.safetensors
- Load ControlNet est réglé sur control_v1p_sd15_qrcode_monster.safetensors
7. Uploadez votre image
Uploadez votre image dans le bloc Load Image.
8. Ajustez le format de l’image de sortie désirée
Dans le bloc Empty Latent Image, ajustez la largeur et la hauteur en fonction du format de votre masque, par exemple, dans mon cas, le format du masque “Tomorrow Theory” est de 962 x 544 (16:9).
Le format du masque et de l’image doit être le même pour obtenir un bon résultat.
Vous pouvez ajuster la taille du lot (batch_size) si vous souhaitez générer plusieurs images en même temps. Sinon, laissez-le à 1.
9. Vérifiez les derniers paramètres
Vérifiez si les valeurs de KSampler et Apply ControlNet (Avancé) correspondent aux captures d’écran ci-dessous.
10. Ajoutez vos prompts positifs et négatifs
Ici, j’ai entré comme prompt positif : “plate of sushi” et comme prompt négatif “worst quality poor details unrealistic”.
Vous pouvez ajuster les prompts positifs et négatifs en fonction de vos besoins (je recommande de garder le même prompt négatif pour commencer).
11. Générez votre première image !
Cliquez sur “Queue Prompt” pour commencer à générer votre image.
Votre image apparaîtra dans le bloc Save Image.
12. Ajustez les paramètres pour obtenir les meilleurs résultats
Selon votre masque et le degré de visibilité que vous souhaitez sur l’image finale, vous pouvez modifier la force sous le bloc Apply ControlNet.
J’ai trouvé les meilleurs résultats entre 1.1 et 1.5, essayez de trouver votre sweet spot !
13. Profitez de votre nouveau superpouvoir !
Mmmh sushi
Vous pouvez trouver toutes vos images générées sous ComfyUI/output.