首页 - 学术科研 - 神经网络 - 数据挖掘

Stable Diffusion基础：ControlNet之图像提示（垫图）

2024-01-23 03:22:50 苏内容

标签： AI

阅读：4071

本文给大家分享 Stable Diffusion 的基础能力：ControlNet 之图片提示。

这篇故事的主角是 IP-Adapter，它的全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models，翻译成中文就是：用于文本到图像扩散模型的文本兼容图像提示适配器，名字很长很拗口，我们只要记住四个字就行了：图像提示，如果还觉得长，那就两个字：垫图。记不住也没关系，下面我会带大家一步步体会它的图片生成能力。

使用过 Stable Diffusion 的同学对提示词的重要程度应该深有体会，无论是文生图还是图生图，我们想要在图片上展现某些元素，都需要编写对应的提示词，有时候为了避免生成一些不想要的东西，我们还需要编写反向提示词。某种程度上可以说提示词就是图片的灵魂。

不过 Stable Diffusion 本身支持的提示词都是文本提示词，文本到图像的映射存在很大的不确定性。而IP-Adapter 可以一定程度上解决这个问题，它提供了一种图像提示的方法，让新生成的图片可以直接使用参考图中的某种主题元素，很多同学也称这个能力为垫图。从描述上看 IP-Adapter 的能力类似 Reference，不过它更高级，最主要的区别就是不用怎么编写提示词。百闻不如一见，先看看官方给的效果图。

IP-Adapter 是一个目前比较新的 ControlNet 类型，是由腾讯AI实验室发布的一个开源项目，项目地址：https://github.com/tencent-ailab/IP-Adapter ，懂技术的同学可以去研究研究。

下面开始我们的使用之旅。

安装

ControlNet 安装

工欲善其事必先利其器，ControlNet 还是先要安装好的，已经安装好的请跳过这一步。

之前的文章已经介绍过相关安装方法，大家请点击这个链接移步过去：ControlNet 安装与基本使用方法

注意需要将 ControlNet 插件升级到 v1.1.410 这个版本，这个版本支持新的 ControlType 类型。

IP-Adapter 安装

使用 IP-Adapter 前，还需要先安装两个预处理器，三个模型。

两个预处理器：

<stable-diffusion-webui>/extensions/sd-webui-controlnet/annotator/downloads/clip_vision/clip_g.pth

<stable-diffusion-webui>/extensions/sd-webui-controlnet/annotator/downloads/clip_vision/clip_h.pth

三个模型：

<stable-diffusion-webui>/extensions/sd-webui-controlnet/models/ip-adapter_sd15.pth

<stable-diffusion-webui>/extensions/sd-webui-controlnet/models/ip-adapter_sd15_plus.pth

<stable-diffusion-webui>/extensions/sd-webui-controlnet/models/ip-adapter_xl.pth

不方便访问 huggingface 的同学可以通过我整理的资源下载，下载方式见文章最后；或者直接使用 AutoDL 上我发布的镜像：https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/yinghuoai-sd-webui-fast