Understand UNet in SD
Stable Diffusion 里的 UNet 主要有三个输入,分别是: Input Dimensions 带噪的潜空间图像 (1, 4, 64, 64) 时间步 (1,) 文本提示编码 (1, 77, 768) 这三个输入经过 UNet 后,会得到一个输出,维度是 (1, 4, 64, 64...
Stable Diffusion 里的 UNet 主要有三个输入,分别是: Input Dimensions 带噪的潜空间图像 (1, 4, 64, 64) 时间步 (1,) 文本提示编码 (1, 77, 768) 这三个输入经过 UNet 后,会得到一个输出,维度是 (1, 4, 64, 64...