Understand UNet in SD

Stable Diffusion 里的 UNet 主要有三个输入,分别是: Input Dimensions 带噪的潜空间图像 (1, 4, 64, 64) 时间步 (1,) 文本提示编码 (1, 77, 768) 这三个输入经过 UNet 后,会得到一个输出,维度是 (1, 4, 64, 64...

June 13, 2025 · x2x5 · 2321 words