## 概述

此节点为 AR（自回归）视频模型准备图像到视频的生成配置。它接收起始图像，使用 VAE 将其编码到潜在空间中，并将编码后的图像存储在模型配置中。这使得视频采样过程能够将该图像用作第一帧，从而在不依赖独立图像到视频模型架构的情况下有效引导生成过程。

## 输入

| 参数 | 描述 | 数据类型 | 必填 | 范围 |
| --- | --- | --- | --- | --- |
| `模型` | 用于生成的 AR 视频模型。 | MODEL | 是 | - |
| `vae` | 用于将起始图像编码到潜在空间的 VAE 模型。 | VAE | 是 | - |
| `起始图像` | 将作为生成视频第一帧的初始图像。 | IMAGE | 是 | - |
| `宽度` | 生成视频帧的宽度（默认值：832）。 | INT | 是 | 16 至 8192（步长：16） |
| `高度` | 生成视频帧的高度（默认值：480）。 | INT | 是 | 16 至 8192（步长：16） |
| `长度` | 生成视频的总帧数（默认值：81）。 | INT | 是 | 1 至 1024（步长：4） |
| `批量大小` | 单批次生成的视频序列数量（默认值：1）。 | INT | 是 | 1 至 64 |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `MODEL` | 克隆后的模型，其配置中存储了编码后的起始图像，用于视频生成。 | MODEL |
| `LATENT` | 一个空的潜在张量，其维度与视频生成过程相匹配。 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/ARVideoI2V/zh.md)

---
**Source fingerprint (SHA-256):** `0445b279ba49fa946050cfa70d1e6b13240eaa600b99dfe63f27c3203dc4b61b`