TextEncodeHunyuanVideo_ImageToVideo 노드는 텍스트 프롬프트와 이미지 임베딩을 결합하여 비디오 생성을 위한 컨디셔닝 데이터를 생성합니다. CLIP 모델을 사용하여 텍스트 입력과 CLIP 비전 출력의 시각적 정보를 모두 처리한 후, 지정된 이미지 인터리브 설정에 따라 이 두 소스를 혼합한 토큰을 생성합니다.

## 입력

| 매개변수 | 설명 | 데이터 타입 | 필수 | 범위 |
| --- | --- | --- | --- | --- |
| `클립` | 토큰화 및 인코딩에 사용되는 CLIP 모델 | CLIP | 예 | - |
| `clip_vision 출력` | 이미지 컨텍스트를 제공하는 CLIP 비전 모델의 시각적 임베딩 | CLIP_VISION_OUTPUT | 예 | - |
| `프롬프트` | 비디오 생성을 안내하는 텍스트 설명으로, 여러 줄 입력 및 동적 프롬프트를 지원합니다 | STRING | 예 | - |
| `이미지 인터리브` | 텍스트 프롬프트 대비 이미지가 결과에 미치는 영향도를 조절합니다. 값이 높을수록 텍스트 프롬프트의 영향력이 커집니다. (기본값: 2) | INT | 예 | 1-512 |

## 출력

| 출력 이름 | 설명 | 데이터 타입 |
| --- | --- | --- |
| `CONDITIONING` | 비디오 생성을 위해 텍스트와 이미지 정보를 결합한 컨디셔닝 데이터 | CONDITIONING |

> 이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! [GitHub에서 편집](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/TextEncodeHunyuanVideo_ImageToVideo/ko.md)

---
**Source fingerprint (SHA-256):** `ee748bd1fb1733593eb4cb1187c5cc279171163cfbc389f039378d0e366fc231`