# 运行 Depth Anything 3

此节点在图像上运行 Depth Anything 3 模型，以估算深度和几何信息。在多视图模式下，多张图像作为同一场景的不同视图被一起处理，以生成几何一致的深度图和相机位姿。

## ## 输入

| 参数 | 描述 | 数据类型 | 是否必需 | 范围 |
|-----------|-------------|-----------|----------|-------|
| `da3_model` | 用于推理的 Depth Anything 3 模型 | DA3_MODEL | 是 | - |
| `image` | 要处理的输入图像或图像集 | IMAGE | 是 | - |
| `resolution` | 模型运行的分辨率（最长边，14 的倍数）。数值越低，运行速度越快且显存占用越少。数值越高，生成的细节越丰富。输出结果会上采样回原始尺寸（默认值：504） | INT | 是 | 140 至 2520（步长：14） |
| `resize_method` | upper_bound_resize：缩放使最长边等于分辨率（限制显存，默认值）。lower_bound_resize：缩放使最短边等于分辨率（在长/宽图像上保留更多细节，但占用更多显存） | COMBO | 是 | `"upper_bound_resize"`<br>`"lower_bound_resize"` |
| `mode` | mono：单视图图像处理（适用于任何模型变体）。multiview：所有图像一起处理，以获得几何一致性和相机位姿估计（仅适用于 Small 和 Base 模型） | COMBO | 是 | `"mono"`<br>`"multiview"` |
| `ref_view_strategy` | 在多视图模式下，哪个视图作为几何锚点。saddle_balanced：在所有视图中最平均的视图（最佳通用选择）。saddle_sim_range：与其他视图视觉差异最大的视图。first / middle：固定的位置选择 | COMBO | 否（有条件） | `"saddle_balanced"`<br>`"saddle_sim_range"`<br>`"first"`<br>`"middle"` |
| `pose_method` | 相机视场角的估算方式（仅适用于 Small 和 Base 模型）。cam_dec：从图像特征中学习。ray_pose：从模型的 3D 射线输出中几何推导得出。影响 3D 输出的透视正确性 | COMBO | 否（有条件） | `"cam_dec"`<br>`"ray_pose"` |

**关于参数约束的说明：**
- `ref_view_strategy` 和 `pose_method` 参数仅在 `mode` 设置为 `"multiview"` 时可用
- 多视图模式需要 Small 或 Base 模型变体。具有其他头部类型（如 Metric 或 Mono）的模型不支持跨视图注意力或相机位姿估计
- 当 `pose_method` 设置为 `"cam_dec"` 时，模型必须具有相机解码器。如果设置为 `"ray_pose"`，模型必须具有 DualDPT 头部
- 如果所选 `pose_method` 与加载的模型不兼容，将引发错误

## ## 输出

| 输出名称 | 描述 | 数据类型 |
|-------------|-------------|-----------|
| `da3_geometry` | 非归一化张量的字典。始终包含键：depth、image、mode。可选键包括：sky（适用于 Mono/Metric 模型）、confidence（适用于 Small/Base 模型）、extrinsics 和 intrinsics（适用于多视图模式） | DA3_GEOMETRY |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/DA3Inference/zh.md)

---
**Source fingerprint (SHA-256):** `e91dd47e6a01719cdd6b6ce8a9bcc45933cac72c5e147ac42906d2f83ab7c250`
