P005 ComfyUi 3Dモデル生成

ComfyUiについての3Dモデル生成の場合です。
チュートリアルに例題があります。

This guide will demonstrate how to use Hunyuan3D-2 in ComfyUI to generate 3D assets.

チュートリアルまとめ

チュートリアルまとめ

以下、notebookLMによるまとめ

hunyuan3d-dit-v2.safetensors とは

このモデルは、Tencentが公開したオープンソースの3D資産生成モデル「Hunyuan3D 2.0」における形状生成（ジオメトリ生成）モデルの核となるファイルです。

• 役割: テキストや画像から、テクスチャのない幾何学的な3Dモデルを生成します。

• アーキテクチャ: フロー拡散トランスフォーマー（flow diffusion Transformer）を採用しています。

• 最大の特徴: シングルビュー（単一視点）入力に特化したモデルであり、1枚の画像から3D形状を作成するワークフローで使用されます。

--------------------------------------------------------------------------------

モデルごとの主な違い

提供されている3つのモデルの主な違いは、**「入力できる視点数」と「生成スピード（推論方法）」**にあります。

モデル名特徴・用途入力の種類
hunyuan3d-dit-v2.safetensors 標準的なシングルビューモデル。1枚の画像から3Dモデルを生成する基本的な構成に使用されます。単一視点（1枚）
hunyuan3d-dit-v2-mv.safetensors マルチビュー（多視点）モデル。異なる角度からの画像を入力として受け取り、より詳細で正確な幾何構造を生成できます。複数視点（マルチビュー）
hunyuan3d-dit-v2-mv-turbo.safetensors 高速生成（蒸留）版モデル。マルチビューモデルをステップ蒸留（Step Distillation）したもので、品質を保ちつつより高速に生成可能です。複数視点（マルチビュー）

補足的な違い

• 生成プロセス: turbo版は、推論時間を短縮するために特別に調整されており、ワークフロー上ではCFG（Classifier-Free Guidance）を1.0に設定し、専用のガイダンスノード（flux guidanceなど）を併用して制御します。

• ハードウェア要件: Hunyuan3D 2.0シリーズは軽量に設計されており、形状生成だけであれば標準バージョンで6GBのVRAMがあれば動作可能です。

例えるなら： これらは「3Dの彫刻家」のようなものです。

• 標準モデルは、1枚の写真だけを見て彫刻を作る職人。

• mv（マルチビュー）モデルは、前後左右からの写真を見て、より正確に彫り進める職人。

• turboモデルは、そのマルチビュー職人の技術をそのままに、超スピードで作業を終わらせるベテラン職人、といった違いです。

そのままだとテクスチャは生成されません。形状生成のみです。

hunyuan3d-dit-v2.safetensors

hunyuan_3d_v2.1.safetensorsに更新

テンプレートから流用できます。

背面は補完されています。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

hunyuan3d-dit-v2-mv.safetensors

背面は図を参照しています。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

hunyuan3d-dit-v2-mv-turbo.safetensors

こちらの方が簡略化されてそうです。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

モデル名	特徴・用途	入力の種類
hunyuan3d-dit-v2.safetensors	標準的なシングルビューモデル。1枚の画像から3Dモデルを生成する基本的な構成に使用されます。	単一視点（1枚）
hunyuan3d-dit-v2-mv.safetensors	マルチビュー（多視点）モデル。異なる角度からの画像を入力として受け取り、より詳細で正確な幾何構造を生成できます。	複数視点（マルチビュー）
hunyuan3d-dit-v2-mv-turbo.safetensors	高速生成（蒸留）版モデル。マルチビューモデルをステップ蒸留（Step Distillation）したもので、品質を保ちつつより高速に生成可能です。	複数視点（マルチビュー）