ComfyUiについての3Dモデル生成の場合です。
チュートリアルに例題があります。
チュートリアルまとめ
以下、notebookLMによるまとめ
hunyuan3d-dit-v2.safetensors とは
このモデルは、Tencentが公開したオープンソースの3D資産生成モデル「Hunyuan3D 2.0」における形状生成(ジオメトリ生成)モデルの核となるファイルです。
• 役割: テキストや画像から、テクスチャのない幾何学的な3Dモデルを生成します。
• アーキテクチャ: フロー拡散トランスフォーマー(flow diffusion Transformer)を採用しています。
• 最大の特徴: シングルビュー(単一視点)入力に特化したモデルであり、1枚の画像から3D形状を作成するワークフローで使用されます。
--------------------------------------------------------------------------------
モデルごとの主な違い
提供されている3つのモデルの主な違いは、**「入力できる視点数」と「生成スピード(推論方法)」**にあります。
モデル名 特徴・用途 入力の種類 hunyuan3d-dit-v2.safetensors 標準的なシングルビューモデル。1枚の画像から3Dモデルを生成する基本的な構成に使用されます。 単一視点(1枚) hunyuan3d-dit-v2-mv.safetensors マルチビュー(多視点)モデル。異なる角度からの画像を入力として受け取り、より詳細で正確な幾何構造を生成できます。 複数視点(マルチビュー) hunyuan3d-dit-v2-mv-turbo.safetensors 高速生成(蒸留)版モデル。マルチビューモデルをステップ蒸留(Step Distillation)したもので、品質を保ちつつより高速に生成可能です。 複数視点(マルチビュー) 補足的な違い
• 生成プロセス:
turbo版は、推論時間を短縮するために特別に調整されており、ワークフロー上ではCFG(Classifier-Free Guidance)を1.0に設定し、専用のガイダンスノード(flux guidanceなど)を併用して制御します。• ハードウェア要件: Hunyuan3D 2.0シリーズは軽量に設計されており、形状生成だけであれば標準バージョンで6GBのVRAMがあれば動作可能です。
例えるなら: これらは「3Dの彫刻家」のようなものです。
• 標準モデルは、1枚の写真だけを見て彫刻を作る職人。
• mv(マルチビュー)モデルは、前後左右からの写真を見て、より正確に彫り進める職人。
• turboモデルは、そのマルチビュー職人の技術をそのままに、超スピードで作業を終わらせるベテラン職人、といった違いです。
そのままだとテクスチャは生成されません。形状生成のみです。
hunyuan3d-dit-v2.safetensors
hunyuan_3d_v2.1.safetensorsに更新
テンプレートから流用できます。

背面は補完されています。
hunyuan3d-dit-v2-mv.safetensors

背面は図を参照しています。
hunyuan3d-dit-v2-mv-turbo.safetensors

こちらの方が簡略化されてそうです。

コメント