ComfyUi

P005 ComfyUi 3Dモデル生成


ComfyUiについての3Dモデル生成の場合です。
チュートリアルに例題があります。

ComfyUI Hunyuan3D-2 Examples - ComfyUI
This guide will demonstrate how to use Hunyuan3D-2 in ComfyUI to generate 3D assets.

チュートリアルまとめ

以下、notebookLMによるまとめ

hunyuan3d-dit-v2.safetensors とは

このモデルは、Tencentが公開したオープンソースの3D資産生成モデル「Hunyuan3D 2.0」における形状生成(ジオメトリ生成)モデルの核となるファイルです。

役割: テキストや画像から、テクスチャのない幾何学的な3Dモデルを生成します。

アーキテクチャ: フロー拡散トランスフォーマー(flow diffusion Transformer)を採用しています。

最大の特徴: シングルビュー(単一視点)入力に特化したモデルであり、1枚の画像から3D形状を作成するワークフローで使用されます。

--------------------------------------------------------------------------------

モデルごとの主な違い

提供されている3つのモデルの主な違いは、**「入力できる視点数」「生成スピード(推論方法)」**にあります。

モデル名特徴・用途入力の種類
hunyuan3d-dit-v2.safetensors標準的なシングルビューモデル。1枚の画像から3Dモデルを生成する基本的な構成に使用されます。単一視点(1枚)
hunyuan3d-dit-v2-mv.safetensorsマルチビュー(多視点)モデル。異なる角度からの画像を入力として受け取り、より詳細で正確な幾何構造を生成できます。複数視点(マルチビュー)
hunyuan3d-dit-v2-mv-turbo.safetensors高速生成(蒸留)版モデル。マルチビューモデルをステップ蒸留(Step Distillation)したもので、品質を保ちつつより高速に生成可能です。複数視点(マルチビュー)

補足的な違い

生成プロセス: turbo版は、推論時間を短縮するために特別に調整されており、ワークフロー上ではCFG(Classifier-Free Guidance)を1.0に設定し、専用のガイダンスノード(flux guidanceなど)を併用して制御します。

ハードウェア要件: Hunyuan3D 2.0シリーズは軽量に設計されており、形状生成だけであれば標準バージョンで6GBのVRAMがあれば動作可能です。

例えるなら: これらは「3Dの彫刻家」のようなものです。

標準モデルは、1枚の写真だけを見て彫刻を作る職人。

mv(マルチビュー)モデルは、前後左右からの写真を見て、より正確に彫り進める職人。

turboモデルは、そのマルチビュー職人の技術をそのままに、超スピードで作業を終わらせるベテラン職人、といった違いです。

そのままだとテクスチャは生成されません。形状生成のみです。

hunyuan3d-dit-v2.safetensors

hunyuan_3d_v2.1.safetensorsに更新

テンプレートから流用できます。

背面は補完されています。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

hunyuan3d-dit-v2-mv.safetensors

背面は図を参照しています。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

hunyuan3d-dit-v2-mv-turbo.safetensors

こちらの方が簡略化されてそうです。

Interactive 3D

ドラッグで回転・スクロールで拡大縮小できます

※スマートフォンはピンチ操作に対応

コメント