ComfyUIは、Stable Diffusionなどの拡散モデルを使用した画像生成のためのノードベースUIである。
ComfyUIの基本概念
ノードベースワークフロー
ComfyUIは従来のテキストボックス形式ではなく、ノード(節点)を線で繋ぐ方式でワークフローを構築する。各ノードが特定の機能を持ち、それらを組み合わせて複雑な画像生成プロセスを作成できる。
基本的なノード構成
入力系ノード
- Checkpoint Loader: モデル(チェックポイント)を読み込む
- CLIP Text Encode: プロンプトをテキストエンコーディングする
- Empty Latent Image: 生成する画像のサイズを指定
処理系ノード
- KSampler: 実際の画像生成(サンプリング)を行う
- VAE Decode: 潜在空間から画像に変換
- LoRA Loader: LoRAモデルを適用
出力系ノード
- Save Image: 生成された画像を保存
- Preview Image: 画像をプレビュー表示
ワークフローの例
基本的な画像生成ワークフローは以下のような流れになる:
Checkpoint Loader → KSampler → VAE Decode → Save Image
↓ ↑
CLIP Text Encode → [正プロンプト]
CLIP Text Encode → [負プロンプト]
↑
Empty Latent Image
AUTOMATIC1111との比較
| 項目 | ComfyUI | AUTOMATIC1111 |
|---|---|---|
| UI形式 | ノードベース | 従来型フォーム |
| 学習コスト | 高い | 低い |
| 柔軟性 | 非常に高い | 標準的 |
| カスタマイズ | 高度 | 限定的 |
| メモリ効率 | 良い | 普通 |
| 処理速度 | 最適化可能 | 標準 |
主要な利点
高度な制御
- 精密なパラメータ調整: 各段階で細かい設定が可能
- 条件分岐: 条件に応じて処理を分岐させられる
- バッチ処理: 効率的な大量生成が可能
メモリ効率
- 部分読み込み: 必要な部分のみメモリに展開
- 最適化: 不要な処理をスキップして高速化
拡張性
- カスタムノード: コミュニティが開発した豊富な追加機能
- API連携: 外部ツールとの連携が容易
代表的なカスタムノード
制御系
- ControlNet: 画像の構図や線画を制御
- IP-Adapter: 参照画像のスタイルを適用
- AnimateDiff: 動画生成機能
画質向上
- Upscaler: 高解像度化
- Face Restore: 顔の修復・改善
- Detailer: 細部の品質向上