ComfyUIは、Stable Diffusionなどの拡散モデルを使用した画像生成のためのノードベースUIである。

ComfyUIの基本概念

ノードベースワークフロー

ComfyUIは従来のテキストボックス形式ではなく、ノード(節点)を線で繋ぐ方式でワークフローを構築する。各ノードが特定の機能を持ち、それらを組み合わせて複雑な画像生成プロセスを作成できる。

基本的なノード構成

入力系ノード

  • Checkpoint Loader: モデル(チェックポイント)を読み込む
  • CLIP Text Encode: プロンプトをテキストエンコーディングする
  • Empty Latent Image: 生成する画像のサイズを指定

処理系ノード

  • KSampler: 実際の画像生成(サンプリング)を行う
  • VAE Decode: 潜在空間から画像に変換
  • LoRA Loader: LoRAモデルを適用

出力系ノード

  • Save Image: 生成された画像を保存
  • Preview Image: 画像をプレビュー表示

ワークフローの例

基本的な画像生成ワークフローは以下のような流れになる:

Checkpoint Loader → KSampler → VAE Decode → Save Image
       ↓              ↑
CLIP Text Encode → [正プロンプト]
CLIP Text Encode → [負プロンプト]
       ↑
Empty Latent Image

AUTOMATIC1111との比較

項目ComfyUIAUTOMATIC1111
UI形式ノードベース従来型フォーム
学習コスト高い低い
柔軟性非常に高い標準的
カスタマイズ高度限定的
メモリ効率良い普通
処理速度最適化可能標準

主要な利点

高度な制御

  • 精密なパラメータ調整: 各段階で細かい設定が可能
  • 条件分岐: 条件に応じて処理を分岐させられる
  • バッチ処理: 効率的な大量生成が可能

メモリ効率

  • 部分読み込み: 必要な部分のみメモリに展開
  • 最適化: 不要な処理をスキップして高速化

拡張性

  • カスタムノード: コミュニティが開発した豊富な追加機能
  • API連携: 外部ツールとの連携が容易

代表的なカスタムノード

制御系

  • ControlNet: 画像の構図や線画を制御
  • IP-Adapter: 参照画像のスタイルを適用
  • AnimateDiff: 動画生成機能

画質向上

  • Upscaler: 高解像度化
  • Face Restore: 顔の修復・改善
  • Detailer: 細部の品質向上