「AIで顔を差し替えられる」と聞いたことはある?
このステップでは、FaceFusionの基本からしくみまでをゼロから丁寧に解説します。
// 01. 基本の「き」
FaceFusionは、画像や動画の中の顔を別の顔に差し替えるAIツールです。オープンソースで無料公開されており、自分のPCにインストールして使えます。
もともとは「DeepFaceLab」「Roop」など先行ツールの流れを受け継ぎ、2023年に登場。直感的なWebUI(ブラウザ操作)で動き、技術的な知識がなくても比較的簡単に顔スワップが実現できます。
「映画のスタント映像でスターの顔を合成する」技術が、誰でもPCで使えるようになったもの。プロの映像スタジオが何日もかけてやっていた作業が、数十秒〜数分でできます。
写真や動画の顔部分を、指定した別の顔に高精度で差し替えます。
スワップ後の顔をAIで綺麗に補正。低解像度もリアルに仕上がります。
GitHubで公開されており、コードも全て無料で利用できます。
ブラウザから操作できるGUI付き。コマンドラインが苦手でも使えます。
// 02. 他との違い
顔スワップツールは複数存在します。それぞれの特徴を比べてみましょう。
| ツール | 価格 | ローカル動作 | 使いやすさ | 品質 |
|---|---|---|---|---|
| FaceFusion | 無料 | ◎ 可能 | ○ WebUI | ◎ 高品質 |
| DeepFaceLab | 無料 | ◎ 可能 | △ 難しい | ◎ 高品質 |
| Roop / roop-unleashed | 無料 | ◎ 可能 | ○ やや簡単 | ○ 普通 |
| SwapFace(クラウド) | 有料 | ✕ クラウドのみ | ◎ 簡単 | ○ 普通 |
FaceFusionは無料・ローカル動作・WebUI操作・高品質のすべてを満たす数少ないツール。DeepFaceLabより手軽に始められながら、品質は引けを取りません。
// 03. 仕組み
FaceFusionは内部でいくつかのAIモデルを組み合わせて動作しています。流れを順に見てみましょう。
FaceFusionが使うコアAI技術。顔の「特徴量(顔の形・目・鼻・口の配置など)」を抽出し、ターゲット画像の顔の位置にフィットさせて自然に合成する技術です。
ソース画像・ターゲット画像の両方から顔領域を検出します。RetinaFaceなどの顔検出モデルが使われます。
ソース(差し替えたい顔)の顔特徴をベクトルとして抽出。目・鼻・口・輪郭の位置情報を数値化します。
InSwapperモデルがターゲットの顔位置に、ソースの顔特徴を自然にフィット。照明・角度・表情の違いも補正します。
GFPGAN・CodeFormer等のエンハンサーで合成後の顔を超解像・補正。より自然でリアルな仕上がりになります。
完成した画像・動画を指定フォルダに保存。動画の場合はフレームごとに処理し、最後に映像として結合します。
マスクを被るイメージ。ソースの顔という「マスク」を、ターゲットの顔の上にぴったりフィットさせる感じです。AIがマスクの形・サイズ・光の当たり方をリアルタイムで調整してくれます。
// 04. 歴史
急速に進化してきたFaceFusionの主要な歴史を追ってみましょう。
Roopの後継として登場。より高品質なスワップと使いやすいUIで注目を集める。
Gradioベースの直感的WebUIが大幅改善。プレビュー機能・Enhancer選択が充実。
複数人の顔を一括スワップ可能に。動画処理の安定性・速度も大幅向上。
新モデルの追加、処理速度・品質の継続改善。コミュニティによる拡張も活発。
// 05. 活用例
FaceFusionでできる主な用途を見てみましょう。ただし利用には倫理的な配慮が必要です(Step5で詳しく説明)。
映画・YouTube・SNS動画の演出として。キャラクター変更やコスプレ表現に使われます。
グループ写真で目をつぶった人を、別カットの表情に差し替えるなど実用的な用途も。
ゲームキャラクターに自分の顔を適用したり、ユニークなアバター作成に活用。
コンピュータビジョン・ディープラーニングの学習素材として。AI技術理解の入口に。
映像プロダクションのビジュアル確認・プリビズ(事前確認用映像)制作などに。
同意なき本人の顔利用・フェイクニュース・詐欺目的での使用は法的・倫理的に完全NG。
// 06. 準備
FaceFusionをローカルで動かすには、ある程度のスペックが必要です。詳細は次のステップで解説しますが、まず概要を確認しましょう。
FaceFusionはGPUを使って高速処理します。NVIDIA GPU(CUDA対応)推奨。VRAM 4GB以上が目安。CPUのみでも動作しますが非常に遅くなります。
| 環境 | 動作 | 速度目安(画像1枚) |
|---|---|---|
| NVIDIA GPU(VRAM 8GB+) | ◎ 最適 | 数秒 |
| NVIDIA GPU(VRAM 4〜6GB) | ○ 動作可能 | 数秒〜十数秒 |
| CPU のみ(Intel/AMD) | △ 低速 | 数十秒〜数分 |
| Apple Silicon(Mac M1/M2+) | ○ CoreML対応 | 数秒〜十数秒 |
CPUモードでも動作しますが、画像1枚に数分かかることがあります。動画処理は現実的ではありません。Google ColabなどのクラウドGPUを使う方法もあります(Step2で説明)。
// Step 1 完了!
何ができるか、どんな仕組みか、どんなPCが必要かがわかりましたね。
次はいよいよインストール方法に進みましょう!