SATO-AI塾は閉塾いたしました。ご自由にご覧ください➡ 動画保管庫へ

【初心者向け】動画生成AIの基本講座(2024.9)

1. はじめに

動画概要

本教材では、動画生成AIの基本を学ぶ上での留意事項についてお話いたします。

重要ポイント

  • 動画生成AIの技術は急速に進化しており、最新の技術に適応する必要があります。
  • 現在、標準的には10秒の動画生成が可能で、エクステンド(延長)機能を使うと最大40秒まで生成できます。
  • 将来的には、1つのプロンプトで長時間の動画が生成できる可能性があります。

目次

  • 動画生成AIの進化
  • 現状の動画生成
  • 詳細プロンプトは応用編

2. Runway Gen-3 プロンプト作成

動画概要

本教材では、動画生成AI「Runway Gen-3」のプロンプト構造と効果的なプロンプトの作成方法について解説します。プロンプトの基本構造や、効果的なキーワードの選び方を学び、理想的な映像を生成できるようにしましょう。

重要ポイント

  • Runway Gen-3のプロンプト構造は「カメラの動き」「主題」「シーン」の順に設定します。
  • プロンプトのキーワードは、互いに矛盾しないように設定することが重要です。
  • 特定の効果を表現するために、適切なキーワードを選ぶことが成功の鍵です。

目次

  • Runway Gen-3の基本的なプロンプト構造
  • カメラタイルとライティングスタイルの設定
  • 動きの表現と速度設定
  • キーワードの選び方と組み合わせのコツ
  • プロンプト作成の注意点

3. Runway Gen-3 テキストから動画作成

動画概要

  • 動画生成のプロンプト構造は「カメラの動き」「主題」「シーン」の順に設定します。
  • 今回の動画生成はカットごとに作成します。
  • プロンプト作成時には文字数制限(500文字)を考慮し、効率的に情報を伝えることが重要です。

重要ポイント

  • Text to Videoの基本操作と設定
  • プロンプトの基本構造とエピソードの設定
  • 各カットのプロンプト作成とジェネレート手順
  • 映像スタイルの設定と注意点
  • 効率的なプロンプト調整と翻訳の活用方法

目次

  • Text to Videoの基本操作と設定
  • プロンプトの基本構造とエピソードの設定
  • 各カットのプロンプト作成とジェネレート手順
  • 映像スタイルの設定と注意点
  • 効率的なプロンプト調整と翻訳の活用方法

Runway Gen-3 プロンプト(Runway Gen-3 公式ドキュメント)
※リソースはナレッジ化して使ってます。

#前提条件:
- タイトル: Runway Gen-3 Alpha用プロンプト作成
- 依頼者条件: クリエイティブで心動かされる動画を作りたい人
- 製作者条件: Runway Gen-3 Alpha専門のプロンプトエンジニア。ユーザーの指示を元に、高品質な動画生成プロンプトを作成することが目標。
- 目的と目標: ユーザーの指示や画像を元に、Runway Gen-3 Alphaで高品質な動画を生成するための、非常に簡潔で効果的なプロンプト(最大300トークン)を作成する。
- リソース: gen-3 prompt,gen-3 usecase
- 評価基準: プロンプトの簡潔さ、トークン数、キーワードの適切さ、ユーザーの意図、視覚的な魅力、創造性
- 明確化の要件:
 - ユーザーの意図を正確に理解すること
 - 動きや雰囲気、スタイルの要素を把握すること
 - gen-3 promptを参照して最適なプロンプト構造を選択すること

#実行指示
1. ユーザーのインプットを分析し、可能な限り短い単語とフレーズを用いて、適切なプロンプトを構築する。
2. プロンプトは以下のいずれかの構造に従って作成する:
 - (テキスト入力時) [camera movement]: [establishing scene], [additional details]
 - (画像入力時) [camera movement]: [additional details describing motion, lighting, and style]
3. 最も重要な要素に絞って記述し、全体的な雰囲気や動きを重視する。
4. 会話的な言葉や命令形を避け、視覚要素を詳細に説明する。
5. カメラアングル、照明スタイル、動きの速度と種類、スタイルと美学などのキーワードを厳選して使用する。
6. レンズタイプ、フィルムグレード、照明効果などの技術的な映画用語を必要最低限組み込む。
7. ネガティブプロンプトを含めず、望ましくない特性は言及しない。
8. 創造性を感じる動きや表現を加えるが、トークン数に注意する。

#制約条件
- プロンプトは絶対に300トークン以内にすること(最大500トークンまで入力可能だが、300トークン以内で表現することが重要)。
- 一つの連続したテキストとして作成し、段落や箇条書きを使用しない。
- 英語で作成する。
- 生成された動画の長さや解像度についての指定は行わない。

#補足:
- オープニングは不要です。
- 指示の復唱はしないでください。
- 自己評価はしないでください。
- 前置きや余計な説明は不要です。

4. Runway Gen-3 画像から動画作成

動画概要

本教材では、Runway Gen-3の「Image to Video」機能を使用して、画像を元に動画を生成する方法について解説します。基本的なプロンプトの設定や、映像を作成する際の注意点を学び、より具体的な表現ができるようになることを目指します。

重要ポイント

  • Image to Videoでは、画像を基にして動画を生成します。ファーストとラストの設定により、画像が動画の最初や最後にどのように表示されるかを決定します。
  • カメラワークやプロンプトの内容に注意し、破綻しない動画を生成することが重要です。
  • プロンプトの調整を繰り返すことで、理想に近い動画を作成できます。

目次

  • Image to Videoの基本操作と設定
  • プロンプトの作成と設定方法
  • ファーストとラストの設定と使い分け
  • 効率的なプロンプト調整と修正方法
  • 具体的なシーン作成の例

5. D-ID 画像から口パク(リップシンク)させる

動画概要

本教材では、画像から口パク動画を作成する方法について解説します。使用するAIは「D-ID」です。音声を用意する手間が少なく、簡単に口パク動画を作成できます。

重要ポイント

  • D-IDを使用して、画像から口パク動画を簡単に作成できます。
  • 音声のテキスト入力で口パク動画を生成可能です。日本語にも対応しています。
  • 無料プランではD-IDのウォーターマークが入るため、商用利用を考える場合は有料プランを検討する必要があります。

目次

  • D-IDの基本設定と登録方法
  • 画像のアップロードと音声テキストの入力
  • 口パク動画の生成とプランの選択
  • 商用利用とプランの選択について

6. AKOOL ディープフェイク動画を作る

動画概要

本教材では、動画生成AI「AKOOL」を使ってディープフェイク動画を作成する方法について解説します。AKOOLは高品質なディープフェイク技術を提供しており、情報発信やコンテンツ作成に役立つツールです。

重要ポイント

  • AKOOLは、既存の動画に別の顔をスワップ(置き換え)するディープフェイク技術を簡単に利用できます。
  • 顔の度合いや強度を調整することで、ディープフェイクの品質をカスタマイズできます。
  • 商用利用を考える場合は、プロプランへの加入が必要です。

目次

  • AKOOLの基本設定と登録方法
  • 動画や画像のアップロードとフェイススワップの設定
  • 顔の強度調整とディープフェイクの生成
  • プランの選択と商用利用のポイント
  • APIの活用と応用方法の検討

7. Heygen 自分の分身アバターを作る

動画概要

本教材では、Heygenを使用してアバター動画を作成する方法について解説します。スマートフォンやWebカメラで撮影した動画を利用し、自分の分身となるアバターを簡単に作成することができます。

重要ポイント

  • Heygenを使用することで、自分自身やオリジナルキャラクターのアバターを簡単に作成できます。
  • 動画はスマホで撮影した高品質なものを使用することを推奨します。Webカメラでも作成可能ですが、画質に影響があります。
  • アバターを作成する際には、読みやすい原稿を用意し、適切な表情や間を意識して撮影することが重要です。

目次

  • Heygenの基本設定と登録方法
  • 動画のアップロードとアバターの作成手順
  • スマホを使った高品質な動画撮影のコツ
  • アバター作成の注意点と認証プロセス
  • 実際のアバター動画の作成と活用方法

8. Heygen アバター動画を作る

動画概要

本教材では、Heygenを使用してアバター動画を作成する方法について解説します。自分のアバターを作成し、テキストを入力することで、アバターが指定した内容を話す動画を簡単に作成できます。表情や音声の細かい調整も行え、さまざまなシチュエーションに対応した動画を作成することができます。

重要ポイント

  • Heygenでは、事前に作成したアバターにテキストを入力し、さまざまな言語や声の設定で動画を作成できます。
  • 音声設定にはJapaneseの中に「default locale」や「japan」の選択肢があり、用途に応じて調整できます。
  • アバターの動作やテキスト内容を調整しながら、自然な動画表現を目指しましょう。

目次

  • Heygenの基本設定とアバターの選択方法
  • テキスト入力と音声設定の使い分け
  • テキストの修正とアバターの動作調整
  • 映像の長さとスクリプトの調整方法
  • 実際の動画作成と出力の手順