今回は話すアバターをAIを使って作成し、二つのサービスを比較してみたいと思います。
近年、AIを使って画像生成が出来るようになってきてそれに伴い、今度はその作成した人物を喋らせるようにする事が出来るようになってきています。
アメリカのトランプ元大統領のディープフェイクが一時話題になったように、そのあまりのクオリティは本物の人間により近づいてきています。
悪用はダメですが、あくまで個人的な趣味の範囲内であれば全然作成して問題ないので、今回はAIで作成した人物をそれぞれのサービスを使って話すようにし、それを比較していきたいと思います。
良ければ最後までご覧下さい。
creative reality studio(D-ID)
一つ目のサービスはcreative reality studioです。

「Creative Reality Studio」は、イスラエルのAI関連企業Studio D-IDが開発したプラットフォームです。このプラットフォームを使用すると、テキストを入力するだけでアバターやアニメーションの作成が可能となります。特に、静止画やイラストをアップロードし、テキストを入力することで、しゃべる動画を生成することができます。
「Creative Reality Studio」の特徴
- ユーザーフレンドリーなインターフェース:
- 「Creative Reality Studio」は、初心者から上級者まで、誰でも簡単に利用できる直感的なインターフェースを持っています。特別な技術的知識や経験は必要ありません。
- テキストベースの動画生成:
- ユーザーはテキストを入力するだけで、その内容に基づいたアバターの動画を生成できます。これにより、迅速にコンテンツを作成することが可能となります。
- 静止画を活用した動画作成:
- イラストや写真などの静止画をアップロードすることで、それをベースにした動画を生成することができます。これにより、オリジナルのコンテンツを簡単に作成することができます。
- 高度なAI技術の採用:
- 「Creative Reality Studio」は、最先端のAI技術を活用しています。これにより、静止画からプロフェッショナルなビデオを高品質で、かつ迅速に作成することができます。
- 多様な用途に対応:
- プレゼンテーション、広告、教育、エンターテインメントなど、さまざまな用途での動画作成が可能です。ユーザーのニーズに合わせて、柔軟にコンテンツを生成することができます。
- オンラインでのアクセス:
- クラウドベースのプラットフォームであるため、インターネットが接続されていれば、どこからでもアクセスして動画を生成することができます。
Hey Gen
二つ目のサービスは「Hey Gen」です。

「HeyGen」は、テキストベースの情報をもとにアバタービデオを生成する革新的なツールとして、多くのユーザーから注目を集めています。
さらに、HeyGenは以前「Movio」という名前で知られていましたが、「Movio Rebrands to HeyGen: Introducing the Future of AI-Driven Video」というニュースリリースによれば、ブランディングを変更し、AI駆動のビデオ生成ツールとしての新しいスタートを切ったとのことです。
ただ日本語に対応していないので使い方がわかりにくいのが難点です。
Hey Genの特徴
- シンプルな操作:
- ユーザーはテキストを入力するだけで、アバタービデオを簡単に生成できます。特別な技術的知識や経験は不要です。
- カスタマイズ可能なアバター:
- 性別や肌の色など、アバターの外見をユーザーの好みに合わせてカスタマイズすることができます。
- 画像との組み合わせ:
- ユーザーは、アバタービデオに表示させたい画像のURLを提供することで、その画像とともにアバターが表示されるビデオを生成することができます。
- 高品質なビデオ生成:
- 「Hey Gen」は、テキストの内容に基づいて、自然な動きと発話を持つアバタービデオを生成します。
- 多様な用途に対応:
- プレゼンテーション、広告、教育、エンターテインメントなど、さまざまな用途での動画作成が可能です。
- クラウドベースのサービス:
- インターネットが接続されていれば、どこからでもアクセスして動画を生成することができます。専用のソフトウェアのインストールやアップデートの必要はありません。
- 短時間での動画生成:
- 「Hey Gen」は、入力されたテキストに基づいて、迅速にアバタービデオを生成します。これにより、ユーザーは待ち時間なく結果を確認することができます。
それぞれのサービスを使用して話すアバターを作成した感想
そしてcreative reality studioとHey Genの機能を使ってそれぞれアバターを喋らせてみました。
こんな感じです。
この女性は正面を向いておらず、あえてこちらを見るような状態で作成しましたが、かなり違いが明確に分かれたと思います。
正直、正面を向いている人物の画像を喋らせる場合はそこまで違いはありませんでしたが、こういう風に人物の顔の向きによって違和感が出たのはcreative reality studioの方でした。
creative reality studioの方は顔の表情や口の動きは問題ありませんでしたが、顔を少し傾けた際の顔の輪郭が奇妙に変化しており、それに対しHey Genの方は顔の輪郭も話す表情もそこまで違和感なかったように感じました。
このあたりは他の方の指摘しているようにやはりクオリティーの差はあるのだと思います。
しかしアバターが正面を向いて喋らせる場合はそこまで差はなかったように思います。
ただcreative reality studioはグーグルアカウントがあればすぐ使用できる上に、初回無料分が20クレジットあるのが大きいです。(合計5分の動画が作成可能)

それに対しHey Genは無料分が1クレジットしかありません。(1分の動画が作成可能)

とりあえず無料分のクレジットを使用してどんな感じに仕上がるのか見てみてそれで使う価値があると判断できた場合に有料プランに移行するのが良いと思います。
Creative reality studioの公式HPはこちら。
Hey Genの公式HPはこちら。
まとめ
いかがでしたか。
今回は二つのサービスを使って話すアバターを比較してみました。
ざっとまとめるとこんな感じです。
creative reality studio:口の動きや表情は良いが、モデル画像の顔の向きによっては違和感が出てしまう。
Hey Gen:表情は少ないが、一貫して安定している。
個人的にはHey Genの方がいいかなと感じました。
料金体系についてもそこまで差はないので(どちらかというとcreative reality studioの方が少し高い)好きな方を使ってみていいのではないでしょうか。
こちらでも動画でまとめているので良ければ見てみて下さい。