解説動画を作るにあたり「1人解説より会話形式の方が、わかりやすいかも?」と思い、入力した文字をAIが読んでくれるVOICEPEAK(ボイスピーク)を購入してみました(^^)
実際に使ってみて、開いた口が塞がらないレベルで、AI音声の精度に驚いています
VOICEPEAK(以下、ボイスピーク)のレビューをしつつ、個人的に思った「どんな場面に役立つか?」など書いていきます。
・会話形式の解説動画を作りたい
・自分のオリジナルキャラクターに声をつけたい
・声出しNGなユーチューバー
・音声を使った商材や教材を作りたい
・ボイスピークとは何か?
・なぜ、有料の入力文字読み上げソフトを購入したのか?
・実際に使ってみた&作ってみた動画の紹介
・ボイスピークのメリット、デメリット
VOICEPEAK(ボイスピーク)って何?
『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。
株式会社AHSより
お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。
感情パラメータによる喜怒哀楽の表現にも対応しています。
https://www.ah-soft.com/voice/6nare/
上記の画像のように文字を打ち込むだけで、人間が話しているような音声を作り出すことができます(詳細は後述)。
AI音声といえば、最近はゲーム実況や解説動画でよく使われているVOICEROID(ボイスロイド)が有名ですね。
たとえば、
・紲星あかり(きずなあかり・CV米澤円)
・結月ゆかり(ゆづきゆかり・CV石黒千尋)
・・など、他にも色んなキャラがいます。
VOICEROID(以下、ボイスロイド)は、
株式会社エーアイが開発した人間的で自然な音声合成を実現することができる高性能音声合成ソフトウェアです。
株式会社AHSより
コーパスベース音声合成機能に加え、微妙なフレーズ(イントネーション)の調整やスピード調整、音声ファイルの作成などを行うことができます。
https://www.ah-soft.com/voiceroid/
ボイスピークとの大きな違いは、キャラクターデザインが最初からあることですね。
ボイスロイドは絵柄がサブカルチャー(オタク)向けが多いので、ゲーム実況などのエンタメ系コンテンツと相性が良さそうです。
あと、声を担当している声優さんがアニメやゲームなどで活躍している方が多いという点。
ちょっと前に、紲星あかりちゃんを使用したホラーゲーム実況動画を楽しく視聴させていただきました(^^)↓
https://www.nicovideo.jp/watch/sm40253219
対するボイスピークはイメージイラストなし。
声を担当している方々を見ていると、映画やテレビ番組、お店などのナレーター関係の仕事をしている方が多いようです。
※アニメやゲームに出演している方もいます
どちらかというと、公の場向け。
声の仕事をしている方々なので、もちろん聞きやすい声です
余談ですが、
この記事を書くのに調べてわかりましたが、株式会社AHSが企画や販売をしていて、合成音声のソフトを作っている会社は別々のようですね(^^;)
https://www.ah-soft.com/company/010_corpo.html
VOICEPEAKの詳細スペックや値段、購入場所、動作環境など
公式サイトに体験版もあるので、まずはお試しするのをオススメします(^^)
購入場所や値段、中身など
ソフトの名前:VOICEPEAK 商用可能 6ナレーターセット
発売日:2022年3月11日
商用利用:可能(ただし、禁則事項あり)
購入場所:楽天市場の出品者から
値段:23792円(クーポン適応価格)
パッケージorダウンロード:パッケージ版を選択
ライセンス(アクティベーションコード):1つ(PC1台分)
声優さん:7名(若森みづき・野宮佳乃・藍沢歩実・加瀬英臣・紙本瞬・柊一希・立石みこ)
どんなコンテンツに向いているか?:解説系の動画、アナウンス、商材など
対応OS:Windows、macOS、Linux
※値段に関して、実際には楽天スーパーセール(10.5倍)で購入したので、さらにポイント還元されています
※公式サイトからダウンロード購入だと23800円、パッケージ版だと24800円(AHSユーザー限定)~
※ボイスピークは色んなパソコンで使えるわけではなく、1台のみ。
パソコンを買い替えるなどの場合は旧パソコンのアクティベーションコードを解除→新しいパソコンにアクティベーションコードを入力し直す必要がある
商用利用可能ですが、禁則事項もあるようなので購入&使用される方は要確認↓
https://www.ah-soft.com/commercial/voicepeak/6nare/index.html
ザッと読んでみて気を付けたいのが‥
①音声素材を配布・販売する行為は禁止
②第三者に依頼された内容の音声を代わりに作成し、提供する行為は禁止(音声そのものを提供する行為は禁止)
③18禁コンテンツへの使用は禁止
④声優名をコンテンツに記載する行為は禁止
※ただし、②の禁止行為は‥
例)他社、顧客などの第三者に対し、音声を含んだ使用した成果物ではなく、依頼された内容の音声を代行で作成し、その音声そのものを提供する。
株式会社AHSより
・・とあるので、たとえば依頼された他人の動画にボイスピークで音声を付けて、動画自体を提供することは可能なようですね。
動画編集できる人なら、ボイスピークで音声を付けて動画を提供する仕事(普通の動画編集より単価がよい)も請け負えそうだね
動作環境
■OS
株式会社AHSより
Windows 11/10/8.1 またはそれ以降 (64bit)
Mac OS X 10.11 またはそれ以降
Ubuntu 18.04 またはそれ以降 (64bit)
Raspberry Pi (モデル:Raspberry Pi 4 / OS:Raspberry Pi OS (64-bit))
※VOICEPEAKは1ライセンスで1台の環境でのみご利用になれます。既に別のOS等でご利用いただいている場合は、ご利用中のVOICEPEAKを先に「アクティベーション解除」してからインストールを行ってください。
■CPU
Intel Core i3以上または同等のAMDプロセッサー
■メモリ
2GB以上
■ハードディスク容量
インストールに500MB以上の空き容量が必要(SSD推奨)
■ディスプレイ解像度
1920×1080以上推奨(必須解像度:1280×720)
■その他
DVD-ROMドライブ(パッケージ版)、オーディオデバイス、インターネット接続環境必須
※アクティベーションならびに最新バージョンのアップデート、ユーザーサポートをお受けいただくためにコンピュータがインターネット環境に接続されている必要があります。
※上記の動作条件を満たしている場合でも、すべてのコンピュータにおける動作を保証するものではありません。
https://www.ah-soft.com/voice/6nare/index.html#spec
動作環境表をみると、低スペックすぎるPCだと厳しいけど、やや低スペック~だと大丈夫そうですね。
自身が使っている中スペックほどのPCでは問題なく動作しています
しかし、音声を作るなら動画編集とセットになる場合が多いと思うので、やはりある程度スペックの高いPCは必要だと思います(^^;)
※動画編集=高スペックPCが必須
自身のパソコンスペック↓
あと、Windows11でも動作可能なのは良いですね(^^)
これからパソコンを買い替えても使えるということなので。
ちょっとした特典がある
商用・業務利用可能なイラストデータ(女性・男性・ネコ3種)が無料で使えるようです。
動画で使用する場合、個人・法人問わず商用利用・業務利用が可能なイラストデータです。
株式会社AHSより
各データ内に収録されているガイドラインをご確認の上ご利用ください。
https://www.ah-soft.com/sozai/index.html
イラストを描くのが苦手な方には、ありがたい特典ですね(^^)
なぜ、有料の入力文字読み上げソフト(VOICEPEAK)を購入したのか?
・無料だと条件が厳しいソフトが多いから
・サブスクリプション(月額制)じゃないから
・7ナレーターだったので、お得に感じた
・2022年発売の比較的新しいソフトだったから
無料だと条件が厳しいソフトが多いから
ちょっと前に無料(条件付)で使える入力文字読み上げソフト「音読さん」を使ったことがあるんですが、こちらも精度が高くて、有料版も使いたいなと思っていました。
ただし、無料でも有料でも文字制限があったり、有料だと月額制であったりと個人的には条件が厳しめでした(^^;)
一応、ほかの入力文字読み上げアプリやソフト(無料)も見てみたんですが、クレジット表記が必須だったり、商用不可だったりと条件が厳しめなものが多い印象でした。
サブスクリプション(月額制)じゃないから
個人的にはサブスクリプションが苦手なので、「買い切り&文字制限なし&精度のよい読み上げソフト」の中から検討していました。
色々と探しているうちに、ゲーム実況などで有名なボイスロイドにたどり着き、ボイスピークを見つけた感じです。
ボイスピークは「買い切り&文字制限なし&精度のよい読み上げソフト」の条件にマッチしていました(^^)
月額制サービスは、やめるかどうか決める時に脳(判断力)を使うので生活必需品以外は、できるだけ避けるようにしています
7ナレーターだったので、お得に感じた
ほかのボイスロイドを見てみると、ボイスロイド1名を購入する場合7980円+税(公式サイトのDL価格)~となっています。
※2022年9月時点の情報で、選ぶキャラクターによって値段が変わります
ボイスピークは7名のナレーターセットです。
AHS社からDL版を購入する場合、23800円÷7人=1名あたり3400円とボイスロイドよりお得です(^^)
※他サイトでもセールを利用すれば、割引やポイント還元で、もっとお得に購入できる場合もあります
デメリットなどは後述しますが、複数人のナレーターがほしい場合は「ボイスピーク」がオススメです
2022年発売の比較的新しいソフトだったから
・古いソフトより新しいソフトの方が現在&ちょっと先のOSに対応している
・音声合成を作っている会社がソフトを作る度にノウハウを蓄積し、精度が高くなっている可能性が高い
おもに、この2つの理由でボイスピークを選びました。
寿命が長く、精度も高いのでソフト系は発売から数か月後のレビューが出てきたあたりに購入するのがオススメです。
悪いレビューが目立つようなら、購入を止めることもできますので。
初回限定価格(15800円だったらしい)を逃すのもったいなくない?
ソフト系はバグが付きものなので(パソコンゲームやOSとかも)、発売後に少し様子をみる方が多いようです。
大体はパッチファイルが無料でもらえたり、自動アップデートがあって修正されるんですが、大型バグだと直らない、または修正に時間がかかる場合があります。
本音をいうと、ここまで精度がいいなら初回限定価格(15800円)で購入したかったですがね‥(^^;)
実際に使ってみた&作ってみた動画
動画編集ソフトの練習もかねて、実際に動画を作ってみました。
※動画は音声が流れますので、ご注意ください
VOICEPEAKを使ったキャラクター動画制作の流れ
この記事では使い方解説はしないので、簡単な流れだけ紹介します。
キャラクターや背景などの絵を用意する
↓
ボイスピークで音声を打ち込み、音声を確認して出力
(またはPCのメモ帳などに文字を入力しておき、ボイスピークの入力画面にコピー&ペーストでもOK)
↓
動画編集ソフトで絵と音声を合わせる+必要に応じてテロップを入れる
↓
動画への書き出し
↓
完成
自分のオリジナルキャラクターに声を付けてみた
自分のオリジナルキャラクターに声を付けてみる(女性バージョン)↓
自分のオリジナルキャラクターに声を付けてみる(男性バージョン)↓
ボイスピーク7ナレーターの声を聞いてイメージイラストを描いてみた動画↓
入力文字読み上げソフトは、アイデア次第で色々と使えておもしろいですね(^^)
VOICEPEAKのメリット、デメリット(初心者向け)
実際に使ってみて感じたメリットやデメリット、要望を書いています。
※ちなみに、AI合成音声を初めて使用する人(私)の感想です。
玄人だと また違った感想になるかもしれないので、その点はご了承ください。
メリット
音声精度が高い
前の方でも書いていますが、ほぼベタ打ち入力(抑揚調整しなくても)でも、高精度の音声が作れます。
抑揚調整・辞書登録などの手間が省けて便利だと思いました(^^)
※ただし、むずしい言葉、外国語や造語などは辞書登録が必要な場合があります
男女6名+子供1名なので、使用用途が広い
複数のナレーターがいるので、たとえば自分の音声を入れずにナレーター同士で会話させることも可能です。
じっさいに、紲星あかりと結月ゆかり(ボイスロイド)の会話形式の解説動画とかもあるしね
買い切りで文字制限がないので、好きなだけ使える
買い切りのメリットでもあり、デメリットでもあるんですが、文字数を気にしないで使えるのは嬉しいです(^^)
頻繁に使う方はすぐに元が取れると思います。
※毎月少ししか使わない場合は、月額制の方がお得な場合もあります
総合的には値段が他のボイスロイドより安い
前述していますが、ボイスロイドは1名あたり7980円+税~(キャラクターによる)ですが、ボイスピークなら1名あたり3400円で半額以上お得です。
絶対に「紲星あかり」や「結月ゆかり」を使いたいとか、音声は1~2名だけでOKとかじゃなければ、コスパ的にはボイスピークがいいと思います。
2022年9月時点では、声かぶりが防げるかも?
2022年9月時点の話になりますが‥
ボイスピークについて調べてみると、ボイスピークをレビューしている記事や動画、Amazon・楽天などで購入している方のレビューがボイスロイドと比べて少ないように感じました。
つまり、ボイスピークはマイナーということ。
なので、自分のオリジナルキャラクターに声を付ける場合、ほかのクリエイターさんと音声が、かぶることが少ないと思います。
なぜ人気がない(売れていない?)のかは不明ですが‥
ボイスピークは一応ナレーターという名目だから、ボイスロイドみたいなエンタメ系には向かないと判断されているのかな?
商用利用の範囲が広い
こちらも前の方で書いていますが、音声を直接販売、依頼者に音声を直接納品、18禁コンテンツに使用しなければOKという商用利用の範囲が広いのがうれしいです。
一例ですが‥
・音声を付けて解説動画を作り広告収入を得たり
・自作したゲームやアニメに声を当てて制作&販売したり
・自作した商材や教材に音声をつけて販売
‥などが可能です。
操作画面が直感的に わかりやすいので初心者にもオススメ
音声合成ソフトって初めて使ったんですが、操作画面がシンプルで直感的にわかりやすかったです。
じつは説明書や使い方解説をほとんどみないで、前の方で紹介している音声動画を作っています
喜怒哀楽や話す速さなどもパラメータバーで簡単に変えられるので、初心者ほどオススメじゃないかと思います。
デメリット
ボイスによって精度の違いがある?
一応、全部の声のサンプルを作ってみたんですが(前述の紹介動画を参照)、ボイスによって読み上げの精度の違いを感じました。
表記的には、女性1~3、男性1~3、女の子となっています。
体感的には、女性1の精度が1番高く、(女の子は特殊)ほかは1段階低い精度かな?と感じました。
※個人的には、女性1>男性2>その他(女の子別枠)と感じた
女性1
・ベタ打ちしてもほぼ自然に人間が話しているように聞こえる(ただし、難しい外国語などは別→辞書で設定できる)
・息づかいのような効果が入っていて、機械っぽさが少ない
その他のナレーター
・こちらの意図する読み方にならないことがあった
・息づかい効果がない(?)、女性1と比べて機械っぽさが出る
女性1>男性2(女の子別枠)以外は、なんとなく機械っぽさが出てしまうように感じました。個人的な感想ですが‥。
買い切りなので、最新のOSに対応しなくなる可能性がある
一応、ボイスピークはWindows11までは使えるようですが、今後Windows12(仮)が出た時にボイスピークが使えるかどうか分かりません。
個人的には、Windows12で使えない場合+合成音声を使いたい場合、その都度購入するのがいいんじゃないかと思います。
何年も先のこと(未来でも動画制作しているか)は、わからないですしね
人によっては7ナレーターは多いかも?
会話形式の動画を作る場合は、1~2名の音声(自分+合成音声または、合成音声①+合成音声②)があればいいので、7ナレーターは人によっては多いかもしれません。
それならボイスピークに23800円出すより、ボイスロイド1名→7980円+税~、またはボイスロイド2名→7980円+税×2=15960円+税で購入する方がコストを節約できます。
※2022年9月時点の金額
ご年配の方の声(男女)があると良かったかも?
これはデメリットというより要望ですが‥
Amazonのレビューでも見かけたんですが、ご年配~中年の方くらいの声があると、さらに使い道が広がっていいなと思いました。
たとえば、ご年配向け会話形式の解説動画を制作するとき、質問役にご年配の方の声をあてれば、より共感を得る動画を作ることができると思います。
叫び声や泣き声、○○弁には対応していない、疑問符に弱い
アニメをよく見る方ならお馴染みだと思いますが、プロ声優さん(人間)が演じるような迫力ある「叫び」や「泣き声」には対応していません。
たとえば、「きゃああああああぁぁあ!」みたいに打ち込んでもボイスピークでは棒読みでした(^^;)
※もしかすると、外部プラグインで作成することは可能かもしれませんが、ボイスピークだけでは不可
多少の喜怒哀楽は、かんたんに設定できるのですが、やはりプロ声優(人間)の演技にはかないません。
将来的には、プロ声優並みの合成音声AIができるのかも?とワクワクしていますが(^^)
あと、たとえば大阪弁や京都弁みたいな特殊なイントネーションを付けたい場合は、手動でパラメータを変えなければなりません。
たしか、ボイスロイド(女の子)で関西弁風にしゃべってくれるソフトがあるので、関西弁をしゃべらせたい場合はそっちを使った方がいいかもしれません。
AHS社のサンプルボイス↓
https://www.ah-soft.com/voiceroid/kotonoha_1/index.html#feature
※Amazonサイトには音楽素材や歌にのみ対応しているソフトや全部に対応しているものもあるので、商品説明は要確認。
あとは、疑問符のある言葉が弱いです。
解説動画を作成中なのですが、「教える側」・「質問する側」という ゆっくり解説みたいな形式を取っています。
※ゆっくり解説とは、東方キャラの霊夢・魔理沙のデフォルメされた首部分+ソフトボイスで分かりやすく解説された動画のこと
ゆっくり解説の例一覧↓
質問する側の「○○はどうなの?」という音声を作りたい場合、ベタ打ちだと若干イントネーションが変です。
語尾のイントネーションを少し上げるとマシになりますが、まだ違和感があるかも‥?(^^;)
ボイスピークに対する他の方のレビューなどを紹介
Amazonで他の方のレビューも調べてみました。
評価:★★★★☆
・声の設定を変更すると不自然さが出る
Bon Jinさん
・ハイテンションな声にできない
・6ナレーターとなっているが男性/女性の3つはどれも大きな差がなく、実質2ボイス+幼児の声
たしかに、大人・学生・幼児・中年・年配・声の高低など色々あれば、もっと良かったですね(^^;)
評価:★★★★☆
ファイルサイズがかなり大きい
Raww Le Kluezeさん
自身が制作した男性ボイスピークテスト(P君動画)がボイスピークデータ自体が140KB、書き出した音声16個が9.53MBでした。
たしかに小さくはないですね(^^;)
評価:★★★★★
難しい操作はほぼ無く、ベタ打ちでも滑らかに喋ってくれます。初めて操作した時は、あまりに流暢に喋ってくれるのでリアルタイムで声優さんが喋っているのでは?と思いました笑
sakanaさん
細かいイントネーション等の調整もできるので、ほぼ人間が喋っているようにしか聞こえないです…!買い切りで商用利用可能というところも魅力的。
男女6人の声+女の子のセットですが、少し年配の落ち着いた声もあったら良いなと思いました。6名の声はアニメ声のような感じでは無いので、幅広いジャンルで使用できるのではないでしょうか。
クセがないので、公的な場所にも使えそうですね(^^)
評価:★☆☆☆☆
不具合かバグかMacにインストールできないです。不具合の連絡をするためにはユーザー登録してからサポートに連絡する必要があります。
シェフシンノスケさん
こういったのはほんと使いにくいですね。
初期不具合の場合にユーザー登録が必須なのは、たしかに面倒に感じますね(^^;)
評価:★★★★☆
特に個人的に感じたのは、ブロックごとの頭出しが、マウスでカーソルを合わせないと出来ない点。
nikyokuさん
“再生”、”先頭に移動”、”末尾に移動”、以外に各ブロック単位ごとで頭出しが欲しかったですね。
それともう一つは急に落ちた時に、バックアップが自動でされていない為、復元が不可能という点ですかね。
一時ファイル的な物を自動で保存できたらもっと使い勝手は良くなっていただけにその辺が残念ではあります。
※レビューは発売当初の2022年3月のものもあるので、修正されているものもあります
そういえば‥音声確認後に再生バーが自動的に「先頭」に戻らないのは、たしかに不便でしたね‥(^^;)
まとめ:VOICEPEAKは会話形式の解説動画にオススメ!(その他の用途にも)
・ほぼベタ打ちでお手軽に高品質のナレーターが作れる
・ただし、ナレーターによって精度の違いを感じた
・商用利用が可能なので、色んな用途に使える(ただし、禁則事項あり)
・会話形式の動画に便利!
・1名あたりのナレーター費用のコスパがいい
・2名までしか使わない場合は、ボイスロイド1~2名を購入した方が金銭負担が少ない
個人的には、ボイスピークを購入して良かったと思っています。
いまのAI合成音声技術も知ることができましたし、動画制作も捗りそうです(^^)
イラストランキング
にほんブログ村