2025年12月13日土曜日

声が出せなくなったVTuberにAI合成音声を作った話

声が出せなくなったVTuberにAI合成音声を作った話
トップ画像はNano Banana Proにて作成

こちらはAI声づくり研究会 Advent Calendar 2025の13日目の記事です。


こんにちは、しちEです。

この記事では、怪我で発声が難しくなったVTuberさんのために、本人の許可を得たうえでAI合成音声(Text to Speech:TTS)を作り、配信で使ってもらった記録を書きます。


⚠️注意⚠️

  • AI合成音声を作成・使用するときはご本人に迷惑にならないように、本人の明示的な許可を取るようにしましょう。
  • この記事は「無断で声を真似する」手法を推奨するものではありません。  
  • AITuberの話ではありません。


作ることになった経緯

葛ノ葉 鈴撫(くずのは すずなで)さんというVTuberさんがいます。

YouTubeとXのアカウントはこちら↓



この方が4月に顎と歯を怪我してしまい、しばらく発声が難しい状況になりました。 

雑談をよくする方なので喋れなくなったのは辛そうでした……

復帰後の最初の配信では、既存の合成音声(TTS)を使って進行していましたが、明らかに普段の声と雰囲気が大きく違う合成音声で配信するのは違和感ありました。

そこで、本人の声を学習させた合成音声を作って渡して良いか?と連絡し、許可をいただいたうえで制作しました。(許可は大事)


使ったツール

本人の声を再現させるための合成音声は「Style-Bert-VITS2 JP-Extra」を採用しました。

採用理由は次の通りです。

  • 無料のOSSで個人のPCで学習ができる
  • 日本語の発声に特化しているTTS
  • 学習するための環境構築が簡単
  • 発声するための環境構築が簡単
  • CPUモードがあり、最低限の動作要件を満たしやすい
  • 文字入力から発声までがキーボードで完結する


試作モデルの作成

ツールの使い方は以下の動画を見るのが早いと思うので、ここでは手順の要点だけ書きます。  


今回は本人の過去配信から数時間程度の音声をキャプチャしました。

BGMがうっすらと流れていたので、「Ultimate Vocal Remover」で音声抽出を行い、音源を作りました。


前処理した音源をStyle-Bert-VITS2でスライスしたところ、458個合計1時間5分のwavファイルが出来上がりました。

その後、自動で文字起こしをしてesd.listを作成し、esd.listをそのまま音声と共に学習ターゲットに設定しました。

まずは様子見のため、パラメータはデフォルトで一晩PCをぶん回しました。


そして出来上がったモデルの音声がこちら。(1つ目のセリフはこのポストから拝借)

怪我する前の配信の音声と聴き比べてみましょう。


これでも本人っぽさは出ましたが、まだ改善余地がある品質でした。  

ここでいったん本人に渡し、改善方針を探りました。


改善

Discordサーバーの「AI声づくり研究会」の中で検索すると色々な知見がありました。

どうやら音声素材をを雑に大量投入するのは逆効果になり得るらしい。

そこで、素材の間引き書き起こしの校正パラメーターの調整を行いました。


①素材の間引き

458本をそのまま聴いて選別するのは現実的ではないため、条件を定義して自動で候補を落としました。

除外した主な条件は以下です。

  • 笑い声が大きい/長い
  • 「えーと」「あのー」などのフィラーが多い
  • ノイズが強い
  • 音量差が極端

この条件に合うような音声を選別するために、ChatGPTに聞いてスクリプトを組みました。

(ここにスクリプトを書くと非常に長くなってしまうので割愛します)

結果として、149個合計20分のwavファイルに絞りました。(試作モデルでは使っていない音声ファイルも一部含まれています)


②書き起こしの校正

選定した素材をすべて聴いて、esd.listで音声と合っていないところはすべて修正しました。

例えば、

  • 「漫画の画力がまじでレベずで高い」→「漫画の画力がまじでレベチで高い」
  • 咀嚼の方が主流だから」→「ソシャゲの方が主流だから

などです。


③パラメーターの調整

パラメーターの方はバッチとエポック数を変更しました。

  • batch: 1 → 2
  • epochs: 100 → 500

本当はパラメーターの比較したほうが良いのですが、そんな時間はなかった……


そして出来上がった改良版はこちら。

なかなか良いのでは!?


改良版を実際に配信で使ってもらった回はこちら。

いい線いってる気がします!

視聴者からは「本人の声の再現度高い!」「合成音声なんだ!?」「最初聞いた時もう治ったのかと思った」といった反応もあり好評でした。

本人にも喜んでもらえたので、作った甲斐がありました!


今回のように、配信者が自身の合成音声を一時的とはいえ普段使いする前例はあまりないのではないでしょうか?

昨今、AIボイスが問題視されがちですが、本人の同意があり、目的が明確で、困りごとを解決するなら、技術が役に立つ場面もあります。


技術で人助けができるのは良いですね!

今回は魔王助けでしたけど。

2023年9月18日月曜日

「LODGE XR Talk」と「バーチャルマーケット2023リアルinアキバ」でミニゲームを展示しました

こんにちは、しちEです。

「LODGE XR Talk」と「バーチャルマーケット2023リアルinアキバ」で自作ミニゲームの「スプれっ!」を展示したので、そのことを書いていきます。

どのようなミニゲームだったのかは以下の動画でどうぞ!


ミニゲームの内容

裸眼立体視ディスプレイ「Looking Glass Portrait」とトリガーの重さを制御できるPS5コントローラー「DualSenseコントローラー」を組み合わせたコンテンツです。
奥から流れてくるキャンバスに魔法のスプレーで色付けをしますが、画面中央に立体的に見える仕切りがあるのでキャンバスを見るには顔を左右に振る必要があります。
コントローラーのL2/R2トリガーを押すと左右のスプレー缶からスプレーが噴出し、キャンバスに当てられたら成功になり、これを90秒間続けます。

DualSenseコントローラーはL2/R2トリガーの重さを変えられるので、スプレーの残量に応じて変化させました。
スプレーの残量が減ったらコントローラーを振ることで回復できます。これによりゲーム性が増します。

また、コントローラーのスピーカーから効果音を鳴らすと同時にその音に合わせた振動をすることでよりスプレーらしくしました。

技術的な記事は別に書く予定ですのでそちらもお楽しみに!

LODGE XR Talk

「LODGE XR Talk」には2023年7月13日開催のVol.5と8月11日開催のVol.6の2回展示しました。
私はVol.5でα版を展示、Vol.6で完全版を展示しました。



過去のイベントは何回か一般参加したことがありますが、展示参加はこれが初めてでした。
このイベントはXR系の技術者やアーティストが多く参加される空間なので、的を射たアドバイスをもらいやすかったです。
こちらは月イチで定期開催されていて、一般参加も出展参加も無料でできるのでオススメです!


バーチャルマーケット2023リアルinアキバ

「バーチャルマーケット2023リアルinアキバ」はバーチャルマーケット史上初めてのリアル会場での試みで、2023年7月29~30日にベルサール秋葉原で開催されました。



地上階は企業が出展している「カンパニーエリア」、地下はなんでもあり一般公募の「パラリアルクリエイターエリア」、バーチャルを盛り上げてきたコミュニティの「バーチャルコミュニティエリア」、ライブやトークショーが行われる「スペシャルステージエリア」に分かれていました。
私は一般公募に落選したのですが、友人のシロフードさんが当選し共同出展のお誘いをしていただいたおかげで「3D立体視デバイス体験会」として7月29日に展示しました。


このイベントは予想以上に来場者が多く、入場制限がかかっていました。
そのため休む暇がなくずっと立ったまま説明をしていたのでめっちゃ疲れた……
こちらは立地の影響もあってLODGE XR Talkとは違いお客さんは一般人がほとんどでした。


冬にも開催されるそうなので興味ある方はチェックしてみてください!

久しぶりに展示をしましたが、自分のコンテンツが「面白い!」「良いね!」と言われるのはクリエイター冥利に尽きますし、色々とコミュニケーション取るのは楽しいですね!
今後も何か作って展示したいです!

また、Looking GlassのDiscordサーバーに投稿したら中の人がプレイしたいとのことでしたので、少し内容いじって配布を予定しています。
配布が開始されたらここに追記予定です~

ではまた!

2022年10月10日月曜日

家のPCをより強くした

前記事:家のPCを強くした - shichiTech

最近PCでVRChatなどのVRゲームをやるとFPSが低いのが気になっていました。

そこで快適なプレイのためにグラボを買い替えました!

どれにしようか迷いましたが、ドスパラで販売しているPalit製のGeForce RTX 3080が安かったのでそれにしました。(買ったときがちょうど底値の9.2万円でラッキーでした)

で、ビフォー・アフターがこちら↓

パーツビフォーアフター
 CPU  Intel Core i7-8700 同じ
 メモリ  Crucial 16GB DDR4-2666 ×2枚 同じ
 SSD(メイン)  Crucial MX500 500GB 同じ
 HDD  TOSHIBA DT01 1TB 
 TOSHIBA DT01 4TB 
 同じ 
 グラボ  玄人志向 GeForce GTX 1070Ti Palit GeForce RTX 3080
 GamingPro V1 10GB 
 マザボ AsRock Z390 Extreme4 同じ 
 電源  750W 80PLUS GOLD 同じ
 光学式ドライブ  LG GH24NSxx
 DVDスーパーマルチドライブ 
 同じ 
 ケース  Define R5 FD-CA-DEF-R5-BK
(ミドルタワー)
 同じ

ベンチマークを実行してみた結果がこちら↓
ビフォー

アフター

なかなか良い感じです!

ついでにVRChatに入ってFPSが改善したか調べました。
Meta Quest2をOculus LinkでPCと接続し、日本列島を再現したJAPANLANDに訪問しました。

グラボ換装前は25~37fpsでしたが、換装後は72fpsに改善しました!(36fpsと72fpsをいったりきたりするときがあるが、Asynchronous Spacewarpのせいだと思われる)
やったー!
これで快適にVRやゲームができますね。

また、Palit製GPUの制御ツールThunderMasterをインストールして、こちらの動画で紹介されているファンの回転設定もしました。(LEDを消灯することもできる)

CPUが少し古くてベンチマークの足を引っ張っているので、次はCPUを買い替えようと思います~

2021年6月20日日曜日

Logicool G HUBのインストール中にフリーズするときの解決策(SATAケーブルを抜く)

Logicoolのマウスやキーボードを管理する「Logicool G HUB」というソフトがあります。
そのLogicool G HUBのインストール中にOSがフリーズすることがありました。
ググってよく出てくる通常の手法ではダメでしたが、なんとか解決方法を見つけたので記事にしておきます。


症状

Windows10のPCでlghub_installer.exeを実行してインストールすると、インストール中にOSがフリーズする。
(lghub_installer.exeは2021/6/20時点での最新版である2021.6.4851)

このタイミングでフリーズする

試したけどダメだったこと

  • PC再起動してからインストール
  • 右クリックメニューの「管理者として実行」をしてインストール
  • 接続しているUSBケーブルをできる限り抜いてからインストール
  • 接続しているマウス、キーボードをLogicool製でないものにしてからインストール
  • 古いバージョンのインストーラーでインストール
  • インストーラーをCドライブ直下に置いてインストール
  • Windows Updateを最新にしてからインストール
  • メモリを抜き差ししてからインストール
  • OSを再インストールしてからインストール


解決方法

以下のフォーラムに解決策がありました。


以下の手順でOSがフリーズしない人は今回の解決方法は効かないかもしれません。(試すときはOSがフリーズする前提で試しましょう)

  1. Windowsを起動する
  2. スタートボタンを右クリックして、メニュー中から「デバイスマネージャー」を開く
  3. 一番上の項目を右クリックして、メニューの中から「ハードウェア変更をスキャン」を実行する
  4. 少し待つとOSがフリーズする
デバイスマネージャー

さて、本題の解決方法です。
実際に私が成功した手順を記載します。
  1. PCの電源を落とす
  2. PCのケースを開ける
  3. オンボードのSATAポートに接続されたBlu-ray/DVD/CDプレーヤーのSATAケーブルを抜く
  4. Windowsを起動する
  5. スタートボタンを右クリックして、メニュー中から「デバイスマネージャー」を開く
  6. 一番上の項目を右クリックして、メニューの中から「ハードウェア変更をスキャン」を実行する
  7. 数秒でスキャンが正常に終了する
  8.  lghub_installer.exeを実行する
  9. インストール中にエラーが発生する場合はインストールをいったん中止する(ここでOSはフリーズしない)
  10. 再度lghub_installer.exeを実行する
  11. 正常にインストールが終了する
  12. PCの電源を落とす
  13. 3で抜いたBlu-ray/DVD/CDプレーヤーのSATAケーブルを接続する
  14. PCのケースを閉じる
  15. Windowsを起動する

これでLogicool G HUBが正常にインストールされて使えるようになりました。

SATAケーブル


後記

このような症状は珍しいパターンだと思います。
SATAケーブル抜いて実行しないとインストールできないという症状は初めて遭遇しましたw
インストール時に接続されているハードウェア情報を読み取っているからでしょうが、そもそもデバイスマネージャーの機能を使用するとフリーズするのは謎ですね。(Windowsのバグでは……?)

ではまた。

2020年1月14日火曜日

JapanVR Fest. 開発者会2020で登壇しました

2020年1月11日(土)に行われた「JapanVR Fest. 開発者会2020」で10分のLT登壇をしました。
登壇内容は「バレーボールVRを作った話」です。

私が発表したスライドはこちらから見れます。

展示も含めた内容は以下のブログ記事に書いてあるのでそちらもご覧ください。
xR Tech Tokyo #17とJapan VR Fest 銀座VR3で「バレーボールVR」を展示しました - shichiTech

=====2020年1月18日追記
登壇時の録画が公開されました。

他の方の映像はこちらからから。
JapanVR Fest. 開発者会2020登壇者一覧
=====ここまで

当日は壇上に上がってプロジェクターのHDMIを挿した瞬間に、Twitterに資料URLを投稿しました。

この方式は以前別の勉強会でやってる人がいたので参考にしました。
これだとプロジェクターの文字が見えにくい人や聞き逃した人にも優しく、シャッター音地獄を回避できます。RTも増えます。
(今回は勉強会を完全に理解した人たちばかりだったので、どの発表もシャッター音が鳴ることはありませんでしたが)

今回の開発者会は発表者約40人で7時間半という長丁場でしたが、どの発表も素晴らしいものでした。
以前と比べるとビジネス寄りの話が増えてきた印象がありますね。

今後もこのようなイベントができることを願っています!
ではまた。

2019年10月13日日曜日

xR Tech Tokyo #17とJapan VR Fest 銀座VR3で「バレーボールVR」を展示しました

コンテンツの説明

「バレーボールVR」はバレーボールのサーブ、トス、アタックの気持ちいいとこだけを集めた、サクッとできるコンテンツです。
Oculus Questで動作します。

2019年9月24日火曜日

オリジナル3Dアバターを作ってもらった話

VRMの登場もあり最近VR界隈で自分の3Dアバターを持つことが流行ってますね。(主観)(要出典)
周りを見渡せばみんな美少女アイコン……

自分もカワイイアバターほしい~~~!!!
観光スポットで美少女自撮りしたい~~~!!!


ということで、オリジナルモデル作成経験のある同僚から助言を聞きながら作ってみました。
先に出来上がったモデルを使った動画を貼ります。

こちらはキャラクターデザインもモデリングも私自身では行っていません。
それではどうやって作り上げたのかを説明していきます!
※名前や金額の掲載については各クリエイターさんから許可を頂いております。