日本語　音声合成に使えそうなデータ

音声データセット

sites.google.com

このコーパスは日本語テキストと読み上げ音声からなります．音声データは48kHzでサンプリングされ，無響室で収録されました．一人の日本語女性話者の音声を収録しました．このコーパスは，10時間の音声 を含み，以下のデータからなります．

basic5000 ... 常用漢字の音読み・訓読みを全てカバー

utparaphrase512 ... 文の一部を読み替えたもの

onomatopee300 ... 日本語オノマトペ

countersuffix26 ... 助数詞

loanword128 ... 外来語由来の動詞・名詞 (e.g., ググる)

voiceactress100 ... 声優統計コーパス (プロ女性声優のフリーコーパス) とのパラ音声

travel1000 ... 旅行ドメインのフレーズ

precedent130 ... 判例文

repeat500 ... 繰り返し発話された音声 (100文 * 5回)

sites.google.com

このコーパスは日本語テキストと多数話者の音声データからなります．スペックは以下のとおりです．

100人のプロフェッショナル話者（声優・俳優など）

各話者について以下の音声を含みます:

"parallel100" ... 話者間で共通する読み上げ音声 100 発話

"nonpara30" ... 話者間で全く異なる読み上げ音声 30 発話

"whisper10" ... ささやき声 10 発話

"falsetto10" ... 裏声 10 発話

高音質(スタジオ収録)・高サンプリングレート(24 kHz)・多数の (30 時間) 音声ファイル

便利なタグ (例：性別，F0レンジ，話者類似度，継続長，音素アライメント (自動抽出))

voice-statistics.github.io

独自に構築した音素バランス文，及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です．