日本語 音声合成に使えそうなデータ

 

音声データセット

sites.google.com

このコーパスは日本語テキストと読み上げ音声からなります.音声データは48kHzでサンプリングされ,無響室で収録されました.一人の日本語女性話者の音声を収録しました.このコーパスは,10時間の音声 を含み,以下のデータからなります.

      • basic5000 ... 常用漢字の音読み・訓読みを全てカバー
      • utparaphrase512 ... 文の一部を読み替えたもの
      • onomatopee300 ... 日本語オノマトペ
      • countersuffix26 ... 助数詞
      • loanword128 ... 外来語由来の動詞・名詞 (e.g., ググる)
      • voiceactress100 ... 声優統計コーパス (プロ女性声優のフリーコーパス) とのパラ音声
      • travel1000 ... 旅行ドメインのフレーズ
      • precedent130 ... 判例
      • repeat500 ... 繰り返し発話された音声 (100文 * 5回)

 

sites.google.com

このコーパスは日本語テキストと多数話者の音声データからなります.スペックは以下のとおりです.

  • 100人のプロフェッショナル話者(声優・俳優など)
  • 各話者について以下の音声を含みます:
    • "parallel100" ... 話者間で共通する読み上げ音声 100 発話
    • "nonpara30" ... 話者間で全く異なる読み上げ音声 30 発話
    • "whisper10" ... ささやき声 10 発話
    • "falsetto10" ... 裏声 10 発話
  • 高音質(スタジオ収録)・高サンプリングレート(24 kHz)・多数の (30 時間) 音声ファイル
  • 便利なタグ (例: 性別,F0レンジ,話者類似度,継続長,音素アライメント (自動抽出))

 

voice-statistics.github.io

 

独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です.