日本語 音声合成に使えそうなデータ
音声データセット
このコーパスは日本語テキストと読み上げ音声からなります.音声データは48kHzでサンプリングされ,無響室で収録されました.一人の日本語女性話者の音声を収録しました.このコーパスは,10時間の音声 を含み,以下のデータからなります.
このコーパスは日本語テキストと多数話者の音声データからなります.スペックは以下のとおりです.
- 100人のプロフェッショナル話者(声優・俳優など)
- 各話者について以下の音声を含みます:
- "parallel100" ... 話者間で共通する読み上げ音声 100 発話
- "nonpara30" ... 話者間で全く異なる読み上げ音声 30 発話
- "whisper10" ... ささやき声 10 発話
- "falsetto10" ... 裏声 10 発話
- 高音質(スタジオ収録)・高サンプリングレート(24 kHz)・多数の (30 時間) 音声ファイル
- 便利なタグ (例: 性別,F0レンジ,話者類似度,継続長,音素アライメント (自動抽出))
独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です.