2020-01-01から1年間の記事一覧
www.dtmstation.com 縦の部分はノイズ。編集ですぐ消せるレベル。 長音で基底の音が消えてしまっているので、ふにゃっという感じになってる。 開発中ということもあるだろうが、NEUTRINOほど声質が安定していない印象を受ける。AIきりたんだと声質は安定して…
vocalomakets.com まだ開発段階からか、もしくはプラグインをかけているからかわからないが、スペクトラムを見てる限り、それほど凄い感じがしない。 人っぽさをわざと消してるのかわからないが、ボカロの延長らしいといえばそうだが。 デモでの一番高い音が…
Melodyneはピッチ調整するためのソフトで、主にボーカルに使われる。 そのためボイロでの調整は本来の使い方とは異なる。 ボイロのUIが自由度が少ないため、もう少し調整したいと思ったときに対応できない。 Melodyneを使ったら、調整が楽になるかと思ったの…
音楽的同位体「可不(KAFU)」ボイスアンケート Aタイプ Bタイプ Cタイプ まず、わかりやすいCタイプは、オートチューンでケロケロボイスになっていて、他の合成音声と変わらない気がするので、個人的興味がない。 Aタイプは人間っぽく、Bタイプは幼いように聞…
Synthesizer V Saki AI Cover Compilation Synthesize V AIのデモ動画が新しく出ました。一般のニュースサイトだとNEUTRINOを使ったAIきりたんが、人間らしく歌うと話題になりましたが、個人的にはSynthesizer V AIは超えていると感じました。 上の図がAIき…
AviUtlは別として、Davinci ResolveやVegas Proも、2D画像を動かすのに適していません。Adobe Premireでは足りずに、Effectを使った方がいいといったのと同じです。 今だとVtuberが流行っているので2Dを動かすとなると、Live2Dという選択肢がすぐに浮かびま…
ボイスロイド劇場を作るときには、立ち絵を拡大したいときがある。 1つのトラックや、イベントに対して拡大するのは、すぐに思いつくが、立ち絵と背景を一緒に拡大する場合、マスターに対して挿入する必要ががある。 動画だけであればトラックのみにズームす…
ボイスロイドを調整する際に困るのは、アクセント調整だったり、音の高さの調整だ。 普段何気なく喋っている日本語に対して、モーラとか普通は知らない。 違和感は感じるが、どこが間違えていて、どう修正しなければならないのかも示してくれない。 文字の入…
本記事における注意事項 VegasPro18を購入したものの、ネットを検索しても出てきません。 ましてボイロ動画を作っている方は皆無といってもいいです。 自分のように購入してしまったがために使いこなしたいがわからない、という人向けに、自分の作業内容をメ…
Synthesizer V voice - Regular vs AI Synthesizer Vのバージョンアップがあり、AIという名前が付き、より自然な歌声を出すことができるようになったそうです。 旧バージョンでもDNNを使っていたとか出ていたように記憶しているのですが、AIをコマーシャル的…
iZotopeは音のノイズなどを処理するソフトだが、初見ではどの機能を使ったらいいのかがわからない。 ヘルプを見るとビデオチュートリアルで、個別の機能については解説があるが、処理の順番があるはずだと、調べたところ見つけることができた。 8 Common Aud…
ファイルに出力 出力に失敗しました。 出力先とファイル名を確認してください。 Synthesizer Vでファイルに出力をしようとすると、エラーが出て失敗することがあります。 フォルダ名に日本語が入っているからダメなのかなど、色々試したのですが、 ウイルス…
Synthesizer Vをインストール時に上記のように複数のファイルが発生して、インストールに失敗することがあります。 コピー先フォルダのファイル名を変更中にエラーが発生しました MoveFileエラー:コード5 アクセスが拒否されました。 ja-jp.txtがエラーを吐…
VEGASを使ってボイロ動画作成時の立ち絵の切り替え方ですが、どれが正解かわからないものの、1つの方法をメモとして残しておきます。 VEGASのテイクという機能を使います。 先に立ち絵のPSDファイルから、画像を吐き出しておきます。差分ではなく全部入りで…
ボイロ動画を作るときには立ち絵を使うことがよくあります。 ただ立ち絵はAviUtilのPSD toolkitを使うことを前提とされています。 Davinci ResolveがVlogなどで使われるようになっている時代でも、ボイロ動画でAviUtilを使うのはその辺りの事情からです。 じ…
ボイスロイド動画では動画に字幕を入れるわけですが、AviUtilのように、音声とテキストを一緒にドラッグアンドドロップしたら入力される機能はVEGASにはなさそうです。 代わりに1つのテキストファイルから改行ごとに1つの字幕を作る機能があります。 音声か…
VEGASでボイスロイド立ち絵の位置を決めたい場合、上の所から調整すると、立ち絵を切り替えるたびに位置調整しないといけないです。 立ち絵を入れているトラックの、上の部分をクリックし、トラックモーションから、デフォルトの位置を指定してやると楽に切…
biss-git.github.io Voiceroid-ScriptというWebサイトを作られている方がいらっしゃいます。 どういうことができるかというと、ボイスロイド2で音声に変換する前のテキストで、どのキャラなのかわかるように絵を入れることができます。 こんな感じです。 動…
github.com
合成音声で話し方を変えようとすると、コンピュータ上でどのような表現がいいのか調べていると、マークアップ言語があった。 読み上げ速度、音量、音素、ピッチといったことも指定できるようだ。 ただバージョン1.1が2010年に出たあと、W3Cのグループは2015…
スペクトル(spectrum)パラメータ メルケプストラム係数(mel-cepstral coefficients) 励振(excitation)パラメータ 基本周波数(F0 frequency) その他 ビブラート(vibrato) 音素(phonetic) 音符(note key) ノート長(note length)
合成音声の学習データを作るときに、セリフがない所はカットする。 単にセリフがないのか、セリフとセリフの間なのかデータからは判断しにくい。 「・・・」といった沈黙だけ別途学習した方がいいのか。 ボイロ2ではポーズが多くて、会話のテンポが悪く、ユ…
ボイスロイド2では、「喜び」「怒り」「悲しみ」の3つのパラメータを調整できる。 しかし実際に感情表現をしようとしたときは、3パターンではない。 3つのパラメータを合わせて調整することもできるが、そうした場合、何を表現しているのかわからなくなる。 …
2016/9 WaveNet 2017/11 Parallel WaveNet (ICML2018) 2017/12 Tacotron2 (ICASSP2018) FFTNET(ICASSP2018) 2017 SampleRNN 2018/2 WaveRNN (ICML2018) 2018/7 ClariNet (ICLR2019) 2018/11 WaveGlow(ICASSP2019) 2018 Tacotron GST 2019/5 ParaNet 2019/10 …
音声データセット sites.google.com このコーパスは日本語テキストと読み上げ音声からなります.音声データは48kHzでサンプリングされ,無響室で収録されました.一人の日本語女性話者の音声を収録しました.このコーパスは,10時間の音声 を含み,以下のデ…
アナウンサー的な文章を読ませるのであれば、今のボイスロイドでもいいが、ボイスロイド実況のようなキャラとして読ませたい場合、より高機能なボイスロイドが欲しくなる。 音楽界隈では、NEUTRINO、Synthesizer Vといった機械学習による歌声合成ソフトが出…
気になった箇所 複数の3Dモデルが入っているが、弦巻マキさんと他の3Dモデルのテイストとクオリティが異なっている。マキさんだけ使うときはいいが、マキさんと組み合わせると違和感を感じる。 ボイスロイドとの連携が、クリップボードのコピー&ペーストに…
3Dモデルの大きさや位置を徐々に変化させたいときは、上の①のように、最初のポイントをクリックしてオレンジ色にし、②の3Dモデルの枠の位置と大きさを決める。 同じようにして、終点のポイントと、3Dモデルの大きさと位置を決める。 これで再生すれば、始点…
ちょっと凝ったことをしようとすると、カメラの向きを変えたくなってくる。そうしたときは右側の+ボタンからカメラを押すと調整メニューが出てくる。 まず、カメラをどの位置で切り替えたいかのポイントを決める。 上の①の+ボタンを押すと、カメラを切り替…
Recotte Studioで3Dモデルありでプロジェクトを作成すると、プレビュー画面に3Dモデルが表示される。 3Dモデルを編集したい場合、モデルを一回クリックする。上のように3Dモデルの枠が表示されるので、大きく表示したいときは枠の四隅の■をドラッグ&ドロッ…