Cevio AIトーク、機械学習での合成音声はクオリティ高くならなかったのか

f:id:qpci32siekqd:20210322095337p:plainCevioAIトーク小春六花のスペクトラムが上図になる。

 

f:id:qpci32siekqd:20210322095530p:plain

これが小春六花のexボイスの波形だ。比べればわかるが人の声の方が綺麗だ。

 

機械学習によってクオリティが上がったという話だったが、個人的にあまり良くならなかったというのが正直な感想だ。

 

スペクトラムを見ると、一番周波数が小さい部分は制御されているように見えるが、黒くなっている部分の高音部が削れてしまっている。

NEUTRINOのきりたんの歌声では安定して高音域まで出ていたので処理アルゴリズムによると思われる。