音声エンドポイントの動的な正確な検出:ウェーブレット畳み込みベースのアプローチ

arxiv.org

 

音声のラベリングで困るのは、時間軸の範囲を指定してラベリングをする際にどこまでを含めるかが曖昧になる。

機械的に検出して範囲を指定できるのであればと思い探したところ、上記の論文にあたった。