CA BASE NEXT CyberAgent Developer Conference by Next Generations 2022

-

07.27

Room A

SESSION

デジタルツインと電話応対における音声合成と音声認識

Digital Twin Label ではデジタルツインの声として音声合成が使われています。その音声合成を高品質に実現するためには,高品質な学習データを用意する必要があります。その高品質なデータを作るためには人手作業が発生しがちですが,そのコストを減らすために音声認識手法を様々に活用しており,その活用法について紹介します。

  • 吉本 暁文のプロフィール画像

    吉本 暁文

    Research Scientist

    2017年入社

    Research Scientist

    2017年新卒入社後,自然言語処理を応用した広告製品開発に従事。2020年より音声研究に着手し,現在は音声合成・声質変換・音声認識に関する研究開発を中心にしつつ,対話研究や応用領域の拡大に取り組んでいる。

Twitter

ハッシュタグをつけてツイートしよう!

#cabasenext_2022 をつけて質問すると登壇者が答えてくれるかも!?

YouTubeチャンネルを登録しよう!

登録して配信通知を受け取ったり、他のコンテンツもチェックしよう!

RELATED SESSIONS