音声信号処理の国際会議 ICASSP2024に論文採択-大規模言語モデルを活用した音声への感情のアノテーション

レブコム

2024年3月28日

株式会社RevComm

株式会社RevComm(レブコム、本社:東京都渋谷区、代表取締役:會田武史)の研究開発組織、RevComm Research(レブコム・リサーチ、RCR)による「大規模言語モデルを活用した音声への感情のアノテーション」に関する論文が、2024年4月14日から19日に開催される、音声・音響信号処理における世界最大規模の国際学会「ICASSP 2024」(ソウル、韓国)にて採択されました。

 

ICASSPとは

「ICASSP」(International Conference on Acoustics, Speech, and Signal Processing)は、米国電気電子学会の中で最も長い歴史を持つ信号処理学会である「IEEE Signal Processing Society」が主催する国際学会で、今年で49回目の開催となります。

 

論文内容

RCRの研究の成果として、シニアリサーチエンジニアのJennifer Santoso、石塚賢吉、リサーチディレクターの橋本泰一が、大規模言語モデルを活用して音声に感情情報をアノテーションする手法に関する論文「Large Language Model-Based Emotional Speech Annotation Using Context and Acoustic Feature for Speech Emotion Recognition」を「ICASSP2024」に投稿し、採択されました。

従来、音声に感情情報を付与するためには、人手により音声を聞き感情を特定して付与するため、多大なコストが必要であり、大規模な感情情報付き音声データを作成することが非常に困難でした。

 

本研究では、音声書き起こし、音声的特徴をもとに感情を大規模言語モデル(Large Language Model, LLM)を活用して自動的に付与する手法を提案しています。本研究の実験によれば、大規模言語モデルは人手とほぼ変わらない精度で感情を推定することができることを示しました。本研究の成果により、大規模な音声感情データの作成が容易になり、より高精度な音声感情認識器の開発ができることが期待されます。

 

このたび採択された論文

Large Language Model-Based Emotional Speech Annotation Using Context and Acoustic Feature for Speech Emotion Recognition

https://ieeexplore.ieee.org/document/10448316

 

RCRはAI技術領域にイノベーションをもたらし、コミュニケーションをより豊かにしていくことを目指しています。そのために、今後も音声・言語・画像の領域に関わる研究開発を推進し、国内外への学術的貢献や製品・サービスのAI技術の深化を積極的に行います。

 

「RevComm Research(レブコム・リサーチ、 RCR)」とは

「RCR」は、人びとがお互いをよくわかりあえる社会を目指し、コミュニケーションの新しい形について研究開発する組織です。人は他者とのコミュニケーションの中でしばしば摩擦や不平等な事態が起き、お互いに理解できない、信頼できない場面が引き起こされます。そのような摩擦をなくすための技術を開発し、より柔軟で誤解のない適切なコミュニケーションができる環境作りを進めます。

また、「RCR」には、「Research for Communication Revolution」の意味も含まれています。「コミュニケーションを再発明し、人が人を想う社会を創る。」という企業理念のもと、音声技術とAIの研究開発により、コミュニケーション課題の解決に取り組みます。

 

RCRサイト:https://www.revcomm.co.jp/rcr/

これまでの活動実績:https://www.revcomm.co.jp/rcr/information/

 

 

 

株式会社RevComm 会社概要

「コミュニケーションを再発明し、人が人を想う社会を創る。」という理念のもと、音声技術とAIにより、コミュニケーション課題を解決する企業です。

 

音声解析AI電話「MiiTel」は、インサイドセールス市場を中心に、営業やコールセンター業務におけるトークの可視化とセルフコーチング、テレワーク体制構築にご活用いただいています。また、AI搭載オンライン会議解析ツール「MiiTel Meetings」は、複数人でのオンライン会議の解析や振り返りが可能となり、営業の成約率を飛躍させます。オフライン(対面)の商談を可視化する「MiiTel RecPod(β版)」の提供も開始し、コミュニケーションが発生するすべての場所における会話のビッグデータ化を実現します。

 

Forbes JAPAN「日本の起業家ランキング TOP20」、週刊東洋経済「すごいベンチャー100」に選出されたほか、2023年4月にはアジア企業で唯一、米国「Forbes AI 50 2023」に選出、2023年5月にはデロイト トーマツ グループ「Technology Fast 50 2022 Japan」で1位を受賞しました。

 

・企業名  : 株式会社RevComm

・所在地  : 150-0002東京都渋谷区渋谷1-3-9 ヒューリック渋谷一丁目ビル7階

・代表者    : 會田 武史

・事業内容 : AI × 音声のソフトウェア・データベースの開発

・企業サイト: https://www.revcomm.co.jp/

 

※記載されている会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社の商標または各権利者の登録商標です

 

本プレスリリースは発表元が入力した原稿をそのまま掲載しております。また、プレスリリースへのお問い合わせは発表元に直接お願いいたします。

プレスリリース添付画像

20230116レブコム・リサーチ_press

20240328_Paper accepted_facial image generation

このプレスリリースには、報道機関向けの情報があります。

プレス会員登録を行うと、広報担当者の連絡先や、イベント・記者会見の情報など、報道機関だけに公開する情報が閲覧できるようになります。

プレスリリース受信に関するご案内

このプレスリリースを配信した企業・団体

  • ※購読している企業の確認や削除はWebプッシュ通知設定画面で行なってください
  • SNSでも最新のプレスリリース情報をいち早く配信中