Insight Navi

音声感情解析

音声の特徴と感情の関係

2025.04.04

音声と感情

音声の特徴と感情の関係

音声は空気の振動。その仕組みを知れば、声から感情を読み取る基礎が見えてくる。

音声感情解析技術(Voice Emotion Analysis)は、音声、音声データから人間の感情状態を可視化する技術であり、顧客満足度の向上やリスクマネジメント、組織の生産性向上に役立つことから、近年多くの企業が注目しています。​

1. 導入:声は、思っている以上に“感情”を語っている

  • 声には話している内容以上に、無意識の情報が含まれている
  • 音声感情解析は“声の振動”という物理現象をデータとして扱う技術
  • 当社の解析技術は、不随意反応=本人が意識しない感情の揺れまで読み取る

2. 音とは何か? ― 空気の振動が“聞こえる”仕組み

  • 音=空気の疎密波(振動)が耳に届く現象
  • 人間の可聴域:20Hz〜20kHz、音の高さ=周波数
  • 声の違い=振動の違い → 感情の違いが声に反映される理論的背景

人間の音声は、主に「声帯」と「声道」の2つの要素によって生成されます。声帯は喉に位置し、肺から送られた空気によって振動し、音の源となります。この振動が声の高さ(ピッチ)を決定します。一方、声道は喉頭、咽頭、口腔、鼻腔から構成され、声帯で生成された音を共鳴させ、声の質(音色)を形成します。声道の長さや形状は個人差があり、これが各人の独特な声を生み出す要因となります。

当社の音声感情解析では、いわゆる非可聴域(人の耳では聞こえない)周波数をも分析し、感情を可視化しています。

いわゆる声の強さを表すパスカル(音圧)とデシベル(音量)は分析項目の一つに過ぎません。

3.当社の音声感情解析とは?

音声感情解析は、人の音声のみから潜在的な人の感情を分析し、客観的かつ定量的に可視化する技術です。この技術は、1997年にイスラエルのAmir Liberman氏によって発明され、心理学、犯罪学、音声学、精神医学、数学などの専門家との協力を通じて開発が進められてきました。 ​特に、Nemesysco社のLVA(Layered Voice Analysis)技術は、話者の脳活動に由来する微細な音声特徴を解析し、感情を多層的に評価するもので、言語や話す内容に依存せず”genuine emotion”を客観的に数値化します。

4.音声感情解析の仕組み

音声感情解析は、主に以下のプロセスを経て感情を数値化します。​

音声データの収集:​対象者の音声を録音ファイルからまたはリアルタイムで取得します。​
感情判定:​抽出された特徴量から感情を推定します。​​”Stress”,”Excitement”,”Embarrasment”などの”感情パラメータ”として数値化します。​

Nemesysco社のLVA技術は、脳の活動変化が声に反映されるという原理に基づいており、高周波数領域(RHFR:興奮・覚醒)と低周波数領域(RLFR:ストレス・認知過程)の音声変動を多層的な数学モデルで解析します。この技術は2003年に「感情を検出するための装置と方法」(米国特許US 6,638,217 B1)、2007年には「人間の声における感情を検出する装置と方法」(米国特許US 7,165,033 B1)の特許を取得しています。

 

関連記事リンク

AMED Delight によるDHTの学術研究のトレンドより

2003年から2022年までに発表された技術関連の論文数を調べたところ、20年間で最も論文数が多かったカテゴリーは、音声・感情解析(n=106,427)という結果が出ています。

 

 

 


テーマ