BLOG

音声活用ブログ

LVAテクノロジーとその特徴

2020.08.06

Nemesysco社テクノロジー

テーマ:

1 LVAテクノロジー (1)

Nemesysco(ネメシスコ)社の基盤技術であるLVAテクノロジーについて
概要を説明します

      
1.LVAテクノロジーとは

 LVAテクノロジーは脳皮質での知覚と事象の解釈は会話中の音声波形に現れてくるという考えに基づいており、人間が何を話しているかは無視し脳活動の変化が声に反映されることに注目する技術です。人間の発声メカニズムは人間の最も複雑な機構のひとつで、脳が時間をぴったりと合わせて多くの筋肉と身体器官を動作するように制御します。
 人間の声はたくさんの周波数の組み合わせからなり、フォーマント(formant)と呼ばれる声道の共鳴周波数によって表されます。人によりフォーマント周波数帯域は異なっていますが、男性は通常100ヘルツから3000ヘルツ、女性は200ヘルツから6000ヘルツです。
 LVAテクノロジーは比較的高周波数領域(RHFR)と比較的低周波数領域(RLFR)で細かな変動をとらえて感情を分析します。RHFRは興奮状態及び感情的に覚醒している時に対応し、RLFRはストレス状態や認知過程に対応しています。
 LVAは話者のRHFR及びRLFRの時間的な変動状況及び発生頻度を独自の数学的モデルに基づき解析して、音声を媒体とした脳活動の証跡を検出し数値として出力します。具体的には入力された音声の時間領域分析層、周波数領域分析層、主分析層、リスク分析層など13個の処理層を順次実行することにより解析し、最終的に全ての感情活動を要約した値を出力します。
 これらの処理はNemesysco社が長年にわたり世界各地から収集したデータを用いて常時校正され、最新状態を保持しています。

 

2.LVAの特長

 LVAテクノロジーの特長は大きく以下の3点に要約されます。

  1)言語非依存
    LVAテクノロジーは人間の脳活動の証跡を用いて感情を検出するので、会話している言語には
    基本的には依存しせん。英語でも日本語でも適応することが可能です。

  2)人種・性別・年齢に非依存
    LVAテクノロジーは解析を始めるにあたって、固有の周波数帯域を話者のフォーマントを用い
    て校正し、その話者に特有の高周波領域と低周波領域を決めますので、人種・性別・年齢に
    依存しないで感情を解析することが可能です。

  3)話者の真の感情を検出して数値化
    日本音響学会編 「音声は何を伝えているか」によると音声は
     ① 文字で示すことができる情報
     ② 意図的感情(パラ言語情報と言い俳優の演技による感情表出など随意的感情)
     ③ 話者の不随意感情(話者の真の感情)
    の3つの要素に分類されると言われています(藤崎の分類)。

Nemesysco(ネメシスコ)社のLVAテクノロジーはこのうち③真の感情を検出し数値化します。
したがって、俳優がわざと感情を装っても見抜くことができます。

 次回は、LVAの処理内容をもう少し詳しく解説します。

                  

 


テーマ