BLOG
音声活用ブログ
音声の性質について基本的な事項をまとめました
2020.10.12
テクノロジー
6 音声の性質(1)
音声の性質について基本的な事項をまとめました。
音声の性質について基本的な事項をまとめてみました。まず音について基本事項を解説し、次に人間の音声について簡単に解説したいと思います。今回は音の物理的性質と等ラウドネス曲線について解説します。
1.音の性質
1) 音とは何か
音は空気の振動です。音源が振動すると周りの空気に密度の疎密状態を作り出しこれが空気の圧力差となって周囲に波として伝わります。この波が音です。空気は主として窒素分子78%、酸素分子21%、その他1%からなっていますが、この分子の単位体積あたりの数が場所と時間により変化することにより音波が伝わると解釈することも出来ます。音源の振動数(周波数)により音の周波数も変わります。高い周波数は甲高い声に、低い周波数はバス歌手の歌声のような低い声に対応します。人間の可聴周波数は20ヘルツ(Hz)~20kヘルツ(Hz)程度です。ヘルツは1秒間に振動する回数を表す単位です。
2) 音圧の計測単位
① パスカル
音圧(空気の圧力)を計測する単位はパスカル(Pa)といわれ、1平方メートルの面積に1ニュートン(約100グラムの物体を手に持った時の重さに相当する力)の力がかかったものと定義されます。標準大気圧(我々が生活している空気の圧力)は何と10万パスカルです。音声は標準大気に比べて非常に弱い圧力で約0.02パスカル程度です。何と大気圧の1,000万分の1程度です。鼓膜はこの微小な圧力の変化を感じ取り脳に伝えています。人間は0.00002Pa=20μPaから20Paの音圧範囲を聴く事が出来ます。
② デシベル
人間が音の大きさを感じる程度は音圧には比例せず音圧の対数に比例します。0.02パスカルの音圧が鼓膜に印加された場合と0. 2パスカルの音圧が印加された場合に10倍の音圧が鼓膜に印加される訳ですが人間は10倍の音の大きさとは感ぜず2倍と感じます。この人間の聴覚の特性を加味して導入された単位がデシベルでdBあるいは(dB SPL)と表記します。SPLはSound PressureLevelの略号です。音圧X(パスカル)をデシベルで表示してとなったとすると
の関係で定義されます。ここでPは測定対象の音圧(パスカル)、P0は基準音圧で人間が聞き取れる最小の音圧です。P0=20(マイクロパスカル=100万分の1パスカル)です。下記に代表的な場合のデシベル値を示します。
- 飛行機のエンジン音 120dB
- 電車 80dB
- 通常会話 60dB
- ひそひそ話 30dB
- 可聴限界 0dB
③ホン(Phon)
聴覚は周波数によって聴覚的な聞こえ方が異なり、同じデシベル値を示す音圧レベルでも周波数が違えば人間は異なる大きさと感じます。このことを加味した単位をホン(Phon)と言い、人間が同じ大きさの音と聞こえる曲線で定義されます。1000ヘルツの正弦波に対してはデシベル値に等しくなるように設定されています。下記の等ラウドネス曲線の項を参照してください。
3) 音速
気体中の音速は気体(空気)の圧力の密度に対する変化率により決まります。これを解析すると音速の2乗は気体を構成する分子の分子量に反比例し、絶対温度(摂氏温度+273℃)に比例することが導かれます。従ってヘリウム気体(分子量4)など空気(分子量29)よりも分子量の小さい気体中の音速は空気中の音速より速くなります。また、空気中の音速はほぼ次の式で求められます。
331.5+0.61t(t=摂氏温度) (メートル/秒)
音速は周波数には依存しません。音楽が成り立つのは音速が周波数に依存しないからです。もし周波数に依存したらソプラノ歌手の歌声はバスの歌手の歌声よりも早く(あるいは遅く)聞こえることになりコンサートホールで後ろの席にいる人にはそもそも歌声が正しく聞こえません。
4) 等ラウドネス曲線
音声の周波数、デシベル、ホンの関係をグラフで表したものが等ラウドネス曲線と言われるものです。この特性はISO226として従来から国際規格化されていましたが、この規格には大きな誤差が含まれていることが明らかになっており、1985年から改正作業が続けられていました。2003年に規約ISO 226: 2003として規格化され、新しい等ラウドネス曲線が発表されました。これは日本の東北大学や独立行政法人電総研などの研究者達が大きく貢献しています。従来規格が1950年代の英国のデータだけに依存していたのに対し、新規格はドイツ、デンマーク、日本、イギリス、アメリカの共同研究に基づくものであり、日本は全体の4割のデータを提供するなど、学術的にも大きく貢献しているとのことです。(「産総研ホームページ > 研究成果 > 研究成果記事一覧 > 2003年 > 聴覚の等感曲線の国際規格ISO226が全面的に改正に」から引用)新ラウドネス曲線を下図に示します。(Googleサーチから引用)
この図は横軸が周波数、縦軸がデシベル表示の音圧です。グラフ中の数字はホン(Phon)を示します。この曲線は人間が同じ大きさの音と認識する曲線です。赤線が新曲線、青線は旧曲線です。0ホン(Phon)の曲線は最小可聴曲線を表します。周波数が低くなると可聴音の音圧が上がる事が解ります。音のエネルギーは周波数と音圧の2乗に比例しますから、低周波数の音を感知するエネルギーを出す為には音圧を高くする必要があるためです。
音の基本を記述しましたが、ご理解いただけたでしょうか?次回のブログでは発声機構について解説記事を示す予定です。
関連記事
ピックアップ
- CATEGORY
- Nemesysco社
- コールセンター
- 感情解析ラボ(活用事例)
- 不正防止
- 金融機関
- 保険金詐欺
- ストレス
- お知らせ
- テクノロジー
- マーケット
- 人気記事
- 10 感情分析と感情解析
- 39 用途が拡がる音声感情解析ソリューション (聞き手理解確認ソリューションについて1)
- 18 リモートワーク(在宅勤務)時代の営業活動と感情解析
- 49 なぜ音声から感情がわかるのか(2)
- 29 コールセンターの優秀人材を確保する最新方法
テーマ
- 感情
- パスカル
- 等ラウドネス曲線
- 音の性質
- デシベル
- 音速
- 周波数
- LVA
- フォーマント
- 解析
- コールセンター
- 運営効率
- パーソナリティー
- 性格診断
- オペレーター感情
- モチベーション
- コールセンター運営
- サイエンスラボ
- 音声解析研究
- 応対品質
- 基盤技術
- ビジネス予測
- 感情解析ビジネス
- 米国心理学会
- 発声機構
- 聴覚機構
- 米国特許
- 学術論文
- 周波数分析
- Nemesysco
- ネメシスコ
- 人事面接
- 聞き手。理解度、音声感情解析
- 聞き手
- 理解度
- パーソナルキャラクター
- ソーシャルスタイル
- DISC理論
- メタバース
- 音声感情
- AI
- コールセンター、品質管理
- 音声感情解析
- 期待効用理論、効用関数
- ベルヌーイ
- ESAS
- 感情解析ラボ
- プロスペクト理論
- 価値関数
- 言語
- 不随意感情情報
- 意図的感情情報
- 音声感情解析、AI、機械学習
- 音の波形
- フーリエ変換
- Chat-GPT、AI、感情、音声
- 警察
- 情報機関
- 人事部門
- 面接
- 採用
- ストレスチェック
- リモートミーティング
- ロボット
- エンタメ
- カラオケ採点
- 学習理解度把握
- 愛情チェック
- 役割
- 機能
- 教育、中国、学習量、学習効率
- 保険請求
- 不正申告
- 保険
- 詐欺
- アレクサ
- Alexa
- amazon
- アマゾン
- 住民感情、コロナ、自治体
- エモーションロジック
- 不正請求
- 保険金詐欺
- Insurance Fraud
- 保険金
- Voice Screen
- ストレス