・2007年度実施項目
1)発話語に依存しない話者識別(情報源の識別技術)
Accuracy and Ratio (%)
→音声時間波形の狭帯域包絡線間相関を利用
使用周波数範囲を4kHz範囲で約80%の認識率
→個人性が,声帯基本周波数,副鼻腔共振周波数
(
100
声帯音源基本周波数
男:100~150Hz(8-11)
女:250~300Hz(13-15)
80
60
第2フォルマント周波数
40
600~4kHz(19-30)
第1フォルマント周波数
200~1.4kHz(12-23)
20
0
6-14,22-31
7-11,22-31
副鼻腔共振周波数
(68-0.2k,10k-5.2k) (81-162,1.1k-5.2k)
3.1k~5.4kHz(28-31)
Used Band Number
帯域番号:7-11,22-31
: used f range/all, :used band /all, :C )
⇒発話者が男性
【今後の研究予定】
話者識別システムの実用化に向けた検討
1)音声基本周波数を活用して識別率を向上
2)重要帯域の近傍帯域での識別率調査
3)公の音声DBを用いた提案手法の有効性検証
4)重要帯域の物理要因調査
【進捗状況】
9月ASJ投稿予定
1)音声基本周波数を活用して識別率を向上
個人性を多く含む重要帯域
・声帯音源基本周波数
・母音の第2フォルマント周波数
・副鼻腔共振周波数
関連しそう
である
基本周波数の時間変動の平均と分散
⇒個人を特定する特徴量になるか
(小橋川の卒業研究)
作業担当者:B4 高山
現在,卒研資料の確認作業を行なっている
【進捗状況】
2)重要帯域の近傍帯域での識別率調査
個人性を多く含む重要帯域
・6-14, 22-31
→近傍帯域での識別率調査
→ロバスト性の検証(3月ASJ)
前回,調査できなかった一部の帯域
(9-14, 22-31・10-14, 22-31)を調査
⇒結果を3)と4)の項目で使用する
作業担当者:B4 青木
現在,作業を担当者に依頼し,調査中
【進捗状況】
9月ASJ・大学紀要投稿予定
3)公の音声DBを用いた提案手法の有効性検証
これまでは自分たちで収録した音声を使用
→追従実験が難しい
→信頼性が十分ではない
公の音声DB(ETL-WD-Ⅰ&Ⅱ)を使用
→追従実験が可能
→登録話者数を増やせる(+女性10名)
→提案手法の有効性が得られる
作業担当者:B4 波々伯部
現在,音声DBから識別に使用する単語を選出
→選出単語を用いて識別率を調査する
【進捗状況】
9月ASJ投稿予定
4)重要帯域の物理要因調査
個人性を多く含む重要帯域
・声帯音源基本周波数
・母音の第2フォルマント周波数
・副鼻腔共振周波数
関連しそう
である
鼻を塞ぎ共振特性を変えた音声を使用
(被験者:前回の音声収録者4名)
⇒識別率が下がれば関連している
作業担当者:M1 末廣
現在,音声収録の準備を行なっている
9月ASJに講演申込する物理特性要因調査について
【目的】
副鼻腔の骨形状に個人性は依存するのかを調査
【方法】
1)副鼻腔の振動を物理的に止めた音声を使用
2)鼻に詰物をした音声を使用
→止める/塞ぐ方法はどうするか?
図1 ノーズクリップ
図2 ダイビング用マスク
まずは副鼻腔の振動が外部から止められるかを調べる
副鼻腔の構造
・上顎洞
・前頭洞
・蝶形(骨)洞
・篩骨洞(篩骨蜂巣)
前頭洞
篩骨洞(篩骨蜂巣)
蝶形洞
上顎洞
参考:http://www.sanada.gr.jp/clinic/lecture/paranasal1.html
鼻を塞ぐだけで副鼻腔の振動を止められるか?
ダウンロード

ppt版