マルチメディアサイエンス実習
音声認識の比較実験
藤川晶子
T00A340-5
2000年1月31日
音声認識率の比較実験概要
音声認識の対象



アナウンサーの音声(ひずんだ波形)
話者適応者の音声(ひずんだ波形)
話者適応者の音声(普通)
使用したソフトウェア


ViaVoice
Cool Edit
アナウンサーの音声認識
原文
東京世田谷で一家4人が殺害された事件です。えー、警
視庁は信用実験などから犯人が玄関から出入りしたとの
見方をさらに強めました。
音声を聞いてみる。
聞き取れましたか?
アナウンサーの音声認識結果
アナウンサー音声認識の結果例
が夜型面ザラザラ減らす芸者エラー収賄罪ガラガラガラアイヌは夫弁護団
からブームしながら村ださらに面が升田
0が夜型ザラザラづらいです芸者エラー収賄罪ガラガラガラ外務右腕LAN沿
岸からブームしながら村だ皿に強めました
阿部えりか夜型ザラザラづらいです芸者エラー収賄罪ガラガラから半分は
夫弁護団からブーム時だから村ださらに面が升田
エラー4年がさザラザラづらいです芸者エラー収賄罪ガラガラ半分は夫弁護
団からブームしながら村ださらに面が升田
えりか夜型ザラザラづらいです芸者エラー収賄罪ガラガラから半分は夫弁
護団からブーム時だから村ださらに強めました
いいが4面が殺害さだづらいです芸者エラー収賄罪ガラガラ半分は夫弁護
団からブームしながら村ださらに面が升田
話者適応者の音声認識
原文
東京世田谷で一家4人が殺害された事件です。えー、警
視庁は信用実験などから犯人が玄関から出入りしたとの
見方をさらに強めています。
音声を聞いてみる。
聞き取れましたか?
話者適応者の音声認識
話者適応者の音声認識結果例
たとえ世田谷で一家4人が殺害された事件ですA警視庁は針葉樹系
などから犯人が玄関から侵入したと述べ方やさらに強めています
妙を空世田谷で一家4人が殺害された事件ですA警視庁は針葉樹系
などから犯人が玄関から侵入したと述べ片やさらに強めています
から空世田谷で一家4人が殺害された事件です警視庁は針葉樹系
などから犯人が玄関から侵入したとの見方をさらに強めています
と妙を空世田谷で一家4人が殺害された事件ですA警視庁は針葉樹
けどなどから犯人が玄関から侵入した後の見方をさらに強めていま
す
から空世田谷0一家4人が殺害された事件ですA警視庁は針葉樹系
などから犯人が玄関から侵入したと述べ形をさらに強めています
話者適応者の音声認識2
原文
東京世田谷で一家4人が殺害された事件です。えー、警
視庁は信用実験などから犯人が玄関から出入りしたとの
見方をさらに強めました。
音声を聞いてみる。
聞き取れましたか?
話者適応者の音声認識結果
話者適応者の音声認識結果例2
公共サタデーで一家4人が殺害された事件ですで警視庁は信用事件などか
ら犯人が玄関から出入りしたとの見方をさらに強めました
東京世田谷で一家4人が殺害された事件ですで警視庁は信用事件などから
犯人が玄関から出入りしたとの見方をさらに強めました
東京サタデーで一家4人が殺害された事件ですで警視庁は針葉樹系などか
ら犯人が玄関から出入りしたとの見方をさらに強めました
東京世田谷で一家4人が殺害された事件です警視庁は針葉樹系などから犯
人が玄関から出入りしたとの見方をさらに強めました
東京世田谷で一家4人が殺害された事件ですで警視庁は針葉樹下などから
犯人が玄関から出入りしたと見方をさらに強めました
認識結果の比較のまとめ
アナウンサーの音声


ほとんど認識されない
認識率は10%前後
話者適応者の音声(ひずんだ波形)


そこそこ認識する
65%程度の認識率
話者適応者の音声(普通)


高い認識率
認識率は80%以上
認識率の向上
入力に適正な音量が不可欠
常に適正な音量をとれる入力ディバイスが
必要なのでは?
ダウンロード

藤川晶子