逆引き辞書の作成を可能にする
対訳辞書編集システムの構築
東京国際大学
川村よし子
逆引き辞書の作成を可能にする
対訳辞書編集システムの構築
• 1.『チュウ太のWeb辞書』開発の流れ
• 2.『チュウ太のWeb辞書』の特徴
• 3. 対訳辞書編集システムの概要
• 4. 逆引き辞書作成の問題点
• 5. 逆引き辞書作成を可能にする
対訳辞書編集システムの構築
• 6. 対訳辞書の活用
研究の目的
目的:『逆引き辞書の作成を可能にする
対訳辞書編集システムの構築』を行う
• どうして電子辞書の需要があるのか。
• どうして対訳辞書(ミニ辞書)が必要なのか。
辞書はいつどこで使いたいのか。
• どうして逆引き辞書(ミニ辞書の逆引き)が必要なのか。
辞書は誰が何のために使うのか。
1.『チュウ太のWeb辞書』開発の流れ
• 日本語読解学習支援システム『リーディング・チュウ太』
• 多言語版日本語辞書『チュウ太のWeb辞書』
◎2003年から編集開始
◎旧日本語能力試験出題基準の単語(8600語)
◎ロシア語・ベトナム語・英語・スロヴェニア語で完成
◎ハンガリー語もほぼ完成
◎25以上の言語で編集が進行中
◎インドネシア語・タガログ語・中国語(簡体字・繁体字)
韓国語・フランス語・スペイン語・タイ語
⇒1語1訳辞書を搭載
◎介護語彙を追加:インドネシア語・タガログ語・英語
◎工学関係の専門辞書を追加:日越・日英
⇒辞書は『日越工学用語辞典』
◎逆引き対訳辞書の作成
日泰英・日越英対訳辞書⇒タイ日英・ベトナム日英辞書
2.『チュウ太のWeb辞書の特徴
①辞書情報(複数の言語版を同時表示可)
見出し語・読み・意味・用法・レベル
初級動詞には活用形も表示
②単語の語義ごとに例文(慣用表現にも対応)
③辞書ツール機能
④単語検索機能 / 例文検索機能
⑤ふりがな機能
⑥単語レベル表示機能(語彙チェッカー)
⑦アクセラレータ機能
☑
☑
☑
チュウ太のWeb辞書の結果画面
チュウ太のWeb辞書の結果画面
チュウ太のWeb辞書の結果画面
「チュウ太のWeb辞書」の単語検索機能
• 単語を入力すれば、辞書項目を表示
半角アステリスク
• 「*」で、前方一致・後方一致の検索も可能
** で単語を挟む
• 「*単語*」を使えば、例文検索も可能
アステリスク(*)の活用法
*生
と入力した場合・・・
生、学生、先生、留学生、写生、誕生 etc.
生*
と入力した場合・・・
生徒、生まれる、生活、生憎、生産 etc.
さらに…
他の単語の「生」で始まる例文も検索可能
☑
ふりがな機能を使った結果画面
☑
3.対訳辞書編集システムの概要
対訳辞書編集システム開発の目的
• 複数の編集者による対訳辞書作成が可能
• Web経由で辞書ファイルのダウンロードが可能
• Web経由で編集済みファイルのアップロードが可能
+
• 共通部分は多言語とは別に適宜編集可能
ダウンロードした多言語用辞書ファイル
訳語を入力した辞書ファイル
校正用の辞書ファイル
a
a
4.逆引き辞書作成の問題点
①サ変動詞・形容動詞
元の辞書の見出し語は語幹のみを出していた
⇒名詞形で入力される場合と動詞・形容詞が入力される
場合が生じていた
②多義語
1語1訳を基本としていたが、複数の意味がある場合、
「/(半角スラッシュ)」で区切って併記していた
⇒逆引きにした場合、日本語見出し語が必ずしも本義と
ならないケースが生じる
間
space/interval
合う
to match/to harmonize/to fit
明るい bright/cheerful/be familiar with
4.逆引き辞書作成を可能にする
対訳辞書編集システムの構築
①サ変動詞・形容動詞
元の辞書の見出し語は語幹のみを出していた
⇒見出し語として、語幹だけでなく「する」「な」を付与
した形を収録する
②多義語
⇒複数の意味がある場合、意味の違いを(
)内に示す
間(場所)
space
間(期間)
interval
合う(一致する)
to match
合う(調和する)
to harmonize
合う(フィットする) to fit
明るい
bright
明るい(性格)
cheerful
明るい(よく知っている)be familiar with
逆引きを配慮した対訳作成リスト(一部)
ダウンロードファイル
ダウンロードした対訳作成リスト(一部)
対訳リスト作成のルール
【1】「日本語見出し語」の語が不要の場合、あるいは、あて
はまる訳語が存在しない場合、備考欄に「×」印を入れる。
【2】見出し語の変更が必要な場合も備考欄に記入する。
【3】原則として、1語-1訳とする。
訳す際に複数の語が必要となる場合は、新たに見出し語を
立て、( )で区別するための説明を加える。
例:
【4】まったく同じ意味で複数の訳語がある場合は、例外的に
「/」(半角スラッシュ)で区切って訳語欄に記入。
ダウンロードした対訳作成リスト(一部)
5.対訳辞書の活用
• 逆引き辞書の編集が可能な対訳辞書は、マレー語およびイ
ンドネシア語で編集中
• 完成した日マレー英、日インドネシア英を元に、逆引き辞
書を作成予定
• 完成後、『チュウ太のWeb辞書』に逆引き辞書も搭載し
両方向から対訳辞書が引ける形にする予定
その他・・・
ネットに依存しない形の対訳辞書としての活用
・紙辞書
・電子辞書
逆引き辞書の編集が可能な対訳辞書の編集者を募集中!
[email protected]す。
謝辞
• 本研究の一部は、平成26年度科学研究費基盤
(B)課題番号15H03219によるものである。
• 対訳辞書編集システムの開発に関しては、
筑波大学の川上大樹氏・小林秀和氏の協力を
得た。
• 各辞書の開発は、チュウ太プロジェクトメン
バーとの連携によるものである。
ここに記して感謝の意を表する。
参考文献
• 川村よし子(2009)『チュウ太の虎の巻』くろしお出版
• 工藤拓(2006) MeCab: Yet Another Part-of-Speech and
Morphological Analyzer,
http://mecab.sourceforge.net
• ご清聴ありがとうございました。
• 今後もいろいろな方々との連携を進め、
より多くの方に役立つツールにしていきたい
と考えています。
ダウンロード

AJE2015逆引き辞書編集システム