2003年度
図書館活用論 Ⅰ 第9講
検索エンジンの仕組みと活用
(明治大学図書館庶務課システム担当 中林)
検索エンジンとは


問題解決のために使われる特殊な仕組みのこと
多くの場合は,何かを動かす為に使われる動力を
意味している.
インターネット上の情報を探し出す為に作られた,特殊な仕組み
では,図書館の目録検索は.......
確かに,情報を検索しているが,一般的な意味ではOPACは
検索エンジンとは別物と考えられている.(コンセプトは同じ!)
インターネットとは?





同じプロトコル(TCP/IP)を利用したネットワーク
の集合体→ネットワークのネットワーク
現在の繁栄は,フリーで開発してきた人々の努
力の賜物
基本的に,参加・利用は自由で無料
インターネット全体を管理する組織・人物はいな
い
自由だが,危険も隠れている
●便利で現代生活には,必要不可欠?
検索エンジンとOPACの違い
OPAC
検索エンジン
コンテンツ
書誌規則による組織化
データ登録
更新
検索方式
人間の判断による
HTML による記述
(非組織化)
半自動登録・自動更新
検索精度
インデックス方式
(正規化処理)
高
全文検索
(非正規化)
低
検索特徴
適合率(近似値ヒット)
呼出率(広範囲ヒット)
同じ検索システムでも,検索対象が違うと,その特色も異なる
検索エンジンの種類
ディレクトリ検索型
全文検索型
代表例
Yahoo!
Google,Goo,
データ収集
方式
更新頻度
登録制(審査あり)
ロボット登録+登録制
(審査なし→ロボット)
随時
検索方式
随時
ディレクトリ優先+
全文検索
セ ー ル ス ポ イ 多彩なディレクトリと
ント
随時更新ニュース
全文検索+ディレクトリ
検索(切り替え方式)
ページランクシステムに
よる適合率表示
ベンダーは,情報検索の手段を提供しているだけ!
実習①
まずは使ってみる!
●キーワード
明治大学
• 漢字でそのまま検索
•全角ひらがなで検索
検索結果を比較して見る
•全角カタカナで検索
OPACとの相違点は?
•半角カタカナで検索
•http://www.yahoo.co.jp/
•http://www.google.co.jp
実習① 結果
検索結果の違いから考える
Yhaoo!とgoogleの検索結果表示の違い
ディレクトリ検索と全文検索の検索方法の違い
・ 比較的有名な事項を集中して検索→ディレクトリ検索
・ 未知数の分野を網羅的に検索→全文検索
検索語表記による結果の違い
検索語の正規化は行われていない(例外あり)
・ 検索されるデータと同じ表記でいれることが重要!
検索エンジンと情報取得
検索エンジンは膨大な数のページを拾ってくる.
どうやって必要なページを探し出すのか?
検索エンジンの検索結果表示順には,秘密がある!
検索語の相関関係やページの重要度を独自のルールで
重み付けをして,優先度を基準に表示している.
Google人気の秘密!→PageRankシステム
●実習2
PageRankシステムを体感する
http://www.google.co.jp/
• まずは, “明治大学図書館”で検索
• その他の大学図書館でも検索
• 適当な場所・施設名で検索
● 殆ど,その機関が持つページが先頭に表示される!
検索エンジンの落とし穴
• 各検索エンジンのページランク付けシステムは完璧か?
• 本当に必要な情報が低ランクになる可能性はないのか?
• いい情報源がみつかった.でもいつまでみられるのか?
• 検索エンジンには探せないものはないのか?
• インターネットは匿名の世界.知らない誰かがみている?
• デジタルディバイド, 情報社会を生き抜く
● 検索エンジンは単なるツール.大切なのは,
゛有益な゛
情報をすばやく手に入れること.
検索エンジンと学術情報
• 学術情報とは? →誰が学術情報と認定するのか?
• 学術情報としての使い方→参考文献リスト
• 学術情報だけを検索エンジンで探し出すには?
• その情報が真実だと保証するのは誰?
• いつまでその情報は保持されるのか?
• 情報の裏付けは必要なのか?
● インターネット上の情報を鵜呑みにするのは危険.必ず確認
● 2次的検索ツールとしての利用には最大級の効果!
●自習3
検索エンジンを活用する
現ブッシュ大統領とブレア首相がノーベル平和
賞にノミネートされたらしい.検索エンジンを
使って,より詳細な情報を手に入れる.
・ 学術情報として利用できるか?
・ 裏づけは取れるページか?
・ その背景や関連事項も探ってみよう
• http://www.yahoo.co.jp
• http://www.google.co.jp/
実習③ 結果サンプル



http://www.geocities.co.jp/HeartLandAsagao/7440/okur-9.html
http://www.sponichi.co.jp/society/kiji/200
2/02/06/11.html
http://www.thepetitionsite.com/takeaction
/302184339
今日の授業の要点




検索エンジンは非常に便利,高速に大量の
情報を取得できる.
検索エンジンでの情報収集にはコツがい
る.上手に使わないと必要な情報を見落と
す可能性あり.
インターネット上の情報を単純に信用する
のは危険.あくまでも参考程度に,もしくは
二次的ツールとして利用する.
学術情報としてのネットワーク情報源
今日の課題

検索エンジンの欠点を挙げる.

検索エンジンで収集した情報の危険性に
ついて挙げる.

今日の授業についてコメントをください.
ダウンロード

目録検索システムの 機能と利用方法