NTCIR-4 特許検索タスク
説明会資料
藤井 敦(筑波大学・科技団CREST)
岩山 真(東工大・日立製作所)
神門典子(国立情報学研究所)
2003.03.07 タスク説明会
1
背景
• NTCIR-3特許検索タスクの成果
– 世界初の特許検索テストコレクションを構築
– テストコレクション構築におけるノウハウ蓄積
– 異業界間の連携:国研,大学,企業,協会
• 残された課題
– 現実の特許検索問題を網羅した訳ではない
– 特許検索に関する(学術的な)知見を得る
– オーガナイザと参加者の目標における齟齬
• 目標に関して,認識(意識)が一致していたのか?
2
目的
• NTCIR-3とは違う特許検索問題を想定
– 新聞対特許検索でない何か
• 到達目標(技術目標)の共有
– ある程度は参加者が問題意識を共有
• 中長期的展望に立った萌芽的タスクの試行
– NTCIRワークショップは1年半周期
– しかし,3年程度を周期とした計画も必要
3
具体的には?
• スパンが異なる2つのタスクを並行
– 基本タスク 短期
– フィージビリティスタディ(可能性調査) 中期
• 技術目標のすり合わせ(意思統一)
– 基盤技術をある程度すり合わせる
– グラスボックス評価
• 基盤技術単位の比較評価
4
基本タスク
• 特許検索における無効資料調査に焦点を
当てる
• 既存の特許(請求項)を検索要求として,
そこで請求されている権利を無効化できる
ような特許を検索する
– 特許対特許検索
5
配布(使用)するデータ
• 無効資料調査には,ある程度まとまった期間の
特許データが必要
– 特許公報1993-2002年(1993-1997年)
– PAJ 1993-2002年
• 第三者抄録(出願人要約)を人手で英訳
• 検索要求となる請求項は,既存の公報から抜粋
– 30件程度作成する(追加問題あり:後述)
– 外国語版の請求項も作成: 言語横断検索
• 準備として,NTCIR-3コレクションの利用を推奨
6
検索要求の例
機体の左右両側部に、機体外側方に張り出す
補助ステップを備える作業用走行車であって、
該作業用走行車の前輪を支持するフロントア
クスルケースに、前記補助ステップの前側を
支持するステップ前側支持部を設ける一方、
機体後部に、左右外側方に延出するステップ
後側支持部を設けて補助ステップの後側を支
持し、さらに補助ステップの前端を、前輪車
軸よりも後方に位置させたことを特徴とする
作業用走行車。
※ 複数のトピック(要素技術)で構成されることがある
7
参加者が提出する情報
• 適合文書の一覧
• 根拠パッセージ
– 墨付括弧で区切られる領域をパッセージとし
て統一する
– フィールド名(と段落番号)で特定
• どちらの情報もプーリングや判定作業に利
用する予定
8
パッセージの例
コンパレータから出力される比較電圧が所定値以上になったとき、その比較電圧
によってウインド開閉モータの駆動電流を制御し、ウインド開閉モータの駆動電
流が一定値以上にならないようにして、
.ウインド開閉モータの焼損の発生を防止している。
【0005】
【発明が解決しようとする課題】前記パワーウインド装<BR>置に用いられる既知
のモータ制御回路は、モータ保護回路を備えていて、ウインド開閉モータの駆動
電流が一定値以上にならないように制御し、ウインド開閉モータの焼損の発生を
防止できるものであるが、モータ保護回路の構成に、モータ制御用カスタム集積
回路(ASIC)やコンパレータ等の比較的高価な部品が用いられるので、モー
タ保護回路の製造コストが上昇し、また、モータ保護回路を構成する構成部品点
数が比較的多いことから、モータ制御回路を製造する際に組立て工程が増え、組
立て手順が複雑になる。
【0006】本発明は、このような技術的背景に鑑みてなされたもので、その目
的は、構成部品点数が少なく、かつ、安価な構成部品を用いて簡単な構成にした
モータ保護回路を有するモータ制御回路を提供することにある。
【0007】
【課題を解決するための手段】前記目的を達成するために、本発明によるモータ制
御回路は、負荷に結合されたモータと、モータに直列接続された電流検出
【発明が解決しようとする課題】【0006】 9
評価方法
• 適合判定レベル(判定者の判断)
– 適合(A): 単独で無効化できる特許
– 部分適合(B):
他との組み合わせ次第で無効化が可能な特許
(構成要素を部分的に無効化可能)
• 評価尺度
– 再現率・精度
– 根拠パッセージの抽出精度
10
評価における注意点
• 適合文書が少ない(予備調査より)
– 評価結果の安定性が保てない可能性がある
• 課題数を増やすことで回避できる
– しかし,判定のコストをあまり増やせない
• 2種類の課題を用意
– 人手で判定することを前提とした30課題
– 自動判定のみの課題(多数)
• 審決公報(拒絶引例)を自動判定用の課題とする
• 審決公報の使用や閲覧を禁止する必要性
11
フィージビリティスタディ(FS)
• 特許マップの自動作成を長期目標とする
– そのために必要な基盤技術で,かつ1年半程度で実
装できそうな技術をタスクとして推進
• 特許マップ
– マクロ解析: 全体の出願傾向を調査
– ミクロ解析: テーマや分野を限定した調査
• NTCIRで目指す特許マップ
– 分野や製品をテーマとして,関連技術の分布を可視
化する
12
NTCIR-4特許マップ完成予想図
「光ディスク」をテーマにした例
開発課題
高密度
記録
達
成
手
段
消去特性の
向上
書き換え
回数の向上
書換回数の管理
特開平123
記録位置のシフト
特開平456
レーザーパワー・
パルス波形
特開平789
特開平000
13
概要
検索要求
検索特許
特許公報DB
検索
NTCIR-3の
データを使用
分割
分類
14
必要な基盤技術(タスク)
• 分割タスク
– 特許(請求項)を構成する複数の要素技術を特定し,
それに基づいて特許をより細かな単位に分割
• 分類タスク
– 分割によって特定された要素技術に基づいて,複数
の特許を分類し,相互に関連付ける
– 明示的なラベル(高密度記録など)を付与する
• 検索結果(特許集合)として,NTCIR-3のデータ
を使用する
15
FSタスクにおける評価
• 知財協が作成した特許マップを模範解答と
して配布する
– FSタスクに参加することの利点
• 定量的な比較評価は対象外
– NTCIR-5以降の課題とする
16
その他
• 使ってほしい情報や技術
– 分類(IPCなど),文書構造(フィールド)
– 対応関係
• 請求項と実施例,出願人要約と本文
• 観点
– 既存技術との比較や併用(自動分類とIPC)
• ツール,データの統一(グラスボックス評価)
– タグ情報(課題の構成技術)の配布・共有
– オープンソース(ChaSen,GETA等)の利用
17
運営に関する事項
• 運営体制
– オーガナイザ(藤井,岩山,神門): タスク総括
– 日本知的財産協会: 予備調査,判定作業
• 参加形態
– 基本タスクへの参加は必須(原則)
– FSへの参加は任意
• スケジュール(タスク参加募集を参照)
– 特許情報に関するチュートリアルを予定
18
お知らせ
• ACL WS on Patent Corpus Processing
– 別紙CFP参照
www.slis.tsukuba.ac.jp/~fujii/acl2003ws.html
19
ダウンロード

NTCIR-4 特許タスクの概要