SEC
Software Engineering
for Mo・No・Zu・Ku・Ri
データ白書の見方・使い方(1)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
0
SEC
データ白書の見方・使い方
Software Engineering
for Mo・No・Zu・Ku・Ri
 『ソフトウェア開発定量データ白書』について、以下の点を
ご理解いただき、データ白書のご活用と定量データの
普及・展開を推進いただけるようお願いいたします。
 白書利用の効果、目指す先を共有するため、
必要性と目的を理解する。
 白書を正しく利用するため、
収集方針を含むデータ概要を理解する。
 分析結果を正しく認識するため、
参照時の留意点を理解する。
 実践的に利用できるようになるため、
データの活用方法を理解する。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
1
SEC
内容:データ白書の見方・使い方
Software Engineering
for Mo・No・Zu・Ku・Ri
1章 背景と本書の目的
2章 収集データについて
3章 分析について
4章 収集データのプロファイル
5章 プロジェクトの主要要素の統計
(6章~10章)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
2
SEC
1.1 IT産業を取り巻く環境(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 近年のIT産業を取り巻く環境について
ネットワークの普及
市場競争の激化
ビジネスモデルの転換
トラブルの多発
期
待
・
ニ
ー
ズ
システムへの
要求が増大
安全・安心の
確保要請が増大
・信頼のおけるマネジメント
・トラブル発生未然抑止
理想
リスクの増大
不適切な見積、生産性の見誤り
人海戦術的な対処方法での対応
データ白書の見方と定量データ活用ポイント
・低コスト、短期開発
・多機能、高性能
Copyright© 2011 IPA, All rights reserved.
現実
KKD(勘、経験、度胸)
Software Engineering Center
3
SEC
1.1 IT産業を取り巻く環境(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 社会的な動向への対応
 工事進行基準の適用:
プロジェクトの進捗部分について「成果の確実性」が認められる
場合に適用される。
「成果の確実性」とは、以下の3つの要素について、
信頼性をもって見積ることができること。
工事収益総額:
工事契約の対価(受注額)。工事完成能力が必要。
工事原価総額:
完成までの原価総額。実原価との比較と見直しが必要。
工事進捗度:
決算日における開発の進捗率。客観的把握が必要。
高い見積り精度と確実性、客観性が求められる。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
4
SEC
1.1 IT産業を取り巻く環境(3)
 ユーザ・ベンダ間の納得感の欠如
ユーザ
【事業計画】
・事業目的
・事業領域/規模
・投資/回収
・事業スケジュー
ル
Software Engineering
for Mo・No・Zu・Ku・Ri
ベンダ
【プロジェクト計画
】
整合
・開発目的
・スコープ/規模
実現性
・予算
・開発スケジュー
「やりたいこと」と「できること」の整合が必要だが…
ル
要件
 共有しやすい見積り手法がない
 初期の仕様は固めにくく、早期契約時の適切な見積りが困難
 要件決定の遅れ、プロジェクト途中での仕様変更の発生 など
定量データに裏付けられたマネジメントが必要
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
5
SEC
1.2 データ白書の目的(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 定量データの必要性
 定量データが十分集まれば ・・・ こんな活用ができる
経営層
ユーザ
・IT投資、概略計画の妥当性、実現性の目安
業務・情報システム部門
組織長・スタッフ
プロジェクト管理者
・予算数値、根拠の制御
・ベンダからの見積の比較と評価、強み/弱みの認識
・計画策定、目標値の制定、QCDの妥当性評価
・予実差異の分析、完了評価、開発能力の評価
ユーザ、ベンダ間の合意形成
経営層
ベンダ
・自社の強み・弱み、生産性などの開発力の認識
PMO
品質保証部門
・定量データベースの構築
・自社プロジェクトのベンチマーキング、モニタリング
プロジェクトマネージャ
プロジェクトリーダ
・規模、工数、工期、品質の見積り、計画策定、制御
・オフショア等、外部委託先評価
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
6
SEC
1.2 データ白書の目的(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 SECの取組みとデータ白書の目的
 定量的アプローチによる科学的マネジメントの普及拡大
モノサシとしての精度を高めていく
新たなモノサシや課題抽出の切り口を提案する
メーカー系、ユーザ系、独立系の複数のベンダからデータを収集
「ソフトウェア開発データ白書」として公開
(2010年度は23企業、2584プロジェクトのデータ)
2005
2006
2007
2008
2009
2010-
2011
942
1418
1774
2056
2327
2010年11月
発行
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
2584
Software Engineering Center
7
SEC
1.3 データ白書利用の際の留意点
Software Engineering
for Mo・No・Zu・Ku・Ri
 データ白書の記載概要と利用の際の留意点
 ソフトウェアの定量的なモノサシとして基本的なものを収録
しており、以下の要素間の関係などを図表で記載している。
代表的な要素
プロジェクトの
特性例
規 模
工 数
工 期
生産性
信頼性
開発種別
アーキテクチャ
業 種
開発言語
開発ライフ
サイクルモデル
プラットフォーム
 プロジェクトデータは様々な特性や環境により異なるため、
必ずしもこのメトリクスをそのまま自プロジェクトに適用できない
場合がある。それぞれのプロジェクトや現場で、何らかの判断や
予測を行う場合の参考として、活用するとよい。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
8
SEC
1.4 データ白書で提供する基礎情報
Software Engineering
for Mo・No・Zu・Ku・Ri
 ソフトウェア開発データ白書の構成 (2010-2011版)











1章
2章
3章
4章
5章
6章
背景と本書の目的
収集データについて
分析について
収集データのプロファイル
プロジェクトの主要要素の統計
工数、工期、規模の
関係の分析
7章 信頼性の分析
8章 工程別の分析
9章 生産性の分析
10章 予実分析等
付録A~G
データ項目の定義や
収集データ年別プロファイル 等々
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
データ収集方針
分析の方針、データの基
準
データ全体のプロファイル
方針に基づく分析結果
予実、生産性の差の
特徴をミニテーマ分析
Software Engineering Center
9
SEC
1.5 データ白書の対象読者
Software Engineering
for Mo・No・Zu・Ku・Ri
 データ白書の活用イメージを考慮した対象読者
 教育部門の方々

企業内での定量データ活用の普及・展開を、社内教育などにより
推進される際、活用いただきたい。
 品質保証部門、プロジェクトマネジメントオフィスの方々

企業内での定量データベース構築や、プロジェクトのベンチマーキングを
推進する際、現場の方々への説明やご指導など対応される際、
活用いただきたい。
 業務部門、情報システム部門の責任者の方々

ソフトウェア開発現場で、データ収集・定量的管理・精度向上等の
取り組みの啓発の際に、活用いただきたい。
 プロジェクトマネージャ、プロジェクトリーダの方々

定量データを用いた見積り、プロジェクト管理の推進(制御、予測等)を
行う際、実践的な利用のためのノウハウとして、活用いただきたい。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
10
SEC
内容:データ白書の見方・使い方
Software Engineering
for Mo・No・Zu・Ku・Ri
1章 背景と本書の目的
2章 収集データについて
3章 分析について
4章 収集データのプロファイル
5章 プロジェクトの主要要素の統計
(6章~10章)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
11
SEC
2.収集データについて
Software Engineering
for Mo・No・Zu・Ku・Ri
 データ収集方針と収集状況
 ソフトウェア開発データ白書で利用しているデータは、国内企業
複数社から収集したプロジェクトデータである。
データの項目は主に実績に関する項目
主な要素では計画データについても収集項目対象
(規模、工期、工数など)
対象プロジェクトはアプリケーションソフトウェアや
システムを開発するプロジェクトが中心
対象時期は直近3年を優先
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
12
SEC
2.1 データ収集のポイント
Software Engineering
for Mo・No・Zu・Ku・Ri
 重点収集したデータについて
 次に示す重点データ項目について、欠損が極力少ない
プロジェクトを対象にデータ収集している。
項 目
詳 細
開発種別
新規開発、改修・保守、拡張
アーキテクチャ
イントラネット/インターネット、2階層C/S、3階層C/S
業 種
金融・保険業、情報通信業、製造業、卸売・小売業、公務など
開発言語
Java、VB、C、COBOL、C++など
規模の指標
FP、SLOCのいずれかで計測されているもの
FP計測手法名が明確、SLOC言語名が明確なもの
プラットフォーム
Windows系、Unix系
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
13
SEC
2.2 データ提供状況
Software Engineering
for Mo・No・Zu・Ku・Ri
 プロジェクトデータの更新年・終了年別クロス集計
開始年ごとのデータ件数
終了年ごとのデータ件数
400
400
データ白書2010-2011
開始年(西暦)
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
2009
2008
2007
2006
2005
2004
2003
2002
2001
0
2000
0
1999
50
1998
50
1997
100
1995
100
1999
150
1998
200
1997
150
250
1995
200
1996
件数
250
300
件数
300
2009年
2008年
2007年
2006年
2005年
2004年
350
1996
2009年
2008年
2007年
2006年
2005年
2004年
350
終了年(西暦)
P17、図表2-2-4、5
【全体】 (2010-2011版での状況)
・開始年では2003年以降のデータが78%を占める
・終了年では2003年以降のデータが84%を占める
(2009年度データ開始・終了プロジェクトは期中のためすべて収集されていない)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
比較的
直近年のデータが
多く集まっている
Software Engineering Center
14
SEC
内容
Software Engineering
for Mo・No・Zu・Ku・Ri
1章 背景と本書の目的
2章 収集データについて
3章 分析について
4章 収集データのプロファイル
5章 プロジェクトの主要要素の統計
(6章~10章)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
15
SEC
3.分析について
Software Engineering
for Mo・No・Zu・Ku・Ri
 分析の対応方針について
 データ白書では、以下のように分析方針を定めて対応している。
分析の進め方
分析の目的、分析の観点、対象要素、分析する要素間の関係、
分析の手順
分析に関する事前の取り決め
データの選定基準などのデータ抽出に関する取り決め、
データ項目の取り扱い
分析結果の取り扱い
分析結果の掲載基準や単位の表記、掲載・表現方式など。
 年度毎に定点観測を行っているため、継続的な分析と新たに行
う分析の対応方針を明確にしている。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
16
SEC
3.1 分析の進め方(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 分析の観点及び方針
 共通認識を形成するための代表的な要素に着目し、
要素間の関係を明らかにするアプローチを取っている。
代
表
的
な
要
素
と
、
要
素
間
の
主
な
関
係
主要要素として
分析の柱にしたもの
データ白書2010-2011
P19、図表3-1-1
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
17
SEC
3.1 分析の進め方(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 分析の手順
 データ白書における分析の手順の概要を以下に示す。
 不良データの除外
(1)収集データの精査
 データ提供側との確認、見直し
(2)全データの分布分析
 ばらつき、偏りをヒストグラムや 散布
図より、自然な傾向を確認
(3)主要要素の
データの分布分析
 規模、工期、工数、生産性、信頼性
の分布の明確化
(4)主要要素の関係分析
 代表的な要素について、要素相互の
関係を分析
(5)層別の設定と分析
データ白書の見方と定量データ活用ポイント
 データの干渉を廃し、極力独立性を出
す、または特徴を出すために層別を設
定し、細分化した分析を実施
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
18
SEC
3.2 分析に関する事前の取り決め(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 データ抽出に関する取り決め
 分析対象データを抽出する際に、以下の取り決めを行っている。



データ抽出対象の工程について
規模データなどのデータ抽出、計測手法について
複数選択がある収集データについての取り扱いについて
 データ項目の取り扱いに関する取り決め
 以下のデータ項目ごとに必要な取り決めを行っている。




開発プロジェクトの種別
FP規模、SLOC規模
工数、工期、月あたりの要員数
外れ値の取り扱い
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
19
SEC
3.2 分析に関する事前の取り決め(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 収集データの前提 (データ定義と留意点)
 データ白書で扱う基本的な対象工程は、基本設計開始から
総合テスト終了までの「開発5工程」としている。



工数は、「社内工数」及び「外部委託工数」の合計値を使用。
「社内工数」には、「開発」、「管理」、「その他」及び「作業配分不可」の
全ての工数を含む。
「開発5工程」では、「該当する5工程」の工数と「工数配分不可」の工数の
合計値を使用。
←
工程内訳
社内実績
工数
システム
化計画
要件
定義
基本
設計
開発5工程
詳細
設計
制作
結合
テスト
→
総合テスト
(ベンダ確認)
総合テスト
(ユーザ確認)
工数配分
不可
開発
管理
その他
作業配分
不可
外部委託工数
開発工数
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
20
SEC
3.3 分析結果の取り扱い
Software Engineering
for Mo・No・Zu・Ku・Ri
 分析結果の取り扱いについて
 データ白書では分析結果の取り扱いとして、掲載基準や
評価の目安、基本的な見方などを取り決めている。
以下について個別に示す。
3.3.1
3.3.2
3.3.3
3.3.4
データ白書の見方と定量データ活用ポイント
共通事項
基本統計量
回帰分析
箱ひげ図
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
21
SEC
3.3.1 共通事項
Software Engineering
for Mo・No・Zu・Ku・Ri
 分析結果の取り扱いにおける共通事項
 データ白書では分析結果の取り扱いにおける共通事項として以
下について取り決めている。
 分析結果の掲載基準



分析対象の標本数
偏りが起きないための前提条件(データ収集元の偏り、占有率など)
基準を満たさない場合でも掲載する例外基準
 単位の表記
 分析結果の掲載方式



使用データの掲載方式
導出指標の例
分析結果の表現方式
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
22
SEC
3.3.2 基本統計量(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 基本統計量について
 散布図や箱ひげ図など視覚的に傾向を捉える図表と共に、基本
統計量も認識することで、的確なデータ値を把握することができ
る。
 基本統計量の表記

次に示すいずれかの形式で掲載している。
N
最小 P25 中央 P75 最大 平均
項目

N
最小 P25 中央 P75 最大 平均
N
中央 平均
標準偏差
標準偏差
標準偏差
各項目は以下のように表記
「項目」:データ名称、 「N」:件数
「最小」:最小値、
「P25」:25 パーセンタイル
「中央」:中央値、
「P75」:75 パーセンタイル
「最大」:最大値、
「平均」:平均値、
「標準偏差」:標準偏差
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
23
SEC
3.3.2 基本統計量(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 基本統計量の評価の目安
 データ数nの量

データ数は層別あたり、最低でもn≧10、望ましいのはn≧30。
データ白書では標本数が10件以上であることが掲載基準。
 統計量の代表値の採択

一般に|歪度|>2の場合、平均値より中央値を採択する。
(分布の非対象性が大きいと見られるため)
「平均値」と「中央値」について:
 ソフトウェア開発プロジェクトのデータは正規分布をして
いない場合が多い。(例えば規模や工数の分布など)
 中央値の方が平均値よりも全体のプロファイルを表す
数値として適切であることが多い。

代表的な値や許容の幅、偏りやばらつきを評価し、
より的確なデータ値を把握する。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
24
SEC
3.3.2 基本統計量(3)
Software Engineering
for Mo・No・Zu・Ku・Ri
 基本統計量の見方と留意点
FP実績値の基本統計量
最小
P25
5
中央
194
例) FP実績値の見方
・FPによる規模では、
500FPまでのプロジェクト
が5割強を占める。
・一方で、2000FP以上の
プロジェクトも、一割強ある。
P75
440
最大
284,900
995
平均
1,225
データ白書2010-2011
FP実績値の分布(ヒストグラム)
P48、図表4-8-4、5
220
200
180
160
140
件数
N
1,130
[FP]
標準偏差
8,617
120
100
80
60
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
2,400超
~2,100
~1,900
~1,700
~1,500
~1,300
~1,100
~900
~700
~500
~300
~100
20
2000FP以上の大きな値に
0
引きづられ、平均値が大きく
FP実績値(調整前)[FP]
なっているが、非対象系の分布など
考慮すると、中央値の方が全体のプロファイルとして適切だと見て取れる。
~2,300
40
25
SEC
3.3.3 回帰分析(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 回帰分析の結果を散布図上で示す
 データ白書ではプロジェクトの代表的な要素間の関係について、
その多くは散布図により表わしている。
 基本的には2つの要素間の関係を表わしている。
 何らかの傾向があるか見ることができる。
 2つの要素間に相関関係がないか見ることができる。
 相関関係が見て取れる場合、2つの要素(2変量)の関係を
回帰分析により、定式化する。(近似式として表わす。)
 定式化が可能な場合、信頼幅の線を表わす。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
26
SEC
3.3.3 回帰分析(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 回帰分析結果の掲載基準
 回帰分析結果について掲載するのは、下記図表に示す
3項目の目安をすべて満たす場合としている。




回帰式は、相関係数が高くデータの件数も十分ある。
2つのデータ項目間に強い関係が見出せると判断される。
回帰直線又は曲線を示す条件も同様。
傾向を単に視覚的に示す場合や説明の必要性から係数を用いるなどの
ケースはこの限りではない。
 回帰分析を使用した場合の評価の目安:
項目
判断の目安
1
データ数nの量
データ数は層別あたり、n≧30とする
2
相関の見方
|相関係数R|≧0.85
:強い関係
0.85>|相関係数R|≧0.70 :やや強い関係
|相関係数R|<0.70
:強い関係は認められないが要継続観察
3
相関の有意性
P値<0.05 とする(危険率5%で相関が有意と判断できる)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
27
SEC
3.3.3 回帰分析(3):白書の表記と見方の留意点①
Software Engineering
for Mo・No・Zu・Ku・Ri
 対数変換による分析
 ソフトウェア開発プロジェクトのデータは正規分布していない
ことが多い。(例えば規模の分布:規模の大きい方に裾野が長い分布)


対数に変換するとほぼ正規分布と見なせることが多く、裾野を含めた
全体の状況が見やすい。
「正規分布」であることを前提としている相関係数の有意性や回帰式の
予測値の信頼区間推定を求めることができる。
FP実績値(調整前) N=211
Log (FP実績値(調整前)) N=211
40
45
35
30
件数
件数
30
20
裾野の分布が
分かり易い
40
対数
スケール化
25
20
15
FP実績値(調整前)
5
次の級
3.96
3.76
3.55
3.35
3.15
2.94
2.74
2.54
2.33
2.13
1.93
1.72
0
1.52
2401~
~2300
~2100
~1900
~1700
~1500
~1300
~1100
~900
~700
~500
~300
~100
0
10
1.32
正規
分布
1.11
10
Log (FP実績値(調整前))
詳細は次の文献を参照のこと
※ 「プロジェクトデータ分析の指針と分析事例」:古山恒夫、SEC journal No3、 pp6~pp13、 2005
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
28
SEC
3.3.3 回帰分析(3):白書の表記と見方の留意点②
Software Engineering
for Mo・No・Zu・Ku・Ri
 もとのデータと対数変換後のデータの見方
 データを対数スケールに変換すると相関が明確になる場合があ
る。



散布図の表記において、必要に応じ対数スケール表示を取り入れている。
元のスケールに戻すと有効範囲(誤差)は右上方向に開く。
もとのデータに戻し、50%の信頼幅を示すと・・・
規模や工数が大きくなるに伴い信頼幅が広がるため、規模と工数の
関係など、妥当性の検証時はそれを考慮して判断する必要がある。
もとのスケールに戻
50%信頼幅
対数表示
す
FP規模と工数 (新規開発、IFPUGグループ) N=188
FP規模と工数 (新規開発、IFPUGグループ) N=188
300,000
log(y)(50%)
log(y)(-50%)
実績値
100,0005
実績工数(開発5工程) [人時]
実績工数(開発5工程) [人時]
1,000,0006
10,0004
1,0003
100
2
10
1
250,000
200,000
150,000
100,000
50,000
Copyright IPA SEC
0
1
10
10
1
100
2
1,000
3
10,000
4
100,000
5
Copyright IPA SEC
0
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
FP実績値(調整前)
FP実績値(調整前)
データ白書の見方と定量データ活用ポイント
y(50%)
y(-50%)
実績値
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
29
SEC
3.3.4 箱ひげ図(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 データの分布を視覚的に捉えることができるグラフ
*
極値
外境界点
箱の高さ×3.0
外れ値
内境界点
箱の高さ×1.5
ひげ
外れ値を除いた最大値
箱の下端は、「下ヒンジ」と呼ばれ、下から
全体の25%に相当するデータの位置である。
上下50%の境目は「中央値」であり、
太線で表す。
上ヒンジ
中央値
箱の高さ×1.5
箱の上端は、「上ヒンジ」と呼ばれ、上から
全体の25%に相当するデータの位置である。
下ヒンジ
外れ値を除いた最小値
内境界点
箱の高さ×3.0
箱の高さの3倍の位置を「外境界点」と呼び、
そこから外れた点を「極値」という。
箱の高さの1.5倍の位置を「内境界点」と呼び、
外境界点内で外れた点を「外れ値」という。
外れ値、極値の除いた点の最大値、最小値
までを「ひげ」として表現する。
外境界点
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
30
SEC
3.3.4 箱ひげ図(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 白書の表記と見方の留意点(箱ひげ図事例)
例) FP規模あたりの検出バグ数(新規開発、IFPUGグループ)
幅は狭いほうが、ばらつきが小さい。
正規分布に近いデータの集団では、
上下のひげが同じ大きさで、
中央値が箱の真ん中にある。
データ白書2010-2011
P214、図表8-4-7
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
31
SEC
内容:データ白書の見方・使い方
Software Engineering
for Mo・No・Zu・Ku・Ri
1章 背景と本書の目的
2章 収集データについて
3章 分析について
4章 収集データのプロファイル
5章 プロジェクトの主要要素の統計
(6章~10章)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
32
SEC
4.収集データのプロファイル(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 収集データのプロファイルについて
 これまで収集したプロジェクトデータについて、どのような
特徴があるか、プロファイルとして明示している。



ある特徴について、ある種別で分類するとどのような分布になっているか
全データ件数に対してどのような割合になるか
ある特徴の大小によって、件数がどのように分布しているか
 上記のような分析結果を、円グラフや棒グラフ、ヒストグラム
などの図表で表示している。
例) 開発プロジェクトの種別で見た際の特徴:


種別を「新規開発」、「改修・保守」、「再開発」、「拡張」とする。
この種別の割合をプロファイルとして見ることで、データの
特徴を捉えることができる。
(新規開発が約55%で、改良・保守開発が約29%など)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
33
SEC
4.収集データのプロファイル(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 データ白書掲載のプロファイル一覧
掲載事項
内容、備考
1
開発プロジェクト
の全般的な特徴
開発プロジェクトの種別、形態、作業概要、
新規顧客か、新規業種・業務か、新技術利用か
2
利用局面
業種、業務、利用形態
3
システム特性
システム種別、業務パッケージ利用、処理形態、
アーキテクチャ、開発対象プラットフォーム、
Web技術の利用、開発言語、DBMSの利用
4
開発の進め方
開発ライフサイクルモデル、類似プロジェクトの参照、
開発方法論の利用、開発フレームワークの利用、
ツールの利用
5
ユーザ要求管理
ユーザ要求と関与、要求レベル
6
要員などの
経験とスキル
PM経験とスキル、要員の経験
7
規模
規模の尺度の種別、FP計測手法、純度、FP実績値、
SLOC実績値
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
34
SEC
4.収集データのプロファイル(3)
掲載事項
Software Engineering
for Mo・No・Zu・Ku・Ri
内容、備考
8
工期
プロジェクト全体の月数実績値、開発5工程の月数実績値
9
工数
プロジェクト全体、開発5工程の工数の実績値
(人時、人月)、工数の単位、人月-人時の換算係数
10
体制
外部委託工数比率、外部委託金額比率
11
信頼性
稼動後の不具合数(全体、現象数、原因数)、
品質保証の体制、品質基準、レビューの有無
12
実施工程の組み
合わせパターン
開発プロジェクトにおける実施工程の有無が同じものを
グルーピングしたパターン
13
プロジェクト成否
計画の評価及び実績の評価は、QCDの三つの観点について
の評価を段階的に表す。
計画の評価(QCD)、実績の評価(QCD)、
プロジェクト成否の自己評価、
顧客満足度に対するベンダ側の主観評価
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
35
SEC
4.収集データのプロファイル(4)
Software Engineering
for Mo・No・Zu・Ku・Ri
 収集データのプロファイル例(1)
業種(大分類)
アーキテクチャ
件数
0
100
200
300
400
500
600
A:農業
C:漁業
D:鉱業
E:建設業
F:製造業
G:電気・ガス・熱供給・水道業
H:情報通信業
I:運輸業
J:卸売・小売業
K:金融・保険業
L:不動産業
M:飲食店,宿泊業
N:医療,福祉
O:教育,学習支援業
P:複合サービス事業
Q:サービス業(他に分類されな
R:公務(他に分類されないもの)
S:分類不能の産業
700
800
件数
0
第1回答
第2回答
第3回答
a:スタンドアロン
b:メインフレーム
100
200
300
400
500
600
700
800
900
第1回答
第2回答
第3回答
c:2階層クライアント/サーバ
d:3階層クライアント/サーバ
e:イントラネット/インターネット
f:その他
(件数の多い順)
①金融・保険業
②製造業
③情報通信業
データ白書の見方と定量データ活用ポイント
データ白書2010-2011
データ白書2010-2011
P33、図表4-3-1
P36、図表4-4-5
①イントラネット/インターネット
②2階層クライアント/サーバ
③3階層クライアント/サーバ
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
36
SEC
4.収集データのプロファイル(5)
Software Engineering
for Mo・No・Zu・Ku・Ri
 収集データのプロファイル例(2)
 例えば図表から以下なども読み取ることができる。(図表は割愛)
プラットフォーム
開発言語
①
②
③
④
① Windows系
② Unix系
開発ライフサイクルモデ
ル
ウォーターフォール型
が
9割強を占める
データ白書の見方と定量データ活用ポイント
Java
VB
COBOL
C
主開発言語グルー
プ
となる主要4言語
開発種別
新規開発が約6割を占める
改良開発は4割弱を占める
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
37
SEC
内容:データ白書の見方・使い方
Software Engineering
for Mo・No・Zu・Ku・Ri
1章 背景と本書の目的
2章 収集データについて
3章 分析について
4章 収集データのプロファイル
5章 プロジェクトの主要要素の統計
(6章~10章)
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
38
SEC
5.プロジェクトの主要要素の統計(1)
Software Engineering
for Mo・No・Zu・Ku・Ri
 プロジェクトの主要要素の統計について
 収集データのプロファイルはデータの特徴を様々な観点の分布
状況から明らかにしたものである。



さらに主要な要素について層別を行い、分布をまとめている
要素間の関係を見るための対象プロジェクトデータと同じ切り口で層別
基本条件によるデータ抽出により明示
 収集データの全体を俯瞰するため、
規模、工期、工数、月あたりの要員数について、
開発プロジェクト種別、業種、アーキテクチャ、業務別
にその件数と分布をまとめている。
 分析結果の確認や利用に際して、基となる基本的なデータ
分布を認識することができる。
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
39
SEC
5.プロジェクトの主要要素の統計(2)
Software Engineering
for Mo・No・Zu・Ku・Ri
 プロジェクトの主要要素の統計例
項 目
分析結果事例(一部抜粋)
FP規模
1000FP以下のプロジェクトが7割弱(但し、3000FP超もある)
「改修・保守」の中央値が264FP、「新規開発」が710FP
SLOC規模
50KSLOC以下のプロジェクトが多く、「新規開発」での内訳
10~20KSLOCが、「改良開発」では10KSLOC以下が多い
工期
14ヶ月以下が9割程度を占めている
業種別において、「製造行」、「情報通信業」の工期がやや短い
工数
工数が5000人時(約31人月)以下が4割程度を占めている
 「改修・保守」の中央値が4800人時、「新規開発」が9600人時
月あたりの
要員数
2~4人が一番多く、10人以下が6割程度を占めている
「金融・保険業」の新規開発では、20人超が3割強ある
データ白書の見方と定量データ活用ポイント
Copyright© 2011 IPA, All rights reserved.
Software Engineering Center
40
ダウンロード

データ白書の見方・使い方(1 ) - IPA 独立行政法人 情報処理推進機構