ITライブラリーより(pdf  · システム erp pos scm sfa cti 外部 データ 分析結果...

31
1 DataWarehouse【御参考資料】 構築と活用につきまして ITライブラリーより pdf 100冊) http://itlib1.sakura.ne.jp/ 一般社団法人 情報処理学会 正会員 腰山 信一 [email protected]

Transcript of ITライブラリーより(pdf  · システム erp pos scm sfa cti 外部 データ 分析結果...

1

DataWarehouseの

【御参考資料】

構築と活用につきまして

ITライブラリーより (pdf 100冊)http://itlib1.sakura.ne.jp/

一般社団法人

情報処理学会 正会員 腰山 信一

[email protected]

2

本資料の関連資料は下記をクリックして

PDF一覧からお入り下さい。

ITライブラリー (pdf 100冊)http://itlib1.sakura.ne.jp/

目次番号 750番 880番 他

3

リスク管理の徹底 顧客・商品別の採算管理

収益管理 一取引毎の損益分析

顧客を巻き込んだエキストラネットの強化 顧客への情報開放と受注処理の自動化

情報システムへの効果的投資 増大するサーバ群、業務システムの統合

ナッレジの共有 知識・情報を個人所有から会社所有へ

戦略的営業の更なる強化 顧客の要望する情報を即座に提供

目的 手段

業務シェアの更なる拡大 ITをフル活用した新商品への対応

Da

taW

are

ho

use

の戦略的活用

3

4

ITビジネスの推進

リスク管理

グループウェアの構築

管理会計実績把握

客先情報配信

取引履歴の集約

月残推移の把握顧客情報管理

社員知識の集約

データマイニング(採掘)多次元分析

汎用検索

取引履歴の分析

新商品への対応 業務システムの統合

売上分析

収益管理付加価値の創造(in 営業現場)

協力企業も巻き込んだナレッジの共有

全社的コストの削減

収益管理

出力帳票の電子化

DataWarehouseの構築

自由帳票の作成

商品別売上推移

顧客別資金需要予測

戦略的DataWarehouseの構築

DataWarehouse

の戦略的活用

4

5

利用形態の変化

● 貯めることが中心のデータ・ウェアハウスからデータを利用する

ことを中心にしたデータ・ウェアハウスの構築(一般論)。

- データ活用の高度化

- B I( Business Intelligence ) ツールの高度な活用

● 二階層モデル/三階層モデルからWebの活用へと進化。

- セントラルデータウェアハウス

- 部門データマート/OLAPデータマート/マイニング・データマート

- Internet、Intranet

5

6

● スクラップ&ビルド型データマートの構築。

- 多様なユーザニーズへの対応

- ユーザニースの変化への対応

● データウェアハウスを中心とした他ソリューションとの連携

- CRM、CTI、SFA、ERP、Internet/Intranet

6

7

企業内に蓄積されたデータを経営資源として位置づけ全社的に活用できるデータとして最適化・一元的管理

●データウェアハウス構築●データマート構築

データを積極的に活用する為の方法と関連する技術

●OLAP分析●Webレポーティング●データマイニング

蓄積したデータを情報に変えて戦略的に活用することにより企業の競争力を強化する

データの統合と情報活用(DWH)

7

8

基幹業務データ

ニーズと問題点

●業務単位のDB構築 ⇒データ項目の属性に整合性がない

●データは最新状態を反映 ⇒過去の履歴データは基本的限られた期間しか持つたない

●データは業務処理を最優先した

形式でしかも明細は大量 ⇒ユーザへの開放は困難

●必要最小限データ ⇒他部門のサーバからのデータ収集が必要

8

9

!?!

CRM

Windows

基幹システム

Webアプ

リケーション

グループウエア

9

10

せっかくの貴重なデータを活用できていない

ユーザの不満(一般論)

○最新データはオンライン検索できるが、過去データはレポートを集めて再編集が必要。

○ホスト、サーバ、個人PCとデータが散在しているため集めるのに手間がかかる。

○SQL、コマンド、スクリプトを習得しないとホストやサーバからデータが抽出できない。

○システム間でデータ項目のタイプやフォーマットが異なるためデータを簡単に加工できない。

○大量データを扱うため分析に時間がかかる。

○レポートを作成しても頻繁に仕様が変る。

10

11

販売管理

顧客情報

製品情報

部材情報

生産管理

受注管理

部門別(主題志向)

データウェアハウス

アプリケーション中心

業務データ

変換加工

全社共通の統一データ(統合化)

各業務毎のデータ

履歴データ(時系列)5~10年

最新データMAX2年

データの追加/更新/削除

検索のみ(確定)

データウェアハウスの特徴と効果

11

12

部門別 : 情報の存在場所が明確になり、活用が容易になる。

統合化 : データ(マスターのコードなど)を全社共通のクリーンなデータにすることで1つの情報をいろいろな角度でまたは、複数の情報を一緒に分析できるようになります。

⇒受注と販売のデータを「顧客」という視点で合わせて参照することができる。

時系列 : 過去からの傾向を分析や、過去のある時点のデータ分析が可能となる。

確定 : 更新処理との競合を意識する必要が無く、検索効率を上げられる。

12

データ統合のメリット

13

OLAP(Online Analytical Processing)

期間軸

商品軸

店舗軸

組織軸

商品体系別での視点

顧客体系別での視点

時間

特定期間別での視点

アドホック(自由条件検索)

での視点

売上データ取引データ財務データ

地域

統合データベースの活用方法

スライシング(キューブの断面を見る)やダイシング

(分析視点の切り替え)の手法を用いて様々な視点でデータを検索/分析

13

14

データマイニング( Data Mining )

Microsoft Decision Trees Example

全顧客データ100,000件

購入あり:28,350件購入なし:71,650件

年収500万以上47,625件

購入あり:17,662件購入なし:29,963件

年収500万以下52,375件

購入あり:10,688件購入なし:41,687件

既婚35,207件

購入あり:11,642件購入なし:23,565件

未婚12,418件

購入あり:6,020件購入なし:6,398件

既婚15,207件

購入あり:3,276件購入なし:11,931件

未婚37,168件

購入あり:7,412件購入なし:29,756件

購入者33% 購入者20%購入者22%購入者48%

統合データベース構築のアプローチ

クラスタ分析や相関分析などの手法を持ちいてデータに潜む未知の規則やパターンを発見( データの中から一定のパターンや関係を発見 )

14

15

2.結果表示

1で指定した範囲の検索結果をもとに自由に加工・表示

3.様々な視点からの分析分析軸は科目

比較軸は年度 分析軸は科目 比較軸は店所

視点変更

分析軸は科目 比較軸は年度 分析軸は科目 比較軸は店所

表示変更 表示変更

業務統合DB

抽出データ項目

検索条件

データ項目一覧

1.検索に必要なデータ項目指定

検索に必要なデータ項目を指定

選択テンプレートプレビュー

テンプレート一覧

1.出力に必要なテンプレートを指定

出力に必要なテンプレートを指定

テンプレートの選択

レポート作成2.結果表示

利用シーンの考察

1.抽出データ項目を自由に選択 → 分析の視点は利用者が自由に設定/様々な視点からの分析が可能

2.出力に必要なテンプレートを選択 → 呼び出されたテンプレートを加工して帳票を作成

「見たい情報を見たい時に」を実現

利用者が自由な視点で表を加工し分析することが可能

16

基幹システム・大量データの保管・統合データベースとの連携

源泉データ過去N年分

分析・予測シュミレーション

定型検索自由検索

エンドユーザ(営業部門、バックオフィス部門)

情報システム部門

マーケティング部門経営企画部門リスク管理部門

・ユーザーニーズへの対応

・鮮度/精度維持・パフォーマンス維持・セキュリティ維持・障害対策

各種業務データ

運用

目的別データ

明細データ

多次元キューブ

統合データベース

統合データベース構築の要件 ~効果的なデータの保持~

統合業務システム・各種業務データ

各業務データ即日反映

蓄積蓄積

集約データ

統合データベースはこれら種々の要求に耐えうる、精度が高く鮮度の良いデータを大量に蓄積し、

様々な情報検索要求に即座に応えられる必要がある

16

17

統合データベース構築の要件 ~効果的なデータの保持~

データウェアハウス構築の一つのポイントとして、様々なユーザの検索ニーズにいかに

柔軟に応えられるか、という点が挙げられます。たとえば経営層が経営目標に対する

モニタリングを行なう時と、リスク管理部門が全社的なリスク・収益を管理する時、そし

て営業現場で各営業担当が顧客データや取引情報を参照にする時では、それぞれ必

要とするデータが違います。これらの多様なニーズに応えるには、精度が高く鮮度の

良いデータを大量に蓄積し、さらにそのデータをいかに見せるか、という点を考慮する

必要があります。

17

18

●明細データ日々のビジネス活動の最前線で発生するデータをそのまま生データ(明細データ)として蓄えます。 これらのデータは以降の分析などに実体を反映した情報として利用されます。

●集約データ明細データでは情報が細かすぎて傾向やトレンドなどを一目で把握しづらく、また量も多いため、大きな傾向を把握するために種々の集約項目に沿ってあらかじめデータを集約しておきます。

■様々な検索要求に応えられる情報の蓄積

18

19

●目的別データベース(データマート)

主にパターン化した定型検索などでその目的に合致したデータベースをあらか じめ作成しておきます。また、WAN経由などの場合、一定のレスポンスを確保するために各検索拠点に配置することもあります。

●多次元キューブ分析/予測/シミュレーションなどを効果的に行なうため、組織、商品、顧客、時

系列など想定 される視軸に沿った多次元データベースを作成します。これらはドリルダウンやスライス&ダイスなどの分析手法に使用されます。

19

20

●ビジネスインテリジェンス(効果と課題)

EAI ポータル(EIP)データ蓄積/活用

・アプリケーション連携・システム統合

・データ統合・データ一元管理・データ分析・情報共有、情報提供

・Webによる再構築・企業ポータル・情報共有

・NW集中化

・TCO削減

・オープン化

・既存資産継承

・TCO削減

・全社データの整合性

・企業戦略、経営指標

・TCO削減

・既存資産継承

・新技術導入

情報共有とビジネスインテリジェンス

21

DWHとビジネスインテリジェンスの連携●データの統合と情報活用(データから価値ある情報へ)

ポータル Webレポート 分析・OLAP データマイニング

ビジネスインテリジェンス・プラットフォーム

DWHDM DM

キューブ キューブ

レガシーシステム

ERP POS SCM SFA CTI 外部データ

分析結果に基づき行動を起こす

BIツールでデータを分析しビジネスを見直す

様々な情報源

からデータを

集約し

DWHやDM

を構築する

レポーティング

ビジネス

インテリジェンス

情報活用

レポーティング

ポータル業務系

データベース

外部

データ

DWH・DMの

構築

全社

ポータル

ETL(抽出・変換・ロード)

22

あらゆる角度からの分析

22

23

情報の可視化

情報共有レポーティング

ビジネス

インテリジェンス

情報活用

レポーティング

ポータル業務系

データベース

外部

データ

DWH・DMの

構築

全社

ポータル

23

24

●全社ポータル

全社レベルの共有情報を格納、伝達

・全社スコアカード、全社戦略マップ

・関連ニュース、文書

・統合検索機能

●部門別ポータル・機能別ポータル

部門レベルの共有情報を格納、伝達・部門スコアカード・ 商品/サービス別スコアカード・ ドリルダウン分析機能

●チームサイト

部や課、バーチャルチームの共有情報を格納・ チームスコアカード・ 特定 KPI のシグナル・ グループウェア機能(予定表や連絡メモ、行き先管理など)

利用者によって欲しいポータル情報は異なりますニーズに合った情報を如何に使いやすく見やすい環境で提供するかが重要

組織ごとの情報ポータルサイト

25

●目的別ポータルの連携による、情報ネットワーク

部門ポータルコラボレーション ポータル

チームサイト 個人用サイト

より詳細なスコアカードへの展開情報共有のためのグループウェア

バーチャルチームでの情報共有 個人のデスクトップ/プロフィール

全社ポータル

データ分析・検索

機能別サイト

ポータル ネットワーク

25

26

経営層からの要求に応えたい

顧客/利用者の期待に応えたい

顧客/利用者の満足を得たい

不足している知識を身に付けたい

成功事例の横展開

情報鮮度のアップ

■部分的な検討による拡張性のないアーキテクチャの構築

■必要がない機能を数多く実装

■情報共有の仕組み(ビジョン・目的の共有)が不十分

■導入の評価基準が曖昧

■情報の鮮度を保ち続ける仕組みが不十分

■情報の公開基準、セキュリティ基準の検討が不十分

■情報公開に対する動機付けがない

利用者/システム部門の主なニーズ

ニーズと課題の関係

企業情報ポータルに対するニーズと課題

27

データ統合

情報活用レポーティング

ビジネス

インテリジェンス

情報活用

レポーティング

ポータル業務系

データベース

外部

データ

DWH・DMの

構築

全社

ポータル

27

28

データウェアハウス構築におけるアプローチ

DWH計画

業務要件分析

データモデル分析

ソースデータ分析

DWH設計

構築 テストと検証 適用

レビューと評価

保守サイクル

繰り返しによる改善・成長

28

29

開発方式のポイント

データウェアハウスの構築手順

ビジネス戦略の策定

・ビジネス情報活用の機会分析

・計画作成及び評価

・情報技術調査の検討

・効果分析評価と承認

データウェアハウス論理設計

・分析要求洗い出し・対象データ洗い出し・エンティティ洗い出し・論理データモデルの作成・効率化検討・モデル検証

データ連携・運用論理設計

・データマッピング・データ連携手段の決定・運用要件定義・リカバリ要件定義・データ量把握

データウェアハウス物理設計

・要求仕様分析・クエリの分析・更新方法検討・システム拡張性検討・ディスクボリュームの見積もり・物理配置決定

システム開発

・開発標準化検討・開発環境詳細設計・クライアント詳細設計・プログラム詳細設計・運用方法詳細設計

システムテスト

・テスト計画立案&作成・結合テスト/総合テスト実施・検証

評価

・ビジネスニースの観点・パフォーマンス・使用S/W

・アーキテクチャ/運用

情報戦略策定 論理設計 物理設計 開発/導入 テスト 評価

スパイラル型開発構築手順概要

データマート論理設計

・分析要求洗い出し・対象データ洗い出し・エンティティ洗い出し・論理データモデル作成・次元定義・変数定義・効率化検討・モデル検証

データ連携・運用論理設計

・データマッピング・データ連携手段の決定・運用要件定義・リカバリ要件定義・データ量把握

データマートの物理設計

・更新方法検討・システム拡張性検討・ディスクボリュームの見積り・キューブの分割検討

システム開発

・開発標準化検討・開発環境詳細設計・クライアント詳細設計・プログラム詳細設計・運用方法詳細設計

システムテスト

・テスト計画立案&作成・結合テスト/総合テスト実施・検証

評価

・ビジネスニースの観点・パフォーマンス・使用S/W

・アーキテクチャ/運用

データウェアハウス

データマート

「大きな構想のもとに小さく始める」というアプローチにて、開発方式は短いサイクルで開発・導入・評価を繰り返す“スパイラル型”が望まれます。

29

30

本資料の関連資料は下記をクリックして

PDF一覧からお入り下さい。

ITライブラリー (pdf 100冊)http://itlib1.sakura.ne.jp/

目次番号 750番 880番 他