Łukasz Grala - BI w Sql 2008
-
Upload
nexik -
Category
Technology
-
view
1.130 -
download
1
description
Transcript of Łukasz Grala - BI w Sql 2008
Business Intelligence w SQL Business Intelligence w SQL Server 2008Server 2008
Łukasz Grala
Seminarium Microsoft SQL Server 2008, Chorzów 19 luty 2009
Łukasz Grala• Doświadczenie:
kierownik projektów ERP, wykładowca, projektant, konsultant, wdrożeniowiec
• Zainteresowania:bazy i hurtownie danych, systemy ERP i BI, badania operacyjne, eksploracja danych, systemy
wspomagania decyzji, teoria obliczeń, technologia Microsoft
• Doradztwo:
Systemy ERP i BI, bazy danych Microsoft SQL Server, rozwiązania analityczne i hurtownie
danych w oparciu o technologie Microsoft, administracja i optymalizacja baz danych
Microsoft SQL Server
• Wybrane certyfikaty:
Microsoft Certified Professional
Microsoft Certified Technology Specialist SQL Server 2005
Microsoft Certified Technology Specialist SQL Server 2005 Business Intelligence Development
Microsoft Certified IT Professional Database Administrator
Microsoft Certified IT Professional Database Developer
Microsoft Certified IT Professional Business Intelligence Developer
Microsoft Certified Trainer
Agenda
• Co to jest BI
• Rozwiązania Microsoft w zakresie BI
• Analysis Services
− Multidimensional Data
− Data Mining
• Raporting Services
Co to jest Business IntelligenceLogika biznesowa – podejście do procesów
zarządzania, umożliwiające
przedsiębiorstwu definiowanie tego, które
informacje są użyteczne i istotne w
procesie podejmowania decyzji
korporacyjnych.
BI – pomaga kadrze menadżerskiej w
szybszym podejmowaniu lepszych decyzji,
dokonując przekształceniu danych w
informacje
SQL Server 2008
• Database Engine (+Replication +
Service Broker)
• Integration Services
• Reporting Services
• Analysis Services
− Multidimensional Data
− Data Mining
Technologia Microsoft
BI PLATFORM
SQL Server SQL Server Reporting ServicesReporting Services
SQL Server SQL Server Analysis ServicesAnalysis Services
SQL Server RDBMSSQL Server RDBMS
SQL Server Integration ServicesSQL Server Integration Services
SharePoint ServerSharePoint Server
DELIVERY
ReportsReports DashboardsDashboards Excel Excel WorkbooksWorkbooks
AnalyticAnalyticViewsViews ScorecardsScorecards PlansPlans
END USER TOOLS & PERFORMANCE MANAGEMENT APPSPerformancePoint PerformancePoint
ServerServerExcelExcel
AS – Multidimensional Data
• Podstawy − Hurtownie danych− Tabele faktów, tabele wymiaru, miary− OLAP (ROLAP, MOLAP, HOLAP)
AS – Multidimensional Data c.d.• Tabele faktów
Rejon Produkt Miesiąc Ilość Wartość
Wielkopolska
Gitara Styczeń 50 25.200,00
Śląsk Gitara Styczeń 45 24.800,00
Wielkopolska
Gitara Luty 12 7.580,00
Śląsk Skrzypce
Styczeń 20 20.500,00
Mazowieckie Gitara Styczeń 100 50.555,00
Dolnyśląsk Skrzypce
Styczeń 10 10.000,00
ID_Rejon ID_Prod Miesiąc Ilość Wartość
10 220 1 50 25.200,00
8 220 1 45 24.800,00
10 320 2 12 7.580,00
8 150 1 20 20.500,00
5 220 1 100 50.555,00
1 150 1 10 10.000,00
AS – Multidimensional Data c.d.• Tabele wymiaru
ID Produkt Grupa
120 Gitara Gibson Instrumenty
220 Gitara Instrumenty
320 Gitara flamenco
Instrumenty
501 Struny nylonowe
Akcesoria
530 Struny nylonowe
Akcesoria
550 Pianino – Bach Nuty
ID Produkt Grupa Cena
120 Gitara Gibson Instrumenty 1.500,00
220 Gitara klasyczna
Instrumenty 580,00
320 Gitara flamenco
Instrumenty 1.100,00
501 Struny nylonowe
Akcesoria 48,00
530 Struny nylonowe
Akcesoria 22,00
550 Pianino – Bach Nuty 34,00
AS – Multidimensional Data c.d.• Hierarchia i agregacja
CZAS
ROK
MIESIĄC
KWARTAŁ
DZIEŃ
KLIENCI
GRUPA
CENTRALA
ODDZIAŁ
MIEJSCE
KRAJ
REGION
MIASTO
PRODUKT
GRUPA
PODGRUPA
PRODUKT
AS – Multidimensional Data c.d.• Przechowywanie agregacji
DB
ROLAP
Fakty + agregacje
MOLAP
Fakty + agregacje
SSAS
HOLAP
DB
Agregacje Fakty
SSAS +
Analysis Services
• Podstawowe elemeny:− Data source (źródła danych)− Data source view („widoki” danych ze
źródła)− Measures (miary)− Measures groups (grupy miar)− Dimensions (wymiary)− Cubes (kostki)
Analysis Services – Narzędzia• Business Intelligence Development
Studio
SS Business Intelligence Development Studio
• Tworzenie kostek, wymiarów…
SS Business Intelligence Development Studio
SS Business Intelligence Development Studio
Analysis Services
• KPI
Analysis Services - przykład
Analysis Services
• Język MDX
([Measures].[Sales Amount], [Product].[Category].&[1])/([Measures].[Sales Amount], [Product].[Category].[All])
([Measures].[Sales Amount], [Product].[Category].CurrentMember)/
([Measures].[Sales Amount], [Product].[Category].[All])
Analysis ServicesDATA MINING
• Dziedzina zajmująca się analizą i odkrywaniem zależności, reguł, wzorców w bazach i hurtowniach danych
• Proces automatycznego odkrywania nietrywialnych, dotychczas nieznanych, potencjalnie użytecznych reguł, zależności, wzorców schematów, podobieństw, trendów w dużych repozytoriach danych
• Połączenie statystyki, analizy prawdopodobieństwa i technologii baz danych
• Celem eksploracji danych jest analiza danych i procesów w celu lepszego ich zrozumienia
Analysis Services – Procesy DM
Model eksploracjiModel eksploracji
DM DM EngineEngineAparat Aparat
DMDM
Dane treningoweDane treningowe
Dane do Dane do przewidzeniaprzewidzenia
Model eksploracjiModel eksploracji
Z prognozamiZ prognozami
Model eksploracjiModel eksploracji
Analysis ServicesDATA MINING – przykładowe
zastosowanie• Analiza marketingowa rynku• Badanie potrzeb kontrahentów• Segmentacja i klasyfikacja
klientów• Badanie koszyka klienta• Badanie zdolności kredytowej• Prognozowanie i planowanie• Badanie ryzyka• Inne
AS – Data Mining algorytmy
• Narzędzia
Algorytm Opis
Drzewa decyzyjne Określa szanse wyniku na podstawie wartości w zestawie treningowym
Reguły asocjacyjne
Określa związki między przypadkami
Klastrowanie Klasyfikuje przypadki na odrębne grupy na podstawie zbiorów atrybutów
Naiwny klasy-fikator Bayesa
Wyraźnie przedstawia różnice konkretnej zmiennej dla różnych elementów danych
Klastrowanie sekwencyjne
Grupuje lub klastruje dane na podstawie sekwencji poprzednich zdarzeń
Szeregi czasowe Analizuje i prognozuje dane czasowe, łącząc możliwości algorytmu ARTXP (opracowanego przez zespół Microsoft Research) do krótkoterminowych prognoz z metodą ARIMA (w programie SQL 2008) w celu osiągnięcia dokładności w dłuższej perspektywie.
Siec neuronowe Szuka nieznanych nieintuicyjnych związków między danymi
Regresja liniowa Określa związki między kolumnami w celu przewidywania wyniku
Regresja logistyczna
Określa związki między kolumnami w celu oceny prawdopodobieństwa, że kolumna będzie zawierać konkretny stan
Szeregi czasowe
Klastrowanie sekwencyjne
Sieci neuronowe
Naiwny klasyfi-kator Bayesa
Regresja logistyczna
Regresja liniowa
Drzewa decyzyjne
Klastrowanie
Reguły asocjacyjne
Klasyfikacja
Klasyfikacja
Szacowanie
Szacowanie
Segmentacja
Segmentacja
Asocjacja
Asocjacja
Prognozowanie
Prognozowanie
Analiza te
kstu
Analiza te
kstu
Zaawansowana
Zaawansowana
ekspl. danych
ekspl. danych
Reporting Services
Reporting Services
Standard Scale-outSharePointIntegrated
Reporting Services
• Podstawowe możliwości:− Budowanie raportów− Zarządzanie dostępem− Elastyczne projektowanie (wykresy,
grafika, funkcje, wyrażenia, parametry)− Różne formaty renderowania (pdf, xls,
jpg,..)− Automatyczne generowanie raportów− Definiowanie źródeł danych− Tworzenie modeli raportów
Reporting Services
PODSUMOWANIE
• To były tylko podstawy• Warto poznać i wdrażać rozwiązania BI
Konferencje
14 MARCA 2009 | WARSZAWA