PODATKOVNO SKLADIŠČE IN PODATKOVNO RUDARJENJE NA PRIMERU NLB D.D.

Similar documents
Novi standard za neprekinjeno poslovanje ISO Vanja Gleščič. Palsit d.o.o.

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO ANALIZA KORISTI SISTEMA POSLOVNE INTELIGENCE

HANA kot pospeševalec poslovne rasti. Miha Blokar, Igor Kavčič Brdo,

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO LJILJANA POPOVIĆ

ANALIZA IN POROČILA OLAP KOT DEL SISTEMA ZA PODPORO ODLOČANJU

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO TINA TURK

Kontroling procesov ali procesi v kontrolingu Dragica Erčulj CRMT d.o.o. Ljubljana

Centralni historian kot temelj obvladovanja procesov v sistemih daljinske energetike

Poslovna inteligenca - Urnik predavanja

Primerjalna analiza ERP sistemov Microsoft Dynamics NAV in SAP-a. Comparative Analysis between the ERP Systems Microsoft Dynamics NAV and SAP

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO INTEGRACIJA PODATKOV

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA D I P L O M S K O D E L O ANALIZE IN POROČILA OLAP KOT DEL SISTEMA ZA PODPORO ODLOČANJU

Primerjava programskih orodij za podporo sistemu uravnoteženih kazalnikov v manjših IT podjetjih

Telekomunikacijska infrastruktura

Ocena zrelostne stopnje obvladovanja informatike v javnem zavodu

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO. Igor Rozman

DELO DIPLOMSKEGA SEMINARJA. Priložnosti in problemi uvedbe ERP sistema v podjetju

POSLOVNI PORTALI ZNANJA IN NJIHOVA PODPORA MANAGEMENTU ZNANJA

UNIVERZA V MARIBORU EKONOMSKO-POSLOVNA FAKULTETA, MARIBOR DIPLOMSKO DELO UPORABA SISTEMA KAKOVOSTI ISO 9001 : 2000 ZA IZBOLJŠANJE PROIZVODNJE

PROCESNA PRENOVA IN INFORMATIZACIJA POSLOVANJA

UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO. Realizacija sistema poslovnega obveščanja v CPK d.d.

UVEDBA CELOVITEGA INFORMACIJSKEGA SISTEMA SAP R/3 V SKUPINI ISTRABENZ

Spletni informacijski portal Proficy v vodenju proizvodnih procesov

IMPLEMENTACIJA SAP SISTEMA V PODJETJU X

SODOBNE TEHNOLOGIJE ZA GRADNJO POSLOVNIH PROGRAMSKIH REŠITEV

MAGISTRSKO DELO UPRAVLJANJE INFORMATIKE

Primerjava BPM orodij K2 Blackpearl in IBM Business process manager

Uvajanje rešitve Pantheon v podjetje Roto Implementation of Pantheon into Roto company

MAGISTRSKO DELO MODELIRANJE IN AVTOMATIZACIJA POSLOVNIH PROCESOV V PODJETJU

MODEL UVAJANJA SAP/R3 V PODJETJE TERMO D.D.

ANALIZA UPORABE PRISTOPA K RAZVOJU PROGRAMSKIH REŠITEV NA OSNOVI MODELIRANJA POSLOVNIH PRAVIL

UPORABA IN VPLIV SODOBNIH INFORMACIJSKO-KOMUNIKACIJSKIH TEHNOLOGIJ (IKT) MED PARTNERJI V LOGISTIČNI VERIGI

PRENOVA POSLOVNIH PROCESOV Z METODO TQM

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO. Gašper Kepic

DIPLOMSKO DELO VPLIV PROJEKTNE SKUPINE NA UVEDBO ERP PROJEKTA

Uvedba IT procesov podpore uporabnikom na podlagi ITIL priporočil

Implementacija principov ameriške vojske v poslovni svet. Tomaž Gorjup Studio Moderna

MODELIRANJE IN PRENOVA POSLOVNEGA PROCESA CELEX V PODJETJU IUS SOFTWARE PRAVNE IN POSLOVNE INFORMACIJE D.O.O., LJUBLJANA

UNIVERZA V MARIBORU EKONOMSKO-POSLOVNA FAKULTETA DIPLOMSKO DELO. Laure Mateja

MODEL EFQM V POSLOVNI PRAKSI MARIBORSKE LIVARNE MARIBOR

Utišajmo mobilne telefone!

PODPORA ODLOČANJA IN UPRAVLJANJA PODPORA POSLOVANJA. Marko Bohanec 1. Sistemi za podporo pri odločanju Vsebina predavanj

UVAJANJE CELOVITE PROGRAMSKE REŠITVE V MEDNARODNEM PODJETJU

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO UVAJANJE ERP REŠITEV IN KRITIČNI DEJAVNIKI USPEHA

Poslovni informacijski sistem

Obravnava in modeliranje ad-hoc poslovnih procesov

Metodologija migracije podatkov

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO PRENOVA IN INFORMATIZACIJA POSLOVANJA PROIZVODNEGA PODJETJA

FAKULTETA ZA INFORMACIJSKE ŠTUDIJE V NOVEM MESTU ŠTUDIJSKEGA PROGRAMA DRUGE STOPNJE FRANCI POPIT

Kako voditi upravno poslovanje, likvidacijo računov, odsotnosti... V enem sistemu?

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO POVEZAVA CELOVITE PROGRAMSKE REŠITVE S SISTEMOM ELEKTRONSKEGA PLAČILNEGA PROMETA V SLOVENIJI

Poslovna pravila v poslovnih procesih

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO UPORABNOST SISTEMA URAVNOTEŽENIH KAZALNIKOV Z VIDIKA NOTRANJIH IN ZUNANJIH UPORABNIKOV

UPRAVLJANJE MATIČNIH PODATKOV INTEGRACIJA PODATKOV O STRANKAH

VZPOSTAVITEV URAVNOTEŽENEGA MERJENJA USPEŠNOSTI IN NAGRAJEVANJA NA RAVNI PODJETJA IN NA RAVNI POSAMEZNIH GRADBENIH PROJEKTOV

UNIVERZA V LJUBLJANI Ekonomska fakulteta MAGISTRSKO DELO PRENOVA POSLOVANJA PODJETJA S POUDARKOM NA PRENOVI PRODAJNIH IN PROIZVODNIH PROCESOV

PROJEKTIRANJE ORGANIZACIJSKIH SISTEMOV. Programi za celovit informacijski sistem: SAP in Microsoft Business Solutions - Navision

SKLEP EVROPSKE CENTRALNE BANKE (EU) 2017/2081 z dne 10. oktobra 2017 o spremembi Sklepa ECB/2007/7 o pogojih za sistem TARGET2-ECB (ECB/2017/30)

Priprava stroškovnika (ESTIMATED BUDGET)

3nasveti POPELJITE VAŠE PODJETJE NA NOVO RAVEN

PRENOVA PROCESA MARKETINŠKEGA KOMUNICIRANJA

DOBA FAKULTETA ZA UPORABNE POSLOVNE IN DRUŽBENE ŠTUDIJE MARIBOR MAGISTRSKO DELO. Teo Pirc

Razvoj poslovne analitike in spremljanje učinkovitosti proizvodnih linij. Matej Kocbek in Miroslav Kramarič Krka, d. d.

Temelji kontrolinga. International Controller Association (ICV) in International Group of Controlling (IGC)

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO MARKO LEBEN

OSKRBOVALNE VERIGE MARKO RAJTER ANDREJA KRIŽMAN

DELOVNI DOKUMENT. SL Združena v raznolikosti SL

Rešitve s področja poslovne informatike

Integracija aplikacij z uporabo Microsoft Biztalk-a

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO STANDARDI ISO IN PRENOVA POSLOVNIH PROCESOV NA PRIMERU MALEGA PODJETJA

ALOKACIJA ČLOVEŠKIH VIROV V PROCESU RAZVOJA PROIZVODA GLEDE NA POSLOVNO STRATEGIJO

Dr. Mateja Podlogar v sodelovanju z mag. Primožem Gričarjem Fakulteta za organizacijske vede Univerza v Mariboru

ELEKTRONSKO RAČUNOVODSTVO

KLJUČNI DEJAVNIKI USPEHA PRI UVEDBI INFORMACIJSKE REŠITVE V ORGANIZACIJI JAVNEGA SEKTORJA

NOTRANJA LOGISTIKA KOT DEL DOBAVNE VERIGE PODJETJA FLENCO, d. o. o.

DOBA FAKULTETA ZA UPORABNE POSLOVNE IN DRUŽBENE ŠTUDIJE MARIBOR

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO PRENOVA POSLOVNEGA PROCESA: PRIMER PROCESA OBVLADOVANJA PRODAJE V PODJETJU MKT PRINT D. D.

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA

ZNIŽEVANJE STROŠKOV KOT POSLEDICA INFORMATIZACIJE LOGISTIČNIH PROCESOV PRIMER PODJETJA ETOL

Strateško tveganje kot osrednje tveganje bank. Strategic Risk as Main Banks' Risk

5. Kakšna je razlika oziroma povezava med podatkom in informacijo?

DIPLOMSKO DELO OSREDOTOČENOST NA KUPCA KOT METODA MANAGEMENTA KAKOVOSTI V BANČNI USTANOVI

PETROL d.d., Ljubljana KARIERNI SEJEM 2017

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA SPECIALISTIČNO DELO IZBRANE OBLIKE RASTI MAJHNEGA PODJETJA: DIVERZIFIKACIJA POSLOVANJA

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO

OUTSOURCING V LOGISTIKI NA PRIMERU INDIJSKEGA GOSPODARSTVA

U N I V E R Z A V L J U B L J A N I

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO JOŽEF STRMŠEK

UVEDBA SISTEMA CRM V PODJETJE AGENCIJA MORI d.o.o.

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO

OSNOVE INFORMACIJSKIH SISTEMOV

STORITVENA ARHITEKTURA ZGOLJ KOMPOZICIJA SPLETNIH STORITEV?

Magistrsko delo Organizacija in management informacijskih sistemov URAVNOTEŽENI SISTEM KAZALNIKOV V TRGOVINSKEM PODJETJU

MAGISTRSKO DELO. Primerjalna analiza modeliranja poslovnih procesov s tehnikama eepc in BPMN

URAVNOTEŽENI SISTEM KAZALNIKOV USPEŠNOSTI POSLOVANJA UVAJANJE IN NADGRADNJA SISTEMA V PODJETJU VALKARTON

UNIVERZA V MARIBORU EKONOMSKO-POSLOVNA FAKULTETA DIPLOMSKO DELO

ANALIZA SISTEMA VODENJA KAKOVOSTI V PODJETJU BELINKA BELLES

Analiza kakovosti spletnih aplikacij za elektronsko bančništvo

POSLOVNI NAČRT. Vsebina dobrega poslovnega načrta. Povzetek poslovnega načrta

Upravljanje ustvarjalnosti in inovacij v malih in srednje velikih podjetjih

Transcription:

UNIVERZA V MARIBORU EKONOMSKO - POSLOVNA FAKULTETA MARIBOR DIPLOMSKO DELO PODATKOVNO SKLADIŠČE IN PODATKOVNO RUDARJENJE NA PRIMERU NLB D.D. Študentka: MARUŠA HAFNER Naslov: STANTETOVA 6, 2000 MARIBOR Številka indeksa: 81594359 Redni študij Program: VISOKOŠOLSKI STROKOVNI Študijska smer: PODJETNIŠKA INFORMATIKA Mentor: dr. SAMO BOBEK Maribor, julij, 2007

PREDGOVOR Banke se danes srečujejo z veliko količino podatkov, veliko konkurenco na trgu in povečanimi zahtevami regulatorja po poročanju. Teh izzivov se lahko učinkovito lotijo z izgradnjo podatkovnih skladišč, kar jim bo prineslo dobro osnovo za pridobitev pravih informacij za dobre poslovne odločitve, večjo poslovno fleksibilnost in učinkovitost, nižje stroške in več dobička. Tako v bankah kot tudi v ostalih podjetjih kjer se srečujejo z vsemi vrstami podatkov, predstavlja velik problem podatke jasno prikazati in jih narediti uporabne. Za doseganje tega cilja potrebujejo zmogljivo OLAP orodje, ki predstavi podatke na jasen in pregleden način. Z ureditvijo podatkov pridemo lahko do koristnih informacij, ki so odlična podlaga za odločanje v podjetjih. Sistemi, ki temeljijo na OLAP tehnologiji omogočajo podporo odločanju in so tudi sestavni del dobrega informacijskega sistema. Uporabniki OLAP sistema niso samo ključni kadri v podjetju, ampak je krog uporabnikov lahko precej širši. Uporabljajo ga praktično vsi, ki pri svojem delu uporabljajo hiter dostop do kvalitetnih podatkov, ki jim omogočajo pravilno odločanje in ukrepanje. Podatkovno skladišče pa ni le enkratna rešitev, ki jo vpeljemo in nanjo pozabimo. Veliko pozornost je namreč potrebno nameniti vzdrževanju podatkovnega skladišča in zagotavljanju pravilnih in ažurnih informacij. Zato bo v tej diplomski nalogi tekla beseda o podatkovnem skladišču v Novi Ljubljanski banki d.d. in o tehnologiji, ki se uporablja za analizo velike količine podatkov.

KAZALO 1 UVOD... 5 1.1 Opredelitev problema diplomske naloge... 5 1.2 Namen in cilji diplomske naloge... 5 1.3 Metode in zasnova diplomske naloge... 6 2 PODATKOVNA SKLADIŠČA... 7 2.1 Opredelitev pojma podatkovno skladišče... 7 2.2 Zgradba in vloga podatkovnega skladišča... 8 2.2.1 Zgradba in izgradnja bančnega podatkovnega skladišča... 10 2.3 Pristopi pri gradnji podatkovnih skladišč... 13 2.3.1 Centralizirani pristop podatkovnega skladišča... 13 2.3.2 Pristop gradnje porazdeljene zgradbe podatkovnega skladišča... 14 2.3.3 Federativni pristop podatkovnega skladišča... 15 2.4 Prenos podatkov v podatkovno skladišče... 16 2.4.1 Proces ETL (Extraction, Transformation, Load)... 16 2.5 Vloga podatkovnih skladišč v bančnih informacijskih sistemih... 17 3 PODATKOVNO RUDARJENJE... 20 3.1 Opredelitev pojma podatkovno rudarjenje... 20 3.2 Uporabnost podatkovnega rudarjenja... 20 3.3 Področja uporabe podatkovnega rudarjenja... 21 3.4 Postopek podatkovnega rudarjenja... 22 3.5 Tehnike podatkovnega rudarjenja... 24 3.5.1 Najbližji sosed... 24 3.5.2 Razvrščanje v skupine... 24 3.5.3 Inducirana pravila... 25 3.5.4 Odločitvena drevesa... 25 3.5.5 Nevronske mreže... 26 3.6 Orodja za podatkovno rudarjenje... 27 4 NOVA LJUBLJANSKA BANKA D.D.... 28 4.1 Predstavitev Nove Ljubljanske Banke d.d... 28 4.1.1 Storitve Nove Ljubljanske banke d.d.... 28 4.1.2 Organizacijska zasnova banke... 29 4.2 Informacijski sistem podjetja... 30 4.2.1 Pomen in vloga informatike v banki... 30 4.2.1.1 Predstavitev Upravljavskega centra za informacijsko tehnologijo... 30 4.2.1.2 Pomen in vloga Upravljavskega centra za informacijsko tehnologijo... 31 5 PODATKOVNO SKLADIŠČE V NLB D.D... 33 5.1 Izgradnja podatkovnega skladišča v NLB d.d... 33 5.2 Izbira tehnologije... 33 5.3 Arhitektura in struktura v podatkovnem skladišču v NLB d.d... 35 5.4 Viri podatkov v NLB d.d... 37 5.5 Orodja za dostop do OLAP... 39 5.6 Zanesljivost podatkov v podatkovnem skladišču v NLB d.d.... 43 3

5.7 Varnostni vidik v NLB d.d.... 43 6 SKLEP... 45 7 POVZETEK... 46 8 LITERATURA... 47 KAZALO SLIK Slika 1: Podatkovno skladiščenje... 8 Slika 2: Osnutek koncepta podatkovnega skladišča... 11 Slika 3: Centralizirano podatkovno skladišče... 13 Slika 4: Porazdeljeno podatkovno skladišče... 14 Slika 5: Federativno podatkovno skladišče... 15 Slika 6: Model arhitekture informacijskega sistema banke... 18 Slika 7: Osnovni proces podatkovnega rudarjenja... 23 Slika 8: Odločitveno drevo... 26 Slika 9: Organizacijska struktura UCIT... 30 Slika 10: Arhitektura podatkovnega skladišča v NLB d.d.... 35 Slika 11: Arhitektura sistema NLB d.d.... 36 Slika 12: Uporabniški dostop skozi OLAP in druga razvita orodja... 37 Slika 13: Multidimenzionalna kocka... 38 Slika 14: Dostop do podatkov preko OLAP orodja... 40 Slika 15: Razvojna metodologija DWH orodja in izhodi... 41 KAZALO TABEL Tabela 1: Razdelitev orodji glede na tehniko in komercialnost... 27 Tabela 2: Tabela prikazov podatkov... 38 4

1 UVOD 1.1 Opredelitev problema diplomske naloge Poslovno okolje tako podjetji kot vseh drugih organizacij postaja vedno bolj kompleksno. Količina podatkov, ki so pomembni za poslovanje podjetji oziroma organizacij se povečuje in postopki odločanja so čedalje bolj nepredvidljivi ter zapleteni. Podatki sami po sebi še ne predstavljajo informacije. Podjetja oziroma organizacije pa razpolagajo z ogromnimi količinami podatkov, ki so shranjeni v različnih sistemih in ni nujno, da so med seboj tudi povezani. Če podatke združimo in organiziramo pridemo do poslovnih informacij, ki so nujna za sprejemanje pravih odločitev. Za le-te pa potrebujemo veliko število podatkov, ki izhajajo iz različnih operativnih virov. Takšne podatke moramo integrirati in jih prečistiti, se pravi da odpravimo podvajanja, poenotimo obliko, Tako integrirani ter prečiščeni podatki predstavljajo podatkovno skladišče. Uspeh vsakega podjetja je odvisen od sprejemanja pravočasnih in pravih odločitev. Ob vse hitrejšem spreminjanju in reagiranju konkurentov se podjetja oziroma organizacije vedno bolj zavedajo, da lahko s pomočjo dobro zgrajenega podatkovnega skladišča sledijo ali pa celo prehitijo konkurenco. Zato sem del diplomske naloge namenila podatkovnem skladišču. Tudi metode, ki so jih podjetja oziroma organizacije za uspešno poslovanje uporabljala v preteklosti, so se izkazale za neuporabne, tako da je poslovanje s pomočjo teh metod postalo neobvladljivo in predvsem nekonkurenčno. Zato podjetja oziroma organizacije že desetletja iščejo načine, s katerimi bi omogočili kvalitetno prilagajanje spremembam s katerimi se srečujemo v vsakodnevnem poslovanju. Začela so se zavedati, da so zbrani podatki lahko prednost, ki spremlja vsakodnevno poslovanje in ugotovila so, da se na podlagi preteklih podatkov marsikaj naučijo in da jim to v prihodnjem poslovanju prinaša konkurenčne prednosti. Tako je nastalo podatkovno rudarjenje, kateremu je poleg podatkovnega skladišča namenjeno to diplomsko delo. 1.2 Namen in cilji diplomske naloge Namen Namen v tem diplomskem delu je predstaviti vlogo podatkovnega skladišča ter predstaviti tehniko podatkovnega rudarjenja kot veliko priložnost, ki se ponuja podjetjem na najrazličnejših gospodarskih področjih. Diplomska naloga je razdeljena na teoretični del, ki temelji na proučevanju literature, ki obstaja na temo podatkovnega skladišča in podatkovnega rudarjenja. V tem delu bom opisala osnovna izhodišča podatkovnega skladišča, ki zagotavlja podatke in informacije za kvalitetno poslovno odločanje. Predstavila bom različne tipe arhitekture podatkovnih skladišč, njihove značilnosti, prednosti in slabosti. Ker dandanes že vsaka organizacija, ki se ukvarja z informacijskimi sistemi, verjame, da je rudarjenje podatkov pomemben del njene prihodnosti, bom eno poglavje namenila tudi podatkovnem rudarjenju. 5

V praktičnem delu pa bom predstavila družbo, njeno poslovno strategijo in informacijski sistem podjetja. Opisala bom podatkovno skladišče v Novi Ljubljanski banki d.d., in predstavila njihovo rudarjenje s podatki. Skratka namen diplomskega dela je predstaviti koncept podatkovnega skladišča in podatkovnega rudarjenja po teoretični plati ter na podlagi le-te nadaljevati na praktičnem primeru. Cilji naloge Cilji prvega, teoretičnega, dela so: opredeliti pojma podatkovno skladišče in podatkovno rudarjenje, predstaviti zgradbo ter vlogo podatkovnega skladišča v podjetju, opisati tehnično arhitekturo, ki je potrebna za izgradnjo podatkovnega skladišča, predstaviti prenos podatkov v podatkovno skladišče, raziskati in opisati namen in proces podatkovnega rudarjenja, opisati orodja za podatkovno rudarjenje, predstaviti vlogo podatkovnih skladišč v bančnih IS. Cilj drugega, praktičnega dela pa so: opis vloge in pomena Upravljavskega centra za informacijsko tehnologijo (UCIT), ki je eden izmed glavnih nosilk strateškega razvoja v NLB d.d. opis oziroma predstavitev podatkovnega skladišča v NLB d.d. opis oziroma predstavitev podatkovnega rudarjenja v NLB d.d.. 1.3 Metode in zasnova diplomske naloge Izvedla bom raziskavo, ki se osredotoča predvsem na informatiko, kot funkcijo podjetja oziroma na sektor informacijske tehnologije v NLB d.d.. Se pravi, da gre za poslovno raziskavo. Uporabila bom Deskriptivni pristop, s katerim bom opisala strukture, delovanje in razvoj posameznih informacijskih tehnologij. V okviru deskriptivnega pristopa bom uporabila dve metodi, in sicer: metodo deskripcije, s katero bom opisala dejstva, na katerih bo slonela raziskava ter metodo kompilacije, kar pomeni, da bom povzemala opazovanja, spoznanja, stališča, sklepe in rezultate drugih avtorjev. 6

2 PODATKOVNA SKLADIŠČA Dobre poslovne odločitve in večjo učinkovitost lahko dosežemo s pravimi informacijami. Pot do teh vodi preko velike količine podatkov, ki jih moramo na ustrezen način obdelati in analizirati. Dobra osnova za pridobivanje pravih informacij je skladišče podatkov. Transakcijski sistemi za to niso primerni, saj imajo pogosto omejeno možnost poizvedovanja po podatkih, ne hranijo zgodovine in niso optimizirani za pripravo analiz. Včasih niti ne vsebujejo vseh potrebnih podatkov, ki jih potrebujemo za analize in poročanja. Te težave dobro rešuje skladišče podatkov, ki hrani zgodovino in integrira podatke iz različnih transakcijskih sistemov v obliki, ki je optimizirana za poizvedovanje, poročanje in različne analize (Milavec, 2006, str. 10). 2.1 Opredelitev pojma podatkovno skladišče Obstaja več različnih definicij o podatkovnem skladišču. V tem diplomskem delu bomo predstavili samo dve definiciji dveh različnih avtorjev. Podatkovno skladišče (angl. Data Warehouse) ni nekaj, kar bi lahko sklepali iz imena, neko odlagališče neuporabnih podatkov, temveč rešuje problem, ki ga ima danes mnogo organizacij: goro podatkov, ki jih ne moremo uporabljati (Jaklič, 2002, str. 18). Podatkovno skladišče je podatkovni vir, ki je (Jaklič, 2002, str. 18): integriran vsebuje podatke o vseh vidikih dejavnosti organizacije, organiziran po poslovnih področjih, to je okrog glavnih entitet podjetja, vsebuje zgodovinske podatke, ki so pomembni za poslovne analize, zato ima skladišče tudi časovno dimenzijo (podatki so točni glede na časovni trenutek, zato ponavadi vsebujejo zaznamek časa), nespremenljiv (podatki se ne ažurirajo), vsebuje detajle (podrobne) in sumarne (zbirne) podatke. Podatkovno skladišče je torej namenjeno podpori odločanju. Naslednja definicija pravi, da je podatkovno skladišče predmetno naravnana, povezana, časovno opredeljena in nespremenljiva zbirka podatkov, ki je namenjena za odločitve vodilnih delavcev v podjetju (Cabena in drugi, 1997, str. 19 20). Predmetno naravnana zato, ker se v podatkovnem skladišču osredotočimo na poslovne subjekte oziroma na glavne entitete podjetja (komitenti, produkti, dobavitelji, ) in ne k posameznim dogodkom, kot je to v klasičnih transakcijah. Povezanost ali integriranost predstavlja najpomembnejši vidik podatkovnega skladišča. Vsi podatki v podatkovnem skladišču so integrirani. Časovna opredeljenost se kaže v naslednjih pogledih: v podatkovnem skladišču so podatki shranjeni 5-10 let, podatki vsebujejo zaznamek časa, ko so bili aktualni, prisotna je časovna razsežnost, kar pomeni, da so podatki v podatkovnem skladišču uvrščeni v časovni okvir, kar nam je v pomoč kasneje pri časovnih analizah, 7

nesprejemljiva, ker se podatki preneseni v podatkovno skladišče ne spreminjajo več. So stabilen vir za konsistentno poročanje in primerjalne analize. Značilnosti podatkovnih skladišč so: da so podatki zbrani iz drugih virov, podatki morajo biti prečiščeni preden se zapišejo v podatkovno skladišče, da so podatki shranjeni na tak način, da omogoča primerno poizvedovanje in analizo, da imajo podatki daljšo življenjsko dobo, saj so podatki v podatkovnih skladiščih praviloma shranjeni za obdobje več let, podatki so običajno namenjeni samo za branje. 2.2 Zgradba in vloga podatkovnega skladišča Podatkovno skladišče zagotavlja zanesljive in kompleksne informacije in omogoča nosilcem poslovnih odločitev hiter dostop do informacij. S tem omogoča graditev konkurenčne prednosti skozi kakovostno upravljanje z informacijami na vseh ravneh organizacije. Bistvo podatkovnega skladišča ni nova tehnologija. Gradimo ga zato, da izboljšamo poslovanje. Dati mora odgovore na najpogostejša vprašanja in reševati najbolj pereče težave. Zavedati se moramo tudi, da pri gradnji podatkovnega skladišča ne gre za enkraten projekt. Podatkovno skladišče mora dihati s poslovnim sistemom. Se pravi, da gre za stalen razvoj in poslovno nadgradnjo, pri kateri morajo biti vselej udeleženi uporabniki (referenti, analitiki, managerji), ki oblikujejo vsebino podatkovnega skladišča, in informacijski strokovnjaki, ki zagotavljajo podatke in njihovo povezovanje v podatkovno skladišče (Jaklič, 2001, str. 5). Spodnja slika prikazuje, da je skladiščenje podatkov sestavljeno iz treh stopenj, in sicer iz sistema za zbiranje podatkov, osrednjega podatkovnega skladišča in sistema za pripravo izhodnih informacij. VIZUALIZACIJA PODATKOV Zunanji viri podatkov - zajem podatkov - čiščenje - transformacija - integracija - polnjenje PODATKOVNO SKLADIŠČE Notranji operativni sistemi POIZVEDOVANJE, POROČANJE OLAP Slika 1: Podatkovno skladiščenje 1 1 Vir: Marolt, Šmid, SRC.SI, 2001, str. 7 IZDELAVA ANALIZ RUDARJENJE PODATKOV 8

Podatke iz različnih operativnih sistemov in eksterne podatke polnimo v podatkovno skladišče. Pod terminom proces polnjenja razumemo proces zajema podatkov, čiščenja, transformacije, integracije in polnjenja podatkov. Podatkovno skladišče je optimizirano za poizvedbe, podatki v njem so integrirani, vsebuje pa tudi zgodovinske podatke. Podatke iz podatkovnega skladišča lahko uporabimo s pomočjo različnih tehnik (Marolt, Šmid, 2001, str. 7): poizvedovanje in poročanje, sprotna analitična obdelava podatkov (OLAP), podatkovno rudarjenje, vizualizacija podatkov. Poizvedovanje in poročanje Pri poizvedovanju gre za dostop do najnižje ravni uporabnikov. Uporabniki morajo vedeti, kaj iščejo. Do podatkov je mogoče priti neposredno s pomočjo poizvedb na podatkovni bazi ali posredno s pomočjo meta podatkov 2, kar omogoča uporabniku oblikovanje poizvedb v njenem lastnem poslovnem jeziku. Poročanje zagotavlja prikaz in distribucijo informacij ter je osnova vsakega sistema za podporo odločanju. Poročanje je že pred projekti podatkovnega skladišča omogočalo prikaz informacij, le da so bila takratna poročila izdelana tako, da so delala na podatkih iz operativnih sistemov. Poznamo dve tipični vrsti poročil: Standardna poročila: so poročila, ki imajo predpisano obliko in vsebino ter se kreirajo z določeno dinamiko (npr. mesečna, tedenska poročila) in distribuirajo vnaprej znanim naročnikom. Ad hoc oz. sprotna poročila: vsebina teh poročil se določi sproti, glede na trenutne uporabniške zahteve. Sprotna analitična obdelava podatkov (OLAP) Pri sprotni analitični obdelavi podatkov (OLAP 3 ) gre za pregled podatkov in izdelavo analiz po več dimenzijah (multidimenzionalno opazovanje). Tipično se uporabljajo agregirani in sumarizirani podatki. Podatkovno rudarjenje Kopanje po podatkih je tehnika, ki omogoča iskanje skritih vzorcev v podatkih, povezav med podatki in trendov. S to tehniko se ukvarjajo ekspertni uporabniki in analitiki. Podatkovno rudarjenje bomo podrobno predstavili v naslednjem poglavju. 2 META podatki so v splošnem podatki o podatkih in vsebujejo naslednje podatke o podatkih: kaj pomeni podatek (opis podatka, njegov pomen in namen), od kod izvira podatek in kje je, v kakšnem formatu je zapisan, kako je bil pretvorjen in preračunan, kako se prenaša, kdaj je bil nazadnje prenesen in kdaj bo prenesen naslednjič, zgodovina prenosov, časovna razporeditev prenosov arhiviranja. 3 OLAP je kratica za On line Analitical Processing 9

Vizualizacija podatkov Vizualizacija podatkov omogoča grafični pregled podatkov, kar pomeni izdelavo histogramov, linijskih grafov in tudi zemljevidov. Najbolj pogosto uporabljene tehnike so poizvedovanje in poročanje ter OLAP. Zanimiva pa je tudi možnost celovitega poslovnega poročanja, saj gre za poročanje iz različnih virov podatkov, od podatkovnega skladišča do operativnih sistemov, sistemov ERP, pa tudi lokalnih podatkov in podatkov s spleta. Dandanes se Slovenske banke srečujejo (Milavec, 2006, str. 9): s problemom ogromne količine podatkov in z izzivi, kako iz njih pridobiti uporabne, koristne in pomembne informacije; s zaostrovanjem in povečevanjem konkurence, ne samo med lokalnimi bankami, ampak tudi v mednarodnem merilu. s povečanimi zahtevami regulatorja glede poročanja zaradi vključevanja v EU. Bančna regulativa se spreminja in postaja vedno bolj zahtevna, kar narekuje nadgradnjo, posodobitev in razvoj informacijskih sistemov bank ter vodi banke k učinkovitejšem upravljanju z vsemi bančnimi tveganji k boljšemu obvladovanju poslovanja. To so razlogi, ki silijo banke k večji učinkovitosti (proizvesti in prodati je treba več, hkrati pa nižati stroške), boljšim poslovnim odločitvam (dobre poslovne odločitve so mogoče ob pravih, kakovostnih in ažurnih informacijah) in boljšemu poznavanju strank. Konkurenca vodi do novih finančnih inovacij, oblikovanju novih proizvodov in spreminjanju odnosa do stranke. V skladišču podatkov hranijo vse za banko pomembne podatke, med drugimi tudi celotno zgodovino poslovanja s stranko, s čimer si priskrbijo informacije za odločanje. Poleg podatkov iz transakcijskih sistemov banke lahko v skladišču podatkov zbiramo tudi podatke, pridobljene od drugih podjetji oziroma organizacij in jih uporabimo za potrebe naših poslovnih odločitev. Podatki v skladišču so glede na poslovni model tipično organizirani, zato so uporabnikom bolj razumljivi in intuitivni za uporabo. Skladišče podatkov omogoča uporabnikom: analiziranje podatkov, kopanje po podatkih, poizvedovanje po podatkih in odkrivanje povezav med podatki. 2.2.1 Zgradba in izgradnja bančnega podatkovnega skladišča Zgradba bančnega podatkovnega skladišča Poslovne banke se vedno več srečujejo z vse večjimi zahtevami po razno vrstnih podatkih o bančnih poslih. Na eni strani jim Banka Slovenije preko zakonov in sklepov narekuje določen tempo pri ustvarjanju novih poročil, na drugi strani pa si vodstvo in analitiki želijo 10

globlji vpogled v samo strukturo poslov, ki presegajo okvire računovodskih informacij znotraj bilance stanja in izkaza uspeha (Prašnikar, 2001, str. 45). Slika 2: Osnutek koncepta podatkovnega skladišča 4 Ključni dejavniki uspeha pri gradnji podatkovnega skladišča so (Prašnikar, 2001, str. 45): Podatkovno skladišče ne smemo graditi od spodaj navzgor, ampak od zgoraj navzdol, v skladu s celotno strukturo banke. Uporaba interaktivnega pristopa. Nemogoče je že na začetku predvideti vse zahteve in zgraditi 100% skladišče; začne se z manjšim naborom podatkovnih polj, ki se z meseci lahko razširijo. Prva konkretna faza projekta mora biti končana v treh do štirih mesecih. Uporabniki morajo hitro videti konkurenčne prednosti, ki se lahko takoj vpeljejo v proces odločanja s ciljem, da se poveča dobiček. Višji management mora podpirati projekt. Lahko celo ustanovi odbor za bančne podatkovne vire, ki usklajuje in potrjuje integriteto podatkov. Uporabniki in računalničarji morajo tesno sodelovati. Še bolje je, če so fizično in/ali organizacijsko skupaj. Vodenje projekta naj bo od končnega uporabnika nekdo, ki zna identificirati ključne poslovne probleme. Uspeh in prednosti uveljavljanja podatkovnega skladišča so večplastne. Od tega, da analitiki hitreje pridobijo podatke za izdelavo poročil, da so informatiki manj obremenjeni z izdelavo poizvedb in izpisov, saj si analitiki lahko sami naredijo poročila, do tega, da banka pozna stranko v celoti in razume, katera stranka je bolj donosna. Dejansko se koristi dajo tudi izmeriti (Prašnikar, 2001, str. 45). 4 Vir:Prašnikar, 2001, str. 45 11

Koristi podatkovnega skladišča banke so zagotavljanje jasne vizije, odkrivanje novih priložnosti (ki predstavljajo za banko konkurenčne prednosti), omogočanje boljšega upravljanja sredstev banke, izboljševanje sodelovanja in razumevanja med uporabniki različnih funkcijskih področji, zagotavljanje pravočasnih informacij, zmanjševanje poslovnega rizika, Polnjenje podatkov v podatkovno skladišče pomeni tudi nadgradnjo podatkov iz transakcijskih sistemov v smislu kakovosti in dodatnih informacij. Podatki, ki jih zbiramo v podatkovnem skladišču, v večji meri nastanejo v transakcijskih sistemih. Pri polnjenju se podatki transformirajo (očistijo, poenotijo, dopolnijo) in napolnijo v skladišče podatkov ETL proces. Tu pride do preskoka v kakovosti podatkov. Podatke lahko dodatno opremimo z različnimi informacijami (npr. z dodatnimi atributi, ki jih transakcijski sistem ne podpira oz. jih ne morejo podpirati). Na ta način se podatkom iz transakcijskih sistemov poveča vrednost za različne analize poslovanja banke in predstavlja boljšo osnovo za dobre poslovne odločitve (Milavec, 2006, str. 10). Na osnovi podatkov v podatkovnem skladišču nato pripravimo ločena področna podatkovna skladišča za potrebe različnih bolj kompleksnih analiz in poročanja. Z analitičnimi orodji si uporabniki lahko sami zgradijo različna preprostejša poročila, možna pa je tudi uporaba naprednejših orodji, kot je rudarjenje po podatkih (Milavec, 2006, str. 10). Izgradnja podatkovnega skladišča v banki 5 Odločitev za izgradnjo podatkovnega skladišča v banki mora biti strateška odločitev najvišjega vodstva, ki poskrbi za pravilno pozicioniranje podatkovnega skladišča in njegovih rezultatov v banki. Izgradnje podatkovnega skladišča se moramo lotiti kot strateške naloge in kot kontinuiranega dolgoročnega procesa, za katerim stoji uprava banke. Pri izgradnji in procesu dograjevanja podatkovnega skladišča mora sodelovati tudi višji management oziroma izvršni direktorji v banki, kateri se v sodelovanju z upravo odločajo o prioritetah v informacijskem razvoju, opredelijo dolgoročne cilje podatkovnega skladišča in skrbijo za financiranje. Uspešna izgradnja podatkovnega skladišča zahteva razumevanje poslovnih potreb in ciljev. Za razumevanje poslovnih potreb je velikega pomena pri postavitvi podatkovnega skladišča posluh za končne uporabnike. Pri izdelavi podatkovnega skladišča morajo sodelovati tudi končni uporabniki, saj bodo le na ta način zbrani pravi podatki, ki bodo odgovarjali na poslovna vprašanja, podatkovno skladišče pa bo hitro vrnilo prave odgovore. Dobro načrtovanje procesa izgradnje podatkovnega skladišča, ki upošteva tako poslovne prioritete, kot zastavljene časovne okvire, je prav tako velikega pomena za uspeh podatkovnega skladišča. 5 Povzeto po Milavec, 2006, str 11. 12

Cilj uvedbe podatkovnega skladišča so višanje dobička z nižanjem operativnih stroškov, višanje učinkovitosti poslovanja in boljše poslovne odločitve. Zavedati se moramo, da podatkovno skladišče po eni strani pomeni veliko porabo sredstev in časa, po drugi strani pa pomeni tudi velik prihranek in primerjalno prednost (dobro poznavanje strank, prilagoditve ponudbe strankam, ). Tako podatkovno skladišče je investicija in ne le strošek. 2.3 Pristopi pri gradnji podatkovnih skladišč 6 Ena izmed najpomembnejših odločitev, s katero se mora soočiti vsak načrtovalec podatkovnega skladišča že ne začetku, je izbira primerne arhitekture. Izbira arhitekture je kritična, saj le-ta določa podatkovni model, vlogo področnih skladišč in sosledje korakov v razvojnem ciklu. V nadaljevanju bomo predstavili tri pristope podatkovnih skladišč: centralizirani pristop podatkovnega skladišča, pristop gradnje porazdeljene zgradbe podatkovnega skladišča, federativni pristop podatkovnega skladišča. 2.3.1 Centralizirani pristop podatkovnega skladišča Za centraliziran pristop podatkovnega skladišča je značilno eno podatkovno skladišče zaključnega organiziranega sistema. Le-to je sestavljeno iz področnih podatkovnih skladišč. Polni se iz operativnih baz ter operativnega podatkovnega skladišča. V taki arhitekturi so področna skladišča odvisna struktura, saj so podatki pridobljeni oziroma naloženi izključno iz podatkovnega skladišča organizacije. Uporablja se v namen analitike, saj ne vsebuje zgodovinskih podatkov, temveč le trenutne, aktualne in detajlne podatke. Slika 3: Centralizirano podatkovno skladišče 6 Povzeto po Golob, Welzer, Brumen, 2003, str. 12-22. 13

Izhajajoč iz arhitekture centraliziranega podatkovnega skladišča (glej sliko 4) je osrednje podatkovno skladišče edini vir podatkov za področno skladišče. Področno skladišče ne ločuje med podatki, ki so prišli v podatkovno skladišče neposredno iz operativnega sveta ali preko operativne podatkovne hrambe. Osnovne značilnosti, ki ločijo področno skladišče in podatkovno skladišče so naslednje: podatkovno skladišče vsebuje veliko količino zelo podrobnih podatkov iz daljšega obdobja (npr. 10 let) v enostavnih strukturah. Področno skladišče pa vsebuje le agregirane in sumarizirane podatke omejene zgodovine (npr. mesec dni) v veliko bolj zapletenih strukturah, strukture podatkovnega skladišča so namenjene neznani uporabi, strukture področnega skladišča so načrtovane za specifične, znane namene, področna skladišča so manjša, podatkovno skladišče ne vsebuje samo granularnih podatkov, temveč tudi sumarne podatke poslovanja celotne organizacije. 2.3.2 Pristop gradnje porazdeljene zgradbe podatkovnega skladišča Področno skladišče je podmnožica podatkovnega skladišča določene organizacije. V porazdeljeni zgradbi je podatkovno skladišče le unija področnih skladišč. Področno skladišče igra ponavadi vlogo oddelčnega, krajevnega ali funkcionalnega podatkovnega skladišča in podpira eno ali več specifičnih področij. Slika 4: Porazdeljeno podatkovno skladišče Organizacija kot del interaktivnega procesa gradnje podatkovnega skladišča zgradi vrsto porazdeljenih področnih skladišč in jih na koncu poveže v logično podatkovno skladišče celotne organizacije. Področna skladišča postavljajo specifične oblikovalske zahteve. Vsako področno skladišče mora biti predstavljeno z dimenzijskim modelom, ki mora biti znotraj enotnega podatkovnega skladišča skladen. Arhitektura oziroma zgradba omogoča razmeroma hitro gradnjo prvega področnega skladišča, ki ima visok poslovni vpliv oziroma pomen, hkrati pa jo je razmeroma enostavno implementirati. Potrebe organizacije po analizah so razvidne iz poslovnih 14

zahtev, od koder nato izhaja tudi določitev prioritet. Tak pristop je zelo pomemben, saj v najkrajšem času pridobimo delujočo podatkovno skladišče, s tem pa podporo zagovornikov s strani vodstva in uporabnikov. Le-to omogoča naslednjo interakcijo, to je gradnjo novega področnega skladišča. 2.3.3 Federativni pristop podatkovnega skladišča Federativno podatkovno skladišče je kombinacija arhitekture centraliziranega in distribuiranega podatkovnega skladišča. Temelji na skupnem poslovnem modelu in področjih priprave informacij, ki so v skupni rabi. Predlagana arhitektura zagotavlja nizke stroške in hitro povrnitev vloženih sredstev z uporabo neodvisnih področnih skladišč, pri čemer kasnejša podatkovna integracija ni potrebna. Slika 5: Federativno podatkovno skladišče Ko se zgradi novo področno skladišče, se praviloma ustvari nova garnitura aplikacij za zajem in transformacijo, ki so le redko integrirana z aplikacijami za gradnjo ostalih področnih skladišč. Uporaba neodvisnih področnih skladišč, poveča tudi število programskih rutin za zajem in transformacijo. Vzdrževanje takih rutin je izjemno kompleksno in zahtevno do virov, najtežje pa je zagotoviti njihovo izvajanje v času, ko je operativna baza obremenjena z rednim procesom. Rešitev omenjenega problema je razbitje procesiranja v več korakov, kar vključuje množice rutin, ki zajemajo podatke in z njimi polnijo področja priprave. Ob dodajanju novih področnih skladišč v sistem podatkovnega skladišča se obstoječe rutine za zajem in podatki v področjih priprave po potrebi ponovno uporabljajo oziroma izboljšajo. Tak način še posebej deluje v federativnem podatkovnem skladišču, kjer lahko skupni podatkovni model uporabimo pri načrtovanju področji priprave in programskih rutin za zajem podatkov. 15

2.4 Prenos podatkov v podatkovno skladišče Prednost podatkovnih skladišč je zmožnost dostopa do vseh ključnih podatkov v podjetju, da se zmanjša podvajanje podatkov in analiz, da se zmanjšajo stroški zaradi lažjih, enotnih in bolj učinkovitih načinov analiziranja podatkov ter, da se s pomočjo ustreznih transformacij v podatkovno skladišče prenesejo vsi pomembni podatki na eno mesto, v enotno obliko. Osnovni procesi, ki oblikujejo podatkovno skladišče so naslednji (Singh, 1998, str. 22): ekstrakcija podatkov in nalaganje v začasne tabele, čiščenje in transformacija podatkov v obliko, ki je primerna za velike količine podatkov in omogoča kratke čase pri poizvedovanju, nalaganje podatkov v podatkovno skladišče, arhiviranje podatkov in njihova zaščita, kreiranje poizvedb. V podatkovno skladišče se podatki ne vnašajo ročno, ampak se prenašajo iz različnih virov, ki pa so lahko poslovne aplikacije, zasnovane na različnih bazah podatkov, pisni dokumenti, tabele v Excelu, ter različni zunanji podatki. Da lahko združimo vse te podatke moramo za vsak vir posebej izdelati vmesnike. Njihova vloga je, da pravilno zajemajo podatke, jih obdelujejo in preverjajo njihovo pravilnost ter podatke shranjujejo v skladišču, in sicer v naprej določeni obliki, ki je poenotena za vse podatke, ki se nahajajo v podatkovnem skladišču. V podatkovno skladišče se podatki prenašajo iz dveh razlogov, in sicer: da nam omogočajo lažje iskanje in analiziranje združenih podatkov iz različnih virov ter z namenom, da nam zagotovijo kvalitetne rezultate povpraševanj in poročil. V podatkovno skladišče so podatki prineseni iz zunanjih virov (ne nastajajo v samem podatkovnem skladišču). Zato obstaja možnost, da se podatkom med prenosom v podatkovno skladišče zmanjša kakovost, zato je v procesu ETL 7 potrebno izdelati vmesnike. 2.4.1 Proces ETL (Extraction, Transformation, Load) Namen podatkovnega skladišča je sprememba mase razpršenih podatkov v koristne informacije. Orodja ETL omogočajo smiselno konverzijo in integracijo transakcijskih podatkov v obliko primerno za tvorbo podatkovnih skladišč in podporo orodjem za poslovno odločanje. Proces prenosa podatkov je sestavljen iz treh delov 8 : ekstrakcije podatkov iz izvornih sistemov, transformacije podatkov in nalaganja podatkov v podatkovno skladišče. 7 Kratica za Extraction, Transformation, Load 8 Povzeto po Perko, 2002, str. 21-22 16

Ekstrakcija podatkov Namen faze ekstrakcije podatkov je ustvarjanje ločene zbirke podatkov, ki so iz izvornega okolja preneseni v nekem časovnem preseku, v katerem se njihova vsebina ne spreminja. Podatki predstavljajo točen posnetek stanja v trenutku prenosa. Prenos podatkov se vrši iz izvornega okolja v okolje znotraj sistema podatkovnega skladišča, ob tem pa se struktura in oblika podatkov ohrani ter ostane ista kot v viru podatkov. Zaradi lažje in hitrejše obdelave se v fazi ekstrakcije prenesejo le tisti podatki, ki so za prenos v podatkovno skladišče pomembni. Transformacija podatkov Ko so podatki očiščeni jih moramo preoblikovati v strukturo, ki je primerna za podatkovno skladišče. Kar pomeni, da se v fazi transformacije spreminja oblika podatkov. Podatki, ki so v fazi ekstrakcije zadržali svojo originalno obliko se v fazi transformacije preoblikujejo tako, da so v skladu s predpisi, ki so določeni v podatkovnem skladišču. V tej fazi se podatkom dodajo ključi, ki kažejo dimenzije, po katerih lahko podatke združujemo, v primeru neobstoja ključev v dimenzijah, se le-te dopolnijo. V fazi transformacije se izvorni podatki preverijo in po potrebi popravijo. Po zaključku transformacije se podatki različnih virov nahajajo v ločenih tabelah. Nalaganje podatkov V fazi nalaganja se transformirani podatki nalagajo v samo podatkovno skladišče. Njihova oblika se ne spreminja več. S to fazo se zaključi postopek prenosa podatkov v podatkovno skladišče. Z ETL procesom lahko zagotovimo kakovostnejše podatke glede na izvorne sisteme, vendar pa se moramo zavedati, da podatkovno skladišče ni dokončna rešitev, ki jo vpeljemo v banko in nanjo pozabimo. Proces vzdrževanja podatkovnega skladišča in zagotavljanja pravilnih in ažurnih informacij v podatkovnem skladišču je izjemnega pomena. Pri kakovosti je zelo pomembno, da uporabniki redno skrbijo za kakovost podatkov v podatkovnem skladišču. Še posebej pomembno je predvideti, upoštevati in preveriti vpliv sprememb na kakovost podatkov v podatkovnem skladišču ob vseh spremembah poslovnih procesov. Na ta način zagotavljamo ažurnost in točnost podatkov v skladišču (Milavec, 2006, str. 11). 2.5 Vloga podatkovnih skladišč v bančnih informacijskih sistemih V modelu arhitekture informacijskih bančnih sistemih so zajeti procesi, ki omogočajo izvajanje delovnih procesov banke, dopolnjeni s podatkovnim skladiščem, ki služi kot povezava med poslovnimi segmenti in upravljavskim delom. Podatkovna skladišča so integrirana v informacijske sisteme banke in so povezana z vsemi poslovnimi procesi v banki (Perko, 2002, str. 74). 17

Arhitektura bančnega informacijskega sistema temelji na modelu bančnih procesov, ki v banko uvaja: uporabniške vmesnike, ki so prilagojeni potrebam bančnih strank in obdelavo podatkov, ki je prilagojena posameznim bančnim storitvam. Slika 6: Model arhitekture informacijskega sistema banke 9 Zgornja slika predstavlja tri plasti podsistemov, ki sestavljajo bančni informacijski sistem 10 : Prva plast Informacijski podsistem strežbe, ki je povezana z neposrednim izvajanjem bančnih storitev. Ločimo dve skupini: informacijske podsisteme bančnih enot, ki podpirajo osebno strežbo tako standardiziranih kot tudi individualnih oblikovanih bančnih storitev in informacijske podsisteme elektronskih prodajnih poti, ki podpirajo samopostrežbo bančnih strank. Druga plast Informacijski podsistemi podpore, ki je povezana z operativnimi postopki delovanja banke. Le-ti so za stranko nevidni in so povezani zlasti z evidentiranjem (knjiženjem). Ločimo tri skupine: informacijski podsistemi, v katerih se izvaja potrebna podpora posamezni bančni storitvi, ki pa ni neposredno povezana s strežbo, informacijski podsistemi, ki omogočajo horizontalno in vertikalno povezovanje ter avtomatizacijo bančnih poslov, informacijski podsistemi, ki so v funkciji informatizacije raznih»notranjih del«poslovanja banke. 9 Povzeto po Perko 2002 str. 74 10 Vir: Bobek. Dostopno na: http://epf-oi.uni-mb.si:8000/clani/bobek/fi/fi_uvod.pdf 18

Tretja plast informacijski podsistemi managementa, ki je povezana z upravljanjem banke. Tudi te podsisteme ločimo v tri skupine: informacijski podsistemi za obvladovanje tveganj, informacijski podsistemi za upravljanje odnosov s strankami, informacijski podsistemi za upravljanje donosnosti in drugih vidikov kontrolinga. Vsebina podatkovnih skladišč se, kot smo že omenili, s pomočjo vmesnikov polni iz vseh aplikacij, del podatkov pa se napolni iz zunanjih virov. Informacije o uspešnosti prenosov in podatkih, ki ne ustrezajo kvalitetnim normam podatkovnega skladišča, se po prenosih vrnejo v izvorne aplikacije, kjer se zagotovi primerna kakovost podatkov, saj je namen podatkovnih skladišč povišati nivo kvalitete podatkov o poslovanju banke in s pomočjo analiz priti do informacij, ki lahko olajšajo sprejemanje poslovnih odločitev (Perko, 2002, str. 74). Uporaba podatkovnih skladišč je primerna povsod, kjer so podatki dostopni a razdrobljeni v različnih delih informacijskega sistema vendar obstaja potreba po analizi zbranih podatkov, ki predstavljajo celotno poslovanje banke. Slabosti informacijskih sistemov v bankah Ena od pogostih slabosti informacijskih sistemov v bankah je večje število transakcijskih sistemov, kar je rezultat postopnega nastajanja sistemov za podporo poslovanja po posameznih produktih (depoziti, krediti, TRR-ji), ki med seboj v večini primerov niso povezani. Tako je lahko ista stranka pri transakcijskih računih opredeljena kot samska, pri kreditih pa kot poročena. Ta razdrobljenost in nepovezanost vodi v slabo kakovost podatkov na ravni banke, saj taki podatki niso zadostni za dobre poslovne odločitve. Nekateri deli transakcijskih sistemov v bankah so v uporabi že mnogo let in jih niso ustrezno nadgrajevali. Nove produkte in procese so pogosto dodajali s čim manjšimi posegi, kar prav tako slabo vpliva na kakovost podatkov. 19

3 PODATKOVNO RUDARJENJE 3.1 Opredelitev pojma podatkovno rudarjenje Podatkovno rudarjenje je prevod angleške besedne zveze»data Mining«. Poleg omenjenega prevoda v slovenščini poznamo tudi izraz»izkopavanje podatkov«. Katerikoli izraz uporabljamo, v vseh primerih govorimo o isti stvari. Obstaja več definicij pojma podatkovnega rudarjenja, Berry in Linoff, avtorja knjige Mastering Data Mining: The Art and Science of Customer Relationship Management, pravita, da gre za proces avtomatskega ali polavtomatskega analiziranja velikih količin podatkov z namenom odkriti zanimive in uporabne vzorce ter pravila. Pri tem opozarjata, da nas ne sme zavesti besedica»avtomatsko«. Podatkovno rudarjenje namreč ne predstavlja črne škatlice, ki jo lahko kupimo na trgu, ampak gre bolj za disciplino, ki jo je potrebno zaobvladovati. (Berry, Linoff, 2000, str. 7). Skratka, podatkovno rudarjenje se ukvarja z odkrivanjem skritega znanja, nepričakovanih vzorcev in pravil iz velikih baz podatkov. Je eden najpomembnejših korakov v procesu odkrivanja znanja iz baz podatkov. Zgrajeno podatkovno skladišče predstavlja zaželeno izhodišče za postopek podatkovnega rudarjenja. 3.2 Uporabnost podatkovnega rudarjenja Rudarjenje podatkov je uspešno, če smo si sposobni neko informacijo razložiti tako, da nam prinaša korist ter da je uporabna za management podjetja. Rudarjenje s podatki postaja vse pogosteje eden izmed vodilnih dejavnikov pri tržnem uspehu podjetji oziroma organizacij. Veliko podjetji se je šele začelo zavedati prednosti pri izkoriščanju potencialov, ki jim jih ponujajo ogromne količine podatkov, shranjene v podatkovnih skladiščih. Tudi tista podjetja oziroma organizacije, ki še ne uporabljajo podatkovnega rudarjenja, bodo gotovo v to prisiljena, že zaradi zagotovitve lastnega obstoja. Zelo pomembno je, da se vprašamo kako prenesti splošno zahtevo managerjev, v neko koristno informacijo. Vsi managerji nimajo enakega znanja, zato moramo zahtevo prenesti v informacijo, ki je primerna za njihov nivo razumevanja samih podatkov in seveda tudi tehnik rudarjenja. Veliko ljudi, ki sestavljajo višji managenment v podjetju oziroma v organizacij, nima čisto popolne slike, kako celotna zadeva funkcionira. Zato za projekte, kjer so poudarki na podatkovnem rudarjenju potrebujemo ljudi, ki imajo znanja s področji, kot so: temeljito razumevanje poslovnih znanj, znanja iz področja projektnega managementa, izkušnje na področju baz podatkov, skladiščenja podatkov, OLAP-a, Tu bi lahko omenili še izurjenost z orodji za dostop do baze podatkov, kot na primer SQL in izkušnje z orodji za rudarjenje podatkov. Dandanes se na trgu pojavljajo orodja za rudarjenje podatkov, ki so uporabniku prijaznejša. Aplikacije so za uporabnike dovolj enostavne, vendar še vedno potrebujemo nekoga, da nem pripravi podatke in seveda, da nam zagotovi njihovo točnost. 20

Podatkovno rudarjenje ni zamenjava za analitika v podjetju oziroma v organizaciji, saj je še vedno potrebno poznati probleme oziroma področja poslovanja, potrebno je razumeti podatke in poznati analitične metode. Orodja za podatkovno rudarjenje so zgolj v pomoč analitiku, saj odkrivajo zanimive vzorce in pravila, ki se pojavljajo v podatkih in ne povedo kakšna je za podjetje vrednost teh odkritih informacij. Za takšne ocene so še vedno potrebni ljudje analitiki. Pri podatkovnem rudarjenju ločimo dva različna pristopa 11 : usmerjeno podatkovno rudarjenje Pri usmerjenem podatkovnem rudarjenju točno vemo, kaj iščemo. Ciljna spremenljivka je vnaprej določena in model mora kar se da dobro prepoznati povezave med njo in ostalimi podatki. neusmerjeno podatkovno rudarjenje Pri neusmerjenem podatkovnem rudarjenjem pa naš cilj ni določen. V tem primeru podatkovno rudarjenje v podatkih odkrije vzorce in nam samim prepusti odločitev o njihovi pomembnosti ali nepomembnosti. 3.3 Področja uporabe podatkovnega rudarjenja Podatkovno rudarjenje je uporabno na vseh področjih, kjer obstaja velika količina podatkov in kjer se iz podatkov splača naučiti nekaj novega. Za uporabo podatkovnega rudarjenja na poslovnem področju velja, da se pridobivanje novih znanj splača toliko časa, dokler je vrednost teh znanj višja od stroškov njihovega pridobivanja. Podatkovno rudarjenje se učinkovito uporablja tudi na področju proizvodnje. Veliko sodobnih proizvodnih linij je nadzorovanih z računalniško vodenimi metodami nadzora. Večina najuspešnejših uporab podatkovnega rudarjenja pa je znanih iz področja trženja, pri čemer gre v večini primerov za analizo podatkovnih zbirk, ki vsebujejo informacije o strankah. Podatkovno rudarjenje pa igra pomembno vlogo tudi v bankah. 11 Povzeto po Berry in Linoff, 2000, str. 8 21

3.4 Postopek podatkovnega rudarjenja Postopek podatkovnega rudarjenja je sestavljen iz štirih procesov 12 : določanje problemov ali področji za analizo, pretvorba podatkov v uporabne informacije, ukrepanje na osnovi pridobljenih informacij, ovrednotenje rezultatov. Določanje problemov ali področji za analizo Pri določanju problemov in področji je pomembno, da analitiki razumejo potrebe podjetja oziroma organizacije. Nikakor nas ne sme zavesti občutek, da je za podatkovno rudarjenje dovolj samo tehnično poznavanje metod. Prav tako je pomembno poznavanje širše poslovne problematike. Eno brez drugega ne gre. Pretvorba podatkov v uporabne informacije Bistvo podatkovnega rudarjenja je v spreminjanju podatkov v koristne informacije. Osnovni koraki, ki nas privedejo do uporabnih informacij so: ugotavljanje potrebe po podatkih in njihovo pridobivanje, pregledovanje, preverjanje in čiščenje podatkov, izbira ravni pogleda na podatke, dodajanje izvedenih spremenljivk, priprava modelnih podatkov, izbira prave tehnike in učenje modela, preverjanje zmogljivosti modela, izbira najboljšega modela. Ukrepanje na osnovi pridobljenih informacij Namen podatkovnega rudarjenja je, da nam na osnovi pridobljenih rezultatov omogoča ustrezno ukrepanje. Rezultati podatkovnega rudarjenja so lahko nova dejstva, ki omogočajo jasen vpogled v poslovanje podjetja ali v obnašanje strank. Ta vpogled moramo nato omogočiti vsem zainteresiranim, ki bi od njega lahko imeli korist. Zgodi pa se lahko tudi, da ves trud okrog podatkovnega rudarjenja razkrije slabe podatke, na osnovi katerih ni mogoče priti do želenih rezultatov. V tem primeru so edini ukrepi usmerjeni v izboljšanje, čiščenje in izpopolnjevanje podatkov. Ovrednotenje rezultatov Dobljene rezultate je potrebno primerjati z dejanskim stanjem, kar velja še posebej pri napovedovanju bodočih dogodkov. 12 Povzeto po Berry in Linoff, 2000, str. 43 22

Osnovni proces podatkovnega rudarjenja je prikazan na spodnji sliki. Slika 7: Osnovni proces podatkovnega rudarjenja 13 Pod-procesi na sliki vsebujejo (Podgorelec, 2001, str. 12): Izbira/vzorčenje podatkov: zaradi izredne velikosti nekaterih podatkovnih baz jih praktično ni mogoče obdelati v celoti. Zato celotno podatkovno bazo običajno na nek način filtriramo ali naključno izberemo podmnožico podatkov za obdelavo. Čiščenje/predobdelava: v tej fazi pripravimo podatke za obdelavo z algoritmom za podatkovno rudarjenje (pretvorba podatkov v primeren format, brisanje neveljavnih ali manjkajočih podatkov). Transformacija/redukcija: namen te faze je revidirati in/ali predefinirati množico atributov. V mnogih primerih niso potrebni vsi atributi, ki opisujejo objekte v množici podatkov. Podatkovno rudarjenje: se nanaša na uporabo izbranega algoritma podatkovnega rudarjenja nad izbranimi podatki. Cenitveni kriteriji: v tej fazi ovrednotimo rezultate obdelave, ki jih poišče algoritem podatkovnega rudarjenja, glede na določene kriterije. S tem ugotovimo dejansko kakovost pridobljenih rezultatov in posredno tudi kakovost uporabljenih algoritmov. Predstavitev rezultatov: predstavlja priredbo rezultatov obdelave v obliko, ki je primerna za ročno analizo oziroma je prirejena končnemu uporabniku. Informacije, ki jih je enostavno razumeti, imajo največ možnosti, da postanejo uporabno znanje. 13 Vir: Podgorelec, 2001, str. 13 23

3.5 Tehnike podatkovnega rudarjenja Izkopavanje podatkov je tehnika, ki je lahko v pomoč pri iskanju danes še neznanih odgovorov in pri vodenju podjetji, katerim omogoča, da ostanejo korak pred konkurenco. V tem poglavju bo predstavljenih pet najpogostejših uporabljenih tehnik podatkovnega rudarjenja: Najbližji sosed, Razvrščanje v skupine, Inducirana pravila, Odločitvena drevesa, Nevronske mreže. Glede odločitve, katero tehniko izkopavanja podatkov izbrati, ni strogega pravila. 3.5.1 Najbližji sosed Najbližji sosed (ang. nearest neighbor) je ena izmed najstarejših tehnik, ki se uporablja na področju podatkovnega rudarjenja. Ideja pri tej tehniki je preprosta in ljudem lahko razumljiva, saj deluje na podoben način kot razmišljamo ljudje: pri reševanju problemov se pogosto naslonimo na rešitve podobnih problemov, ki smo jih že rešili. Podobno pot ubira tudi tehnika najbližjega soseda. Da bi napovedala vrednost spremenljivke pri izbrani opazovani enoti se nasloni na pretekle podatke in izmed podobnih enot izbere tisto, ki ji je po značilnostih najbližja. Tehniko bi lahko ponazorili s praktičnim primerom iz prakse. Ko se odločamo na primer za prodajo starega motorja, se največkrat pozanimamo pri podjetjih, ki se ukvarjajo s preprodajo rabljenih motorjev, kakšna je bila realizirana prodajna cena podobnih motorjev (enaka znamka, isti letnik, podobno število prevoženih kilometrov, ohranjenost, oprema, ). Če so se podobni motorji v bližnji preteklosti prodajali za npr. milijon tolarjev, obstaja verjetnost, da je tudi naš motor vreden približno milijon tolarjev. Če je iz preteklosti znanih več realiziranih prodaj s podobno ceno, je verjetnost, da se bo maš motor prodal za podoben znesek, še toliko večja. Večja verjetnost nastopa določenega rezultata je namreč povezana z večjim številom podobnih realizacij iz preteklosti. Tehnika najbližjega soseda izgleda na zgornjem primeru povsem enostavna, saj je do zaključkov mogoče priti na enostaven način. Zavedati pa se moramo, da pa se v podjetjih oziroma v organizacijah srečujemo s kompleksnejšimi problemi, ki jih moramo rešiti. V teh primerih pa rešitve niso več tako enostavne. 3.5.2 Razvrščanje v skupine Pri tej tehniki (ang. clustering) gre za razvrščanje opazovanih enot v skupine. V isto skupino se razvrstijo enote, ki so si med seboj čim bolj podobne. Same skupine pa naj bi bile med seboj čim bolj različne. Pri tehniki razvrščanje v skupine v začetku analize ni znano koliko skupin naj bi se oblikovalo oziroma na podlagi katerih spremenljivk naj bi se skupine oblikovale. Teoretično je mogoče, da so vse enote podobne med seboj in se ustvari 24

samo ena skupina. Možen pa je tudi primer, da vsaka proučevana enota tvori svojo skupino. V obeh skrajnih primerih uporabne vrednosti rezultata ni. Ko so skupine definirane, jih lahko uporabimo za klasifikacijo novih podatkov. Orodja, ki uporabljajo tehniko razvrščanja v skupine največkrat ponujajo možnost, da uporabnik sam izbere število skupin, ki jih želi tvoriti. Omenjena možnost je zelo uporabna, saj uporabniki v večini primerov vedo kakšne rezultate želijo. Tehnika razvrščanja podatkov v skupine je namenjena ugotavljanju določenih zakonitosti, ki veljajo za posamezno podatkovno bazo. Z uporabo te metode dobimo boljši vpogled na strukturo in povezanost podatkov, ki jih imamo shranjene v bazah. 3.5.3 Inducirana pravila Tehnika induciranih pravil (ang. induction rules) je izmed opisanih tehnik najboljša za odkrivanje vzorcev, ki se pojavljajo v bazi podatkov. Uporaba induciranih pravil se verjetno najbolj približa tistemu, kar si pod pojmom podatkovno rudarjenje predstavlja povprečen laik. Pri tem koristne informacije predstavljajo nova, doslej neznana pravila, ki veljajo med podatki. Pravila so definirana v obliki če potem (if then): če je izpolnjen pogoj A, potem pogosto velja B. Uporaba tehnike induciranih pravil je običajno zahtevana z vidika uporabe, saj se zahteva sistematično analiziranje vseh vzorcev, ki se pojavljajo v bazi podatkov. Podatkovne baze so velike, prav tako pa je običajno tudi veliko število različnih vzorcev, ki se pojavljajo. Za vsak vzorec pa je potrebno določiti tudi stopnjo zaupanja oziroma verjetnost ponovitve posameznega vzorca. Velika prednost tehnike induciranih pravil je zagotovo možnost visoke avtomatičnosti in pa sistematične urejenosti pravil, ki jih običajno dobimo kot rezultat. Tehnika omogoča podrobno spoznavanje poslovnih problemov. 3.5.4 Odločitvena drevesa Že samo ime odločitvena drevesa (ang. decision trees) pove, da gre za napovedovalne modele, ki so zgrajeni v obliki dreves. Ime po drevesu je tehnika dobila zaradi prikaza v obliki diagrama, ki izgleda kot drevo. Diagram je sestavljen iz treh bistvenih komponent: vozlišč odločanja, vej, listov. Izgradnja napovedovalnega modela s pomočjo dreves odločanja je enostavna, saj je rezultat enostaven za razumevanje, poleg tega pa je prednost te tehnike tudi zmožnost grafične ponazoritve. Običajen diagram drevesa odločanja običajno izgleda kot drevo, ki raste od zgoraj navzdol, saj iz izhodiščne točke vsakim vozliščem postaja vedno bolj razvejano. 25

Ko iščemo rešitev za nek nov primer (primer, ki še ni rešen) začnemo v korenu drevesa in se v vsakem atributnem vozlišču odločimo za vejo glede na vrednost pripadajočega atributa, vse dokler ne pridemo do lista in s tem do predlagane rešitve. Kot primer si oglejmo odločitveno drevo za rešitev primera:»kako investirati 1000 $?«Denar lahko vežemo v banki, ali se odločimo za bolj tvegano naložbo (nakup svežnja delnic). Za naš sveženj delnic se lahko tržišče izboljša ali poslabša. Ocenjujemo, da je verjetnost izboljšanja tržišča 60%. Če vežemo denar v banki, v enem letu zaslužimo $50. Za naš sveženj delnic ocenimo, da dobimo $500, če se delnice dvignejo, v nasprotnem primeru pa izgubimo $600. tvegana naložba (sveženj delnic) izboljšanje tržišča vozlišče naključja 0,6 $500 kako investirati $1000? odločitveno vozlišče vezava s 5% obresti $50 poslabšanje tržišča 0,4 -$600 rezultantno vozlišče Slika 8: Odločitveno drevo 14 3.5.5 Nevronske mreže Nevronske mreže (ang. neural netwoeks) so na področju podatkovnega rudarjenja dokaj nove, saj se je razvoj začel proti koncu prejšnjega stoletja. Ideja je bila naučiti računalnike razmišljati na način, kot to počnemo ljudje. Z nevronskimi mrežami rešujemo različne vrste problemov: klasificiranje, generalizacije, razvrščanje. Podobno kot drevesa odločanja je nevronske mreže mogoče prikazati na grafičen način, vendar je taka mreža težje razumljiva, saj gre za kompleksnejše povezave. Pomanjkljivost nevronskih mrež je v tem, da nimajo mehanizma, s pomočjo katerega bi lahko dobljene rešitve razložili. Zaradi tega so manj primerne za uporabo pri odločanju, uspešna pa je njihova uporaba pri prepoznavanju vzorcev. 14 Vir: http://www.ailab.si/blaz/predavanja/os/slides/os10-odlocitvenadrevesa.ppt 26

3.6 Orodja za podatkovno rudarjenje Za podatkovno rudarjenje je na voljo veliko programov, ki pa se razlikujejo po nekaterih ključnih dejavnikih, in sicer: glede na tehniko podatkovnega rudarjenja, ki jo uporabljajo, glede izhodišč, na podlagi katerih so se razvila, s finančnega vidika. KOMERCIALNA ORODJA BREZPLAČNA ORODJA Tehnika odločitvenih dreves AC2, Alice d`isoft 6,0, Business Miner, C5.0/See5, CART 4.0, Cognos Scenario, Decisionhouse, KnowlageSEEKER, C4.5, EC4.5, IND, LMDT, ODBCMINE, OC1, PC4.5, PLUS Neuscience axi.decisiontree, PolyAnalyst, SPSS AnswerTree, XpertRule Miner Analytica, AT-Sigma Data Chopper, Data Digest Business Navigator 5, DXpress, Ergo, HIGIN, KnowledgeMiner, Netica, PrecisionTree AIRA, Datamite, DataDowser, PolyAnalyst, SuperQuery, WizWhy, XpertRule Miner Natural Network FAQ list, BioComp imodel, COGNOS 4Thought, BrainMaker, DB Prophet, KINOsuite, MATLAB Neural Net Toolbox, Neural Innovation Proforma, NeuralWare NeuroSolutions, SPSS Neural Connection2, STATISTICA Neural networks Affinum Model Suite, SPSS Clementine, Darwin, KINOsuite PR, Knowledge Studio, MarketMiner, Polyanalyst, Prediction Works, Previa Classpad, Datalogic, KXEN, K-DYS, Discipulus, Evolver, MARS, WINROSA Verjetnostni mrežni pristop Tehnika pravil Tehnika nevronskih mrež Hibridne tehnike Tabela 1: Razdelitev orodji glede na tehniko in komercialnost 15 BAYDA 1.0, Bayesian belief network software, FDEP, GeNIe, JavaBayes, MSBN: Microsoft Belief Network Tools, Pulcinella, SPI, RoC (Robust Bayesian Classifier) CBA, Claudien, CN2, DBPredictor, KINOsuite-PR, RIPPER Neural Network FAQ, Tiberius, PNL Neural Shareware list, SNNS BSVM, LIBSVM, Kernel Machines, Grobian, Rough Enough, PEBLS, TiMBL 2.0, MLC++, JAM, SIPINA-W, ROC Convex Hull Program V zgornji tabeli je razvidna razdelitev orodji, ki so prisotna na trgu, na skupine, ki uporabljajo podobno tehniko rudarjenja. Na voljo nam je majhno število brezplačnih orodji, kar nam dokazuje, da podatkovno rudarjenje ni preprost postopek. Vodilna orodja na trgu so SAS, SPSS in Oracle. V Sloveniji pa je na področju podatkovnega rudarjenja mogoče najti predvsem orodja: SAS, SPSS, Oracle, Angoss, KXEN, Za kopanje po podatkih je značilno, da je orodje namenjeno specializiranim analitikom. Saj le-ti določijo cilj vsakega kopanja, v sodelovanju z managerji, vrsto podatkov ki jih potrebujejo in analizo. 15 Vir: AAAI Spring Symposium on Information Refinement and Revision for Decision Making 27

4 NOVA LJUBLJANSKA BANKA D.D. 4.1 Predstavitev Nove Ljubljanske Banke d.d. Vloga banke je bila vedno odvisna od razvojne stopnje gospodarstva in od gospodarskega sistema, zato zgodovinsko banka ni bila nikoli enotno opredeljena. Včasih je bila funkcija banke predvsem hranjenje denarja in seveda tudi drugih vrednosti. Iz te prvotne funkcije se je razvila njena osrednja funkcija funkcija financiranja. Danes je banka podjetje, ki sprejema denarne naložbe, daje kredite, izvaja plačilni promet, trguje z instrumenti denarnega in kapitalskega trga tako doma kot v tujini ter opravlja druge finančne funkcije. Nadzorni svet je na svoji 26. seji z dne 25.02.2004 jasno podprl usmeritev NLB, da ostane univerzalna banka z vodilno vlogo v Sloveniji, ob tem pa nadaljuje s širitvijo mednarodnega poslovanja na trge, kjer ima kooperativne prednosti, kot sta dobro poznavanje trgov in geografska bližina. (Letno poročilo 2002, 2003) Zgodovinski začetki Nove Ljubljanske banke d.d. segajo v 19. stoletje, ko je bila leta 1889 ustanovljena Mestna hranilnica ljubljanska. Odločitev o ustanovitvi Nove Ljubljanske banke (NLB) je 27. julija 1994 sprejel Državni zbor Republike Slovenije. Banko vodi, predstavlja in zastopa uprava, ki jo sestavljajo predsednik uprave in člani uprave. 4.1.1 Storitve Nove Ljubljanske banke d.d. Ker je NLB univerzalna banka z licenco Banke Slovenije za opravljanje vseh bančnih poslov v Sloveniji in tujini ima v svoji ponudbi celo paleto raznovrstnih storitev. Ponuja tudi takšne storitve, ki niso neposredno povezane z bančništvom. Dejavnosti banke so: Bančne storitve - sprejemanje depozitov od fizičnih oseb, - dajanje kreditov iz sredstev, zbranih z depoziti, za svoj račun, - storitve, za katere drug zakon določa, da jih smejo opravljati samo banke; Finančne storitve - kreditiranje vključno s potrošniškimi posojili, hipotekarnimi posojili in financiranjem komercialnih poslov, - opravljanje poslov plačilnega prometa, - izdajanje garancij in drugih jamstev, - trgovanje s tujimi plačilnimi sredstvi, vključno z menjalniškimi posli, - izdajanje in upravljanje s plačilnimi instrumenti, - storitve v zvezi z vrednostnimi papirji po zakonu, ki ureja trg vrednostnih papirjev, - trgovanje z izvedenimi finančnimi instrumenti, - faktoring, - zbiranje, analiza in posredovanje informacij o kreditni sposobnosti pravnih oseb, 28

- posredovanje pri prodaji zavarovalnih polic po zakonu, ki ureja zavarovalništvo, - posredovanje pri sklepanju posojilnih in kreditnih poslov, - finančni zakup (leasing), - upravljanje pokojninskih oziroma investicijskih skladov po zakonu, ki ureja pokojninske oziroma investicijske sklade, - oddajanje sefov; Pomožne bančne storitve - finančno, davčno in drugo poslovno svetovanje, - posli upravljanja z nepremičninami, - upravljanje in vodenje sistema za obdelavo podatkov, - svetovanje, razvoj in oskrba z računalniškimi storitvami, - dejavnosti, povezane s podatkovnimi bazami, - obdelava podatkov, - hramba dragocenih predmetov, - izobraževalna dejavnost, - prevoz gotovine in drugih dragocenih predmetov, - storitve razvoja bančnih storitev, - trgovanje s tehnološkimi rešitvami (know how), - trgovanje z zlatom, - pravno svetovanje, - druge poslovne dejavnosti. V skladu z zakonom o bankah lahko banka opravlja bančne storitve kot so (Zakon o bančništvu, 1999): sprejemanje depozitov od fizičnih in pravnih oseb, dajanje kreditov iz teh sredstev za svoj račun, storitve, za katere drug zakon določa, da jih smejo opravljati le banke. 4.1.2 Organizacijska zasnova banke Banka svojo dejavnost opravlja v okviru organizacijskih delov, ki so določeni s pravilnikom o organizaciji banke. Za organiziranje in vodenje banke so v njej organizirani organi, ki jih imenuje uprava banke. Organizacijsko strukturo NLB sestavlja pet centrov upravljalski in štirje poslovni centri, pri čemer vsakega izmed njih vodi posamezen član uprave NLB. Slika organizacijske strukture NLB d.d. je v prilogi diplomske naloge. 29

4.2 Informacijski sistem podjetja 4.2.1 Pomen in vloga informatike v banki V bankah je informacijska tehnologija proizvodna tehnologija banke. Vloga informacijske tehnologije, kot proizvodne tehnologije v bančnih procesih je 16 : informatizacija poslovnih aktivnosti strežbe 17, informacijska podpora strank, ki omogoča principe»samopostrežbe«, avtomatizacija poslovnih aktivnosti podpore. Glede na to, da je NLB d.d. finančna institucija, je razumljivo, da ima informatika zelo pomembno vlogo. To poglavje opisuje pomen informatike za NLB d.d. Ob zadnjih organizacijskih spremembah je bil v NLB d.d. ustanovljen Upravljalski center za informacijsko tehnologijo. 4.2.1.1 Predstavitev Upravljavskega centra za informacijsko tehnologijo Glavne naloge Upravljavskega centra za informacijsko tehnologijo (UCIT) so: načrtovanje tehnične in tehnološko aplikativne arhitekture in nadzor nad izvedbo, priprava strategije in politike razvoja informacijskega sistema NLB d.d. in Skupine NLB, spremljanje in ukrepanje pri izvajanju strategije ter politike razvoja informacijskega sistema NLB d.d. in Skupine NLB, nadzor nad skrbniškim sistemom uvajanja informacijske zaščite ter skrbništvo nad varnostnimi dokumenti centra, odobravanje odstopanj od standardiziranih postopkov informacijske zaščite v centru. Upravljalski center za informacijsko tehnologijo Sektor za izvajanje obdelav in infrastrukturo Sektor za razvoj informacijskega sistema banke Sektor za strateško načrtovanje in upravljanje informacijskega sistema banke Slika 9: Organizacijska struktura UCIT 16 Vir: Bobek. Dostopno na: http://epf-oi.uni-mb.si:8000/clani/bobek/fis/isstoritve.pdf 17 Poslovne aktivnosti strežbe so poslovne aktivnosti v katerih storitev nastaja ob prisotnosti stranke. 30

UCIT sestavljajo trije sektorji. Sektor je opredeljen kot specializirana organizacijska enota, v kateri se realizira zadani obseg nalog v upravljalo-ravnalnem procesu banke. Vsi trije sektorji morajo sodelovati pri nalogah, ki so opredeljene na ravni direkcije (Šiftar, 2004, str. 58). Področja dela v sektorju za izvajanje obdelav in infrastrukture so: izvajanje informacijske podpore za bančne skupine in druge banke, spremljanje, načrtovanje, uvajanje in vzdrževanje centralnih operacijskih sistemov in spremljajočih programov, sistemov za podporo podatkovnih zbirk, računalniških omrežij in IT zaščitnih sistemov, izvajanje mikrofilmskih rešitev za banke in druge uporabnike ter vodenje mikrofilmskega arhiva, sodelovanje pri načrtovanju, izvajanju in implementaciji IT sistemov kakovosti ter zaščite NLB, pri zasnovi IT infrastrukture, razvoju aplikacij in projektnih rešitev ter sodelovanje pri pripravi in izvajanju informacijske strategije NLB. Področja dela v sektorju za razvoj informacijskega sistema banke so: oblikuje in nadzira izvajanje politike razvoja tehnologije dela, načrtuje in izvaja prenovo tehnologije dela poslovanja banke, izvaja optimiranje tehnologije dela poslovanja banke, nadzira izvajanje načrtovanih razvojnih nalog in letnega poslovnega načrta, projektira in izvaja razvoj aplikativnih rešitev računalniške podpore poslovnih funkcij banke. Področja dela v sektorju za strateško načrtovanje in upravljanje informacijskega sistema banke so: oblikuje in nadzira izvajanje politike razvoja informacijskega sistema banke in Skupine NLB, sodeluje pri oblikovanju in nadziranju izvajanje nabavne politike za področje informacijske tehnologije, projektira razvoj aplikativnih rešitev računalniške podpore poslovnih funkcij banke. 4.2.1.2 Pomen in vloga Upravljavskega centra za informacijsko tehnologijo 18 Informatika in s tem tudi Upravljalski center za informacijsko tehnologijo ima v banki kot storitveni dejavnosti s svojim poslanstvom in vizijo še posebno pomembno vlogo. Poslanstvo Zagotavljati poslanstvo usklajene, uresničljive, smiselne in tehnično upravičene IT rešitve v skladu s strateškimi smernicami banke in dogovorjenimi ravnmi opravljanja storitev na osnovi preverjenih načel najboljše prakse. 18 Povzeto po Šiftar, 2004, str. 59. 31

Vizija Informacijska tehnologija se v banki razvija s končnim ciljem zagotavljanja ažurne informacije v času in na način, kot ga zahteva določeno poslovanje banke, ki ga podpira konkretna informacijska rešitev. Načela, ki opredeljujejo vlogo Upravljavskega centra za informacijsko tehnologijo so: Izpolnjevanje zahtev uporabnikov: - varno, zanesljivo, pravočasno in kakovostno - strokovno - profesionalno - sodobno Izvajanje dela temelji na: - učinkoviti organizaciji - znanju - dolgoletnih izkušnjah 32

5 PODATKOVNO SKLADIŠČE V NLB D.D. 5.1 Izgradnja podatkovnega skladišča v NLB d.d. Glavni namen podatkovnega skladišča je izdelati in uveljaviti enoten podatkovni standard v NLB d.d., ki temelji na pretoku podatkov iz operativnih baz na transakcijski ravni znotraj NLB in zunanjih virov ter bo osnova za pripravo informacij za podporo poslovnemu odločanju v NLB. To pa pomeni: zagotoviti skupne informacijske platforme za analize in poročanja, usklajevati informacijske potrebe znotraj NLB. Za uresničevanje teh splošnih ciljev je potrebno: definirati in izpeljati postopke avtomatskega pridobivanja in čiščenja podatkov, postaviti podatkovno skladišče na ustreznem podatkovnem strežniku, ponuditi uporabnikom kvalitetne informacije za odločanje. Podatkovno skladišče pripomore doseči naslednje poslovne koristi: realizacijo delovnih procesov pri zbiranju podatkov; realizacijo delovnih procesov pri analizah podatkov in pripravi poročil; povečano frekvenco poročanja (dnevno); spremljanje dobičkonosnosti storitev, organizacijskih enot in komitentov; spremljanje tveganju prilagojene donosnosti; hitrejše zaznavanje tržnih priložnosti; hitrejše načrtovanje novih storitev; celovito upravljanje odnosov s strankami; povečanje možnosti za spreminjanje strukture aktive in pasive. Pri izdelavi podatkovnega skladišča je potrebno upoštevati tudi pogoje za zagotavljanje namenskih ciljev, kar v praksi pomeni, da naj potrebe podatkovnega skladišča ne bi dodatno obremenjevale poslovnih enot banke, ampak bi kvečjemu pomenile zmanjšanje administrativnega dela. 5.2 Izbira tehnologije Podatkovno skladišče pomeni zbiranje obstoječih podatkov, ki se nahajajo v različnih aplikacijah. Ti podatki se nato organizirajo na način, ki omogoča lažji in hitrejši dostop na različnih nivojih združevanja. V Novi Ljubljanski banki d.d. uporabljajo naslednjo tehnologijo: centralna podatkovna zbirka DB2 Z/OS OLAP in ETL transformacija SQL server 2000 oziroma SQL server 2005 reporting services SQL 2000/2005 Centralna baza je tista iz katere gradimo podatkovno skladišče. V Novi Ljubljanski banki d.d. je baza centralna podatkovna zbirka DB2 Z/OS. Centralna baza v NLB d.d. deluje na IBM-ovem centralnem sistemu. 33

Za izgradnjo podatkovnega skladišča je uporabljena moderna arhitektura podatkovnih skladišč na osnovi relacijske podatkovne baze z uporabo Microsoft SQL Server 2000, transformacijskih orodji DTS (Data Transformation Service) in OLAP (Online Analitical Processing) tehnologije. Strojna in sistemska programska oprema: vsi osnovni procesi polnjenja podatkovnega skladišča tečejo na IBM HOST, za dostop do podatkov se uporablja SPD, z inštaliranim OLAP orodjem Proclarity, za povezavo med OLAP orodjem in vrtalnikom 19 uporabljajo v NLB d.d. tudi NLB add in za ProClarity orodja. Jedro računalniškega sistema je v posebni sobi, ki je ob enem tudi varnostna celica pred požari, vlomi, Sistem sestavljata IBM-ova centralna računalnika, ki se ločita na strojni del in operacijski sistem. Sistem za upravljanje z bazo podatkov Sistem za upravljanje z bazo podatkov (SUBP) uporabniku omogoča definiranje, oblikovanje in vzdrževanje podatkovne baze, hkrati pa omogoča nadzor nad dostopom do podatkovne baze oziroma je posrednik med podatkovno bazo in uporabniškimi programi. V NLB imajo več SUBP-ov. Najpomembnejši je sistem DB2, ki uporablja SQL jezik. Namenjen je za opis in uporabo podatkov. DB2 je SUBP in je izdelek IBM-a in temelji na reakcijskem podatkovnem modelu. Dobra lastnost DB2 je zmogljivost, saj omogoča izvajanje dinamičnih in statičnih poizvedb. SUBP upravljajo skrbniki baz podatkov 20. Od strokovnjakov za SUBP oziroma od skrbnikov se pričakuje poznavanje arhitekture, načrtovanja, izgradnje baznih komponent in poslovnih rešitev, uporabo najnovejših tehnologij in zagotavljanje znanj s področja baznih tehnologij za programske arhitekte, razvojnike in uporabnike. Osnovna gradnika konceptualnega podatkovnega modela sta tabela in baza podatkov. Tabela je določena z imenom in obsega poljubno število stolpcev, ki so ravno tako določljivi le z imenom, ter poljubno število vrstic. Baza podatkov pa logično zaokrožuje skupino tabel, ki služijo določenemu poslovnemu procesu. Več logično povezanih tabel zberemo v eno podatkovno bazo. SUBP pa lahko upravlja z več različnimi bazami podatkov. DB2 vsebuje množico pogledov ter tabel. V okviru nekega pogleda lahko priredimo tiste podatkovne elemente, ki uporabnika zanimajo. Podatki, ki tvorijo pogled, so lahko deli različnih tabel, ali pa že oblikovanih pogledov. Sistem sam izlušči zahtevane podatke in iz njih sestavi logični zapis. Poenostavljena je tudi zaščita dostopa do podatkov in sicer tako, da lahko uporabniku preprečimo uporabo določenega stolpca, lahko pa mu dovolimo le uporabo določenih vrstic tabele, ki zadoščajo nekemu pogoju. 19 BDWvrtalnik služi vrtanju podatkov do nivoja fizične osebe. Vrtalnik vrne nabor posameznikov, ki padejo v določen pogoje. S temi podatki se potem oblikujejo prodajne akcije oziroma kampanije. 20 DBA DataBase Administrator 34

5.3 Arhitektura in struktura v podatkovnem skladišču v NLB d.d. Podatkovna skladišča omogočajo raziskovanje in pridobivanje vedno novih informacij. Arhitektura podatkov pomeni ogrodje, ki nam pomaga razumeti kako se podatki skozi podjetje gibljejo in uporabljajo. Slika 10: Arhitektura podatkovnega skladišča v NLB d.d. 21 Iz slike so razvidni trije osnovni elementi arhitekture skladiščenja podatkov: viri podatkov, iz katerih v NLB polnijo podatkovno skladišče (glavna knjiga, register komitentov, IBM, VAX, PC, ); preoblikovanje in integracija teh podatkov; dostop uporabnikov do podatkov z orodji, ki so pripravljeni v ta namen ( OLAP orodja ProClarity); Osnovni elementi, ki so vključeni pri izgradnji podatkovnega skladišča: Izvorni sistemi (Source Systems): Operativni sistemi (On-Line Transaction Processing OLTP) s katerimi se zbirajo podatki o poslovnih transakcijah. Ti sistemi nudijo ažurnost podatkov in so ves čas aktivni in dostopni. Podatkovno skladišče nima kontrole nad izvornimi sistemi, zato se le-ti ne smatrajo kot sestavni del podatkovnega skladišča ampak le kot izvor podatkov. Vmesno podatkovno področje (Data Staring Area): Vsebuje pomnilniško področje in nabor funkcij za prečiščenje, transformacijo, združevanje, vhodnih podatkov za 21 Vir: Intetrni viri Nove Ljubljanske banke d.d. 35

Complaints Anal ysis Dimensions Measures Product Business Unit Geography Line of Business Customer Market Segment Number o f Co mp laints Av erage Response time Change Service Product Access Service Financial Engineering Trading Services Support Services North W est East South Trust Retail Commercial W holesale Group Services Large Commercial Small/medium Commercial High Net W orth Individuals In div idu als Charities - Podatkovno skladišče in podatkovno rudarjenje v NLB d.d. - pripravo in uporabo v podatkovnem skladišču. Podatki so organizirani v relacijskih tabelah baze podatkov. Področno podatkovno skladišče (Data Mart): predstavlja posamezen poslovni proces ali skupino povezanih procesov. Vsako področno podatkovno skladišče je sestavljeno iz tabele dejstev in pripadajočih dimenzijskih tabel. Bazira na razčlenjenih podatkih, ki se združujejo v sumarne podatke (Summary Area). Analitična orodja OLAP. Aplikacije končnega uporabnika in aplikacije za modeliranje: zbirka orodji za povpraševanje, prikazovanje in analizo podatkov ter napredna orodja, ki vključujejo modele za napovedovanje, podatkovno rudarjenje, in izdelavo raznih možnih scenarijev (orodja ProClarity). Banking Data Warehouse Model ERWin ( M1) Business Solution Templates M1 Business Solution Templates 4 2 1 Users 6 7 Data Architect Source Systems Input files Input files Input files Feedback Area Staging Area Staging Area Staging Area Database Definitions System of Reference Transport Warehouse database DB2 NDM/MQ Series IBM Mainframe DB2, DTS, SQL/Cobol Summary Area OLAP DB Definitions Cubes Data Mart MS OLAP Server, DTS Business reports ProClarity Business Reports Queries and Analysis Data Mining End Users 3 5 Skrbniki + IT 30+30 Phys-Phys Mapping Current Systems Logical& Physical Models Host Host Implementation Implementation Expert (1) programmers (5-6) Metadata documents 8 Operational Executon Data Metadata Repository Meta-data Management DB2, Word, Access DW Administrator (1) Metadata programmer Slika 11: Arhitektura sistema NLB d.d. 22 LEGENDA: 1) Končni uporabnik definira potrebe skozi mere in dimenzije v orodju M1. 2) Orodje M1 generira logični model na podlagi definiranih uporabniških zahtev v M1. 3) Uporabniški in IT skrbniki poskrbijo za»metadata«podatke o virnih aplikacijah. 4) V»metadata«podatke se napolnijo logični in fizični modeli referenčnega sistema. 5) Uporabniški in IT skrbniki, skupaj z izvajalci pripravijo»mapirna«pravila S2T). 6) Fizični model je osnova za kreiranje referenčnega modela (SOR). 22 Vir: Interni viri Nove Ljubljanske banke d.d. 36

7) Orodje M1 je osnova za OLAP definicije; mere in dimenzije za uporabnika. 8) Podatki o izvedbi se shranijo in uskladijo v»metadata«področju. 5.4 Viri podatkov v NLB d.d. Podatkovno skladišče zagotavlja dostop do integriranih informacij v enotnem referenčnem sistemu na nivoju NLB d.d.. Podatki iz virnih sistemov so integrirani, sumirani in shranjeni v podatkovno skladišče. Uporabniški dostop je mogoč na konsistenten in objektivno naravnan način skozi OLAP in druga razvita orodja, kot prikazuje sledeča slika. Slika 12: Uporabniški dostop skozi OLAP in druga razvita orodja 23 Enostavnost in fleksibilnost multidimenzionalne baze je tista značilnost, ki nudi uporabniku izdelavo odprtih tabel, kjer je možno izvajati primerjave (npr. med OE) in spremljati časovne vrste za različne periodičnosti, razvrščati po velikosti in uspešnosti poslovanja, ugotavljati vzroke za spremembe z vrtanjem v globino, Bistvo OLAP tehnologije je večdimenzionalna kocka. OLAP kocka predstavlja kompleksno SQL poizvedbo ali množico podatkov poslovnega procesa, ki so shranjeni in prikazani na večdimenzionalni način. Kocke gradimo iz atributov poslovnih dimenzij. Dimenzijski atributi so koordinate osi kocke. Tako lahko na primer gradimo kocko z osjo, ki predstavlja mesta iz dimenzije»mis tip«, z osjo, ki predstavlja dneve iz časovne dimenzije»obdobje«in z osjo, ki predstavlja postavke iz dimenzije»postavke«. Točka oz. celica v tej kocki vsebuj tri vrednosti: MIS tip (stanje na dan, mesečno povprečje in kumulativno povprečje), določeno postavko (bilančna vsota, krediti in vloga) in določeno obdobje. Če pustimo nespremenjene vrednosti za dve osi in spreminjamo vrednosti na tretji osi, lahko vidimo, kako se meritve spreminjajo po spreminjajoči se osi. 23 Vir: interni vir Nove Ljubljanske banke d.d. 37

Prikaz podatkov iz tabele Tabela 2: Tabela prikazov podatkov 24 v multidimenzionalni kocki Slika 13: Multidimenzionalna kocka Pomembnejše kocke 25 v NLB d.d. se skrivajo v bazi MIS Budget: Bančni sistemi BSIS Bistvena uporabnost kocke je v izračunih tržnih deležev za NLB d.d.. Podatki so po metodologiji Banke Slovenije za slovenski bančni sistem in NLB d.d. vključno s podružnico Trst. Podatki so mesečne periodičnosti. Bančni sistem KB Izbiramo lahko med mesečnimi podatki po metodologiji Banke Slovenije za konkurenčne banke v slovenskem bančnem prostoru v primerjavi s celotnim bančnim sistemom. Bančni sistem SRS Mesečni izkazi SRS 24 Vir: interni vir Nove Ljubljanske banke d.d. 25 Kocko si lahko prestavljamo kot datoteko. Medsebojno se kocke ločijo po vsebini. 38

Mesečni izkazi Kocka vsebuje podatke glavne knjige in baze planskih podatkov po interni metodologiji. V tej kocki so zajeti tudi podatki o številu zaposlenih. Podatki so mesečne periodičnosti in omogočajo pregled po organizacijskih enotah banke. Dnevno stanje Dnevni podatki bilance stanja in devizne podbilance po organizacijskih enotah banke za obdobje zadnje 4 mesece. Podrobnejša predstavitev kock je priložena v prilogi diplomske naloge. 5.5 Orodja za dostop do OLAP Sprotna analitična obdelava podatkov - OLAP je tehnologija, ki omogoča analitikom in managerjem hiter ter zanesljiv vpogled v podatke iz različnih vidikov. S pomočjo OLAP tehnologije lahko v trenutku obdelamo velike količine podatkov, ki jih imajo uporabniki na voljo pri pripravi analiz poslovnih procesov. Glavne prednosti OLAP so: preprosta uporaba, izredno hitra odzivnost in možnost za nadgradnjo. Od vseh pomembnih odločitev pri načrtovanju in vzdrževanju OLAP tehnologije je ena izmed najpomembnejših odločitev sama izbira OLAP orodji, saj uporabniki prav z uporabo le-teh pridejo do želenih informacij. Za OLAP orodja je značilna kratka življenjska doba uporabe, saj na tržišče neprestano prihajajo nova orodja, nove verzije. Potreben je tudi določen čas, da se uporabniki naučijo orodje tudi uporabljati za svoje delo. V Novi Ljubljanski banki d.d. se ob nakupu OLAP orodja zavedajo vseh teh pomembnih dejavnikov. Poznamo več vrst uporabnikov, od uporabnikov in porabnikov informacij, tehnologov, analitikov, Dela, ki jih opravljajo, se med seboj razlikujejo, prav tako tudi njihova pričakovanja možnosti, ki jih ponujajo orodja OLAP. V Novi Ljubljanski banki d.d. za dostop do OLAP baz uporabljajo orodje ProClarity 6.x in ProClarity server za vnaprej pripravljena poročila. Orodje ProClarity 6.x uporabljajo analitiki za AD-hoc analize. Za poslovalnice (uporabniki) pa uporabljajo že narejena poročila preko Reporting Services na platformi SQL 2000 in SQL 2005. 39

OLAP Dostop do podatkov preko On Line Analitical Processing orodij, skozi: Mere števila, zneski,.. Dimenzije storitve, valute, Vsi prikazani podatki temeljijo na posameznem: - poslu Arrangement - komitentu Involved Party Orodje ProClarity 4.0 Slika 14: Dostop do podatkov preko OLAP orodja 26 Dostop do podatkov preko On Line Analitical Processing orodij (Orodje ProClarity), skozi: Mere števila, zneski,.. Dimenzije storitve, valute, Vsi prikazani podatki temeljijo na posameznem poslu (Arrangement) in komitentu (Involved Party) OLAP orodja so za uporabnike, ki ne poznajo ozadja oziroma ne vedo kaj pomenijo lahko zelo "nevarna" saj si lahko napačno interpretirajo dobljen rezultat in posledično naredijo veliko škode, oziroma se odločijo za napačne akcije. Ravno zaradi tega primera so se v NLB d.d. odločili navadnim uporabnikom dati že pripravljena poročila, ki jih pripravijo analitiki v marketingu. 26 Vir: interni viri Nove Ljubljanske banke d.d. 40

Razvojna metodologija DWH orodja in izhodi BDW Nadzornik Administrator BDW Vrtalnik Source Systems Extract files Staging Area Feedback Area Business reports Uporabnik Extract files Extract files Staging Area Staging Area transform System of Reference Warehouse database Summary Area Cubes OLAP Data Mart Business Reports Queries and Analysis Data Mining DB2 Browser Metadata - Bimethod Bimethod Razvojnik Slika 15: Razvojna metodologija DWH orodja in izhodi 27 V Novi Ljubljanski banki d.d. ne uporabljajo podatkovnega rudarjenja ampak uporabniki v NLB d.d. dostopajo do podatkov preko: Knosys ProClarity, Reporting Services, Web aplikacij. Knosys ProClarity Za dostopanje do OLAP baz (podatkovnega skladišča) je možno uporabiti različna orodja. V NLB d.d. so najpogosteje uporabljeni odjemalci: ProClarity, ProClarity Add-In in excelov Cube Analysis. ProClarity Knosys Proclarity je program za poslovno analizo. Je grafični program za vizualizacijo in analizo podatkov. Narejen je tako, da uporabnik z enim klikom odpre aplikacijo, ki vsebuje vse potrebne poglede, ki jih lahko vnaprej pripravimo. Z enostavnimi kliki na želene poglede se nam pokažejo podatki v tabelarični ali grafični obliki. Z vrtanjem v globino ali z združevanjem podatkov pridemo do informacij, ki jih potrebujemo. Priprava pogledov je zelo preprosta in omogoča v zelo kratkem času izdelavo veliko koristnih poročil. ProClarity zagotavlja prenos podatkov v multidimenzionalne OLAP baze (podatkovno skladišče) posredno v Excelovo tabelo. Oblikovanje tabel s pomočjo ProClarity-a navaja analitika k razmišljanju o vzrokih sprememb in se mu ni potrebno ukvarjati z razmišljanjem kako priti do podatkov. Vse 27 Vir: Interni vir Nove Ljubljanske banke d.d. 41

analize je v aplikaciji ProClarity je možno shraniti in predstavljajo scenarije (poizvedbe), ki jih lahko kasneje tudi prikličemo in dodatno popravimo. ProClarity orodja nudijo prednosti na naslednjih področjih: hitrejše sprejemanje poslovnih odločitev, na podlagi dejstev, ki jih uporabniki črpajo iz preglednih podatkovnih vizualizacij. večja uporabna vrednost informacijske tehnologije z učinkovitim povezovanjem virov podatkov. Aplikacija ProClarity nam nudi tudi grafično predstavitev, katera omogoča uporabniku pregled podatkov po različnih vrstah grafikonov, izdelavo in oblikovanje grafikonov po meri, izdelavo demokompozicijskih dreves in persoektivnih pogledov z visoko analitično vrednostjo. Poleg grafične predstavitve podatkov, so le-ti predstavljeni tudi tabelarično, kjer si lahko izdelamo skupne seštevke, seštevke vrstic, stolpcev, določamo meje vrednosti agregatov, ki se v primeru preseganja obarvajo z določeno barvo. Cube Analysis Dobro poslovno upravljanje zahteva hitro odzivanje na spreminjajoče se razmere na tržišču. Najzanesljivejše in najhitrejše so, že preverjene, izdelane poizvedbe. V ta namen so pripravljeni javni scenariji s katerimi analiziramo tako banko kot posamezne njene organizacijske enote. Javni scenariji so vnaprej pripravljene kompleksne datoteke, ki omogočajo finančno analizo poslovanja banke in posameznih organizacijskih enot. Nadomeščajo finančno poročilo, ki ga je izdeloval Sektor kontrolinga v NLB. Cube Analysis Add-In je poslovno analitična aplikacija v Excelu, ki na preprost način, omogoča prenos podatkov iz multimenzionalnih kock podatkovnega skladišča neposredno v Excelovo tabelo. Omenjena aplikacija je namenjena predvsem tistim uporabnikom, ki želijo na enostaven in hiter način analizirati množico podatkov o finančnem poslovanju v Excel okolju. Web aplikacij BDW Vrtalnik 28 je WEB aplikacija, ki je razvita v skladu z NLB standardi razvoja WEB aplikacij. Dostop do nje je izveden preko domenskega uporabnika. BDW vrtalnik služi vrtanju podatkov do nivoja fizične osebe. Vrtalnik vrne nabor posameznikov, ki padejo v določen pogoje. S temi podatki se potem oblikujejo prodajne akcije oziroma kampanije. Z BDW vrtalnikom lahko Izdelamo sezname strank na podlagi izbranih parametrov: virne aplikacije, storitve, ki jih stranka ima ali ki jih stranka nima, 28 Slika BDW Vrtalnika je v prilogi diplomske naloge. 42

aktivne / neaktivne storitve / stanja časovne dimenzije, lokacije stranke, demografije. Izpis je izdelan v obliki seznama na ekranu in TXT izvoza. 5.6 Zanesljivost podatkov v podatkovnem skladišču v NLB d.d. Naloga zaščite je preverjati pri vsakem posameznem izvrševanju opravil ali je uporabnik pooblaščen oziroma ima pravico izvesti določeno opravilo. Problem zaščite ima več vidikov, in sicer: pravni, sociološki oziroma etični vidik (ali ima uporabnik pravico uporabljati določene podatke npr. podatke o višini bančnega računa); fizična zaščita (zaklepanje prostorov); operativni problemi (zagotoviti, da je geslo res trajno); možnosti kontrole, vgrajene v strojno opremo (ali vsebuje procesor dodaten, privilegiran nabor ukazov). Podatki s katerimi razpolaga Nova Ljubljanska banka d.d. ne smejo biti na voljo vsakomur, podatkovna baza pa mora biti zaščitena pred namernimi in tudi naključnimi nepooblaščenimi posegi, kot so spreminjanje ali brisanje podatkov. V SUBP ima vsak uporabnik več identifikacijskih oznak. Primarna identifikacijska oznaka (primary ID) služi predvsem za dostop do SUBP samega. Dodatne identifikacijske oznake (secondary ID) pa služi predvsem za dodeljevanje dodatnih pravic uporabe sistema. Podatkovno skladišče morajo odlikovati ažurnost in točnost podatkov, zanesljivost delovanja ter kratki odzivno čas poizvedb. 5.7 Varnostni vidik v NLB d.d. Varnost je pomemben del vsakega informacijskega sistema in predstavlja pomemben segment v zaščiti in varovanju programske in strojne opreme, podatkov, omrežij, Varnost lahko delimo na fizično in logično. Pri fizični varnosti gre za ločitev prostorov in naprav informacijske tehnologije, ki onemogoča krajo informacijskih sredstev, zagotavlja zaščito pred nepooblaščenimi spremembami v opremi informacijske tehnologije. Zato se v večini primerov za fizično zaščito uporabljajo posebni prostori, ki so dobro zaščiteni (so zaklenjeni, opremljeni z video nadzorom ter so parni pred požari in poplavami). V Novi Ljubljanski banki d.d. so prostori fizično zaščiteni v štirih conah z različnimi varnostnimi ukrepi. Bližje kot je cona računalniškemu centru, manj zaposlenih ima dostop vanjo. Zaposleni v UCIT-u imajo kartico in PIN kodo s katero lahko vstopajo v te prostore. Vsak prihod zunanjih sodelavcev v prostore UCIT-a pa se vpiše oziroma registrira pri varnostniku na vhodu. 43

Pri logični varnosti pa gre za omejevanje dostopa tam, kjer ni fizičnih zaščit. Vsak zaposlen v Novi Ljubljanski banki d.d. ima svoje uporabniško ime in geslo za dostop do omrežja. Za dostop do centralnega računalnika pa je potrebno posebno uporabniško ime in geslo. Za nadzor nad sistemom in dodeljevanjem uporabniških pravic skrbi sistemski inženir, saj vsak uporabnik v NLB nima dostopa do posameznih ali vseh sistemov. Odobritev dostopa in nivo prioritete mora za posameznega uporabnika podpisati vodja oddelka in odobriti varnostni inženir. Varnost je za banko ključnega pomena. V NLB d.d. se zavedajo, da so ljudje, objekti, informacije in sredstva predmet potencialnih groženj. 44

6 SKLEP Dandanes je informacija moč, moč pa prinaša denar in napredek. Pravočasne in natančne informacije potrebujemo za odločanje. V večjih organizacijah se srečujemo z ogromno količino pomembnih in nepomembnih podatkov iz katerih je potrebno izluščiti informacije s katerimi se bomo hitreje in seveda tudi pametneje odločali. Podatke je potrebno organizirati na način, ki nam jih omogoča kar najhitreje pretvoriti v želene informacije. Eden izmed takšnih načinov je skladiščenje podatkov. Na trgu vlada močna konkurenca zato si zaposleni v Novi Ljubljanski banki d.d. ne morejo privoščiti, da bi porabili preveč časa z zbiranjem pravih informacij. Pomembno je, da imajo banke podatkovna skladišča in seveda programe, ki jim omogočajo pridobivanje podatkov iz podatkovnih skladišč v kar najkrajšem času. Od pisanju diplomske naloge sem prišla do ugotovitve, da v Novi Ljubljanski banki d.d. ne uporabljajo podatkovnega rudarjenja, kot sem si na začetku zastavila cilj diplomske naloge, ampak uporabniki v Novi Ljubljanski banki d.d. dostopajo do podatkov preko: Knosys ProClarity, Reporting Services in Web aplikacij. Spoznala sem tudi, da je izgradnja in sama uporaba podatkovnega skladišča zahteven projekt, ki zahteva veliko znanja tako zaposlenih kot tudi zunanjih sodelavcev, saj si lahko uporabniki z neznanjem napačno interpretirajo dobljen rezultat, kar vodi do napačnih odločitev. Skratka podatkovno skladišče je pomembno za vsako podjetje, ki hoče na trgu ostati konkurenčen. Zato je pomembno da znajo zaposleni izmed ogromnih količin podatkov, ki izhajajo iz različnih operativnih virov, izluščiti prave poslovne informacije, katere pripomorejo k sprejemanju pravočasnih in predvsem pravih odločitev. Pri tem so jim v veliko pomoč različne tehnike s katerimi lahko podatke iz podatkovnega skladišča uporabljajo, kot na primer v Novi Ljubljanski banki d.d.. tehniko sprotne analitične obdelave podatkov (OLAP). 45

7 POVZETEK Diplomska naloga obravnava podatkovno skladišče in podatkovno rudarjenje na primeru Nove Ljubljanske banke d.d.. V prvem delu diplomske naloge smo opredelili pojma podatkovno skladišče in podatkovno rudarjenje ter predstavili tri osnovne tipe arhitekturnih podatkovnih skladišč: centralizirano, federativno in distribuirano (njihove značilnosti, prednosti, slabosti, ). Predstavili smo tehnike podatkovnega rudarjenja in opisali orodja za podatkovno rudarjenje. Opisali smo tudi potek prenosa podatkov v podatkovno skladišče z osnovnimi procesi, ki oblikujejo podatkovno skladišče ter opredelili vlogo podatkovnih skladišč v bančnih informacijskih sistemih. V drugem delu naloge smo predstavili Novo Ljubljansko banko d.d., njeno poslovno strategijo in informacijski sistem podjetja. Podrobneje smo predstavili tudi podatkovno skladišče in vire podatkov ter OLAP orodja na primeru Nove Ljubljanske banke d.d.. KLJUČNE BESEDE: Podatkovno skladišče, podatkovno rudarjenje, bančno podatkovno skladišče, arhitektura podatkovnega skladišča, tehnike podatkovnega rudarjenja, orodja za podatkovno rudarjenje, OLAP (sprotna analitična obdelava podatkov), OLAP kocka. ABSTRACT The diploma work is dealing with data wharehouse and data mining in the case of the bank Nova Ljubljanska banka d.d.. In the first part of the diploma work we have defined the terms of data wharehouse and data mining, and introduced three basic types of architecture data wharehouses: centralised, federative and distributive, together with their characteristics, advantages and disadvantages. We have also presented the data mining techniques, and described the data mining tools, as well as the course of transferring data into data wharehouse. We have described the basic processes forming data wharehouses, and defined the role of data wharehouses in bank informational systems. In the second part we have introduced the bank Nova Ljubljanska banka d.d. together with their business strategy and the informational system. We have also detailed their data wharehouse, data sources and OLAP tools in the case of the bank Nova Ljubljanska banka d.d.. Key words: Data wharehouse, data mining, banking data wharehouse, data wharehouse architecture, data mining techniques, bank informational system, data mining tools, OLAP (On-Line Analytical Processing), OLAP cube. 46

8 LITERATURA Tiskani viri 1. Berry, Michael J.A. in Linoff, Gordon. 2000. Mastering Data Mining: The Art and Science of Customer Relationship Management. New York: John Wiley & Sons, Inc. 2. Cabena, P., Hadjinian, R. Stadler, J. Verhees in A. Zanasi. 1997. Discovering data mining: from concept to implementation. New Yersey: Prentice Hall. 3. Devlin, Barry. 1997. Data Warehouse: From architecture to Implemention. Reading, Massachusetts: Addison Weseley Longman, Inc.. 4. Han, Jiawei in Kamber, Micheline. 2001. Data mining Concepts and Techniques. San Francisco: Morgan Kaufmann Publishers. 5. Inmon, W.H..1996. Building the Data Warehouse. Second Edition. New York: John Wiley & Sons, Inc.. 6. Kavčič, Ana. 2005. Podatkovno skladišče v banki. Specialistično delo. Ljubljana: Ekonomska fakulteta. 7. Kimball, Ralp in Merz, Richard. 2000. The data webhouse toolkit: building the webenabled data warehouse. New York: J. Wiley cop. 8. Perko, Igor. 2002. Povezovanje tehnologij podatkovnih skladišč in interneta v bančnih informacijskih sistemih. Magistrsko delo. Maribor: Ekonomsko poslovna fakulteta. 9. Podgorelec, Vili. 2001. Oblikovanje inteligentnih sistemov in odkrivanje znanja z avtomatskim programiranjem. Doktorska disertacija. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. 10. Poole, John in Chang, Dan in Tolbert, Douglas in Mellor, David. 2002. Common Warehouse Metamodel. New York: John Wiley & Sons, Inc.. 11. Sing, Harry H.. 1998. Data werehousing. New Jersey: Prentice Hall. 12. Šiftar, Branko. 2004. Podatkovno skladišče in tehnologija za sprotno analizo podatkov na primeru likvidnostne lestvice NLB. Magistrsko delo. Ljubljana: Ekonomska fakulteta. 47

Elektronski viri 1. AAAI Spring Symposium on Information Refinement and Revision for Decision Making: Modeling for Diagnostics, Prognostics, and Prediction Software and Data. 2002 [online]. Dostopno na: http://www.cs.rpi.edu/~goebel/ss02/software-and-data.html [11.12.2006] 2. Benčina, Gregor. (2005). Spreminjanje bančnega poslovanja [online]. Dostopno na: http://www.src.si/library_si/pdf/infosrc/infosrc.si%20-%202005-40.pdf [12.09.2006] 3. Bobek, Samo. Informatika v bankah [online]. Dostopno na: http://epf-oi.unimb.si:8000/clani/bobek/fi/fi_uvod.pdf 4. Golob, Izidor in Welzer Tatjana. Arhitekture podatkovnih skladišč [online]. Dostopno na: http://www.drustvoinformatika.si/dogodki/arhiv/dsi2001/sekcija_a/ golob_welzer.doc [09.09.2006] 5. Jaklič, Tatjana. (2001). Podatkovna skladišča v finančnih institucijah [online]. Dostopno na: http://www.src.si/library_si/pdf/infosrc/infosrc.si%20%20200130.pdf# search= %22podatkovna%20skladi%C5%A1%C4%8Da%22 [09.09.2006] 6. Krapež, Alenka in Rajkovič, Vladislav. Tehnologije znanja pri predmetu informatika: vodnik za izpeljavo sklopa tehnologije znanja [online]. Dostopno na: http://lopes1.fov.uni-mb.si/za_pes_po_net/tehnologije%20znanja.pdf [4.12.2006] 7. Pivk, Aleksander. Rudarjenje podatkov (Data mining) [online]. Dostopno na: http://ai.ijs.si/mezi/pedagosko/rudpod.pdf#search=%22pivk%20aleksander%20%2b% 20rudarjenje%20podatkov%22 [18.09.2006] 8. Roblek, Peter. Analiza podatkov z OLAP tehnologijo [online]. Dostopno na: http://www.drustvo-dmrs.si/e_zbornik_prvi/prispevki/34_roblek_peter.pdf [15.05.2007] 9. White, Colin J. (1997). Building a Corporate Information System: The Role of the Data Warehousing [online]. Dostopno na: http://www.dmreview.com/whitepaper/ dmc.pdf [09.09.2006] 10. Zupan, Blaž. Odločitvena drevesa [online]. Dostopno na: http://www.ailab.si/blaz/predavanja/os/slides/os10-odlocitvenadrevesa.ppt [15.03.2007] 11. http://www.proclarity.com/ 48

Članki v revijah 1. Golob Iztok, Welzer Tatjana, Brumen Boštjan. 2003. Analiza in primerjava pristopov pri gradnji podatkovnih skladišč. Uporabna informatika 1: 12 22. 2. Jagarinec, Darko. 2005. Olap in podatkovna skladišča. Moj Micro 10: 78 79. 3. Marolt Šmid, Jasna. 2001. Poslovno obveščanje včeraj in danes za jutri. Glasilo Info SRC.SI 31: 7-8. 4. Milavec, Helena - Tina. 2006. Zakaj banke potrebujejo skladišče podatkov. Glasilo Info SRC.SI 44: str. 9. 5. Prašnikar, Domen. 2001. Bančno podatkovno skladišče. Bančni vestnik 7-8: 44-46. 6. Rizman Žalik, Krista. 2004. Podatkovna skladišča in kakovost podatkov. Uporabna informatika 1: 19 29. Interna dokumentacija 1. Interno gradivo Nove Ljubljanske banke d.d. 2. Letno poročilo 2000. Ljubljana. Nova Ljubljanska banka d.d., str. 37-42. 3. Letno poročilo 2002. Ljubljana. Nova Ljubljanska banka d.d., str. 2-3. 4. Nova Ljubljanska banka [online]. Dostopno na: http://www.nlb.si [12.09.2006] 5. Zakon o bančništvu (Uradni list RS, št.7/99). 6. Vodič skozi MIS v BDW. 2006. Nova Ljubljanska banka d.d. 7. Vodič za uporabo Cube Analysis add-in. 49

PRILOGE Priloga 1: Organizacijska struktura Nove Ljubljanske banke d.d. Priloga 2: Struktura kocke Mesečni izkazi Priloga 3: Struktura kocke Bančni sistem BSIS Priloga 4: Struktura kocke Bančni sistem KB Priloga 5: BWD Vrtalnik 50

51

- Podatkovno skladišče in podatkovno rudarjenje v NLB d.d. - 52

- Podatkovno skladišče in podatkovno rudarjenje v NLB d.d. - 53