Primjeri skladišta podataka i njegove računalne definicije

Što ako organizacije obrade sve svoje podatke u podršku odlučivanju? Što bi se dogodilo da koriste specijalizirani softver koji je služio za prezentaciju informacija i njihovu analizu? Mi ćemo dati neke Primjeri skladišta podataka odgovoriti na ova pitanja.

PRIMJERI-SKLADIŠTE PODATAKA

Primjeri skladišta podataka

Prije svega, važno je razlikovati dva pojma koja nas zbog svoje kratice mogu lako zbuniti, a od početka je namjera da korisnik zna što može očekivati ​​i da poznaje neke osnovne pojmove suočiti se. Ovdje ćemo pokazati beskonačne primjere koji služe tako da pojedinac ima alate za razlikovanje ovih elemenata.

Definicija

S obzirom na razliku između dva pojma, nastavit ćemo ih formalno definirati, budući da je to proces koji izdvaja, transformira, konsolidira i integrira podatke organizacije, unutarnje i vanjske, kako bi bili dostupni i korisni pri donošenju odluka -izrada.

Na isti način, skladište podataka može se definirati i kao baza s podacima o elektroničkom datotečnom sustavu, koja pohranjuje potrebne podatke za analizu informacija i donošenje odluka. Njegova je razlika u tome što je poslovno orijentiran, integriran, mijenja se u vremenu i nije promjenjiv.

U osnovi, skladište podataka (DWH) je proces, a skladište podataka (DW) je baza podataka.

značajke

Skladište podataka karakterizira nekoliko aspekata koji pružaju potrebne alate za njegovu optimalnu uporabu, čime su u skladu s programiranim smjernicama koje generiraju alate za njegovu upotrebu na najbolji mogući način. Detaljno ćemo opisati skladište podataka:

Poslovno orijentirano

Samo relevantni podaci unose se u skladište podataka za analizu i donošenje odluka. Odnosno, podaci koji nemaju analitičku vrijednost, poput adresa soba, poštanskih brojeva, adresa e -pošte, između ostalog, ne uzimaju se u obzir. No, oni su od promjenjivog interesa, poput vrste klijenta, zemljopisnog položaja, dobi itd.

Upravlja se entitetima na visokoj razini, kao što su klijenti, proizvodi, artikli, područja i drugi. Podaci se pohranjuju na višedimenzionalan način, odnosno u tablice činjenica i dimenzija.

Integriran

Svi podaci iz heterogenih izvora objedinjeni su kako bi se zajamčila njihova kvaliteta i čistoća. Glavni izvori podataka su:

Prema vrsti korisnika.

    • Operativno: Svakodnevno proizvodi veliku količinu podataka, ali samo po sebi nije od velike važnosti za potrebnu analizu. Na primjer, prodaja proizvoda.
    • Srednje: generira podatke sa implikacijama u kratkom i srednjoročnom razdoblju, na temelju operativnih podataka. Dobar primjer ovog koncepta je generiranje zaliha.
    • Upravljački: Koristi podatke koji su rezultat procesa integracije i transformacije. Zauzvrat, generira nove informacije. U osnovi se odnosi na korisnika skladišta podataka.

Prema području ili odjelu organizacije

    • Područja: Svatko ima dobro definirane odgovornosti. Oni stvaraju vlastite podatke koji se dijele s drugim područjima.
    • Pododjeljci: Obično su zemljopisni. Oni pružaju podatke o lokaciji koje je potrebno uključiti zajedno s ostalima.

Prema izvoru

    • Interno: Oni stvaraju vlastite podatke koji dolaze iz svakodnevnih aktivnosti tvrtke.
    • Vanjski: Dopunjuju interne podatke, na primjer popise i statistiku.

Varijanta u vremenu

Omogućuje pristup različitim verzijama iste situacije, budući da se trenutačni podaci pohranjuju zajedno s povijesnim podacima, u primjerima skladišta podataka.

skladište podataka

Nije hlapljivo

Jamči stabilnost podataka, budući da se jednom kad podaci uđu, ne mijenjaju se. Odnosno, podacima se manipulira samo kada se u njih unese i kada se s njima konsultira.

Ukratko, glavne kvalitete skladišta podataka su:

Kvalitete

Rukuje količinskim podacima, posljedica nakupljanja povijesnih, trenutnih i zbirnih podataka, iz različitih izvora.

Postavlja cijeli opseg podataka u jednu centraliziranu bazu podataka. Strukturirajte podatke na višedimenzionalan način.

prednosti

Zbog svojih karakteristika i kvaliteta, skladište podataka predstavlja sljedeće prednosti:

  • Smanjuje minimalno vrijeme potrebno za prikupljanje svih relevantnih podataka o određenoj temi.
  • Pruža alate za analizu.
  • Mnoga izvješća i analize definiraju korisnici.
  • Omogućuje izravan pristup, analizu i praćenje pokazatelja organizacije.
  • Pomaže u identificiranju čimbenika koji utječu na rad tvrtke.
  • Omogućuje napredovanje i određivanje budućeg ponašanja institucije.
  • Korisnici mogu brzo i jednostavno tražiti podatke.

Ukratko, skladište podataka pomaže organizaciji da odgovori na bitna pitanja za donošenje odluka. Time se postižu konkurentske prednosti koje optimiziraju njihov položaj na tržištu na kojem posluju. Neka od ovih pitanja su:

  • Kakav je profil klijenata?
  • Kakvo je njihovo ponašanje?
  • Kolika je isplativost poslovanja?
  • Koji je rizik za organizaciju?
  • Koje usluge i proizvode koristite i kako ih možete povećati?

PRIMJERI-SKLADIŠTE PODATAKA

Područje primjene

Skladište podataka može se prilagoditi bilo kojoj organizaciji, bez obzira na veličinu i složenost. To je posljedica agende bilo koje institucije, tvrtke ili organizacije pri donošenju odgovarajućih odluka u vezi s podacima koje proizvodi.

Rizici primjene

To zahtijeva velika ulaganja od strane organizacije. Prednosti njegove provedbe ne vide se kratkoročno, već srednjoročno i dugoročno.

Manipulacija podacima prijeti manipulacijom osjetljivim podacima.

Aspekti koje treba uzeti u obzir

Kao što je spomenuto na početku, postoji nekoliko aspekata koji se moraju uzeti u obzir pri primjeni ovih elemenata za korištenje poslužitelja. Među njima možemo spomenuti sljedeće:

Troškovi prijave

Skladište podataka snosi troškove izgradnje, rada i podrške. Troškovi izgradnje podrazumijevaju troškove ljudskih resursa, vremena i tehnologije, dok troškovi rada i održavanja uzimaju u obzir troškove evolucije, rasta i one uzrokovane promjenama u podrijetlu podataka.

Utjecaj na ljude

Primjena Skladišta podataka uvijek generira očekivanja kod korisnika koji će nužno morati steći nove vještine. Uspjeh ove vrste podataka ovisi o aktivnoj uporabi i povratnim informacijama korisnika.

Utjecaj na poslovanje i procese donošenja odluka

Primjenom skladišta podataka mogu se otkriti određeni nedostaci u poslovnim procesima, ali se istodobno povećava povjerenje u odluke donesene na temelju dobivenih rezultata.

Arhitektura

PRIMJERI-SKLADIŠTE PODATAKA

Opća arhitektura primjera skladišta podataka prikazana je na gornjoj slici. Kao što se može vidjeti, ovaj sustav uključuje niz interakcija između njegovih komponenti. S tim u vezi i kao sažetak, njegovo se djelovanje može opisati na sljedeći način:

  • Podaci se uzimaju iz različitih izvora, poput internetskih usluga, datoteka i drugih baza podataka, unutarnjih i vanjskih.
  • Nakon što se podaci izdvoje, oni se integriraju, transformiraju i čiste, da bi se kasnije učitali u skladište podataka.
  • Kako bi se stvorile taktičke i strateške informacije, izvješća i analize dobivaju se učitavanjem podataka.
  • Konačno, korisnici se mogu konzultirati i istražiti generirana izvješća i analize.

elementi

Sada ćemo opisati neke od elemenata koje je moguće ocijeniti u skladištu podataka koje treba uzeti u obzir.

Izvori skladišta podataka

Općenito, oni su rezultat svakodnevnih aktivnosti tvrtke, u tom slučaju se nazivaju internim izvorima. Kada se podaci preuzimaju, na primjer, s web poslužitelja, oni se smatraju vanjskim izvorima. Oni se međusobno razlikuju jer ovise o podrijetlu, formatu, funkciji itd.

Ekstrakcija, transformacija i utovar

PRIMJERI-SKLADIŠTE PODATAKA

Poznat kao ETL, proces je koji uključuje sve zadatke koji se provode od trenutka dobivanja podataka do njihova učitavanja u skladište podataka. To su: ekstrakcija, manipulacija, kontrola, integracija, čišćenje podataka, učitavanje i ažuriranje.

Izvlačenje

Uključuje tehnike usmjerene na prikupljanje, iz različitih izvora, samo relevantnih podataka i njihovo čuvanje u internoj pohrani. Ova vrsta pohrane omogućuje manipulaciju podacima bez miješanja ili mijenjanja izvora ili skladišta podataka s više podataka, stvarajući sloj ekstrakcije između čitanja i učitavanja, pohranjivanje i upravljanje metapodacima generiranima u procesu te olakšavanje integracije.

Ekstrakcija se temelji na potrebama korisnika i zahtjevima definiranim za rješenje.

transformacija

To su tehnike zadužene za usklađivanje različitih formata, kao i za filtriranje i klasifikaciju podataka i povezanih izvora.

Ova je funkcija odgovorna za primjenu svih odgovarajućih naredbi u vezi s podacima, kako bi ih se promicalo na snažan i razuman način koji je kompatibilan i dosljedan Skladištu podataka. Osim toga, odgovoran je za čistoću i kvalitetu podataka.

transformacija vlakana

Carga

Što se tiče tehnika početnog učitavanja podataka i povremenog ažuriranja skladišta podataka.

  • Početno učitavanje odnosi se na prvo učitavanje podataka koje skladište podataka prima. Općenito, to oduzima mnogo vremena zbog velikog broja zapisa koji pripadaju dugim vremenskim razdobljima.
  • Periodično ažuriranje odnosi se na umetanje malih količina podataka. Vaš je cilj dodati uzorcima skladišta podataka samo one podatke koji su generirani iz zadnjeg ažuriranja. Ovisi o potrebama i zahtjevima korisnika.

Ukratko, kroz proces učitavanja podataka jamči se održavanje skladišta podataka.

Ukratko, može se reći da se ETL proces provodi na sljedeći način:

  • Podaci, nakon što su izvučeni iz relevantnih izvora, pohranjuju se u internu pohranu.
  • Dok se podaci čuvaju u internoj pohrani, oni su integrirani i transformirani.
  • Kad se podaci očiste, nakon prethodnog koraka, prosljeđuju se u skladište podataka.

Izvještaji

Izvješća su grafički alati koji korisniku omogućuju dobivanje detaljnih izvješća o podacima o vašoj tvrtki. Način interakcije s ovim izvješćima vrlo je jednostavan za korisnika, budući da su to jednostavne upute. U osnovi, morate odabrati opcije s izbornika, pozivajući se na uvjete i specifikacije predstavljene teme.

OLAP

To je najmoćnija komponenta skladišta podataka jer sadrži specijalizirani višedimenzionalni mehanizam upita sustava.

Omogućuje analizu organizacije iz različitih povijesnih scenarija. Projektira svoje ponašanje i evoluciju iz višedimenzionalne vizije, odnosno kombiniranjem različitih perspektiva, tema od interesa ili dimenzija. To omogućuje zaključivanje trendova otkrivanjem odnosa između perspektiva koje bi na prvi pogled bilo teško pronaći.

Data Mining

PRIMJERI-SKLADIŠTE PODATAKA

To je prvenstveno statistički alat pomoću kojeg se mogu napraviti predviđanja. Radi se o zaključivanju ponašanja, a da ne postoje unaprijed utvrđena pravila. On generira izvješća u obliku tablica i grafikona, među ostalim, koji promiču donošenje odluka na proaktivan način. Radi na temelju informacija koje su već u potpunosti obrađene.

Razlika između OLAP -a i Data Mining -a

Nakon što se razmotre glavni aspekti OLAP -a i Data Minig -a, može se uspostaviti osnovna razlika između njih.

  • Pomoću OLAP-a tumači se trenutna situacija tvrtke koja daje brze odgovore koji olakšavaju donošenje odluka.
  • Data Minig predviđa situacije, temeljene na proučavanju skrivenog znanja koje izaziva određene vrste ponašanja.

Slijedom toga, oba se sustava bave rješavanjem različitih vrsta analitičkih situacija.

Data Minig i njegov odnos s skladištem podataka

Sustav Data Minig tehnologija je podrške za krajnjeg korisnika čiji je cilj izvući korisne informacije iz podataka sadržanih u bazi podataka tvrtki. Drugim riječima, podrijetlo informacija koje koriste algoritmi Data Minig obično su povijesni podaci sadržani u skladištu podataka.

Mora postojati integracija između Data Minig tehnika i procesa uključenih u skladište podataka. Drugim riječima, kako bi se izvršila analiza poslovanja, mora postojati sporazum između Data Minig -a, skladišta podataka i OLAP poslužitelja.

Svaki put kad Data Warehouse daje nove rezultate, tvrtka može ponovno primijeniti Data Minig radi optimizacije donošenja odluka.

Ukratko, Data Minig i skladište podataka potpuno su kompatibilni alati. Skladište podataka pruža memoriju i Data Minig inteligenciju.

Tradicionalne baze podataka protiv skladišta podataka

Analiza dosad izloženih aspekata dovodi nas do razumijevanja da se skladište podataka razlikuje od baza podataka koje podržavaju dnevne transakcije organizacija. Ovdje su osnovne razlike

  • U tradicionalnim bazama podataka informacije su organizirane tako da se mogu lako dohvatiti i ažurirati. Skladište podataka organizirano je i orijentirano na krajnjeg korisnika, koji se može samo raspitati.
  • Transakcijske baze podataka brinu se o svakodnevnoj obradi podataka. Skladište podataka radi s povijesnim podacima, odnosno odgovara dugim vremenskim razdobljima.
  • Tradicionalnim bazama podataka pristupa se nekoliko puta tijekom radnog dana. U skladištu podataka očitanja i upiti su minimalni jer se njima pristupa povremeno.
  • Količina podataka kojima skladište podataka upravlja mnogo je veća od one kojom se upravlja u tradicionalnim bazama podataka.
  • Struktura transakcijskih baza je stabilna. Struktura skladišta podataka varira ovisno o vlastitoj evoluciji i uporabi.

Zatim ćemo uspostaviti neke Primjeri skladišta podataka.

Primjeri skladišta podataka

Tvrtka u cijeloj zemlji, posvećena prodaji sredstava za čišćenje na razini veleprodaje i maloprodaje, koja se također smatra srednjom zbog opsega prodaje, ima glavni cilj maksimizirati svoju dobit. Slično, kako biste dobili više kupaca, želite se proširiti na novu razinu tržišta, a kasnije i proširiti svoju liniju proizvoda. Jedna od njegovih glavnih politika je kontinuirano poboljšavanje radi boljeg položaja u odnosu na konkurente uzoraka skladišta podataka.

PRIMJERI-SKLADIŠTE PODATAKA

Primjena skladišta podataka nudi sljedeće prednosti organizaciji.

  • Omogućuje korisnicima pregled poslovanja.
  • Pretvorite operativne podatke u analitičke informacije, usredotočene na donošenje odluka.
  • Generirajte dinamička izvješća koja vam olakšavaju analizu.
  • Olakšava oblikovanje strategija za ispunjenje ciljeva organizacije.
  • Koristi za stabilnost strukture tvrtke.

Drugi primjer svakodnevnog skladišta podataka odnosi se na upravljanje obrazovnom ustanovom koja ima nedostataka u smislu komunikacije sa svojim studentima. Slično, nedostaje jedinstveni informacijski centar koji ima sve njihove podatke. Cilj institucije je pratiti studente tijekom njihove karijere i nakon diplomiranja, ponuditi nove prijedloge koji poboljšavaju uspješnost organizacije i razvoj učenika.

Primjenom skladišta podataka nastojimo odgovoriti potrebama sveučilišta. U načelu, uklanjanjem dupliciranja informacija i prisutnosti pogrešnih podataka o studentima, kao i svih podataka koji se općenito smatraju nekvalitetnima i koji nisu relevantni. Osim toga, sve su informacije integrirane, tvoreći jedinstvenu evidenciju studenata koja služi kao osnova za pravilan razvoj projekta ustanove.

Konačno, promiču se marketinške aktivnosti koje daju sveučilištu veću korist i pomažu mu u rastu pravilnim upravljanjem informacijama.

Zaključno, u primjerima skladišta podataka pruža mogućnost da se zna što se događa u organizaciji, što se dogodilo, što se može dogoditi i zašto. Možete pogledati članak vrste računalnih virusa.