Mis vahe on andmelaos ja kuubikus?


Vastus 1:

Andmekuup

Programmeerimiskontekstides on andmekuup (või andmekuubik) mitmemõõtmeline väärtuste massiiv, mida tavaliselt kasutatakse kujutise andmete aegridade kirjeldamiseks. Andmekuupi kasutatakse andmete kuvamiseks mingil huvipakkuval mõõtmel. Isegi kui seda nimetatakse „kuubikuks“, võib see olla ühemõõtmeline, kahemõõtmeline, kolmemõõtmeline või kõrgem. Iga mõõde tähistab uut mõõdet, kuubi lahtrid aga huvipakkuvaid fakte.

Mõelge ülaltoodud kaubanduskeskuste haldussüsteemi kuubikule.

Iga veerg tähistab iga poe müüginumbreid.

Iga rida tähistab kaubanduskeskuse erinevaid osakondi.

Iga kiht tähistab kuud.

Siin on nähtavad väärtused juuni kuu.

Seega on juunis 2 kaupluses 2 toidupoed.

(Lisateavet leiate lehelt 136, Data Mining: Han ja Kamberi kontseptsioonid ja tehnikad, 3. väljaanne)

Andmeladu

Andmetöötluseks on andmeladu (DW või DWH), tuntud ka kui ettevõtte andmeladu (EDW), aruandluseks ja andmete analüüsiks kasutatav süsteem, mida peetakse äriteabe põhikomponendiks.

DW-d on ühest või mitmest erinevast allikast pärit integreeritud andmete kesksed hoidlad. Nad salvestavad praegused ja ajaloolised andmed ühes kohas.

Lihtne seletus: Data Warehouse on üks koht, kus aruandluse jaoks salvestatakse palju andmeid erinevatest ressurssidest.

Kujutage ette Reliance mega kaubanduskeskuse ketti Indias. Üleriigiliselt on olemas Reliance megakeskused. Iga kaubanduskeskus saadab kesksetesse hoidlatesse erinevate osakondade andmed. Ühes kohas kogutakse see nn andmeladu. Seda kasutatakse mitmesuguste andmete haldamiseks. Andmeid kasutatakse ka erinevat tüüpi analüüside tegemiseks, näiteks ostumustrite jaoks.

Seega on ülaltoodud kaks mõistet; Andmeladu ja andmekuup on täiesti erinevad, kuid need pole võrreldavad ja seetõttu ei saa me loetleda kahe erinevust.

Allikas:

[1] Vikipeedia

[2] Andmete kaevandamine: Han ja Kamberi kontseptsioonid ja tehnikad

Sa olid Vyas


Vastus 2:

Kui keegi viitab Data Warehouse'ile, viitavad nad Kimballi põhistele Star-skeemidele, Inmonil põhinevatele normaliseeritud andmelao skeemidele koos lavastuspiirkonna skeemidele, mis on füüsiliselt loodud relatsiooniandmebaasis, näiteks Oracle, DB2 jne. täheskeemidele viidatakse ka kui Data Mart (id).

Kuup on mitmemõõtmelise salvestuse viide, kasutades OLAP-i tööriistu nagu Cognos, Hyperion jne.


Vastus 3:

Kui keegi viitab Data Warehouse'ile, viitavad nad Kimballi põhistele Star-skeemidele, Inmonil põhinevatele normaliseeritud andmelao skeemidele koos lavastuspiirkonna skeemidele, mis on füüsiliselt loodud relatsiooniandmebaasis, näiteks Oracle, DB2 jne. täheskeemidele viidatakse ka kui Data Mart (id).

Kuup on mitmemõõtmelise salvestuse viide, kasutades OLAP-i tööriistu nagu Cognos, Hyperion jne.