a ténytáblák képezik az adattárház alapját. Ezek tartalmazzák a vállalat alapvető méréseit, és a legtöbb adattárház lekérdezés végső célpontja. Nincs értelme a ténytáblákat a zászlórúd fölé emelni, kivéve, ha azokat úgy választották ki, hogy tükrözzék a sürgős üzleti prioritásokat, gondosan garantálják a minőséget, és olyan dimenziók veszik körül őket, amelyek rengeteg belépési pontot biztosítanak a korlátozáshoz és a csoportosításhoz. Most, hogy kiköveztük az utat a ténytáblák számára, nézzük meg, hogyan lehet ezeket felépíteni és használni.
maradj hű a gabonához
az első és legfontosabb tervezési lépés az asztali gabona tényének deklarálása. A gabona az üzleti meghatározása annak, amit egy ténytábla rekord képvisel. A grain deklaráció nem olyan dimenziós idegen kulcsok listája, amelyek a ténytábla elsődleges kulcsát valósítják meg. Inkább a gabona a fizikai világ mérési eseményének leírása, amely mérést eredményez. Amikor az élelmiszerbolt szkenner méri a megvásárolt termék mennyiségét és felszámított árát, a gabona szó szerint a szkenner sípolása. Ez egy nagyszerű gabona meghatározás!
közvetlenül a gabona deklarálása után fel lehet sorolni az adott gabonánál létező dimenziós idegen kulcsokat. Azzal, hogy először a gabonát deklaráljuk, az idegen kulcsok megvitatása megalapozott és pontos marad.
a ténytábla valódi célja, hogy a mérési esemény során megfigyelt numerikus tények tárolója legyen. Rendkívül fontos, hogy ezek a tények igazak legyenek a gabonára. A “beep” élelmiszerbolt méri a beolvasott termék mennyiségét és kiterjesztett árát. Soha nem tartalmazunk más numerikus méréseket, amelyek megsértik a gabonát, mint például a teljes Kategória értékesítése vagy a termék értékesítése a múlt hónapban. Annak ellenére, hogy ezek a más mérések szűken hasznosak lehetnek a kiválasztott számításokhoz, nem kombinálhatók a tényrekordok között, és furcsa aszimmetriákat vezetnek be az alkalmazások tervezésében. Hagyjuk, hogy üzleti intelligencia (BI) eszközeink kiszámítsák ezeket a témán kívüli értékeket a lekérdezés idején, ahelyett, hogy keményen kódolnák őket a ténytábláinkba.
mindig arra törekszünk, hogy a tények additívak legyenek a dimenziókban, és pontosan összhangban legyenek a gabonával. Vegye figyelembe, hogy nem tároljuk a beolvasott termék árát, mert az ár nem kiegészítő. Inkább a kiterjesztett árat tároljuk, amely szabadon hozzáadható a termékekhez, üzletekhez, időkhöz és az összes többi dimenzióhoz.
felépítés a lehető legalacsonyabb gabonából
az adattárháznak mindig a lehető legalacsonyabb gabonán kifejezett ténytáblákra kell épülnie. A példában az élelmiszerbolt pénztárgépének sípolása a lehető legalacsonyabb gabona, mert nem osztható tovább. A legalacsonyabb szemcsés ténytáblák a legkifejezőbbek, mert az adott üzleti folyamathoz a lehető legteljesebb dimenzióval rendelkeznek. A beep grain fact tábla lehet Dátum, bolt, termék, pénztáros, menedzser, ügyfél, promóció, verseny, kosár, sőt időjárás, ha ezek az adatforrások rendezhetők a tényrekordok létrehozásakor. A magasabb szemű összesített táblázatok, mint például a kategóriák körzetenkénti értékesítése, nem tudják támogatni ezeket a dimenziókat, ezért sokkal kevésbé kifejezőek. Alapvető hiba, ha csak összesített táblázatokat teszünk közzé a végfelhasználók számára anélkül, hogy a legalacsonyabb szemcsés ténytáblákat fúrással simán hozzáférhetővé tennék. A legtöbb hamis elképzelés, miszerint a dimenziós táblázatok feltételezik az üzleti kérdést, ennek az alapvető hibának az elkövetéséből származik.
háromféle Ténytáblázat
Ha hű marad a gabonához, akkor az összes ténytáblája csak három típusba sorolható: tranzakciós gabona, periodikus pillanatkép gabona és felhalmozódó pillanatkép gabona (a három típus az 1.ábrán látható). Az 1. ábrán a dimenziókat FK (idegen kulcs)jelöli, a numerikus tényeket pedig dőlt betűvel.
a tranzakciós gabona egy pillanat alatt elvégzett mérésnek felel meg. Az élelmiszerbolt hangjelzése tranzakciós gabona. A mért tények csak az adott pillanatra és az adott eseményre érvényesek. A következő mérési esemény történhet egy milliszekundummal később vagy a következő hónapban, vagy soha. Így a tranzakciós gabona ténytáblák kiszámíthatatlanul ritkák vagy sűrűek. Nincs garancia arra, hogy az összes lehetséges idegen kulcs képviselteti magát. Transaction grain fact táblázatok óriási lehet, a legnagyobb tartalmazó sok milliárd rekordok.
a periódusos pillanatkép egy előre meghatározott időtartamnak felel meg, gyakran pénzügyi beszámolási időszaknak. Ábra 1 szemlélteti a havi számla időszakos pillanatkép. A mért tények összefoglalják a tevékenységet az időtartam alatt vagy annak végén. A periodikus pillanatkép-gabona erőteljes garanciát jelent arra, hogy az összes jelentéstevő entitás (például az 1.ábrán látható bankszámla) megjelenik minden pillanatképben, még akkor is, ha nincs tevékenység. Az időszakos pillanatkép kiszámíthatóan sűrű, az alkalmazások pedig támaszkodhatnak a kulcsok kombinációira, amelyek mindig jelen vannak. Az időszakos pillanatfelvétel ténytáblái is nagyok lehetnek. Egy 20 millió számlával és 10 éves történelemmel rendelkező banknak 2 lenne.4 milliárd rekord a havi számlán időszakos pillanatkép!
a felhalmozódó pillanatkép ténytáblázat egy kiszámítható folyamatnak felel meg, amelynek jól meghatározott kezdete és vége van. A megrendelések feldolgozása, a követelések feldolgozása, a szolgáltatáshívás felbontása és a főiskolai felvételi tipikus jelöltek. A megrendelés feldolgozásához szükséges felhalmozódó pillanatkép szemcséje például általában a megrendelés sora. Figyelje meg az ábrán 1 hogy több Dátum képviseli a megrendelés szokásos forgatókönyvét. A pillanatfelvételek felhalmozódását a rendszer felülvizsgálja és felülírja, ahogy a folyamat az elejétől a végéig halad. A pillanatfelvétel-ténytáblák felhalmozódása általában sokkal kisebb, mint a másik két típus, ennek a felülírási stratégiának köszönhetően.