Co je to skladování dat?
Skladování dat je elektronické ukládání velkého množství informací firmou nebo organizací. Skladování dat je životně důležitou součástí podnikové inteligence, která využívá analytické techniky obchodních dat.
Koncept skladování dat byl představen v roce 1988 vědci IBM Barry Devlin a Paul Murphy. Potřeba skladovat data se vyvinula s tím, jak se počítačové systémy staly složitějšími a zvládaly narůstající množství dat. Klíčovou knihou o skladování dat je WH Inmon's „Building the Warehouse“, která byla poprvé vydána v roce 1990 a od té doby byla několikrát dotisknuta.
Jak funguje skladování dat
Skladování dat slouží k lepšímu vhledu do výkonnosti společnosti porovnáním dat konsolidovaných z více heterogenních zdrojů. Datový sklad je navržen tak, aby spouštěl dotaz a analýzu historických dat získaných z transakčních zdrojů.
Jakmile jsou data začleněna do skladu, nemění se a nelze je měnit, protože datový sklad provádí analýzu událostí, ke kterým již došlo, a to zaměřením se na změny v čase. Skladovaná data musí být uložena způsobem, který je bezpečný, spolehlivý, snadno získatelný a snadno spravovatelný.
K vytvoření datového skladu jsou podniknuty určité kroky. Prvním krokem je extrakce dat, která zahrnuje sběr velkého množství dat z více zdrojových bodů. Poté, co byla data zkompilována, prochází čištěním dat, procesem česání dat za chyby a opravou nebo vyloučením všech nalezených chyb.
Vyčištěná data jsou poté převedena z formátu databáze do formátu skladu. Jakmile jsou data uložena ve skladu, data procházejí tříděním, konsolidací, sumarizací atd., Takže je koordinovanější a snadněji se používá. Postupně se do skladu přidává více dat, protože se aktualizuje více zdrojů dat.
Klíč s sebou
- Skladování dat je elektronické ukládání velkého množství informací firmou nebo organizací. Datový sklad je navržen tak, aby spouštěl dotaz a analýzu historických dat odvozených z transakčních zdrojů pro účely obchodní inteligence a dolování dat. Skladování dat se používá k zajištění většího vhled do výkonnosti společnosti porovnáním údajů konsolidovaných z různých heterogenních zdrojů.
Zvláštní úvahy: Dolování dat
Podniky mohou ukládat data pro použití při průzkumu a těžbě dat a hledat vzory informací, které jim pomohou zlepšit jejich obchodní procesy. Dobrý systém skladování dat může také usnadnit různým oddělením v rámci společnosti přístup k datům druhé strany.
Například datový sklad může společnosti umožnit snadno posoudit data prodejního týmu a pomoci při rozhodování o tom, jak zlepšit prodej nebo zefektivnit oddělení. Podnik by se mohl rozhodnout zaměřit se na nákupní zvyky svých zákazníků, aby mohl lépe umístit své produkty a zvýšit prodej.
S datovým skladováním může společnost shromažďovat historická data o výdajích svých zákazníků v minulosti - řekněme 20 let - a provádět analýzu těchto dat. Výsledné informace by mohly poskytnout nahlédnutí do preferencí jeho spotřebitelů; denní doba, měsíc nebo rok s větším prodejem; nebo zákazník s nejvyššími výdaji za rok.
Efektivní ukládání a správa dat také umožňují procesy, jako je iniciace cestovních rezervací a používání bankomatů.
Proces dolování dat je rozdělen do pěti kroků:
- Organizace shromažďují data a načítají je do svých datových skladů. Poté data ukládají a spravují, buď na interních serverech nebo v cloudu. Obchodní analytici, řídící týmy a odborníci na informační technologie přistupují k datům a určují, jak je chtějí uspořádat. Aplikační software pak třídí data na základě uživatelských výsledků. Koncový uživatel konečně prezentuje data ve snadno sdílitelném formátu, jako je graf nebo tabulka.
Skladování dat vs. databáze
Datový sklad nemusí být nutně stejný koncept jako standardní databáze. Databáze je transakční systém, který je nastaven tak, aby monitoroval a aktualizoval data v reálném čase, aby měla k dispozici pouze nejnovější data. Datový sklad je naprogramován tak, aby agregoval strukturovaná data za časové období. Například databáze může mít pouze nejnovější adresu zákazníka, zatímco datový sklad může mít všechny adresy, v nichž zákazník žil za posledních 10 let.
