Co je to Data Science?
Data science poskytuje smysluplné informace založené na velkém množství komplexních dat nebo velkých dat. Věda o údajích, nebo věda založená na údajích, kombinuje různé oblasti práce ve statistice a výpočtu pro interpretaci dat pro účely rozhodování.
Porozumění Data Science
Data jsou čerpána z různých sektorů, kanálů a platforem včetně mobilních telefonů, sociálních médií, webů elektronického obchodování, průzkumů zdravotnictví a vyhledávání na internetu. Nárůst množství dostupných údajů otevřel dveře novému oboru studia založenému na velkých datech - rozsáhlých souborech dat, které přispívají k vytvoření lepších operačních nástrojů ve všech odvětvích.
Neustále rostoucí přístup k datům je možný díky pokroku v technologii a technikách sběru. Na základě shromážděných informací lze sledovat nákupní chování a chování jednotlivců a provádět předpovědi.
Stále rostoucí data jsou však nestrukturovaná a vyžadují efektivní analýzu pro efektivní rozhodování. Tento proces je pro společnosti složitý a časově náročný - tedy vznik datové vědy.
Věda o údajích nebo věda založená na údajích používá k interpretaci dat pro účely rozhodování velká data a strojové učení.
Stručná historie vědy o datech
Termín věda o údajích existuje pro lepší část za posledních 30 let a byl původně používán jako náhrada za „počítačovou vědu“ v roce 1960. Přibližně o 15 let později byl tento termín použit k definování přehledu metod zpracování dat používaných v různých aplikace. V roce 2001 byla datová věda představena jako samostatná disciplína. Recenze Harvard Business Review zveřejnila v roce 2012 článek popisující roli vědce v oblasti dat jako „nejsmutnější práce 21. století“.
Klíč s sebou
- Pokroky v technologii, internetu, sociálních médiích a používání technologie mají zvýšený přístup k velkým datům. Vědecké údaje používají techniky, jako je strojové učení a umělá inteligence, k extrahování smysluplných informací ak předpovídání budoucích vzorců a chování. Pole dat věda roste s technologickým pokrokem a technikami sběru a analýzy velkých dat jsou sofistikovanější.
Jak se aplikuje věda o údajích
Věda o údajích zahrnuje nástroje z více oborů pro shromažďování datové sady, zpracování a odvozování poznatků ze sady dat, extrahování smysluplných dat ze sady a jejich interpretaci pro účely rozhodování. K disciplinárním oblastem, které tvoří pole vědy o údajích, patří těžba, statistika, strojové učení, analytika a programování.
Dolování dat aplikuje algoritmy na komplexní datovou sadu k odhalení vzorů, které se pak používají k extrahování užitečných a relevantních dat ze sady. Statistická opatření nebo prediktivní analytika využívají tato extrahovaná data k měření událostí, které se pravděpodobně stanou v budoucnu na základě toho, co údaje ukazují, ke kterým došlo v minulosti.
Strojové učení je nástroj umělé inteligence, který zpracovává velké množství dat, která by člověk za celý život nemohl zpracovat. Strojové učení zdokonaluje rozhodovací model prezentovaný v rámci prediktivní analýzy tím, že přizpůsobuje pravděpodobnost, že se událost stane, s tím, co se skutečně stalo v předpokládaném čase.
Pomocí analytiků analytik dat shromažďuje a zpracovává strukturovaná data z fáze strojového učení pomocí algoritmů. Analytik interpretuje, převádí a sumarizuje data do soudržného jazyka, kterému může rozhodovací tým porozumět. Věda o údajích je aplikována prakticky ve všech kontextech a jak se role vědce v oblasti dat vyvíjí, pole se rozšíří tak, aby zahrnovalo architekturu dat, datové inženýrství a správu dat.
Rychlá fakta
Podle IBM se očekává, že do roku 2020 vzroste poptávka po vědcích o údaje o 28%.
Datový vědec definován
Vědec údajů shromažďuje, analyzuje a interpretuje velké množství dat, v mnoha případech za účelem zlepšení fungování společnosti. Odborníci na datové vědce vyvíjejí statistické modely, které analyzují data a detekují vzorce, trendy a vztahy v souborech dat. Tyto informace lze použít k předpovědi chování spotřebitelů nebo k identifikaci obchodních a provozních rizik. Vědec údajů je často vypravěčem, který předkládá tvůrcům údajů informace o datech způsobem, který je pochopitelný a použitelný pro řešení problémů.
Data Science Today
Společnosti aplikují velká data a vědu o údajích na každodenní činnosti, aby přinesly spotřebitelům hodnotu. Bankovní instituce vydělávají na velkých datech, aby zlepšily své úspěchy v odhalování podvodů. Společnosti pro správu aktiv využívají velká data k předpovídání pravděpodobnosti, že cena cenných papírů bude v určitém čase stoupat nebo klesat.
Společnosti jako Netflix těží velká data, aby určily, jaké produkty dodávají svým uživatelům. Netflix také používá algoritmy k vytváření personalizovaných doporučení pro uživatele na základě jejich historie prohlížení. Datová věda se vyvíjí rychlým tempem a její aplikace budou i nadále měnit životy do budoucnosti.
