Data Mining
Dolování dat je proces analýzy velkého množství dat datum za účelem objevení vzorů a dalších informací. Obvykle se provádí na databáze, které ukládají data ve strukturovaném formátu. „Těžbou“ velkého množství dat lze skryté informace objevit a použít k jiným účelům.
Příklady dolování dat
Společnost vydávající kreditní karty může pomocí dolování dat zjistit více o nákupních návycích svých členů. Analýzou nákupů od držitelů karet z celých Spojených států může společnost objevit nákupní návyky pro různé demografické údaje, jako je věk, rasa a umístění. Tyto informace by mohly být užitečné při nabízení konkrétních propagačních akcí jednotlivcům. Stejná data mohou také odhalit nákupní vzorce v různých regionech země. Tyto informace by mohly být cenné pro společnosti, které chtějí inzerovat nebo zahájit podnikání v konkrétních státech.
Online služby, jako např Google a Facebook, těžit obrovské množství dat, abych svým uživatelům poskytoval cílený obsah a reklamy. Google může například analyzovat vyhledávání dotazy objevovat populární vyhledávání určitých oblastí a přesouvat je na začátek seznamu automatického doplňování (návrhy, které se objevují při psaní). Díky těžbě dat o činnosti uživatelů může Facebook objevit oblíbená témata mezi různými věkovými skupinami a na základě těchto informací poskytovat cílené reklamy.
Zatímco dolování dat se běžně používá pro marketingové účely, má také mnoho dalších využití. Například zdravotnické společnosti mohou pomocí dolování dat objevit vazby mezi určitými geny a chorobami. Společnosti o počasí mohou těžit data, aby objevily vzorce počasí, které mohou pomoci předpovědět budoucí meteorologické události. Instituce pro správu provozu mohou těžit data z automobilů, aby předpovídaly budoucí úrovně provozu a vytvářely vhodné plány pro dálnice a ulice.
Požadavky na dolování dat
Dolování dat vyžaduje dvě věci - spoustu dat a spoustu výpočetního výkonu. Čím jsou data organizovanější, tím snáze je získávat užitečné informace. Proto je důležité, aby každá organizace, která se chce zapojit do dolování dat, proaktivně vybírala, která data se mají protokolovat a jak je ukládat. Pokud jde o těžbu dat, superpočítače a výpočetní klastry lze použít ke zpracování petabajty dat.