Broušení dokumentů
Broušení dokumentů je proces analýzy dokumenty extrahovat smysluplná data. Termín je často spojován s počítačovým hackingem, protože hackeři může „brousit“ dokumenty a odhalit důvěrná data. Broušení dokumentů se však používá také pro nemalární účely. Mezi příklady patří identifikace neznámého typy souborů a prohlížení souboru metadat.
Je možné provést broušení dokumentů na obou prostý text a dvojitý soubory.
Textové soubory
Broušení textových souborů je jednoduchý proces, protože ukládají data jako prostý text. Můžete hledat znaků a řetězce v textovém dokumentu pomocí nástroje jako grep nebo jiný vyhledávací nástroj. Protože zpracování textu je relativně rychlá operace počítače, je možné brousit několik velkých dokumentů za méně než sekundu.
Mezi běžné typy textových souborů zaměřených na broušení dokumentů patří soubory protokolu (.LOG, . TXT) a konfigurační soubory (KONF, .CNF). Pokud hacker získá přístup k Webový servernapříklad může v těchto souborech hledat uživatelské jména, heslaa další důvěrné údaje.
Binární soubory
Binární soubory mohou obsahovat nějaký prostý text, ale ukládají také binární soubory datum - 1 s a 0 s. Je obtížnější brousit binární data, protože je nelze prohledávat pomocí nástroje pro textové vyhledávání. Mnoho binárních souborů je navíc uloženo v proprietárním formátu formát souboru, což je obtížné analyzovat bez odpovídajících aplikace. Proto se binární broušení dokumentů obvykle zaměřuje na hlavička a zápatí dokumentu, který může obsahovat prostý text. Může také usilovat o extrakci metadat souboru.
Mnoho binárních souborů obsahuje informace o typu souboru v záhlaví souboru soubor. Například v ukázkovém obrázku písmena „PNG“ v záhlaví označují, že soubor je a PNG obraz. Tyto informace jsou užitečné pro identifikaci typu souboru, protože nemá a přípona souboru. Podobně digitální fotografie často obsahují skryté EXIF data uložená při pořízení fotografie. Program pro prohlížení obrázků nebo broušení dokumentů skript může být schopen tyto informace zjistit a extrahovat.