Výzkumníci společností Microsoft a Intel spolupracují na projektu, v jehož rámci využívají hluboké učení pro detekci a klasifikaci škodlivých kódů. Svůj přístup označují akronymem STAMINA – STAtic Malware-as-Image Network Analysis. Přesnost identifikace a klasifikace činí 99,07 procenta. Falešně pozitivních testů je 2,58 procenta.
V rámci vyvíjeného přístupu výzkumníci společností Microsoft a Intel, resp. Intel Labs převádějí vzorky malwaru, jeho binární kód, na obrázky o unifikovaném rozměru. Jednorozměrný tok nul a jedniček zkonvertují do standardizované dvourozměrné podoby. Pracují přitom pouze s odstíny šedi.
Změny velikosti obrázku, které vyžaduje různá velikost kódu malwaru, údajně nemají zásadní vliv na detekční schopnosti. Velké soubory naopak snižují efektivitu zpracování. Vzniklý obrázek lze analyzovat s pomocí dostupných algoritmů pro detekci obsahu fotografií.
Rozboru grafického výstupu již asistuje hloubkové učení, konkrétně DNN – Deep Neural Network. Hledá vzory, jež odpovídají různým typům již dříve zpracovaných škodlivých kódů. Výstupem celého procesu je zařazení malwaru do odpovídající kategorie, případně jeho přesné určení.
Pro výcvik detekčních schopností neuronové sítě použili výzkumníci společnosti Microsoft 2,2 milionu otisků, hashů, spustitelných infekčních souborů PE – Portable Executable. 60 procent z nich posloužilo pro trénink, 20 procent pro validaci a 20 procent pro testy. Míra úspěšné detekce dosáhla 99,07 procenta. Falešně pozitivních hlášení bylo 2,58 procenta.
stamina_540