Dokumentslipning
Dokumentslipning är analysprocessen dokument för att extrahera meningsfull data. Termen är ofta associerad med datorhackning, sedan hackare kan "slipa" dokument för att avslöja konfidentiella uppgifter. Dokumentslipning används dock också för icke-skadliga ändamål. Exempel är att identifiera okänt filtyper och visningsfil metadata.
Det är möjligt att utföra dokumentslipning på båda oformatterad text och binär filer.
Textfiler
Slipning av textfiler är en enkel process eftersom de lagrar data som vanlig text. Du kan söka efter tecken och strängar i ett textdokument med ett verktyg som grep eller ett annat sökverktyg. Eftersom textbehandling är en relativt snabb datoroperation kan det vara möjligt att slipa flera stora dokument på mindre än en sekund.
Vanliga textfiltyper riktade för dokumentslipning inkluderar loggfiler (.LOG, TXT) och konfigurationsfiler (.CONF, .CNF). Om en hackare får tillgång till en webbservertill exempel kan han söka efter dessa filer användarnamn, lösenordoch andra konfidentiella uppgifter.
Binära filer
Binära filer kan innehålla en del vanlig text, men de lagrar också binära filer datum - 1s och 0s. Det är svårare att slipa binär data eftersom det inte kan sökas med ett textsökningsverktyg. Dessutom sparas många binära filer i en egen filformat, vilket är svårt att parse utan motsvarande ansökan. Därför fokuserar binär dokumentslipning vanligtvis på rubrik och sidfot i ett dokument som kan innehålla vanlig text. Det kan också syfta till att extrahera filmetadata.
Många binära filer innehåller information om filtypen i rubriken på fil. I exempelbilden anger bokstäverna "PNG" i rubriken till exempel att filen är en PNG bild. Denna information är användbar för att identifiera filtypen eftersom den inte har en filtillägg. På samma sätt innehåller digitala foton ofta dolda EXIF data sparas när fotot togs. Ett bildvisningsprogram eller ett dokumentslipning skript kanske kan upptäcka och extrahera denna information.