Hem : Filformat : Definition av dokumentslipning

Dokumentslipning

Dokumentslipning är analysprocessen dokument för att extrahera meningsfull data. Termen är ofta associerad med datorhackning, sedan hackare kan "slipa" dokument för att avslöja konfidentiella uppgifter. Dokumentslipning används dock också för icke-skadliga ändamål. Exempel är att identifiera okänt filtyper och visningsfil metadata.

Det är möjligt att utföra dokumentslipning på båda oformatterad text och binär filer.

Textfiler

Slipning av textfiler är en enkel process eftersom de lagrar data som vanlig text. Du kan söka efter tecken och strängar i ett textdokument med ett verktyg som grep eller ett annat sökverktyg. Eftersom textbehandling är en relativt snabb datoroperation kan det vara möjligt att slipa flera stora dokument på mindre än en sekund.

Vanliga textfiltyper riktade för dokumentslipning inkluderar loggfiler (.LOG, TXT) och konfigurationsfiler (.CONF, .CNF). Om en hackare får tillgång till en webbservertill exempel kan han söka efter dessa filer användarnamn, lösenordoch andra konfidentiella uppgifter.

Binära filer

Binära filer kan innehålla en del vanlig text, men de lagrar också binära filer datum - 1s och 0s. Det är svårare att slipa binär data eftersom det inte kan sökas med ett textsökningsverktyg. Dessutom sparas många binära filer i en egen filformat, vilket är svårt att parse utan motsvarande ansökan. Därför fokuserar binär dokumentslipning vanligtvis på rubrik och sidfot i ett dokument som kan innehålla vanlig text. Det kan också syfta till att extrahera filmetadata.

Många binära filer innehåller information om filtypen i rubriken på fil. I exempelbilden anger bokstäverna "PNG" i rubriken till exempel att filen är en PNG bild. Denna information är användbar för att identifiera filtypen eftersom den inte har en filtillägg. På samma sätt innehåller digitala foton ofta dolda EXIF data sparas när fotot togs. Ett bildvisningsprogram eller ett dokumentslipning skript kanske kan upptäcka och extrahera denna information.

TechLib - Tech Lib Computer Dictionary

Denna sida innehåller en teknisk definition av dokumentslipning. Det förklarar i dataterminologi vad Document Grinding betyder och är ett av många filformattermer i TechLib-ordlistan.

Alla definitioner på TechLib-webbplatsen är skrivna för att vara tekniskt korrekta men också lätta att förstå. Om du tycker att denna dokumentslipningsdefinition är till hjälp kan du referera till den med citatlänkarna ovan.