Data Mining
Data mining är processen för att analysera stora mängder datum för att upptäcka mönster och annan information. Det utförs vanligtvis på databaser, som lagrar data i ett strukturerat format. Genom att "bryta" stora mängder data kan dold information upptäckas och användas för andra ändamål.
Exempel på datautvinning
Ett kreditkortsföretag kan använda datautvinning för att lära sig mer om sina medlemmars köpvanor. Genom att analysera inköp från kortinnehavare över hela USA kan företaget upptäcka shoppingvanor för olika demografi, såsom ålder, ras och plats. Denna information kan vara användbar för att erbjuda enskilda specifika kampanjer. Samma data kan också avslöja shoppingmönster i olika regioner i landet. Denna information kan vara värdefull för företag som vill marknadsföra eller starta företag i specifika stater.
Onlinetjänster, t.ex. Google och Facebook, min enorma mängder data för att ge riktat innehåll och annonser till sina användare. Google kan till exempel analysera sökning sökfrågor för att upptäcka populära sökningar för vissa områden och flytta dem till toppen av autoslutförtlistan (förslagen som visas när du skriver). Genom att bryta användaraktivitetsdata kan Facebook upptäcka populära ämnen bland olika åldersgrupper och tillhandahålla riktade annonser baserat på denna information.
Datautvinning används ofta för marknadsföringsändamål, men det har också många andra användningsområden. Till exempel kan vårdföretag använda data mining för att upptäcka kopplingar mellan vissa gener och sjukdomar. Väderföretag kan hämta data för att upptäcka vädermönster som kan hjälpa till att förutsäga framtida meteorologiska händelser. Trafikhanteringsinstitutioner kan bryta fordonsdata för att förutsäga framtida trafiknivåer och skapa lämpliga planer för motorvägar och gator.
Krav på datautvinning
Datautvinning kräver två saker - massor av data och mycket datorkraft. Ju mer organiserad data, desto lättare är det att bryta den för användbar information. Därför är det viktigt för alla organisationer som vill bedriva datautvinning att vara proaktiva när de väljer vilka data som ska loggas och hur de ska lagras. När det gäller att bryta data, superdatorer och datorkluster kan användas för att bearbeta petabyte av data.