Što je Data Mining? Osnove i njegove tehnike.

Temelj četvrte industrijske revolucije uvelike će ovisiti o podacima(Data) i povezivanju(Connectivity) . Usluge analize(Analysis Services) sposobne za razvoj ili stvaranje rješenja za rudarenje podataka imat će ključnu ulogu u tom pogledu. Mogao bi pomoći u analizi i predviđanju ishoda kupovnog ponašanja kupaca za ciljanje potencijalnih kupaca. Podaci(Data) će postati novi prirodni resurs i proces izdvajanja relevantnih informacija iz tih nerazvrstanih podataka poprimiti će ogromnu važnost. Kao takvo, ispravno razumijevanje pojma – Data Mining , njegovih procesa i primjene moglo bi nam pomoći u razvoju holističkog pristupa ovoj popularnoj riječi.

Osnove rudarenja podataka(Data Mining Basics) i njegove tehnike

rudarenje podataka

Data mining, također poznat kao Otkrivanje znanja u podacima(Knowledge Discovery in Data) ( KDD ) je pretraživanje velikih skladišta podataka kako bi se otkrili obrasci i trendovi koji nadilaze jednostavne analize. Ovo, međutim, nije rješenje u jednom koraku, već proces u više koraka i dovršava se u različitim fazama. To uključuje:

1] Prikupljanje podataka i priprema

Počinje prikupljanjem podataka i njihovom pravilnom organizacijom. To pomaže u značajnom poboljšanju šansi za pronalaženje informacija koje se mogu otkriti rudarenjem podataka

2] Izgradnja modela i evaluacija

Drugi korak u procesu rudarenja podataka je primjena različitih tehnika modeliranja. Oni se koriste za kalibraciju parametara na optimalne vrijednosti. Primijenjene tehnike uvelike ovise o analitičkim sposobnostima potrebnim za rješavanje niza organizacijskih potreba i donošenje odluke.

Pogledajmo ukratko neke tehnike rudarenja podataka. Utvrđeno je da većina organizacija kombinira dvije ili više tehnika rudarenja podataka kako bi formirale odgovarajući proces koji zadovoljava njihove poslovne zahtjeve.

Pročitajte(Read) : Što su veliki podaci?(What is Big Data?)

Tehnike rudarenja podataka

  1. Udruživanje –  (Association – )Udruživanje(Association) je jedna od nadaleko poznatih tehnika rudarenja podataka. U skladu s tim, uzorak se dešifrira na temelju odnosa između stavki u istoj transakciji. Stoga(Hence) je poznata i kao tehnika odnosa. Trgovci velikih robnih marki oslanjaju se na ovu tehniku ​​kako bi istražili kupovne navike/preference kupaca. Na primjer, kada prate kupovne navike ljudi, trgovci na malo mogu identificirati da kupac uvijek kupuje vrhnje kada kupuje čokolade, te stoga sugeriraju da sljedeći put kada kupe čokolade možda žele kupiti i vrhnje.
  2. Klasifikacija(Classification) – Ova tehnika rudarenja podataka razlikuje se od gore navedene po tome što se temelji na strojnom učenju i koristi matematičke tehnike kao što su linearno(Linear) programiranje, stabla odlučivanja , (Decision)neuronske(Neural)mreža. U klasifikaciji, tvrtke pokušavaju izgraditi softver koji može naučiti kako klasificirati stavke podataka u grupe. Na primjer, tvrtka može definirati klasifikaciju u aplikaciji koja "s obzirom na svu evidenciju zaposlenika koji su ponudili otkaz u tvrtki, predvidjeti broj pojedinaca koji će vjerojatno dati otkaz u tvrtki u budućnosti." Prema takvom scenariju, poduzeće može razvrstati evidenciju zaposlenika u dvije skupine i to “odlaze” i “ostaju”. Zatim može koristiti svoj softver za rudarenje podataka za razvrstavanje zaposlenika u odvojene grupe stvorene ranije.
  3. Grupiranje(Clustering)različito(Different)objekti sličnih karakteristika grupirani su u jedan klaster putem automatizacije. Mnogi takvi klasteri nastaju kako se klase i objekti (sa sličnim karakteristikama) postavljaju u njih sukladno tome. Da bismo to bolje razumjeli, razmotrimo primjer upravljanja knjigama u knjižnici. U knjižnici je ogromna zbirka knjiga u potpunosti katalogizirana. Predmeti iste vrste navedeni su zajedno. To nam olakšava pronalaženje knjige koja nas zanima. Slično, korištenjem tehnike grupiranja, možemo držati knjige koje imaju neke vrste sličnosti u jednom klasteru i dodijeliti mu prikladan naziv. Dakle, ako čitatelj želi zgrabiti knjigu relevantnu za njegov interes, mora samo otići do te police umjesto da pretražuje cijelu knjižnicu. Dakle, tehnika klasteriranja definira klase i stavlja objekte u svaku klasu,
  4. Predviđanje(Prediction) – Predviđanje je tehnika rudarenja podataka koja se često koristi u kombinaciji s drugim tehnikama rudarenja podataka. Uključuje analizu trendova, klasifikaciju, podudaranje uzoraka i odnos. Analizom prošlih događaja ili instanci u odgovarajućem slijedu može se sigurno predvidjeti budući događaj. Na primjer, tehnika analize predviđanja može se koristiti u prodaji za predviđanje buduće dobiti ako je prodaja odabrana kao nezavisna varijabla, a profit kao varijabla ovisna o prodaji. Zatim, na temelju povijesnih podataka o prodaji i dobiti, može se nacrtati prilagođena regresijska krivulja koja se koristi za predviđanje dobiti.
  5. Stabla odlučivanja(Decision trees) – U stablu odluka počinjemo s jednostavnim pitanjem koje ima više odgovora. Svaki odgovor vodi do daljnjeg pitanja koje pomaže klasificirati ili identificirati podatke kako bi se mogli kategorizirati ili kako bi se na temelju svakog odgovora moglo napraviti predviđanje. Na primjer, koristimo sljedeće stablo odlučivanja kako bismo odredili hoćemo li igrati kriket ODI ili ne : Stablo odlučivanja za rudarenje podataka(Data Mining Decision Tree) : Počevši od korijenskog čvora, ako vremenska prognoza tada predviđa kišu, trebali bismo izbjegavati utakmicu za taj dan. Alternativno, ako je vremenska prognoza vedra, trebali bismo odigrati utakmicu.

Data Mining je u središtu analitičkih napora u raznim industrijama i disciplinama kao što su komunikacije, osiguranje(Insurance) , obrazovanje(Education) , proizvodnja(Manufacturing) , bankarstvo(Banking) i maloprodaja(Retail) i još mnogo toga. Stoga je prije primjene različitih tehnika bitno imati točne informacije o tome.



About the author

Pozdrav potencijalnim poslodavcima! Vrlo sam iskusan softverski inženjer s više od 7 godina iskustva u tom području. Znam kako dizajnirati i razvijati aplikacije za Windows 7 i na svom profilu imam širok raspon preporuka za Cool web stranice. Moje vještine i iskustvo nude mi odličan izbor za svaku tvrtku koja traži talentiranog pojedinca s dobrim vještinama upravljanja projektima, znanjem programiranja i iskustvom u razvoju web stranica.



Related posts