Što je Data Mining? Osnove i njegove tehnike.
Temelj četvrte industrijske revolucije uvelike će ovisiti o podacima(Data) i povezivanju(Connectivity) . Usluge analize(Analysis Services) sposobne za razvoj ili stvaranje rješenja za rudarenje podataka imat će ključnu ulogu u tom pogledu. Mogao bi pomoći u analizi i predviđanju ishoda kupovnog ponašanja kupaca za ciljanje potencijalnih kupaca. Podaci(Data) će postati novi prirodni resurs i proces izdvajanja relevantnih informacija iz tih nerazvrstanih podataka poprimiti će ogromnu važnost. Kao takvo, ispravno razumijevanje pojma – Data Mining , njegovih procesa i primjene moglo bi nam pomoći u razvoju holističkog pristupa ovoj popularnoj riječi.
Osnove rudarenja podataka(Data Mining Basics) i njegove tehnike
Data mining, također poznat kao Otkrivanje znanja u podacima(Knowledge Discovery in Data) ( KDD ) je pretraživanje velikih skladišta podataka kako bi se otkrili obrasci i trendovi koji nadilaze jednostavne analize. Ovo, međutim, nije rješenje u jednom koraku, već proces u više koraka i dovršava se u različitim fazama. To uključuje:
1] Prikupljanje podataka i priprema
Počinje prikupljanjem podataka i njihovom pravilnom organizacijom. To pomaže u značajnom poboljšanju šansi za pronalaženje informacija koje se mogu otkriti rudarenjem podataka
2] Izgradnja modela i evaluacija
Drugi korak u procesu rudarenja podataka je primjena različitih tehnika modeliranja. Oni se koriste za kalibraciju parametara na optimalne vrijednosti. Primijenjene tehnike uvelike ovise o analitičkim sposobnostima potrebnim za rješavanje niza organizacijskih potreba i donošenje odluke.
Pogledajmo ukratko neke tehnike rudarenja podataka. Utvrđeno je da većina organizacija kombinira dvije ili više tehnika rudarenja podataka kako bi formirale odgovarajući proces koji zadovoljava njihove poslovne zahtjeve.
Pročitajte(Read) : Što su veliki podaci?(What is Big Data?)
Tehnike rudarenja podataka
- Udruživanje – (Association – )Udruživanje(Association) je jedna od nadaleko poznatih tehnika rudarenja podataka. U skladu s tim, uzorak se dešifrira na temelju odnosa između stavki u istoj transakciji. Stoga(Hence) je poznata i kao tehnika odnosa. Trgovci velikih robnih marki oslanjaju se na ovu tehniku kako bi istražili kupovne navike/preference kupaca. Na primjer, kada prate kupovne navike ljudi, trgovci na malo mogu identificirati da kupac uvijek kupuje vrhnje kada kupuje čokolade, te stoga sugeriraju da sljedeći put kada kupe čokolade možda žele kupiti i vrhnje.
- Klasifikacija(Classification) – Ova tehnika rudarenja podataka razlikuje se od gore navedene po tome što se temelji na strojnom učenju i koristi matematičke tehnike kao što su linearno(Linear) programiranje, stabla odlučivanja , (Decision)neuronske(Neural)mreža. U klasifikaciji, tvrtke pokušavaju izgraditi softver koji može naučiti kako klasificirati stavke podataka u grupe. Na primjer, tvrtka može definirati klasifikaciju u aplikaciji koja "s obzirom na svu evidenciju zaposlenika koji su ponudili otkaz u tvrtki, predvidjeti broj pojedinaca koji će vjerojatno dati otkaz u tvrtki u budućnosti." Prema takvom scenariju, poduzeće može razvrstati evidenciju zaposlenika u dvije skupine i to “odlaze” i “ostaju”. Zatim može koristiti svoj softver za rudarenje podataka za razvrstavanje zaposlenika u odvojene grupe stvorene ranije.
- Grupiranje(Clustering) – različito(Different)objekti sličnih karakteristika grupirani su u jedan klaster putem automatizacije. Mnogi takvi klasteri nastaju kako se klase i objekti (sa sličnim karakteristikama) postavljaju u njih sukladno tome. Da bismo to bolje razumjeli, razmotrimo primjer upravljanja knjigama u knjižnici. U knjižnici je ogromna zbirka knjiga u potpunosti katalogizirana. Predmeti iste vrste navedeni su zajedno. To nam olakšava pronalaženje knjige koja nas zanima. Slično, korištenjem tehnike grupiranja, možemo držati knjige koje imaju neke vrste sličnosti u jednom klasteru i dodijeliti mu prikladan naziv. Dakle, ako čitatelj želi zgrabiti knjigu relevantnu za njegov interes, mora samo otići do te police umjesto da pretražuje cijelu knjižnicu. Dakle, tehnika klasteriranja definira klase i stavlja objekte u svaku klasu,
- Predviđanje(Prediction) – Predviđanje je tehnika rudarenja podataka koja se često koristi u kombinaciji s drugim tehnikama rudarenja podataka. Uključuje analizu trendova, klasifikaciju, podudaranje uzoraka i odnos. Analizom prošlih događaja ili instanci u odgovarajućem slijedu može se sigurno predvidjeti budući događaj. Na primjer, tehnika analize predviđanja može se koristiti u prodaji za predviđanje buduće dobiti ako je prodaja odabrana kao nezavisna varijabla, a profit kao varijabla ovisna o prodaji. Zatim, na temelju povijesnih podataka o prodaji i dobiti, može se nacrtati prilagođena regresijska krivulja koja se koristi za predviđanje dobiti.
- Stabla odlučivanja(Decision trees) – U stablu odluka počinjemo s jednostavnim pitanjem koje ima više odgovora. Svaki odgovor vodi do daljnjeg pitanja koje pomaže klasificirati ili identificirati podatke kako bi se mogli kategorizirati ili kako bi se na temelju svakog odgovora moglo napraviti predviđanje. Na primjer, koristimo sljedeće stablo odlučivanja kako bismo odredili hoćemo li igrati kriket ODI ili ne : Stablo odlučivanja za rudarenje podataka(Data Mining Decision Tree) : Počevši od korijenskog čvora, ako vremenska prognoza tada predviđa kišu, trebali bismo izbjegavati utakmicu za taj dan. Alternativno, ako je vremenska prognoza vedra, trebali bismo odigrati utakmicu.
Data Mining je u središtu analitičkih napora u raznim industrijama i disciplinama kao što su komunikacije, osiguranje(Insurance) , obrazovanje(Education) , proizvodnja(Manufacturing) , bankarstvo(Banking) i maloprodaja(Retail) i još mnogo toga. Stoga je prije primjene različitih tehnika bitno imati točne informacije o tome.
Related posts
26 Najbolji softver za rudarenje podataka
Kako koristiti značajku automatske vrste podataka u Excelu
Postavljanje BitLockera nije uspjelo izvesti pohranu BCD (podaci o konfiguraciji pokretanja).
Kako upravljati ograničenjem upotrebe podataka u sustavu Windows 11/10
Nije moguće uvesti datoteku registra. Nisu svi podaci upisani u Registar
Besplatni softver za oporavak podataka: Oporavak izbrisanih datoteka i mapa
Uključite ili isključite dijagnostičke podatke o korištenju pripovjedača u sustavu Windows 10
Tko posjeduje IoT podatke? Proizvođač, krajnji korisnik ili neka treća strana?
Obrišite ili izbrišite povijest pregledavanja, kolačiće, podatke, predmemoriju u Edgeu
Snimanje na disk zasivljeno u sustavu Windows 10; Nije moguće snimiti DVD
Kako preimenovati niz podataka u Excel grafikonu ili grafikonu
Potrošnja velikih podataka. Koja je upotreba velikih podataka.
Kako koristiti značajku Umetanje podataka iz slike u Excelu
Ashampoo Burning Studio 2020 - Snimanje CD-a, DVD-a, Blu-raya BESPLATNO!
Alat za popravak dvostrukog pokretanja: popravi BCD podatke o konfiguraciji pokretanja
Onemogućite telemetriju i prikupljanje podataka u sustavu Windows 10 pomoću Planera zadataka
CD/DVD Data Recovery softver za oporavak podataka s CD DVD-a
Zašto tvrtke prikupljaju, prodaju, kupuju ili pohranjuju osobne podatke
Pogreška 0x8004010F, Outlook podatkovnoj datoteci nije moguće pristupiti
Izbrišite kolačiće, podatke web-mjesta, predmemoriju za određenu web stranicu: Chrome Edge Firefox