Što su veliki podaci - jednostavno objašnjenje s primjerom

Izraz Big Data sve se više koristi gotovo svugdje na planetu - online i offline. I to nije vezano samo za računala. Dolazi pod općim pojmom pod nazivom Informacijska tehnologija(Information Technology) , koja je sada dio gotovo svih drugih tehnologija i područja studija i poslovanja. Veliki podaci(Big Data) nisu velika stvar. Hipe oko toga sigurno je prilično velika stvar koja će vas zbuniti. Ovaj članak govori o tome što su Big Data . Također sadrži primjer kako je NetFlix koristio svoje podatke, odnosno Big Data , kako bi bolje služio potrebama svojih klijenata.

Što su Big Data

Što su Big Data

Podaci koji su ležali na serverima vaše tvrtke do jučer su bili samo podaci – sortirani i arhivirani. Odjednom je žargon Big Data postao popularan, a sada su podaci u vašoj tvrtki Big Data . Pojam pokriva svaki podatak koji je vaša organizacija do sada pohranila. Uključuje podatke pohranjene u oblacima, pa čak i URL-ove(URLs) koje ste označili. Vaša tvrtka možda nije digitalizirala sve podatke. Možda niste već strukturirali sve podatke. Ali tada su svi digitalni, papiri, strukturirani i nestrukturirani podaci s vašom tvrtkom sada Big Data .

Ukratko, svi podaci – kategorizirani ili ne – prisutni na vašim poslužiteljima zajednički se nazivaju VELIKI PODACI(BIG DATA) . Svi ti podaci mogu se koristiti za dobivanje različitih rezultata korištenjem različitih vrsta analiza. Nije nužno da sve analize koriste sve podatke. Različite analize koriste različite dijelove VELIKIH PODATAKA(BIG DATA) kako bi proizvele potrebne rezultate i predviđanja.

Veliki podaci(Big Data) u osnovi su podaci koje analizirate za rezultate koje možete koristiti za predviđanja i druge namjene. Kada koristite izraz Big Data , iznenada vaša tvrtka ili organizacija radi s najvišom informacijskom(Information) tehnologijom kako bi zaključila različite vrste rezultata koristeći iste podatke koje ste namjerno ili nenamjerno pohranjivali tijekom godina.

Koliko su veliki Big Data

U osnovi, svi kombinirani podaci su veliki podaci(Big Data) , ali mnogi se istraživači slažu da se velikim podacima –(Big Data –) kao takvima – ne može manipulirati pomoću uobičajenih proračunskih tablica i redovitih alata za upravljanje bazom podataka. Potrebni su im posebni alati za analizu kao što je Hadoop (proučit ćemo to u zasebnom postu) kako bi se svi podaci mogli analizirati odjednom (mogu uključivati ​​iteracije analize).

Suprotno gore navedenom, iako nisam stručnjak za tu temu, rekao bih da su podaci s bilo kojom organizacijom – velikom ili malom, organiziranom ili neorganiziranom – Big Data za tu organizaciju i da organizacija može odabrati vlastite alate za analizu podaci.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Obično su ljudi za analizu podataka stvarali različite skupove podataka na temelju jednog ili više uobičajenih polja kako bi analiza postala laka. U slučaju velikih podataka(Big Data) , nema potrebe za stvaranjem podskupova za njihovu analizu. Sada imamo alate koji mogu analizirati podatke bez obzira na to koliko su veliki. Vjerojatno sami ovi alati kategoriziraju podatke čak i dok ih analiziraju.

Smatram važnim spomenuti dvije rečenice iz knjige “Big Data” Jimmyja Gutermana(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-I-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Dakle, vidite da su i volumen i analiza važan dio velikih podataka(Big Data) .

Pročitajte(Read) : Što je Data Mining?(What is Data Mining?)

Koncepti velikih podataka

Ovo je još jedna točka s kojom se većina ljudi ne slaže. Neki stručnjaci kažu da su Big Data koncepti(Big Data Concepts) tri V:

  1. Volumen
  2. Brzina
  3. Raznolikost

Neki drugi konceptu dodaju još nekoliko V-ova:

  1. Vizualizacija
  2. Vjerodostojnost (pouzdanost)
  3. Varijabilnost i
  4. Vrijednost

Pojasnit ću koncepte velikih podataka(Big Data) u zasebnom članku jer ovaj post već postaje velik. Po mom mišljenju, prva tri V-a su dovoljna da objasne koncept velikih podataka(Big Data) .

Primjer velikih podataka – kako ga je NetFlix(Big Data Example – How NetFlix) koristio da riješi svoje probleme

Pred 2008. na NetFlixu(NetFlix) je došlo do kvara zbog kojeg su mnogi korisnici ostali u mraku. Dok su neki još uvijek mogli pristupiti uslugama strujanja, većina ih nije mogla. Neki kupci uspjeli su dobiti svoje iznajmljene DVD-ove(DVDs) , dok drugi nisu uspjeli. U blogu u Wall Street Journalu(Wall Street Journal) stoji da je Netflix upravo započeo streaming na zahtjev.

Ispad je natjerao upravu da razmišlja o mogućim budućim problemima i stoga; okrenuo se Big Data . Analizirao je područja s velikim prometom, osjetljive točke i mrežnu propusnost, itd. koristeći te podatke i radio na tome kako bi smanjio vrijeme zastoja ako se pojavi budući problem dok je postao globalan. Ovdje je poveznica(the link) na blog Wall Street Journala(Wall Street Journal Blog) , ako želite provjeriti primjere velikih podataka(Big Data) .

Gore navedeno sažima što su Big Data na laičkom jeziku. Možete to nazvati vrlo osnovnim uvodom. Planiram napisati još nekoliko članaka o povezanim čimbenicima kao što su – koncepti(Concepts) , analiza(Analysis) , alati(Tools) i upotreba velikih podataka(uses of Big Data) , velikih podataka 3 V , itd. U međuvremenu, ako želite nešto dodati gore navedenom, komentirajte i podijelite s nama.

Pročitajte sljedeće(Read next) : Što je Web Scraping ?



About the author

Ja sam web programer s iskustvom u radu sa sustavima Windows 11 i 10. Također sam mnogo godina korisnik Firefoxa i postao sam prilično vješt u korištenju potpuno nove igraće konzole Xbox One. Moji glavni interesi leže u razvoju softvera, posebno u web i mobilnom razvoju, kao i znanosti o podacima. Dobro sam upućen u razne računalne sustave i njihovu upotrebu, tako da mogu pružiti nepristrane povratne informacije o raznim programima ili uslugama koje biste mogli koristiti.



Related posts