Kako otvoriti stvarno velike tekstualne i CSV datoteke

MS Excel može prikazati 1.048.576 redaka. Iako se to može činiti kao jako velik broj u normalnoj upotrebi, postoji mnogo scenarija u kojima to nije sasvim dovoljno.

Bilo da gledate datoteke dnevnika ili velike skupove podataka, lako je naići na CSV datoteke s milijunima redaka ili goleme tekstualne datoteke. Budući da Excel ne može podržati datoteke ovako velike, kako ih točno otvoriti? Hajde da vidimo.

Zašto normalni uređivači teksta(Normal Text Editors) ne mogu otvoriti stvarno velike datoteke(Open Really Large Files) ?

Računalo ima gigabajte prostora za pohranu, pa zašto uređivači teksta ne mogu otvoriti velike datoteke?

Ovdje su u igri dva faktora. Neke aplikacije imaju tvrdo kodirano ograničenje koliko podataka mogu prikazati. Nije važno koliko memorije ima vaše računalo, oni ga jednostavno neće koristiti.

Drugi problem je RAM . Mnogi uređivači teksta nemaju čvrsto ograničenje broja redaka, ali ne mogu prikazati velike datoteke zbog ograničenja memorije. Oni učitavaju cijelu datoteku u RAM sustava , pa ako ova memorija nije dovoljno velika, proces ne uspijeva.

Metoda #1: Korištenje besplatnih uređivača

Najbolji način za pregled iznimno velikih tekstualnih datoteka je korištenje… uređivača teksta. Ne bilo koji uređivač teksta, već alati namijenjeni pisanju koda. Takve aplikacije obično mogu bez problema rukovati velikim datotekama i besplatne su.

Large Text File Viewer vjerojatno je najjednostavniji od ovih aplikacija. Doista je jednostavan za korištenje, radi brzo i ima vrlo mali otisak resursa. Jedina mana? Ne može uređivati ​​datoteke. Ali ako želite vidjeti samo velike CSV datoteke, ovo je najbolji alat za taj posao.

Za uređivanje velikih tekstualnih datoteka, trebali biste isprobati Emacs . Izvorno stvoren za Unix sustave, savršeno dobro radi i na Windowsima(Windows) i može rukovati velikim datotekama. Slično, Neovim i Sublime Text su dva lagana IDE -a koja se mogu koristiti za otvaranje (IDEs)CSV tekstualnih datoteka veličine gigabajta .

Ako sve što tražite je traženje podataka kroz velike datoteke dnevnika, onda je klogg samo alat za vas. Ažurirajuća vilica popularnog glogg-a(glogg) , ova aplikacija vam omogućuje da s lakoćom izvodite složene operacije pretraživanja kroz ogromne tekstualne datoteke. Budući da računalno generirane datoteke dnevnika često mogu imati milijune redaka, klogg je dizajniran za rad s takvim veličinama datoteka bez problema.

Metoda(Method) #2: Podijelite na više dijelova(Into Multiple Parts)

Cijeli problem s pokušajem otvaranja velikih CSV datoteka je u tome što su prevelike. Ali što ako ih podijelite u više manjih datoteka?

Ovo je popularno rješenje jer općenito ne uključuje učenje sučelja novog uređivača teksta. Umjesto toga, možete upotrijebiti jedan od mnogih CSV razdjelnika dostupnih na mreži(one of the many CSV splitters available online) kako biste veliku datoteku razdvojili u niz datoteka koje se lako otvaraju. Svakoj od ovih datoteka tada se može normalno pristupiti.

Međutim, ovo nije najbolji način za to. Dijeljenje velike datoteke često može dovesti do čudnih pogrešaka pri upisu ili nepravilno konfiguriranih datoteka. Štoviše, otvaranje svakog dijela zasebno sprječava vas da filtrirate cijele podatke odjednom.

Metoda #3: Uvoz u bazu podataka

Tekstualne i .csv datoteke koje se protežu na više gigabajta općenito su veliki skupovi podataka. Pa zašto ih jednostavno ne uvesti u bazu podataka?

SQL je najčešći jezik za označavanje baze podataka koji se danas koristi. U upotrebi su mnoge verzije SQL(many versions of SQL) -a, ali najlakša je vjerojatno MySQL . I na sreću, moguće je pretvoriti CSV datoteku u MySQL tablicu(convert a CSV file into a MySQL table) .

Ovo nipošto nije najjednostavniji način rada s velikim CSV datotekama, stoga ga preporučujemo samo ako želite redovito raditi s velikim skupovima podataka. Ako MySQL zvuči preteško, uvijek možete uvesti svoje .csv datoteke u MS Access .

Metoda(Method) #4: Analizirajte s Python knjižnicama

Kada radite s .csv datotekom s milijunima redaka podataka, očito nećete moći ručno shvatiti puno smisla. Vjerojatno želite filtrirati podatke i pokrenuti određene upite kako biste razumjeli trendove.

Pa zašto onda ne napisati Python kod(write Python code) za to?

Još jednom, ovo nije najprikladnija metoda. Iako Python nije najteži programski jezik za naučiti(Python isn’t the hardest programming language to learn) , on je kodiranje, tako da možda nije najbolji pristup za vas. Ipak, ako morate svakodnevno analizirati stvarno velike CSV datoteke, možda biste željeli (CSV)automatizirati zadatak s nekim Python kodom(automate the task with some Python code) .

Metoda #5: s vrhunskim alatima

Uređivači teksta koje smo vidjeli u prvoj metodi nisu bili namjenski alati namijenjeni za obradu CSV -a. (CSV)Bili su to alati opće namjene koji su se mogli koristiti i za rad s velikim .csv datotekama.

Ali što je sa specijaliziranim aplikacijama? Ne postoje li aplikacije koje su stvorene za rješavanje ovog problema?

Postoje, zapravo. CSV Explorer , na primjer, temelji se na samom procesu koji smo opisali u posljednje dvije metode ( SQL baza podataka i Python kod) za stvaranje aplikacije sposobne za pregledavanje i uređivanje CSV datoteka bilo koje veličine. Možete učiniti sve što očekujete od alata za proračunske tablice kao što je stvaranje grafikona ili filtriranje podataka u CSV Exploreru(CSV Explorer) .

Druga opcija je UltraEdit . Za razliku od prethodnog alata, ovo nije namijenjeno samo za .csv datoteke već za bilo koju vrstu tekstualne datoteke. Lako može rukovati tekstualnim i CSV datotekama u rasponu od nekoliko gigabajta, sa sučeljem sličnim mnogim besplatnim uređivačima o kojima smo ranije raspravljali. 

Jedini nedostatak ovih alata je to što su premium aplikacije, koje zahtijevaju da dobijete plaćenu licencu da biste ih mogli koristiti. Uvijek možete isprobati njihove besplatne probne verzije kako biste provjerili njihove značajke ili ako imate samo jednokratnu upotrebu.

Koji je najbolji način za otvaranje velikih tekstualnih(Large Text) i CSV datoteka(CSV Files) ?

U ovo doba velikih podataka(Big Data) nije neuobičajeno naletjeti na tekstualne datoteke koje se kreću u gigabajtima, što može biti teško čak i pregledati pomoću ugrađenih alata kao što su Notepad ili MS Excel . Da biste mogli otvoriti tako velike CSV datoteke, morate preuzeti i koristiti aplikaciju treće strane.

Ako je sve što želite vidjeti takve datoteke, onda je Large Text File Viewer najbolji izbor za vas. Za njihovo stvarno uređivanje, možete isprobati uređivač teksta bogat značajkama kao što je Emacs ili odabrati vrhunski alat kao što je CSV Explorer .

Tehnike poput dijeljenja CSV datoteke ili uvoza u bazu podataka uključuju previše koraka. Bolje vam je da dobijete plaćenu licencu namjenskog premium alata ako često radite s ogromnim tekstualnim datotekama.



About the author

Računalni sam tehničar s više od 10 godina iskustva u industriji zabave. Znam kako popraviti računala i tablete, poboljšati njihove performanse i poboljšati njihovu upotrebljivost. Osim toga, također vam mogu pomoći s vašim potrebama za zabavom davanjem savjeta o tome kako gledati TV ili preuzimati filmski sadržaj na vaš iPhone ili Mac.



Related posts