Как открыть действительно большие текстовые и CSV-файлы

MS Excel может отображать 1 048 576 строк. Хотя при обычном использовании это может показаться очень большим числом, существует множество сценариев, в которых этого недостаточно.

Независимо от того, просматриваете ли вы файлы журналов или большие наборы данных, легко найти файлы CSV с миллионами строк или огромные текстовые файлы. Поскольку Excel не может поддерживать такие большие файлы, как именно вы их открываете? Давай выясним.

Почему обычные текстовые редакторы(Normal Text Editors) не могут открывать действительно большие файлы(Open Really Large Files) ?

Компьютер имеет гигабайты памяти, так почему же текстовые редакторы не могут открывать большие файлы?

Здесь действуют два фактора. Некоторые приложения имеют жестко запрограммированное ограничение на объем данных, которые они могут отображать. Неважно, сколько памяти у вашего ПК, они просто не будут ее использовать.

Вторая проблема — оперативная память(RAM) . Многие текстовые редакторы не имеют жесткого ограничения на количество строк, но не могут отображать большие файлы из-за нехватки памяти. Они загружают весь файл в системную оперативную память(RAM) , поэтому, если этой памяти недостаточно, процесс завершается ошибкой.

Способ №1: Использование бесплатных редакторов

Лучший способ просматривать очень большие текстовые файлы — использовать… текстовый редактор. Не просто текстовый редактор, а инструменты, предназначенные для написания кода. Такие приложения обычно могут без проблем обрабатывать большие файлы и бесплатны.

Средство просмотра больших текстовых файлов(Large Text File Viewer) , пожалуй, самое простое из этих приложений. Он действительно прост в использовании, работает быстро и требует очень мало ресурсов. Единственный минус? Он не может редактировать файлы. Но если вы хотите просматривать только большие CSV -файлы, это лучший инструмент для работы.

Для редактирования больших текстовых файлов вам также следует попробовать Emacs . Первоначально созданный для систем Unix , он прекрасно работает и в Windows и может работать с большими файлами. Точно так же Neovim и Sublime Text — это две легкие IDE(IDEs) , которые можно использовать для открытия текстовых файлов CSV размером в гигабайт.(CSV)

Если все, что вам нужно, — это поиск данных в больших файлах журналов, то klogg — это именно то, что вам нужно. Это приложение, являющееся обновленной версией популярного glogg , позволяет с легкостью выполнять сложные операции поиска в огромных текстовых файлах. Поскольку файлы журналов, созданные компьютером, часто могут содержать миллионы строк, klogg предназначен для работы с такими размерами файлов без проблем.

Метод(Method) № 2: разделить на несколько частей(Into Multiple Parts)

Вся проблема с попыткой открыть большие CSV - файлы в том, что они слишком велики. Но что, если вы разделите их на несколько файлов меньшего размера?

Это популярное решение, поскольку оно обычно не требует изучения интерфейса нового текстового редактора. Вместо этого вы можете использовать один из множества разделителей CSV, доступных в Интернете(one of the many CSV splitters available online) , чтобы разбить большой файл на несколько файлов, которые легко открыть. После этого к каждому из этих файлов можно получить доступ в обычном режиме.

Однако это не лучший способ сделать это. Разделение большого файла часто может привести к странным опечаткам или неправильно сконфигурированным файлам. Кроме того, открытие каждого фрагмента по отдельности не позволяет фильтровать все данные сразу.

Способ № 3: импорт в базу данных

Текстовые файлы и файлы .csv размером до нескольких гигабайт обычно представляют собой большие наборы данных. Так почему бы просто не импортировать их в базу данных?

SQL является наиболее распространенным языком разметки баз данных, используемым в наши дни. Существует множество используемых версий SQL(many versions of SQL) , но, вероятно, самой простой из них является MySQL . И, как назло, есть возможность конвертировать файл CSV в таблицу MySQL(convert a CSV file into a MySQL table) .

Это ни в коем случае не самый простой способ работы с большими CSV - файлами, поэтому мы рекомендуем его только в том случае, если вы хотите регулярно работать с большими наборами данных. Если MySQL кажется слишком сложным, вы всегда можете вместо этого импортировать файлы .csv в MS Access .

Метод(Method) № 4: анализ с помощью библиотек Python

Когда вы работаете с файлом .csv с миллионами строк данных, вы, очевидно, не сможете разобраться в нем вручную. Вероятно, вы захотите отфильтровать данные и выполнить определенные запросы, чтобы понять тенденции.

Так почему бы не написать код(write Python code) на Python именно для этого?

Опять же, это не самый удобный метод. Хотя Python — не самый сложный для изучения язык программирования(Python isn’t the hardest programming language to learn) , он представляет собой программирование, поэтому он может быть не лучшим подходом для вас. Тем не менее, если вам приходится ежедневно анализировать очень большие CSV -файлы, вы можете (CSV)автоматизировать эту задачу с помощью некоторого кода Python(automate the task with some Python code) .

Способ № 5: с помощью инструментов премиум-класса

Текстовые редакторы, которые мы видели в первом методе, не были специальными инструментами, предназначенными для обработки CSV . Это были инструменты общего назначения, которые также можно было использовать для работы с большими файлами .csv.

А как насчет специализированных приложений? Неужели нет приложений, созданных для решения этой проблемы?

Есть, на самом деле. CSV Explorer , например, основывается на том самом процессе, который мы описали в последних двух методах ( база данных SQL и код Python ), для создания приложения, способного просматривать и редактировать CSV -файлы любого размера. Вы можете делать все, что ожидаете от инструмента для работы с электронными таблицами, например создавать графики или фильтровать данные в CSV Explorer .

Другой вариант — UltraEdit . В отличие от предыдущего инструмента, это предназначено не только для файлов .csv, но и для текстовых файлов любого типа. Он может легко обрабатывать текстовые и CSV - файлы размером до нескольких гигабайт с интерфейсом, аналогичным многим из бесплатных редакторов, которые мы обсуждали ранее. 

Единственным недостатком этих инструментов является то, что они являются приложениями премиум-класса, и для их использования требуется платная лицензия. Вы всегда можете попробовать их бесплатные пробные версии, чтобы проверить их функции, или если вы используете их только один раз.

Как лучше всего открывать большие текстовые(Large Text) и CSV-файлы(CSV Files) ?

В наш век больших данных(Big Data) нередко встречаются текстовые файлы размером в гигабайты, которые трудно даже просмотреть с помощью встроенных инструментов, таких как « Блокнот»(Notepad) или MS Excel . Чтобы иметь возможность открывать такие большие файлы CSV , вам необходимо загрузить и использовать стороннее приложение.

Если все, что вам нужно, это просматривать такие файлы, то программа просмотра больших текстовых файлов(Large Text File Viewer) — лучший выбор для вас. Для их фактического редактирования вы можете попробовать многофункциональный текстовый редактор, такой как Emacs , или воспользоваться инструментом премиум-класса, таким как CSV Explorer .

Такие методы, как разделение CSV - файла или его импорт в базу данных, требуют слишком много шагов. Вам лучше получить платную лицензию на специальный инструмент премиум-класса, если вы много работаете с огромными текстовыми файлами.



About the author

Я компьютерный техник с более чем 10-летним опытом, в том числе 3 года в качестве 店員. У меня есть опыт работы с устройствами Apple и Android, и я особенно хорошо разбираюсь в ремонте и обновлении компьютеров. Я также люблю смотреть фильмы на своем компьютере и использовать свой iPhone для съемки фотографий и видео.



Related posts