Что такое большие данные — простое объяснение с примером

Термин « большие данные(Big Data) » все чаще используется практически везде на планете — онлайн и офлайн. И это касается не только компьютеров. Он подпадает под общий термин « Информационные технологии(Information Technology) », который теперь является частью почти всех других технологий и областей исследований и бизнеса. Большие данные(Big Data) не имеют большого значения. Ажиотаж вокруг этого, безусловно, довольно большой, чтобы сбить вас с толку. В этой статье мы рассмотрим, что такое большие данные(Big Data) . Он также содержит пример того, как NetFlix использовала свои данные, а точнее, большие данные(Big Data) , чтобы лучше удовлетворять потребности своих клиентов.

Что такое большие данные

Что такое большие данные

Данные, лежащие на серверах вашей компании, до вчерашнего дня были просто данными — отсортированными и подшитыми. Внезапно стал популярен сленг Big Data , и теперь данные в вашей компании — это (Big Data)Big Data . Этот термин охватывает все без исключения данные, которые ваша организация хранила до сих пор. Он включает в себя данные, хранящиеся в облаках, и даже URL(URLs) -адреса , которые вы добавили в закладки. Возможно, ваша компания не оцифровала все данные. Возможно, вы еще не структурировали все данные. Но тогда все цифровые, бумажные, структурированные и неструктурированные данные вашей компании теперь являются большими данными(Big Data) .

Короче говоря, все данные, независимо от того, классифицированы они или нет, присутствующие на ваших серверах, в совокупности называются БОЛЬШИМИ ДАННЫМИ(BIG DATA) . Все эти данные можно использовать для получения разных результатов с помощью разных видов анализа. Не обязательно, чтобы все анализы использовали все данные. В другом анализе используются разные части БОЛЬШИХ ДАННЫХ(BIG DATA) для получения необходимых результатов и прогнозов.

Большие данные(Big Data) — это, по сути, данные, которые вы анализируете для получения результатов, которые можно использовать для прогнозов и других целей. При использовании термина « большие данные » ваша компания или организация вдруг начинает работать с (Big Data)информационными(Information) технологиями высшего уровня для получения различных типов результатов с использованием одних и тех же данных, которые вы намеренно или непреднамеренно хранили в течение многих лет.

Насколько велики большие данные

По сути, все объединенные данные представляют собой большие данные(Big Data) , но многие исследователи согласны с тем, что большими данными(Big Data –) как таковыми нельзя манипулировать с помощью обычных электронных таблиц и обычных инструментов управления базами данных. Им нужны специальные инструменты анализа, такие как Hadoop (мы изучим это в отдельном посте), чтобы все данные можно было проанализировать за один раз (может включать итерации анализа).

Вопреки вышесказанному, хотя я и не являюсь экспертом в этом вопросе, я бы сказал, что данные любой организации — большой или маленькой, организованной или неорганизованной — являются большими данными для этой организации, и что организация может выбирать свои собственные инструменты для анализа данных. данные.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Обычно для анализа данных люди создают разные наборы данных на основе одного или нескольких общих полей, чтобы упростить анализ. В случае с большими данными(Big Data) нет необходимости создавать подмножества для их анализа. Теперь у нас есть инструменты, которые могут анализировать данные независимо от того, насколько они огромны. Вероятно, эти инструменты сами классифицируют данные, даже когда они их анализируют.

Считаю важным упомянуть два предложения из книги «Большие данные» Джимми Гутермана(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-И-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Итак, вы видите, что и объем, и анализ являются важной частью больших данных(Big Data) .

Читать(Read) : Что такое интеллектуальный анализ данных?(What is Data Mining?)

Концепции больших данных

Это еще один момент, с которым большинство людей не согласны. Некоторые эксперты говорят, что концепции больших данных(Big Data Concepts) состоят из трех частей:

  1. Объем
  2. Скорость
  3. Разнообразие

Некоторые другие добавляют к концепции еще несколько V:

  1. Визуализация
  2. Правдивость (Надежность)
  3. Изменчивость и
  4. Ценность

Я расскажу о концепциях больших данных(Big Data) в отдельной статье, так как этот пост уже становится большим. На мой взгляд, первых трех букв достаточно, чтобы объяснить концепцию больших данных(Big Data) .

Пример больших данных — как NetFlix(Big Data Example – How NetFlix) использовал их для решения своих проблем

Ближе к 2008 году в NetFlix произошел сбой,(NetFlix) из-за которого многие клиенты остались в неведении. Хотя некоторые все еще могли получить доступ к потоковым сервисам, большинство из них не могли. Некоторым клиентам удалось получить арендованные DVD(DVDs) -диски, тогда как другим не удалось. В сообщении в блоге Wall Street Journal говорится , что Netflix только что начал потоковую передачу по запросу.

Отключение заставило руководство задуматься о возможных проблемах в будущем и, следовательно,; он обратился к большим данным(Big Data) . Он проанализировал области с высоким трафиком, уязвимые точки, пропускную способность сети и т. Д., Используя эти данные, и работал над этим, чтобы сократить время простоя, если в будущем возникнет проблема, когда она станет глобальной. Вот ссылка(the link) на блог Wall Street Journal(Wall Street Journal Blog) , если вы хотите ознакомиться с примерами больших данных(Big Data) .

Вышеизложенное резюмирует, что такое большие данные на языке непрофессионала. Вы можете назвать это очень простым введением. Я планирую написать еще несколько статей о сопутствующих факторах, таких как « Концепции(Concepts) », « Анализ»(Analysis) , « Инструменты(Tools) » и «Использование больших данных(uses of Big Data) », « Большие данные 3 V» и т. д . Между тем, если вы хотите что-то добавить к вышесказанному, прокомментируйте и поделитесь. с нами.

Читать дальше(Read next) : Что такое веб-скрейпинг(Web Scraping) ?



About the author

Я iOS-разработчик с более чем 10-летним опытом. Я специализируюсь на разработке приложений для iPhone и iPad. У меня есть опыт создания пользовательских потоков, создания пользовательских комплектов разработки (CDK) и работы с различными средами разработки приложений. В своей предыдущей работе я также разработал инструменты для управления магазином приложений Apple, в том числе инструмент управления продуктами и инструмент отправки приложений.



Related posts