Что такое интеллектуальный анализ данных? Основы и его методы.

Основа четвертой промышленной революции во многом будет зависеть от данных(Data) и возможностей подключения(Connectivity) . Службы Analysis Services(Analysis Services) , способные разрабатывать или создавать решения для интеллектуального анализа данных, будут играть ключевую роль в этом отношении. Это может помочь в анализе и прогнозировании результатов покупательского поведения клиентов для нацеливания на потенциальных покупателей. Данные(Data) станут новым природным ресурсом, и процесс извлечения соответствующей информации из этих несортированных данных приобретет огромное значение. Таким образом, правильное понимание термина Data Mining , его процессов и приложений может помочь нам в разработке целостного подхода к этому модному слову.

Основы интеллектуального анализа данных(Data Mining Basics) и его методы

сбор данных

Интеллектуальный анализ данных, также известный как обнаружение знаний в данных(Knowledge Discovery in Data) ( KDD ), заключается в поиске больших хранилищ данных для выявления закономерностей и тенденций, выходящих за рамки простого анализа. Однако это не одноэтапное решение, а многоэтапный процесс, который выполняется на различных этапах. Это включает:

1] Сбор и подготовка данных

Все начинается со сбора данных и их правильной организации. Это помогает значительно повысить шансы найти информацию, которая может быть обнаружена с помощью интеллектуального анализа данных.

2] Построение и оценка модели

Вторым шагом в процессе интеллектуального анализа данных является применение различных методов моделирования. Они используются для калибровки параметров до оптимальных значений. Используемые методы в значительной степени зависят от аналитических способностей, необходимых для удовлетворения целого ряда организационных потребностей и принятия решения.

Давайте кратко рассмотрим некоторые методы интеллектуального анализа данных. Выяснено, что большинство организаций объединяют два или более методов интеллектуального анализа данных вместе, чтобы сформировать соответствующий процесс, отвечающий их бизнес-требованиям.

Читать(Read) : Что такое большие данные?(What is Big Data?)

Методы интеллектуального анализа данных

  1. Ассоциация  . (Association – )Ассоциация(Association) является одним из широко известных методов интеллектуального анализа данных. При этом шаблон расшифровывается на основе взаимосвязи между элементами в одной и той же транзакции. Следовательно(Hence) , он также известен как метод отношений. Крупные розничные торговцы брендами полагаются на этот метод для изучения покупательских привычек/предпочтений клиентов. Например, отслеживая покупательские привычки людей, розничные продавцы могут определить, что покупатель всегда покупает сливки, когда они покупают шоколад, и, следовательно, предположить, что в следующий раз, когда они будут покупать шоколад, они также могут захотеть купить сливки.
  2. Классификация(Classification) . Этот метод интеллектуального анализа данных отличается от описанного выше тем, что он основан на машинном обучении и использует математические методы, такие как линейное(Linear) программирование, деревья решений , (Decision)нейронные сети.(Neural)сеть. В области классификации компании пытаются создать программное обеспечение, которое может научиться классифицировать элементы данных по группам. Например, компания может определить классификацию в приложении, которая «учитывая все записи о сотрудниках, которые предложили уйти из компании, предсказать количество людей, которые могут уйти из компании в будущем». При таком сценарии компания может классифицировать записи сотрудников на две группы, а именно «уходят» и «остаются». Затем он может использовать свое программное обеспечение для интеллектуального анализа данных, чтобы классифицировать сотрудников по отдельным группам, созданным ранее.
  3. Кластеризация(Clustering)разное(Different)объекты, обладающие схожими характеристиками, с помощью автоматизации группируются в один кластер. Многие такие кластеры создаются по мере того, как классы и объекты (со схожими характеристиками) размещаются в нем соответствующим образом. Чтобы лучше понять это, давайте рассмотрим пример управления книгами в библиотеке. В библиотеке обширная коллекция книг полностью каталогизирована. Элементы одного типа перечислены вместе. Это облегчает нам поиск интересующей нас книги. Точно так же, используя метод кластеризации, мы можем хранить книги, которые имеют некоторое сходство, в одном кластере и присваивать ему подходящее имя. Таким образом, если читатель хочет взять книгу, соответствующую его интересам, ему нужно всего лишь подойти к этой полке, а не искать во всей библиотеке. Таким образом, метод кластеризации определяет классы и помещает объекты в каждый класс,
  4. Прогнозирование(Prediction) . Прогнозирование — это метод интеллектуального анализа данных, который часто используется в сочетании с другими методами интеллектуального анализа данных. Он включает в себя анализ тенденций, классификацию, сопоставление с образцом и взаимосвязь. Анализируя прошлые события или случаи в надлежащей последовательности, можно с уверенностью предсказать будущее событие. Например, метод прогностического анализа можно использовать в продажах для прогнозирования будущей прибыли, если продажа выбрана как независимая переменная, а прибыль как переменная, зависящая от продажи. Затем на основе исторических данных о продажах и прибыли можно построить подогнанную кривую регрессии, которая используется для прогнозирования прибыли.
  5. Деревья решений(Decision trees) . В дереве решений мы начинаем с простого вопроса, на который есть несколько ответов. Каждый ответ приводит к следующему вопросу, чтобы помочь классифицировать или идентифицировать данные, чтобы их можно было классифицировать или чтобы можно было сделать прогноз на основе каждого ответа. Например, мы используем следующее дерево решений, чтобы определить, играть ли в крикет ODI : Дерево решений интеллектуального анализа данных(Data Mining Decision Tree) : начиная с корневого узла, если прогноз погоды предсказывает дождь, мы должны избегать матча на этот день. В качестве альтернативы, если прогноз погоды будет ясным, мы должны сыграть матч.

Интеллектуальный анализ данных(Data Mining) лежит в основе аналитических усилий в различных отраслях и дисциплинах, таких как связь, страхование(Insurance) , образование(Education) , производство(Manufacturing) , банковское дело(Banking) и розничная торговля(Retail) и многие другие. Поэтому перед применением различных методов важно иметь правильную информацию об этом.



About the author

Я веб-разработчик с опытом работы в Firefox и Google Docs. У меня есть степень в области делового администрирования Университета Флориды. Мои навыки включают в себя: разработку веб-сайтов, систему управления контентом (CMS), анализ данных и дизайн пользовательского интерфейса. Я опытный консультант, который может помочь вашей команде создавать эффективные веб-сайты и приложения.



Related posts