интересно
Предыдущая | Содержание | Следующая

Системы накопления знаний.

Проблема приобретения и использования новых знаний является весьма актуальной и значимой для многих современных предприятий, стремящихся повысить свою эффективность. Один из путей решения этой проблемы связан с созданием прикладных программных систем , реализующих разнообразные математические и эмпирические методы анализа данных (статистический и спектральный анализ, распознавание образов и т.д.).

Однако, несмотря на значительные достижения в этой области, решение этой задачи для рядовых пользователей по-прежнему представляет собой сложную проблему. Дело в том, что большие объемы данных, разнообразие возникающих на практике задач, отсутствие формализованных моделей исследуемых объектов и необходимость получения априорных знаний о поступающих данных, ограничения существующих оптимальных математических алгоритмов, а также высокая разнородность и противоречивость данных, их неопределенность и наличие ошибок - все это существенно затрудняет процесс анализа данных и приобретения новых знаний.

В этой связи в рассматриваемой области в последнее время стали развиваться методы неклассического интеллектуального анализа данных, получивших название Data Mining и Knowledge Discovery (DM&KD). Как отмечается в , DM&KD представляет собой процесс управляемого данными (data-driven) извлечения зависимостей из больших баз данных. В этом процессе центральное место занимает порождение характеризующих анализируемые данные моделей, правил или функциональных зависимостей, которые затем представляются пользователю для оценки их интересности, релевантности и полезности. При этом под зависимостями понимаются не только традиционные аналитические соотношения, но и выделение кластеров (групп) или каких-либо шаблонов в данных, построение классификаций и порождение ассоциаций, установление причинных отношений и т.д. При этом применяются методы порождения деревьев решений, рассуждения на основе правил, генетические алгоритмы, нейронные сети, когнитивная графика. Как следствие, в существующих системах DM&KD (IBM Intelligent Miner, SAS Enterprise Miner и т.д.) пользователю предлагаются приближенные, не точные и не оптимальные решения, которые, тем не менее, позволяют получать важные результаты, правила и обобщения.

Вместе с тем, рассматриваемые системы на практике оказываются закрытыми, слишком сложными и жестко устроенными программами, узко специализированными и не позволяющими расширять, скрещивать или модифицировать используемые алгоритмы, работать в режиме непрерывного поступления данных (что особенно характерно, например, для систем е-коммерции в сети Интернет) и т.д. Можно утверждать, что в настоящее время отсутствуют универсальные и технологичные программные системы, пригодные для решения широкого спектра подобных задач (в диапазоне от задач кластеризации и исследования структурных зависимостей – до анализа временных рядов или распознавания образов), которые были бы достаточно мощными, гибкими, удобными и простыми в применении для неподготовленных пользователей.

В этой связи в настоящей работе предлагается новый подход к решению задач DM&KD, основанный на принципах построения открытых мультиагентных систем. В этом подходе свое воплощение впервые находят идеи самоорганизации и эволюции данных, противопоставляющие традиционным централизованным, жестким и последовательным алгоритмам решения задач динамичное и гибкое взаимодействие относительно простых программных агентов, представляющих интересы любых записей, образов, кластеров, формул и т.д. Очевидно, что на основе подобных принципов может быть создан качественно новый инструмент интеллектуального анализа данных, открытый и гибко адаптируемый к решаемой задаче, глубоко интегрируемый с другими системами, легко распараллеливаемый и т.п.