Data Mining и OLAP в больших финансовых и коммерческих базах данных
Data Mining (DM) - это набор "интеллектуальных" средств для глубокого
анализа больших объемов информации и обнаружения скрытых корреляций между
различными характеристиками данных. В результате анализа
найденных зависимостей можно сделать выводы о поведении и взаимном
влиянии различных объектов в окружающем мире и появляется возможность
более точно (читай "более прибыльно") строить стратегию и тактику бизнеса
Существенно, что традиционными методами обнаружить подобные закономерности
либо невозможно, либо это требует чрезмерного количества времени и денег. [подробнее...]
Решаемые задачи
Примеры решений / Продукты
Статьи по данной технологии:
1. "НОВОЕ ЭЛЬДОРАДО : ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В БИЗНЕСЕ"
2. "Портрет читателя в интерьере российского бизнеса"
Решаемые задачи :
Основными "потребителями интеллекта" по-прежнему являются банкиры,
финансисты, государственные структуры. Их типичные вопросы:
- На какие группы делятся клиенты компании ? Какая группа наиболее представительна ? Какая наиболее доходна ?
- Какие факторы способствуют увеличению числа продаж того или иного товара ?
- Какие события влияют на изменения фьючерсных котировок ?
- Какова общая картина политических настроений избирателей по регионам ?
Часто в качестве одного из контролируемых параметров выступает шкала времени - и тогда отображается динамика валютных торгов, прогнозы пополнения сырьевых запасов и эволюция взглядов сторонников президента.
Примеры решений / Продукты :
Наиболее известен, пример DM-системы для проверки кредитных карточек
American Express, на многие миллионы долларов сокративший ущерб от махинаций
с карточками.Агентство NASA с помощью системы SKICAT подготовило новое
издание звездного атласа Паламара. В уникальный каталог вошли изображения
и информационные материалы о 50 млн. известных галактик, содержащих около
2 млрд. звезд.Федерация атлетов США использует DM-пакет IDIS для выявления
долгосрочных факторов, влияющих на спортивные результаты легкоатлетов.
По заказу политиков, в университете Wisconsin-Milwaukee на основе IDIS
была разработана система, которая строит своеобразные "психологические
портреты" политических течений и блоков, представленных в парламенте,
анализируя результаты голосования по различным вопросам.По поручению
популярного компьютерного журнала PC Week/RE специалистами компании
ИнтерРусСофт с использованием специально настроенного пакета PolyAnalyst
(разработчик - компания Megaputer) была проведена обработка и анализ
результатов анкетирования подписчиков этого знаменитого издания.
Подробнее о технологии Data Mining и OLAP в больших финансовых и
коммерческих базах данных :
Современные DM-технологии способны не только находить корреляционные
зависимости, но и позволяют оценивать вероятность каждой гипотезы,
оперировать не только количественными, но и качественными параметрами
- "популярный", "прибыльный", "стабильный" и др.Важной возможностью
DM-технологий является автоматическая кластеризация и классификация данных.
Обычно пользователей интересует не только количество и размер кластеров,
но и расположение их центров (характеризующее "портрет" типичного представителя
данного класса объектов), четкость границ и многие другие параметры.Для решения
основной задачи DM-систем - выделения корреляционных зависимостей между данными
чаще всего используются три подхода - многомерный корреляционный анализ,
обработка гипотез по принципу "запрос-отчет" (query-and-reporting tools) и
т.н. "интеллектуальные агенты". Классификация и кластеризация данных
выполняется с помощью нового класса алгоритмов, являющихся развитием
нейронных сетей Кохонена и Гроссберга. Сеть Кохонена до недавнего времени
считалась единственным примером алгоритма автоматической классификации без
обучения и предобработки данных (кроме вырожденных случаев). Сейчас стали
появляться более мощные и быстрые комбинированные алгоритмы.
|