интересно
Предыдущая | Содержание | Следующая

Bestfit - пакет автоматизированной подгонки данных к лучшему распределению

BestFit относится к набору достаточно тесно связанных и дополняющих друг друга программных инструментов фирмы Palisade Corporation, предназначенных для исследования и экспертной оценки ситуаций, содержащих неопределенность, что помогает в разработке самых разнообразных моделей принятия решений в сфере деловой и финансовой активности. Так, подобные компьютерные модели сегодня активно используются при техническом анализе текущего состояния и перспектив развития фондовых рынков, а неопределенность ситуаций наиболее показательно выражается нечеткостью ("fuzzy") входных и промежуточных данных на различных этапах анализа.

BestFit базируется на осознании того, что математические свойства вероятностных распределений достаточно хорошо изучены и их можно использовать для предварительной подгонки, прецизионного статистического исследования и уточнения данных, изначально содержащих неопределенность. После достаточно незамысловатого сеанса, BestFit готов к экспорту таких "более определенных" данных через Clipboard практически в любое Windows-приложение и, особенно просто - в @RISK - пакет моделирования и анализа задач с присутствием фактора риска, одного из наиболее многообещающих и функционально разнообразных программных продуктов все той же фирмы Palisade Corporation.

BestFit обеспечивает начальный ввод дискретных и непрерывных данных в выборочной (Sample), плотной (Density) и кумулятивной (Cumulative) формах. Возможна предварительная фильтрация данных и задание ограничений на их последующий автоматический анализ.

Для автоматической подгонки BestFit предлагает достаточно представительный набор типов дискретных и непрерывных распределений, включающий нормальное (Normal), биномиальное (Binomial), геометрическое (Geometric). экспоненциальное (Exponential), распределение Парето (Раreto) а др. (числом более 30), с основными свойствами которых можно ознакомиться в соответствующих Help-ax пакета или же узнать о них подробно в Evans, Merran, Nicholas Hastings and Brian Peacock. Statistical Distributions, 2nd ed: John Wiley & Sons, lnc. New York, NY, 1993.

Первоначальные варианты типов распределения BestFit выбирает лишь после предварительной оценки максимального правдоподобия параметров. Действительно. ЭТОТ метод позволяет использовать выборочные характеристики генеральной совокупности и приводит, как правило, к состоятельным, незначительно смешенным, эффективным и достаточным оценкам. Далее, используя результаты предварительного этапа в качестве параметров, первоначальные варианты типов распределений оптимизируются методом Levenberg-Marquardt (Levenberg-Marquardt Method, The Art of Scientific Computing: Cambridge University Press, Cambridge, 1990, Chapter 14, pp 517-565.).

Проблема статистической проверки того, насколько выбранные распределения не противоречат уточняемым данным, разрешается BestFit прежде всего применением известного критерия согласия К. Пирсона (хи-квадрат). Кроме этого критерия используется также критерий Колмогорова-Смирнова и Anderson-Darling Test. После измерения соответствующих критериев, все выбираемые типы распределений оцениваются уже с точки зрения наивысшего критерия согласия и выстраиваются в соответствии со значением этого критерия.

Определив с помощью BestFit наиболее подходящее для Ваших данных распределение, его можно отобразить блоком статистических отчетов, а также визуализировать одним из четырех предлагаемых графических способов.

Далее остается лишь принять окончательное решение по выбору распределения. Правда, BestFit предложит Вам еще некоторые дополнительные средства анализа, в частности -возможность промоделировать ситуации выхода значений за границы существования выбираемых функций распределения.

Естественно, что BestFit не претендует (как и большинство подобных прагматических средств экспертно-консультационного типа) на единственно верное, оптимальное и абсолютно надежное решение, он лишь предлагает одно из имеющихся в его распоряжении распределений, которое в соответствии с его стратегией выбора и "разумением" - наиболее приемлемо для Ваших данных. Окончательное решение пользователь принимает все же на основании анализа и сопоставления всей многоплановой информация, которую предоставляет BestFit как с помощью соответствующих процедур статистической проверки гипотез в тех или иных доверительных интервалах, так и в виде разнообразных описательных статистик анализируемые данных (среднее арифметическое, мода, медиана, среднее и среднее квадратичное отклонение и т.д.).