АНАЛИЗ ДАННЫХ

Механизм анализа представляется совокупностью объектов встроенного языка 1С:Предприятие. Схема взаимодействия основных объектов механизма показана на рисунке.

Рис 11.1.

Объекты, которые могут быть использованы на сервере 1С:Предприятие отображены на схеме в блоках с белым фоном, объекты, используемые только на клиенте помещены в блоки с темным фоном.

Настройка колонок анализа данных - совокупность настроек входных колонок анализа данных. Для каждой колонки указывается тип данных, содержащихся в ней, роль выполняемая колонкой, дополнительные настройки, зависящие от типа производимого анализа.

Параметры анализа данных - набор параметров производимого анализа данных. Состав параметров зависит от типа анализа. Например, для кластерного анализа указывается количество кластеров, на которые необходимо разбить исходные объекты, тип измерения расстояния между объектами и т.п.

Исходные данные - источник данных для анализа. В качестве источника данных может выступать результат запроса, область ячеек табличного документа, таблица значений.

Анализатор - объект, непосредственно выполняющий анализ данных. Объекту устанавливается источник данных, задаются параметры. Результатом работы данного объекта является результат анализа данных, тип которого зависит от типа анализа.

Результат анализа данных - специальный объект, содержащий информацию о результате анализа. Для каждого вида анализа предусмотрен свой результат. Например, результатом анализа данных - дерево решения будет объект типа РезультатАнализаДанныхДеревоРешений. В дальнейшем результат может быть выведен в табличный документ при помощи построителя отчета анализа данных, может быть выведен посредством программного доступа к его содержимому, может быть использован для создания модели прогноза. Любой результат анализа данных может быть сохранен для последующего использования.

Модель прогноза - специальный объект, позволяющий выполнять прогноз на основании входных данных. Тип модели зависит от типа анализа данных. Например, модель, созданная для анализа данных - поиск ассоциаций будет иметь тип МодельПрогнозаПоискаАссоциаций. Такая модель сможет выдавать прогнозы типа: т.к. данный покупатель купил заданный набор товаров, то с определенно вероятностью он должен купить и другой набор товаров. На вход модели прогноза передается источник данных для прогноза. Результатом является таблица значений, содержащая прогнозируемые значения.

Выборка для прогноза - таблица значений, результат запроса или область табличного документа, содержащая информацию, по которой необходимо построить прогноза. Например, для модели прогноза - поиск ассоциаций, выборка может содержать перечень продуктов документа продажи. Результат же работы модели может рекомендовать, какие товары можно еще предложить покупателю.

Настройка колонок выборки - набор специальных объектов, показывающих соответствие между колонками модели прогноза и колонками выборки прогноза. Например, колонки модели прогноза с именем "Товар" может соответствовать колонка выборки "Номенклатура".

Настройка колонок результата — позволяет управлять тем, какие колонки будут помещены в результирующую таблицу модели прогноза. Например, для поиска ассоциаций мы можем вывести в результат номенклатуру, которую скорее всего приобретет клиент и вероятность подобной покупки.

Результат работы модели - таблица значений состоящая из колонок, как указано в настройках результирующих колонок и содержащая прогнозируемые данных. Конкретное содержимое определяется типом анализа.

Построитель отчета анализа данных - объект, позволяющий выводить отчет о результате анализа данных. Кроме того, построитель отчета предоставляет специальные объект для связи с данными, с тем, чтобы позволить пользователю интерактивно управлять параметрами анализа, настройкой колонок источника данных, настроек колонок модели прогноза и т.п.

Механизм позволяет выполнять следующие виды анализа:

· Общая статистика.

· Поиск ассоциаций.

· Поиск последовательностей - анализ наличия указанных в параметрах закономерностей.

· Дерево решений - схематическое представление процесса принятия решений по определенной задаче, изображаемое графически в виде древовидной структуры. Дерево решений представляет собой схему, описывающую процесс принятия решения и последствия выбора каждой из возможных альтернатив. Каждый вариант характеризуется вероятностью рисков и затратами или доходами от выбора каждой логической последовательности событий и будущих решений.

· Кластерный анализ - один из методов математической обработки данных является кластерный анализ. Кластерный анализ представляет собой средство исследования топологической структуры совокупности объектов. Он позволяет разбить множество объектов на классы близких между собой объектов статистической совокупности. Обнаруженные этим методом классы родственных элементов называются кластерами.