НОВЫЕ ТЕХНОЛОГИИ В ИНФОРМАЦИОННО-БИБЛИОТЕЧНОМ ОБЕСПЕЧЕНИИ НАУЧНЫХ ИССЛЕДОВАНИЙ

А.И. НЕСТЕРЕНКО

АЛГОРИТМЫ ПОЛУЧЕНИЯ СТАТИСТИЧЕСКИХ СЕДЕНИЙ В БД

Для класса алгоритмов получения статистических сведений в БД предлагается рассматривать два типа:

а) количественные и б) качественные.

К количественным отнесены алгоритмы, целью которых является получение статистики по нескольким полям БД, удовлетворяющим задаваемым параметрам и логическим связям между ними.

К качественным - получение полной статистической картины для одного поля БД, как в абсолютном, так и в относительном значениях, возможно и при некоторых условиях для других полей.

Основной проблемой при разработке обоих типов алгоритмов является универсальность, имеющая свой характер для каждого типа.

Универсальность количественных алгоритмов получения статистики определяется как включение любого поля БД с требуемым значением для анализа.

Универсальность качественных алгоритмов определяется как анализ любого, в том числе и наперед не заданного, значения одного из полей БД. В итоге статистическая картина будет включать весь домен или ту его часть, которая удовлетворяет параметрам, задаваемым пользователем для других полей. Орфографические ошибки и различные варианты сокращений естественно будут трактоваться, как разные значения, что позволяет пользователю после получения статистической картины поля исправить ошибки или унифицировать сокращения.

Для количественных алгоритмов задача универсальности решается методом меню, где пользователь выбирает нужное ему поле в БД и вводит требуемый параметр. Затем алгоритмически производится анализ каждой записи в так называемом однопроходном режиме.

Для качественных алгоритмов решение задачи универсальности значительно сложнее. Алгоритмическое решение производится в трехпроходном режиме. Вначале пользователь в диалоге выбирает требуемое поле БД и далее, возможно, другие параметрические поля. Затем алгоритмически при первом проходе, решается задача составления домена или его части, удовлетворяющей задаваемым пользователем параметрам.

При втором проходе строится структура выбора вариантов значений анализируемого поля БД.

Третий проход уже как обычно производит подсчет числа вариантов.

Заканчивается работа качественного алгоритма составлением целостной картины выдачи.