ПРОБЛЕМЫ АВТОМАТИЗАЦИИ БИБЛИОТЕЧНО-БИБЛИОГРАФИЧЕСКИХ ПРОЦЕССОВ В АКАДЕМИЧЕСКИХ БИБЛИОТЕКАХ

А.Ю.КОЛОМИЕЦ, Я.В.ЛИНДА, С.Д.ПРОШКИН, А.В.САВЧЕНКО, О.И.СТУЧЕВСКАЯ

БИБЛИОГРАФИЧЕСКАЯ ИПС НА БАЗЕ МИКРОКОМПЬЮТЕРА

Работа с библиографической информацией является одним из основных видов деятельности, выполняемой ученым, инженером в процессе научного исследования.

Обычно библиографическая информация, полученная исследователем из различных источников (научных и реферативных журналов, централизованных баз данных и т.п.), организуется в виде индивидуальной картотеки библиографических описаний документов.

Вместе с тем, широкое внедрение микропроцессорной техники в практику научных исследований позволяет заменить ручную картотеку машиной, используя для хранения и поиска библиографических данных микрокомпьютер.

В статье излагается опыт разработки и внедрения во Всесоюзном кардиологическом научном центре АМН СССР библиографической ИПС ПОИСК на базе 16-разрядного микрокомпьютера ЛАБТАМ.

Программное обеспечение ИПС ПОИСК поддерживает следующие основные функции, связанные с организацией хранения и поиска библиографической информации:

  • ведение словаря ключевых слов (дескрипторов);
  • индексирование документов;
  • поиск библиографических описаний документов по ключевым словам;
  • выдачу библиографических описаний документов, найденных по запросу пользователя, на экран терминала, печать или запись их в файл.

Ядром программного обеспечения ИПС ПОИСК является СУБД реляционного типа - Data Flex, работающая под управлением операционных систем МS DOS и Concurrent DOS .

Среди особенностей СУВД Data Flex, которые были использованы для организации базы данных (БД) ИПС ПОИСК , необходимо отметить возможность установления статистических связей между файлами БД (т.е. связей, определяемых в схемах БД), а также возможность создания ДО 9 вторичных индексов для каждого файла БД. В связи с отсутствием в СУБД, Data Flex встроенного механизма поиска по ключевым словам в ИПС ПОИСК задача дескрипторного поиска в основном решалась за счет выбора соответствующей структуры БД.

База данных ИПС ПОИСК состоит: из словаря, в котором каждому ключевому слову сопоставлен его цифровой код и частота встречаемости файла, определяющего вхождение ключевых слов в документы; файла библиографических описаний документов, где каждое описание содержит также поисковый образ документа, представленный набором кодов ключевых слов, и ряда вспомогательных файлов.

Реализация запроса в ИПС ПОИСК осуществляется следующим образом. Сначала ключевые слова запроса переводятся в коды и среди ключевых слов запроса выбирается ключевое слово с минимальной частотой встречаемости. Затем, используя это ключевое слово в качестве значения вторичного индекса, формируется выборка библиографических описаний документов. Очевидно, что полученная выборка является минимальной по отношению к выборкам по другим ключевым словам запроса. В процессе формирования минимальной выборки делается проверка вхождения остальных ключевых слов запроса в поисковый образ документа.

Время реализации запроса в ИПС ПОИСК линейно зависит от объема минимальной выборки и количества ключевых слов запроса. Анализ релевантности 500 документов (объем минимальной выборки) запросу с 10 ключевыми словами при условии, что каждый поисковый образ документа содержит все 10 ключевых слов запроса (худший вариант), осуществляется в течение 2 минут.

Настоящая версия ИПС ПОИСК работает под управлением ОС Concurrent DOS. Поскольку микрокомпьютер ЛАБТАМ является многотерминальной ЭВМ, а СУБД Data Flex и ОС Concurrent DOS поддерживают многотерминальную работу, ИПС ПОИСК может использоваться в режиме коллективного доступа к БД.