ПРИМЕНЕНИЕ ЭВМ В ИНФОРМАЦИОННО - БИБЛИОТЕЧНОЙ ТЕХНОЛОГИИ

В.М. Тютюнник, А.И.Смирнов, С.А. Луканцов, Г.Ю. Жабин

Международный информационный Нобелевский центр

Проблемы совместимости большого количества баз данных при многоаспектном поиске.

Базы данных по Нобелевским премиям и лауреатам

Международный информационный Нобелевский центр (МИНЦ) создан в Тамбове, Россия, с целью концентрации колоссальной по объему и значению, но разрозненной информации о жизни и деятельности лауреатов Нобелевских премий, А.Нобеля и Учреждений Нобеля, а также для создания в едином центре условий международного пользования наследием выдающихся представителей наиболее перспективных направлений в науке, экономике, литературе и политике мира [1].

МИНЦ является: 1) информационной организацией, осуществляющей поиск, накопление, переработку и распространение нобелевской информации; 2) научным центром, предназначенным для проведения фундаментальных исследований в различных областях знаний международными усилиями. Наше собственное научное направление - нобелевская информатика и бионаукометрия (биобиблиометрия, биоинформетрия), объединяемые ныне термином "нобелистика".

Деятельность МИНЦ развивается по различным направлениям, одно из которых - пополнение Международного банка данных и знаний "А.Нобель и Нобелевские премии. Лауреаты Нобелевских премий по физике, химии, физиологии или медицине, литературе, мира, экономике", содержащего серию проблемно-ориентированных баз данных (БД), обращение к которым дает возможность пользователю проводить многоаспектный поиск и получать любую информацию о А.Нобеле, Нобелевских премиях, о жизни и деятельности каждого из 627 (1901-1992 гг.) нобелевских лауреатов, и др. [2,3].

Необходимость решения проблем совместимости большого количества БД привела к созданию новой "библиотечно-музейно-архивно-информационной технологии" (БМАИТ) с нетрадиционным подходом к обслуживанию с помощью фондов МИНЦ: специально разработанные способы кодирования и индексирования всех документов как единой системы позволяют максимально долго не допускать потребителя к документам на бумажных носителях, последовательно удовлетворяя его фактографические, библиографические, аналитические и комплексные запросы по нобелевской тематике путем использования накопленной в БМАИТ систематизированной информации и результатов её библиометрической, наукометрической и информетрической обработки.

субд NDB (Nobel's Data Bases) состоит в настоящее время из 20 БД (одна - служебная для поиска по ключевому слову ;

19 - проблемно-ориентированные) и 21 управляющей программы (20 - для ввода данных, одна - управляющая одновременно всеми БД). Управляющая программа имеет графический (VGA + mouse) и сетевой интерфейсы. Язык программирования - Turbo C++, Borland C++, Turbo Assembler Borland, язык интерфейса - русский и английский, информация вводится на языке оригинала (кроме японского, китайского, арабского и подобных начертаний). Общий объем информации - около 350 МБ.

Все БД в составе субд имеют распределенную структуру:

DBF-стандарт, индексный файл, группа текстовых файлов. В приведенном примере (рис.1) текст Txt общим объемом 100КБ содержит сведения о деятельности Учреждений А.Нобеля (Нобелевский Фонд, Нобелевские комитеты, Нобелевские институты, Королевская Шведская академия наук, Шведская академия, Каролинский медико-хирургический институт, Государственный банк Швеции и др.) и нобелевских организаций (фирмы, концерны, заводы и т.п.) по форме: адрес и другие координаты учреждения или организации, фамилии и должности руководства, библиографические описания источников информации, ключевые слова и реферат по основным направлениям деятельности.

Все текстовые файлы хранятся в архивированном виде. Архивирование и разархивирование осуществляется оболочкой. DBF-стандарты всех БД минимизированы по длинам полей, чтобы увеличить скорость поиска через перекрестные ссылки. Таким образом, поиск осуществляется не по тексту (фамилия, ключевое слово, название и т.п.), а по индексной ссылке на него. Такая структура информации позволяет хранить максимальное количество Tht в сжатом виде и минимальное количество данных в виде DBF-стандартов. Все ненужные связи между БД при каждом конкретном поиске маскируются.

В зависимости от типа и вида запроса (меню содержит около 50 вариантов) реализовано два способа работы с БД : 1) одноаспектный запрос / поиск (непосредственное обращение к информации, которая содержится в одной из БД); 2) многоаспектный запрос/ поиск (одновременное обращение к нескольким / всем БД через группу стандартных запросов). Рассмотрим пример сложного многоаспектного запроса/ поиска. Необходимо получить списки литературы с портретами и формулировками Нобелевского комитета о нобелевских лауреатах по физике, которые получили премии после 1970 г. и проживали в Германии. Алгоритм поиска выглядит следующим образом (рис.2). Из БД 16 отбираются нобелевские лауреаты по физике после 1970 г., которые фильтруются с помощью БД2 по слову "Германия" и ранжируются по городам присуждения Нобелевской премии. Из БД5 отбирается та литература, которая содержит информацию о выбранных лауреатах, и фильтруется с помощью БД8 и БД9 по признакам "портрет" и "формулировка". Тексты списков литературы разархивируются по мере анализа.

4

Рис.1. Структура БДЗ "Учреждения А.Нобеля. Нобелевские фирмы.". 1 - поле наименования учреждения или фирмы на языке оригинала; 2 - поле языка; 3 - поле ссылки на текст; 4 - поле текста.

Рис.2. Схема реализации многоаспектного запроса/поиска

ЛИТЕРАТУРА

1. Тютюнник В.М. Международный Информационный Нобелевский Центр (г. Тамбов, СССР): Проспект: Информ. материалы -Тамбов,1991.-14 с.

2. Тютюннчк В.М. Альфред Нобель и Нобелевские премии: Биобиблиогр. указ.-2-е изд.-Тамбов, 1991.-94 с.

3. Тютюнник В.М. Взаимосвязи информатики и науковедения: Анализ данных и модели.-Тамбов, 1989.-44 с.