Развитие системы “Наука России”

как части Интегрированной системы информационных

ресурсов РАН

Н.Е.Каленов, С.А.Власова, А.В.Глушановский

(БЕН РАН)

Информационно – аналитическая система “Наука России” [1] разрабатывается по гранту РФФИ как типовая двухуровневая система, обеспечивающая децентрализованное формирование библиографических баз данных (локальный комплекс РОНА-Л), последующее их слияние и централизованную обработку (центральный комплекс РОНА-Ц). Одним из направлений использования системы “Наука России” является создание баз данных трудов сотрудников РАН на основе картотек, которые ведутся в течение многих лет сотрудниками библиотек академических институтов. Соответственно, комплекс РОНА-Л разрабатывался в рачете на компьютеры небольшой мощности (которые обычно передаются в библиотеки научными подразделениями, обновляющими свою технику) и пользователей – сотрудников библиотек, имеющих минимальные навыки работы с компьютерами.

При разработке комплекса значительное внимание уделялось обеспечению простоты и прозрачности пользовательского интерфейса, исключению возможности попадания в нештатные ситуации при случайном нажатии клавиш, минимизации объема ввода идентичной информации. Версия комплекса, используемая в настоящее время во многих библиотеках НИИ РАН, может работать на ПК, начиная с IBM PC-AT/286, поддерживается оригинальным программным обеспечением, написанным на языке “СИ” в среде MS-DOS.

Комплекс обеспечивает поддержку четырех взаимосвязанных подбаз данных, содержащих сведения, соответственно, об организациях, персоналиях (в частности, авторах публикаций), публикациях на аналитическом и монографическом уровнях, изданиях на сводном уровне (журналах, сборниках и т.п.). Каждая из подбаз в процессе инсталляции может быть легко настроена на требуемое количество и вид полей данных. При этом поля могут иметь фиксированную (до 100б) или переменную (до 10 000б) длину; любые поля могут быть объявлены обязательными для ввода, значения полей при вводе данных могут выбираться из списков (например, виды издания, научная степень автора), иерархических файлов (например, рубрикатор ВАК или рубрикатор ГРНТИ). В рамках комплекса реализована возможность ввода пристатейной библиографии (библиографических ссылок), что создает предпосылки для создания отечественного аналога базы данных Science Citation Index [2]

В настоящее время программное обеспечение комплекса "РОНА-Л" обеспечивает:

Одной из серьезных проблем, возникающих при децентрализованной подготовке библиографической информации, является появление логически дублированных записей (библиографических описаний, относящихся к одним публикациям), выявление которых стандартными средствами СУБД во многих случаях невозможно из-за различий в описаниях документов. В связи с этим возникает задача разработки специальных методов, алгоритмов и программного обеспечения для выявления и исключения подобных записей. В процессе создания комплекса “РОНА-Л” эта задача была решена. Специальный программный модуль анализирует записи базы данных, выявляет среди них пары “подозрительных” на дублирование и предлагает администратору решить, какую запись удалить, или оставить обе.

Комплекс "РОНА-Л" включает также набор сервисных программ, позволяющий производить все необходимые операции по обслуживанию системы.

Эксплуатация комплекса ведется с 1996 года, Он установлен и работает в ряде библиотек НИИ РАН и других ведомств.

Интегрированная система информационных ресурсов (ИСИР) РАН (см. статью Бездушного А.Н. и др. в этом сборнике) предназначена для обеспечения доступа широкого круга пользователей к удаленным информационным и вычислительным ресурсам РАН, организации оперативного обмена научной информацией и создания на основе современных информационных технологий условий для проведения совместных исследовательских работ.

Информация о сотрудниках институтов РАН и их публикациях является одной из основных составляющих ИСИР РАН. В этом плане задачи, стоящие перед системой “Наука России”, тесно переплетаются с задачами информационного наполнения ИСИР РАН. Различие состоит в степени детализации информации - ИСИР РАН предусматривает использовать для описания публикаций формат “Dublin Core”, библиотечные специалисты вводят в систему “Наука России” информацию, позволяющую формировать библиографические описания в формате ГОСТ 7.1-84. В целях исключения дублирования при вводе данных и обеспечения координации наполнения информационных систем НИИ РАН целесообразно согласовать их в организационном и технологическом планах.

В организационном плане административные функции по поддержке данных, отражающих публикации сотрудников академического института должны быть возложены на сотрудников его библиотеки. Эти функции органично вытекают из задач библиотек НИИ РАН, включающих ведение картотек трудов сотрудников. Получив от авторов информацию о выходе в свет очередной публикации, сотрудник библиотеки вводит данные о ней в достаточно подробной форме в локальный комплекс системы “Наука России”, после чего с помощью специальных программ формируется информация, загружаемая в ИСИР РАН, к которой добавляются ссылки на полный текст документа (если он имеется в электронной форме).

В результате в каждом академическом институте будет сформирован достаточно корректный информационный массив, отражающий публикации его сотрудников, как часть распределенной интегрированной системы РАН, доступной через Интернет. Эта же система может быть использована и для аналитических задач наукометрии. Однако для этого а рамках ИСИР необходимо будет решить проблему исключения дублированных записей (они могут возникнуть при вводе совместных публикаций, авторы которых являются сотрудниками различных институтов). Для этого могут быть использованы алгоритмы, разработанные в рамках системы “Наука России”.

Как уже указывалось, к настоящему времени в ряде библиотек НИИ РАН уже созданы библиоографические базы данных трудов сотрудников. Они могут служить основой информационного наполнения ИСИР РАН, поэтому в ближайшее время предполагается разработать конвертер, обеспечивающий загрузку информации из системы “Наука России” в ИСИР РАН.

Литература.

1. Васильев А. В., Власова С. А., Глушановский А. В., Каленов Н.Е.

Система “Наука России” и е использование в информационно – библиотечной технологии. // Информационное обеспечение науки: новые технологии: сб. науч. тр. – М., 1997. – С. 86-88

2. Глушановский А.В., Каленов Н.Е., Лексикова Е.Е. База данных

"Science Citation Index" на CD-ROM. / Государственная научно-техническая программа России "Средства обеспечения исследований по физико-химической биологии и биотехнологии". Информационный бюллетень.- Выпуск 6. - 1993.