# !1!

БИБЛИОТЕКИ ЦБС БЕН РАН И ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ НАУКИ

Калёнов Н.Е.
(Библиотека по естественным наукам РАН)

В работе, опубликованной в предыдущем сборнике, посвященном проблемам информационного обеспечения научных исследований [1], были рассмотрены общие вопросы функционирования библиотек РАН в современных условиях. Здесь мы хотим остановиться на конкретной реализации функций, связанных с информационным обеспечением академической науки в централизованной системе библиотек (ЦБС), возглавляемой Библиотекой по естественным наукам (БЕН) РАН [2]. ЦБС БЕН РАН включает библиотеки академических институтов и научных центров и имеет достаточно сложную структуру — часть библиотек связана с Центральной библиотекой (ЦБ) напрямую, часть — через центральные библиотеки научных центров (рис. 1).

Рис. 1

Около половины библиотек, входящих в ЦБС, являются подразделениями БЕН РАН (их сотрудники входят в ее штат, все фонды числятся на балансе БЕН). В это число входят как библиотеки отдельных институтов; так и центральные библиотеки научных центров РАН московского региона, которые, в свою очередь, имеют филиалы в институтах отделения. Остальные библиотеки, входящих в ЦБС БЕН РАН, являются подразделениями академических институтов и не подчиняются в административном плане руководству ЦБ, хотя методическое руководство их деятельностью возложено на БЕН.

Структура ЦБС БЕН РАН определяет и функции, выполняемые каждым из ее звеньев.

Деятельность Центральной библиотеки

Рассматривая Центральную библиотеку, необходимо иметь в виду, что она фактически включает две структуры — собственно библиотеку, имеющую свой фонд и выполняющую все функции, свойственные другим библиотекам, входящим в ЦБС (см. ниже), и совокупность подразделений, которые поддерживают централизованную технологию. Именно эта совокупность является ядром ЦБС, и говоря в дальнейшем о ЦБ, мы будем иметь в виду именно эту часть БЕН.

ЦБ осуществляет централизованное комплектование и обработку литературы для всех библиотек ЦБС, ведет сводные каталоги фондов ЦБС, обеспечивает централизованное обслуживание по межбиблиотечному абонементу (МБА), координирует информационную деятельность своих библиотек и осуществляет методическое руководство ими. Остановимся подробнее на каждом из перечисленных процессов.

Комплектование

Целью комплектования ЦБС является создание оптимального (в смысле максимума информативности для ученых РАН) совокупного фонда печатных и электронных изданий, приобретаемого на средства, выделяемые БЕН на эти цели Президиумом РАН. При этом под фондом понимаются не только физические единицы, поступающие в Библиотеки, но и права доступа к электронным версиям изданий через Интернет.

Для достижения этой цели специалисты ЦБ обобщают данные об информационных потребностях ученых, обслуживаемых ЦБС БЕН, поступающие из библиотек системы (формируется сводный тематико-типологический план комплектования — ТТПК ЦБС); анализируют предложения отечественного и зарубежного информационных рынков; предоставляют ученым — экспертам информацию о новых ресурсах в интересующих их областях; обрабатывают полученные оценки совместно с ТТПК, формируют заказ на необходимые материалы, получают их и направляют в библиотеки ЦБС. Достаточно подробно процесс комплектования с использованием современных сетевых технологий описан в [3]. Внутри БЕН РАН процессы, связанные с заказом, регистрацией поступлений и распределением литературы (включая распечатку различных учетных документов), реализуются с помощью двух программных комплексов, разработанных специалистами Библиотеки — DISKAT (поддерживает все процессы, связанные с журналами) и BIBLIOBUS (поддерживает все процессы, связанные с централизованным комплектованием и обработкой книг и продолжающихся изданий). В рамках системы DISKAT имеется полная информация о подписке на журналы, их поступлении и распределении по библиотекам. В системе BIBLIOBUS на этапе комплектования формируются данные о заказанных изданиях с указанием библиотек, для которых они предназначены, источниках поступления, полная информация о поступлении и распределении изданий.

Обработка литературы

Целью централизованной обработки поступающих материалов является создание справочного аппарата по фондам, доступного любому пользователю Интернет.

Вся литература, поступающая в ЦБ, регистрируется в технологической базе данных (ТБД) и распределяется по библиотекам ЦБС в соответствии с предварительным заказом. После этого один экземпляр вновь поступившего издания направляется на каталогизацию (составление и ввод в ТБД библиографического описания), а затем на систематизацию (присвоение индексов УДК и перевод заглавий иностранных изданий на русский язык). В результате выполнения этих процессов в ТБД формируется полная информация об изданиях (библиографические описания, данные о библиотеках, в фонды которых они направляются, сведения о прохождении технологического цикла каждым поступившим экземпляром). Кроме того, каждая операция осуществляется в системе BIBLIOBUS с предварительной авторизацией пользователей, поэтому в ТБД имеется исчерпывающая управленческая информация, которая используется для обеспечения оперативной устойчивой работы ЦБ. ТБД служит основой сводного электронного каталога ЦБС БЕН РАН, предоставляемого в открытый доступ через Интернет. Фрагмент ТБД, отражающий поступления за последние 12 месяцев, поддерживается на ftp-сервере БЕН РАН, откуда библиотеки ЦБС, ведущие свои электронные каталоги, выгружают нужные им записи. На основе ТБД распечатываются карточки для традиционных каталогов, которые вместе с изданиями направляются в библиотеки, продолжающие их вести.

Обслуживание по МБА

Располагая сводным каталогом, отражающим фонды ЦБС, ЦБ строит на нем систему централизованного обслуживания по МБА. Задачей службы централизованного МБА ЦБ является предоставление опубликованных материалов, необходимых сотрудникам РАН, как из фондов ЦБС БЕН, так и (при их отсутствии в ЦБС) из фондов других отечественных и (в случае отсутствия и там) зарубежных библиотек. Заказы читателей на материалы, отсутствующие в своих фондах, библиотеки ЦБС направляют в ЦБ. Сотрудники ЦБ определяют местонахождение требуемого издания, в первую очередь, по сводному каталогу ЦБС. Издания, имеющиеся в библиотеках ЦБС московского региона, привозятся в ЦБ, а затем направляются в библиотеки-заказчицы. Издания из иногородних библиотек ЦБС заказываются и поступают по почте. Если издание в сети БЕН отсутствует, его наличие проверяется по каталогам других библиотек, в том числе и зарубежных, где они заказываются и при поступлении в ЦБ направляются в библиотеки-заказчицы, которые выдают их пользователям. Следует отметить, что наибольшим спросом сотрудников РАН пользуются не издания целиком, а статьи из журналов и сборников, поэтому в последние годы поток оригиналов изданий, направляемых в библиотеки ЦБС, существенно уменьшился — его заменяют копии статей в электронном виде, выполняемые библиотеками-фондодержателями и направляемые заказчикам через ЦБ для личного использования учеными.

Наряду с приоритетным обслуживанием библиотек РАН, ЦБ обслуживает по МБА на договорной основе библиотеки других ведомств, однако обслуживание ведется исключительно на основе фондов БЕН и библиотек ЦБС московского региона — при отсутствии изданий в их фондах заказчик получает отказ.

Технология приема и обработки заказов в рамках централизованного МБА является достаточно сложной, особенно в части контроля за сроками выполнения заказов и возврата изданий, а также финансовых расчетов с абонентами различных категорий (в случае выполнения копий фрагментов изданий). Для поддержки этой технологии на современном уровне в ЦБ функционирует специальная комплексная автоматизированная система [4], которая обеспечивает прием заказов через Интернет, диспетчеризацию их выполнения на всех этапах технологии, проведение финансовых расчетов и получение практически любых статистических данных — как о работе службы МБА, так и о спросе на различные материалы. Кроме того, система предоставляет возможность заказчикам следить через Интернет за состоянием выполнения своих заказов.

Информационное обслуживание

В конце прошлого века в ЦБ функционировала развитая система избирательного распространения информации (ИРИ) — Библиотека приобретала отечественные и зарубежные базы данных на машинных носителях (магнитные ленты, CD-ROM); с помощью специализированного программного обеспечения из БД выбиралась информация, соответствующая предварительно собранным обобщенным запросам ученых академических институтов. Отобранная информация на машинных носителях передавалась через библиотеки ЦБС в вычислительные центры институтов, где она распределялась между лабораториями и отделами в соответствии с запросами их сотрудников, предварительно введенными в систему ИРИ, установленную специалистами БЕН на ЭВМ института. С развитием сетевых технологий надобность в такой трехзвенной системе отпала — появилась возможность самостоятельной работы самих пользователей — ученых РАН с базами данных в сетевом режиме, используя компьютеры либо на своих рабочих местах, либо в библиотеках НИИ или ЦБ. Роль ЦБ в этом направлении свелась к координации приобретения прав доступа к БД. В зависимости от стоимости и важности ЦБ приобретает доступ к БД либо только со своих компьютеров (в Библиотеке оборудован специальный класс работы с локальными и сетевыми ресурсами), либо дополнительно с компьютеров своих филиалов в тех или иных институтах. В рамках этого направления ЦБ представляет библиотеки своей ЦБС в организациях, централизованно (в интересах государственных учреждений) приобретающих доступ к зарубежным научным электронным журналам (РФФИ, НЭИКОН).

Развитие сетевых технологий и бурный рост количества научных ресурсов разного рода, представленных в Интернет, определили новое направление в информационной деятельности академических библиотек, связанное с поиском ресурсов Интернет по тематике обслуживаемых пользователей и информирование их об имеющихся ресурсах. Работая в этом направлении, ЦБ как политематический информационный центр сформировала и поддерживает на своем сайте (http://www.benran.ru) систему “метауказателей” “Естественные науки в Интернет” [5]. При создании этого ресурса не ставилась задача сбора как можно большего числа ссылок на отдельные ресурсы по рассматриваемым областям. Это связано, с одной стороны, с тем, что такая задача крайне трудоемка, а с другой стороны, с тем, что в сети Интернет существует достаточно много такого рода указателей, создаваемых ведущими научными институтами, обществами и отдельными специалистами в каждой из областей. Таким образом, под метауказателем понимается совокупность ссылок на указатели ресурсов по данному научному направлению, созданные ведущими специалистами в этой области.

Специалистами БЕН РАН систематически проводится поиск таких указателей и актуализация метауказателей. Для этого просматриваются сайты ведущих научных обществ, университетов, научно-исследовательских институтов и лабораторий, библиотек. Критериями отбора ссылок являются авторитетность организации, ведущей указатель, объем указателя, а также актуальность представленной информации (дата обновления, малый процент “мертвых” ссылок).

В настоящее время на сайте БЕН РАН поддерживаются указатели: “Астрономия в Интернет”, “Биология в Интернет”, “Математика в Интернет”, “Механика в Интернет”, “Науки о Земле в Интернет”, “Общенаучная информация в Интернет”, “Физика в Интернет”, “Химия в Интернет”, “Экология в Интернет”.

Кроме перечисленных, в систему указателей “Естественные науки в Интернет” входит также указатель “Сериальные издания” (“Научная периодика в Интернет”).

Другим аспектом информационной работы ЦБ является организация выставок новой литературы в библиотеках научных центров РАН, являющихся отделениями ЦБ. Еженедельно, после демонстрации на Выставке новых поступлений в БЕН РАН, издания, поступившие в ЦБ по тематике подмосковных НЦ РАН вывозятся в их центральные библиотеки и демонстрируются там в течение недели. За это время сотрудники институтов Центра могут ознакомиться с изданиями, заказать и получить копии интересующих их статей.

Наряду с выставками новой литературы, ЦБ на базе фонда ЦБС организует тематические выставки по естественнонаучным направлениям, приуроченные к различным юбилеям, и сопровождающие конференции и симпозиумы, организуемые институтами РАН.

Методическое руководство

В части методического руководства деятельностью библиотек ЦБ собирает и анализирует ежегодные отчеты библиотек ЦБС; регулярно проводит “дни библиотечной учебы”, на которых обсуждаются актуальные проблемы, связанные с развитием библиотечного дела вообще и ЦБС БЕН РАН, в частности. Функциональные отделы БЕН РАН консультируют сотрудников библиотек ЦБС по вопросам организации фондов, обслуживания читателей и т.п. Одним из основных направлений методического руководства является внедрение современных вычислительных и сетевых технологий в практику работы библиотек ЦБС. В структуре ЦБ имеется Отдел системных исследований и автоматизированной технологии, в штате которого состоят квалифицированные программисты и специалисты в области вычислительной техники. Ими разработаны и поддерживаются программные средства, обеспечивающие автоматизацию библиотечной технологии как в ЦБ, так и библиотеках научных центров и институтов РАН. Они осуществляют внедрение программных средств в библиотеках ЦБС, оказывают консультативную помощь в их эксплуатации. За последние два года ЦБ организовала обучение более ста сотрудников библиотек ЦБС работе с общесистемными (MS OFFICE, электронная почта, Интернет-браузеры) и прикладными программными средствами, разработанными в БЕН РАН.

Кроме консультативных функций по отношению к библиотекам ЦБС ЦБ предоставляет свои вычислительные ресурсы для размещения информации, подготовленной библиотеками. В частности, на сайте ЦБ представлены базы данных публикаций сотрудников ряда академических институтов, формируемые соответствующими библиотеками; на специальном сервере ЦБ поддерживает единую базу данных читателей ЦБС [6], которая ведется в интерактивном режиме сотрудниками библиотек (каждый авторизованный представитель библиотеки может вводить и редактировать данные о своих и только о своих читателях).

Деятельность центральных библиотек научных центров РАН

В подмосковных научных центрах (НЦ) РАН имеются Центральные библиотеки, являющиеся отделениями БЕН РАН. Целесообразность их наличия обусловлена двумя факторами — территориальная близость и близкие направления исследований институтов, входящих в состав НЦ. В этой связи ЦБ НЦ РАН выполняет следующие функции:

Примером успешной реализации перечисленных функций является Центральная библиотека Пущинского научного центра (ЦБП). Библиотека поддерживает свой сайт (http://cbp.iteb.psn.ru/), на котором представлены сводные каталоги журналов и книг (системы их поддержки разработаны сотрудниками БЕН РАН); ссылки на платные электронные ресурсы, доступ к которым имеют сотрудники ПНЦ из своих институтов (приобретены РФФИ или НЭИКОН) или с компьютеров ЦБП (приобретены БЕН РАН); ссылки на свободные ресурсы по тематике исследований ПНЦ; другие материалы, обеспечивающие информационную поддержку исследований Центра [7, 8].

На сайте ЦБП поддерживаются системы заказа материалов в читальном зале и по МБА, аналогичные представленным на сайте ЦБ.

Сотрудники ЦБП ведут большую научную работу, связанную с анализом информационных потребностей ученых ПНЦ [9, 10] и путей их удовлетворения. По запросам ученых ПНЦ специалисты ЦБП осуществляют информационный поиск, определяют индексы цитирования их публикаций по базе данных Science Citation Index (имеющейся в библиотеке на CD-ROM) и ее Интернет-версии WEB OF SCIENCE.

Библиотеки институтов РАН

Библиотеки академических институтов, входящие в ЦБС БЕН РАН, ведут основную работу по информационному обслуживанию ученых — сотрудников своего института. Наряду с традиционными формами библиотечной работы (анализ информационных потребностей своих пользователей, формирование ТТПК и передача его “по подчиненности” в ЦБ или в ЦБ НЦ РАН; формирование фонда и ведение справочного аппарата по нему; обслуживание пользователей в читальных залах, на абонементе и по МБА), библиотеки ЦБС ведут базы данных публикаций сотрудников своих институтов; поддерживают собственные сайты, предоставляя на них каталоги своей библиотеки, а также списки свободных и платных ресурсов Интернет по тематике исследований института, доступных пользователям данной библиотеки. Начиная с 2006-го года, все библиотеки — отделения ЦБ регистрируют своих читателей в единой базе данных, поддерживаемой ЦБ.

В качестве примера успешной реализации библиотеками ЦБС БЕН РАН современных информационных технологий можно привести библиотеку Математического института им. В.А. Стеклова (МИАН), на сайте которой (http://libserv.mi.ras.ru/) наиболее полно представлены различные ресурсы по математике, включая не только каталоги и электронные библиотеки, формируемые собственно Библиотекой МИАН, но и достаточно полные данные о математических ресурсах России в целом. Среди последних — перечень математических журналов со ссылками на их сайты; сведения о трудах математических институтов, конференциях и т.д.

Собственные сайты с предоставлением на них разнородной информации поддерживают библиотеки Физического института РАН им. П.Н. Лебедева, Института астрономии РАН, Института радиотехники и электроники РАН и ряд других.

Развитие академических библиотек в области применения современных технологий сдерживается рядом факторов, среди которых главный — отсутствие библиотечных кадров, способных осуществить переход на новые методы работы, которое обусловлено низкой заработной платой библиотечных сотрудников в РАН, “непрестижностью” библиотечной работы и отсутствием научных перспектив. Касаясь последнего, необходимо отметить, что “библиотечные” научные дисциплины, такие как библиотековедение, книговедение, библиографоведение, не входят не только в перечень научных направлений РАН, но и в перечень направлений, поддерживаемых РФФИ и РГНФ. Нам представляется, что это положение необходимо в корне изменить, учитывая важную информационную и социальную роль библиотек, которую в последнее время подтверждают высшие должностные лица страны.

Литература

  1. Калёнов Н.Е. Функции библиотек РАН в современных условиях. Информационное обеспечение науки: новые технологии: Сб. науч. тр. — М.: БЕН РАН, 2005. — С. 6-16
  2. Калёнов Н.Е. Централизованая библиотечная система БЕН РАН и информационное обеспечение науки в современных условиях // Библиотеки национальных академий наук: проблемы функционирования, тенденции развития: Научно-практический и теоретический сборник. Вып.3. — Киев: НБУВ, 2005. — С. 41-50.
  3. Н. Калёнов. Е. Кочукова, В. Наумова. Ученым — новейшую информацию // Библиотека, 2007. — № 3. — с. 50-52.
  4. Власова С.А., Калёнов Н.Е., Колерова Т.С. Комплексная автоматизированная система обработки заказов по межбиблиотечному абонементу // Межотраслевая информационная служба: Науч.-метод. журн., 2006. — № 1. — С. 48-52.
  5. Власова С.А., Глушановский А.В., Калёнов Н.Е. БЕН РАН в современном информационном пространстве // Информационные ресурсы России, 2004. — №  4. — С. 2-6.
  6. Варакин В.П., Власова С.А., Калёнов Н.Е. Интернет в системе обслуживания читателей БЕН РАН // Научный сервис в сети Интернет. — М., 2004. — С. 70-71.
  7. Харыбина Т.Н Центральная библиотека Пущинского научного центра в современных условиях // Библиотека на службе науке. 30 лет Библиотеке по естественным наукам Российской Академии наук (юбилейный сборник статей). — М.: БЕН РАН, 2004. — С. 94-105.
  8. Слащева Н.А., Мохначева Ю.В., Харыбина Т.Н. Интегрированный подход к информационному обеспечению научных исследований // Информационное обеспечение науки: новые технологии: Сб. науч. тр. — М.: БЕН РАН, 2005. — С. 45-55.
  9. Слащева Н.А., Мохначева Ю.В. Электронная информация в наукометрических исследованиях // Научно-техническая информация. Сер.1, 2003. — № 5. –С. 21-26.
  10. Кудеярова А.Ю., Слащева Н.А., Мохначева Ю.В. Процесс изучения потребностей пользователей // Библиополе, 2005. — № 3. — С. 14-15.
!2!

ЗАРУБЕЖНЫЕ И РОССИЙСКИЕ РЕСУРСЫ В СФЕРЕ НАУЧНОГО НАСЛЕДИЯ И ОСНОВНЫЕ ПРИНЦИПЫ СОЗДАНИЯ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ “НАУЧНОЕ НАСЛЕДИЕ РОССИИ”

Антопольский А.Б.
(Некоммерческое партнерство
“Электронные библиотеки”, Москва)

Работы по созданию электронной библиотеки (ЭБ) “Научное наследие России”, которые ведутся в рамках одноименной целевой программы Президиума РАН, требуют определенного аналитического обеспечения, которое отчасти должен восполнить настоящий доклад. В данном докладе тем не менее не предполагается давать исчерпывающий анализ состояния информационных ресурсов в области научного наследия, тем более что в недавно вышедшей работе [1] приводится достаточно подробный анализ ситуации с электронными библиотеками как в мире, так и в России. Дадим лишь краткий очерк состояния проблемы.

Зарубежный опыт

Работы по созданию ЭБ ведутся весьма широко и в проектах разных масштабов. Известны большие международные проекты (Всемирная цифровая библиотека, Европейская цифровая библиотека, проект “Гуттенберг” и др.), множество национальных проектов (США, Франция, Германия, Япония, Великобритания, Испания и др.). Кроме того, в отдельных университетах и библиотеках ведется множество проектов по созданию цифровых коллекций, в том числе полностью или частично, отражающих тематику научного наследия. Приведем некоторые характерные примеры.

Тематические и персональные коллекции

Проект Архимед.

Проект осуществляется консорциумом в составе Института истории науки им. Макса Планка (Берлин), Гарвардского университета, Университета Миссури (Канзас-Сити) и проекта “Персей” Университета Тафта. Проект поддерживается Национальным научным фондом в рамках программы “Инициатива по электронным библиотекам” (DLI, Phase 2). Целью проекта является создание инструмента для интерактивного изучения истории механики, исследования развития ментальности в сфере механики. Одновременно проект создает образец открытой библиотеки по истории науки. Фонд библиотеки составляют многочисленные труды по механике на различных языках, в том числе на латинском и греческом, итальянском, включая инкунабулы. Библиотека снабжена специальным морфологическим анализатором для этих языков, современными и историческими словарями, другим справочным аппаратом (http: //archimedes.mpiwg-berlin.mpg.de/arch/archimedes.new.html)

Классическая наука он-лайн (Болонья)

Коллекция создана Международным центром истории университетов и науки при поддержке Итальянского национального научного совета в рамках проекта по культурному наследию. Коллекция основана на новой издательской серии научной классики, полные тексты которой будут доступны в режиме онлайн. Серия включает произведения, которые получили всемирное признание и охватывают историю Болонского университета за многие столетия.

Калифорнийский архив океанографических исследований

Коллекция создана совместной работой архива и библиотеки Океанографического института Скриппса, Суперкомпьютерного центра Сан-Диего и Исторического общества Сан-Диего (США). Она включает в себя различные текстовые, графические и аудиоресурсы, относящиеся к океанографическим исследованиям, проводящимся в Калифорнии. Коллекция содержит документы, данные и изображения по 822 экспедициям, организованным Океанографическим институтом Скриппса, начиная с 1903 г. Система позволяет свободное включение новых материалов. Ресурсы снабжены метаданными, позволяющими проводить разнообразные виды поиска.

Встреча цивилизаций

ECHO (European Cultural Heritage Online — Европейское культурное наследие Онлайн). Проект осуществляет Институт истории науки Макса Планка в Берлине, Германия, с участием других научных коллективов. Коллекция включает оцифрованные документы, посвященные развитию и взаимодействия западной и восточной цивилизаций начиная с шумерских клинописных табличек (3000 до нашей эры), оцифрованных в рамках проекта CDLI(см.), и вплоть до 20 века.

Цифровой Галилей

Данный проект включает несколько отдельных коллекций. Коллекция трудов Галилея создана Национальной центральной библиотекой Флоренции (Италия) и включает избранные труды в виде факсимильных изображений. Поиск доступен через базу данных на итальянском языке. Для просмотра изображений требуется веб-браузер, поддерживающий Java “Заметки о движении” Галилео Галилея.- объединенный проект Национальной центральной библиотекой Флоренции, Института и музея истории науки (Флоренция) и Иснститута истории науки Макса Планка (Берлин). Оцифрованный труд Галилея с двуязычным интерфейсом на английском и итальянском языках. Объединенный цифровой репозиторий трудов Галилея http: //moro.imss.fi.it:9000/struts-aig/primoIngresso.do создан Флорентийским институтом и музеем истории техники. Включает труды Галилея начиная с ранних публикаций датируемых 1540 г. и свыше 36 тыс. изображений, связанных с историей науки. Имеет двуязычный интерфейс на английском и итальянском языках. Harmonia Macrocosmica Андреаса Целлариуса (1661). Цифровое представление упомянуто астрономического атласа. Имеется возможность поиска и просмотра. Проект выполнен библиотекой университета Мариотта (ЮТА. США).

История медицины с 16 века

Проект выполнен Межуниверситетской медицинской библиотекой (Париж, Франция). Коллекция содержит около 2,5 тыс. произведений общим объемом 415 тыс. стр. Включает в себя наиболее значительные произведения по истории медицины и стоматологии начиная с 16-го века. Коллекция снабжена средствами навигации и поиска а также справочно-библиографическими указателями и комментаряими, подготовленными сотрудниками библиотеки Collection Medic@.

Мендель в вебе

Проект Роджера Блумберга, начатый в 1997 г., представлен по адресу: http://www.mendelweb.org. Образовательный ресурс, предназначенный для преподавателей и студентов, интересующихся историей науки, и в частности источниками классической генетики. Основан на классической труде Грегора Менделя 1965 г. “Опыты по гибридизации растений” и его пересмотренной англоязычной версии. Ресурс представляет собой источник литературы по истории генетики и представляет сервисы для совместной работы студентов и исследователей данной области.

Проект Ньютон

Проект осуществляется с 1998 г. Центром истории науки, техники и медицины Лондонского имперского колледжа совместно с Кембриджским университетом. Доступен по адресу: http://www.newtonproject.sussex.ac.uk/prism.php?id =. Цель проекта — сделать доступными в электронной форме рукописи и печатные изданий Ньютона, как в виде факсимильных изображений, так и в распознанном виде. Коллекция включает в себя разнообразные документы, относящиеся к изучению трудов Ньютона.

Архив А. Эйнштейна он-лайн

Адрес: http://www.alberteinstein.info. Объединенный проект Архива Альберта Эйнштейна, Еврейского университета в Иерусалиме, Еврейской национальной библиотеки и Калифорнийского института технологии в Пасадене. Коллекция включает в себя свыше 900 оцифрованных рукописей в виде изображений с высоким разрешением.

Труды знаменитых астрономов Болонской Обсерватории

Проект астрономического отдела исторического архива Болоньи и болонского университета. http://www.bo.astro.it/~biblio/sma/index.html. Цифровая коллекция трудов трех астрономов: Эустаччио Манфреди, Витторио Франческо Станкари и Эустаччио Дзанотти, относящихся к их деятельности в Болонской обсерватории. Коллекция включает в себя ссылки на другие оцифрованные исторические труды, имеющиеся в университетской библиотеке.

Проект Линней

Проект осуществляется на основе сотрудничества Международного центра изучения 18-го столетия Ферней-Вольтер и Международного общества изучения 18-го столетия университета Рутгера. Проект имеет целью сделать доступными в вебе письма Карла Линнея(1707-1778). Включает в себя шведские источники.

Цифровая библиотека Александра Гумбольдта

Проект Университета прикладной науки в Оффенбурге, Германия. Создан пилотный прототип мультимедийного онлайнового цифрового архива Александра Гумбольдта, который будет далее развиваться как распределенный цифровой архив с участием немецких и американских университетов.

Коллекция Аллена Ньюелла

Коллекция создана библиотека Университета Карнеги Меллона и представляет собой мультимедийный архив, отражающий важнейшие этапы научного пути известного ученого. Отдельные его труды представлены в виде факсимильных изображений. Ален Ньюелл (1927-1992) был пионером в области искусственного интеллекта и систем представления знаний.

Труды братьев Райт

Коллекция создана в рамках проекта “Память Америки” в Библиотеке Конгресса США в результате совместной работы департаментов рукописей и фотографий. По оцифровке различных материалов, относящихся к деятельности Уилбура и Орвилла Райт по созданию управляемого полета. Включает корреспонденцию, дневники, записные книжки, рисунки, чертежи, печатные материалы, а также коллекцию фотографических негативов на стеклянных пластинах.

Путешествия и открытия

Голубая книга по исследованию Арктики

Библиотека Университета Манитоба, Виннипег. Представляет собой Интернет-версию уникального указателя Эндрью Тейлора к материалам Британского Парламента 19-го века, относящимся к исследованиям Канадской Арктики.

История геологического изучения Канады

Коллекция создана в Университете Торонто и содержит отчеты экспедиций Дж. Тиррела по геологическому изучению Канады 1892-1894 гг.

Путешествия Френсиса Дрейка

Коллекция создана Отделом редких книг и специальных коллекций Библиотеки Конгресса. Коллекция включает собранные книжным антикваром Гансом Петером Краусом первичные и вторичные материалы, относящиеся к путешествиям Френсиса Дрейка по испанским владениям Америки. Тексты на английском, латинском, немецком, голландском, ительянском, испанском, французском языках. Коллекция включает 60 единиц -16 рукописей, 29 книг, 8 карт, а также 7 медалей и портретов.

Таким образом, очевидно, что значительная часть электронных коллекций, ориентированных на сохранение в электронной форме научного наследия, являются узко специализированными, создаются в основном в университетах, а также отдельными энтузиастами. Многие важные принципы создания специализированных электронных библиотек по научному и культурному наследию изложены в работе [2]. Практически все заметные проекты в данной области осуществляются на основе широкого международного сотрудничества.

С другой стороны, в большинстве развитых стран осуществляются национальные проекты по созданию электронных библиотек, предполагающих оцифровку большого количества материалов, относящихся к культурному наследию. Крупнейшим из них является проект “Память Америки”. Ведущими участниками национальных проектов по оцифровке культурного наследия, как правило, являются национальные библиотеки.

Российские электронные библиотеки
в сфере научного наследия

Проблема описания российских электронных библиотек по научному наследию является нетривиальной, поскольку сам термин “научное наследие” вряд ли может быть определен достаточно точно. К тому же можно предположить, что трактовка этого термина меняется для различных областей науки, особенно для гуманитарных, технических и естественных наук. Особый взгляд на эту проблему у историков, в том числе историков науки. Очевидно, имеет значение и “возраст” науки. В таких молодых отраслях, как, например, информатика, к научному наследию следует относить книги, написанные совсем недавно, например, 30 лет тому назад. В то время как для философии книги этого времени, бесспорно, являются современными.

Если же рассматривать задачу создания электронной библиотеки по научному наследию как задачу разрушения барьеров между академическим сообществом и широкой публикой (как это делают авторы работы [2]), то есть как одно из направлений популяризации науки, то проблема критериев комплектования такой библиотеки становится еще более размытой.

Очевидно, что многие оцифрованные книги, другие документы, относящиеся к научному наследию, входят в состав коллекций создаваемых в крупных библиотеках — РГБ. РНБ, ГПИБ и др., также в научных учреждениях, университетах и других учреждениях. Обзор этих коллекций также представлен в [1].

Такие документы можно обнаружить практически во всех сколько-нибудь заметных электронных библиотеках. Поскольку большинство российских электронных библиотек являются любительскими, то включение в них книг, относящихся к научному наследию, происходит случайно, на основе субъективных оценок составителей библиотеки.

Примеры включения классических научных трудов в массовые электронные библиотеки весьма многочисленны.

Возьмем, например, астрономию. Электронная библиотека ЧАРА города Чистополя (http://reestr.elibra.ru/lib.chistopol.ru) содержит свыше 4 тыс. книг по науке, в том числе несколько десятков по астрономии, среди которых можно обнаружить избранные труды А. Козырева, бесспорно относящиеся к категории научного наследия.

Классические труды по астрономии можно обнаружить еще во многих любительских электронных библиотеках. А вообще электронных коллекций по астрономии великое множество, достаточно проанализировать Путеводитель астрономов по Интернет (http://astra.prao.psn.ru/SAM/WIN/astro.htm). Выявление в них материалов научного наследия — задача, требующая профессионального знания предмета.

Рассмотрим другой пример. Такой сюжет научного наследия, как история развития отечественной вычислительной техники и информатики, представлен в ряде ресурсов, образующих некоторое сообщество в Интернете.

Виртуальный компьютерный музей (http: //www.computer-museum.ru/index.php). Ресурс содержит ряд разделов, в том числе “Галерея славы”. Этот раздел музея содержит научные биографии выдающихся ученых и инженеров, которые внесли наиболее весомый вклад в создание и применение отечественных средств вычислительной техники. Статьи раздела посвящены основателям школ разработки и главным конструкторам универсальных вычислительных машин, универсальных и специализированных управляющих машин, специализированных вычислительных машин военного назначения. В разделе также представлены статьи об основателях отечественных школ программирования. Музей имеет и ряд других разделов: История отечественной вычислительной техники, История программного обеспечения, История компьютерных игр, История развития электросвязи, Книги и пресса, Документы.

Музей также содержит аннотированные ссылки на другие музеи по истории вычислительной техники в России, некоторые из них мы приведем здесь. Этот музей и связанные с ним электронные ресурсы могут служить хорошей иллюстрацией для оценки состояния и рассеяния документов по истории науки и техники.

Электронный архив академика Андрея Петровича Ершова — это проект Института систем информатики Сибирского отделения Российской академии наук, осуществляемый благодаря спонсорской помощи Microsoft Research и при технической поддержке компании xTech. Архив содержит уникальные документы, отражающие историю развития информатики в СССР, переписку академика Ершова и рукописи его работ. В архиве упоминается более 5 тысяч человек, оставивших свой след в истории развития информатики в нашей стране и за рубежом (http://ershov.iis.nsk.su/russian).

Значительное число сайтов посвящено различным аспектам Истории отечественной вычислительной техники. Они представлены на сайтах НИВЦ МГУ (http://www.parallel.ru/), МГТУ им. Баумана (http://museum.iu4.bmstu.ru/index.shtml), многочисленных сайтах, поддерживаемых энтузиастами — частными лицами (Б.Н. Малиновским — http://sovietcomputing.com/, Эндрю Дэйви — http://www.taswegian.com/MOSCOW/soviet.html, Сергея Фролова — http: //www.rk86.com/frolov/calcoll.htm, Сергея Тархова — http://www.bashedu.ru/konkurs/tarhov/russian/index_r.htm и др.)

Значительное количество материалов по научному наследию представлено на сайтах образовательных учреждений. Рассмотрим, к примеру, систему ресурсов Московского государственного университета им М.В. Ломоносова.

Среди более 300 ресурсов (сайтов, тематических серверов и коллекций) этого комплекса мы находим несколько целиком относящихся к научному наследию. Это, прежде всего, электронный музей “История Императорского московского университета” (http://museum.guru.ru/), коллекция документов и публикаций по истории Московского университета (http://www.mmforce.net/msu/story/), сайт посвященный А.Н. Колмогорову (http: //www.kolmogorov.pms.ru/). Имеется также коллекция “классический университетский учебник”. Однако, кроме того, материалы по истории науки, персоналиям, публикации отдельных классических научных трудов мы находим также на различных тематических сайтах, сайтах факультетов и отдельных кафедр. Например, на Ботаническом сервере МГУ (http://herba.msu.ru) имеется раздел “классики науки”.

Даже беглый взгляд на проблему показывает очень большой объем и высокую степень рассеяния информации по научному наследию.

Следует также иметь в виду, что согласно замыслам создателей электронной библиотеки “Научное наследие РАН” [3] в эту библиотеку должны включаться не только полные тексты произведений известных русских ученых, но и энциклопедические сведения о них, библиография их трудов, портреты, фотографии, видео и кино-материалы и другие сопутствующие документы. В такой постановке число потенциальных источников рассматриваемой библиотеки еще более возрастает. Так, множество ресурсов содержит электронные энциклопедии, как универсальные, так и отраслевые, российские, советские и современные, официальные и личные. Среди них нужно отметить “Википедию” — один из наиболее популярных ресурсов, создаваемый, как известно, на общественных началах самым широким кругом заинтересованных лиц. Эта энциклопедия содержит громадное число статей, посвященных российской науке и российским ученым. Широко известен проект “Рубрикон”, содержащий оцифрованные версии ряда наиболее известных печатных энциклопедий

Можно указать и на многие другие разнородные ресурсы, содержащие материалы по истории науки и научному наследию.

М.В. Ломоносов. Электронное научное издание, создаваемое по технологии и в рамках Фундаментальной электронной библиотеки “Русская литература и фольклор” (http: //feb-web.ru) совместно Институтом лингвистических исследований РАН и Фондом ФЭБ. Электронное издание включает полное собрание сочинений М.В. Ломоносова, энциклопедические сведения о нем, литературу, посвященную великому русскому ученому, а также множество графических и других вспомогательных материалов. Проект находится в стадии реализации и должен быть обнародован в текущем году.

Тексто-графическая база данных по истории российской фундаментальной науки на основе фондов архивов РАН (http: //hp.iitp.ru/index.html). Банк изображений содержит коллекции медалей и знаков, хранящейся в АРАН (Разряд ХIII, около 350 единиц хранения), реляционная база данных включает архивную опись коллекции и связанный с ней банк цифровых изображений.

История физики. Электронная коллекция по истории физики Санкт-Петербургской академии постдипломного педагогического образования (http: //edu.delfa.net/Interest/biography/biblio.htm) содержит несколько десятков книг, составляющих классическое научное наследие отечественных и зарубежных ученых.

История химии. Фундаментальное электронное издание Института истории естествознания и техники РАН (http: //grokhovs.chat.ru/chemhist.html) посвящено истории возникновения и развития химии с древнейших времен до XVII века.

Электронная библиотека Ярославского региона. Электронная библиотека, источниковой базой которой являются собрания и коллекции, хранящиеся в ВУЗах, музеях, библиотеках, архивах, а также в православных храмах Ярославской области.

Еще раз подчеркнем, что приведенный список лишь иллюстрирует степень рассеяния электронных ресурсов по научному наследию. Систематическое изучение существующих ресурсов в данной области — предмет специальной постоянной профессиональной деятельности.

Рассмотрим концептуальные решения по созданию и развитию электронной библиотеки “Научное наследие России”.

Цели и задачи создания ЭБ

В работе [3] сформулированы следующие цели создания ЭБ:

1) предоставление всем желающим через Интернет информации о выдающихся российских ученых, внесших вклад в развитие фундаментальных естественных и гуманитарных наук, с возможностью ознакомления с полными текстами опубликованных ими наиболее значительных работ.

2) обеспечение сохранности оригиналов изданий, являющихся исторической ценностью — возможность работы с цифровыми копиями существенно снижает потребности в работе с печатными материалами, а каждая “книговыдача” на руки раритетных изданий сокращает срок их “жизни”.

3) включение сведений об ученых и основных результатах их научной деятельности в Единое научное информационное пространство (ЕНИП) РАН.

Вероятно, данные формулировки требуют некоторого уточнения. В частности, следует определить круг пользователей ЭБ, в частности, следует ли ориентироваться в основном на специалистов по истории наук, или ЭБ имеет в большей степени популяризаторский характер. Эта альтернатива уже отмечена авторами разработки: следует ли стремиться к полноте отображения научного наследия ученого или достаточно представление его наиболее известных работ.

Далее требует конкретизации понятие “фундаментальных” наук: означает ли это понятие, что в ЭБ принципиально не включаются ученые, чья деятельность в основном носит прикладной характер, в частности, в области техники, медицины, сельского хозяйства, педагогики и проч. Понятно, что ответ на этот вопрос в значительной степени будет определяться отобранными экспертами, т.е. сводится к принципам формирования экспертного совета.

Вероятно, следует и более точно определить понятие исторической ценности издания. Возможными альтернативами являются: формальное определение ценности на основе отражения издания в перечне особо ценных изданий или этот критерий будет определяться именно применительно к созданию данной ЭБ.

Организация и управление ЭБ

К организационным вопросам, которые следует определить в концепции, относятся:

Часть перечисленных вопросов была решена на первом этапе создания системы. Необходимо принять решения по другим, в частности, определить порядок расширения состава участников, имея в виду не только прямое привлечение за счет централизованного финансирования, но и различные формы сотрудничества на основе обмена информацией, технологиями.

По мере расширения библиотеки и перехода ее развития и поддержания на промышленные рельсы, вероятно, понадобится создание специальных структур, обеспечивающих поддержку обеспечивающих компонентов, прежде всего метаданных, словарей и авторитетных файлов, служб мониторинга источников комплектования, координации оцифровки, а также обратной связи с потребителями.

При наличии дополнительных (кроме бюджета РАН) источников финансирования в системе управления понадобится и планово-экономическая служба.

И, наконец, на более поздних этапах развития системы, возможно создание специализированной организации — например, некоммерческого партнерства или фонда (по примеру Фонда ФЭБ), для организации эксплуатации ЭБ.

Экономическая модель ЭБ

Центральным вопросом создания стабильной и устойчивой любой информационной системы, в том числе, естественно, и электронной библиотеки, являются вопросы финансово-экономического обеспечения. В то же время эта проблематика разработана совершенно недостаточно. В принципе возможны 3 экономические модели функционирования ЭБ, элементы которых, конечно, могут сочетаться.

  1. Бюджетная модель. Эта модель предполагает полное финансовое обеспечение системы из бюджета и бесплатное предоставление информации пользователям. Бюджетное финансирование может дополняться грантами из некоммерческих фондов, однако последние по своей природе не могут быть надежным финансовым источником на сколько-нибудь длительную перспективу. Что же касается чисто бюджетного финансирования на постоянной основе, то в условиях РАН это достаточно затруднительный вариант. Скорее всего, даже при благоприятных условиях эта модель сведется к некоторому увеличению сметы для головной организации, что не позволит эффективно развивать систему. Еще сложнее будет реализовать бюджетную модель, если в число участников войдут организации других ведомств или негосударственные организации.
  2. Модель перекрестного субсидирования. Эта модель предполагает бесплатное предоставление информации пользователям и развитие на основе ЭБ некоторых платных сервисов. Типичным для этого варианта является рекламная модель. Делаются также попытки использования других смежных платных сервисов, например, электронной торговли. Эта модель в современных российских условиях позволяет достичь рентабельности только при очень высокой посещаемости ресурса. В то же время есть основания сомневаться, что рассматриваемая ЭБ позволит добиться соответствующей посещаемости.
  3. Модель платного доступа. Эта модель имеет ряд разновидностей, в зависимости от формы сбора платы и форм предоставления доступа. Например, в последнее время интерес специалистов по ЭБ вызвала инициатива компании ЛитРес по организации электронных библиотек с бесплатным чтением и платным копированием произведений из библиотеки (http://users.livejournal.com/magister_/238369.html). Подробно все варианты моделей платного доступа к произведениям в цифровой форме рассмотрены в фундаментальном исследовании А.Б. Долгина [4].

Очевидно, что без решения экономических вопросов практическое создание электронной библиотеки не имеет смысла. Для выработки экономической модели необходимо детально проанализировать размеры затрат на эксплуатацию ЭБ и размеры и формы возможных поступлений. Экономическая модель должна быть разработана до завершения работ по действующей целевой программе.

Правовые вопросы

Промышленно работающая ЭБ должна, очевидно, иметь и соответствующее правовое обеспечение. При этом речь должна идти не только об охране объектов авторского права, хотя эта проблема является самой острой. Необходимо зафиксировать правовой статус ЭБ, права и обязанности участников, обеспечить правовые гарантии сохранности ЭБ и решить ряд других вопросов.

Что же касается охраны авторских прав, то на первом этапе, конечно, возможно ограничиться оцифровкой неохраняемых произведений. Но очевидно, что по мере развития ЭБ это ограничение станет критическим. Поэтому для ЭБ необходимо разработать набор документов, позволяющих решать различные правовые проблемы. Это авторские договора, договора об отчуждении прав, договора с издательствами, договора с партнерами и поставщиками информации, нормативно-правовые акты, регламентирующие передачу в ЭБ служебных произведений и ряд других.

Организация фонда

В работе [3] намечены принципы организации фонда ЭБ “Научное наследие России” на первом этапе ее создания и предполагающие децентрализованное комплектование и централизованное хранение. Однако это слишком общая постановка вопроса. Возможно выделение открытой и закрытой частей фонда (в случае включения в коллекцию охраняемых произведений), наличие основного пользовательского и страхового фонда, формирование в составе фонда коллекций, принадлежащих отдельным поставщикам и другие варианты.

Естественно, возможно и членение фонда по технологическим признакам. На первом этапе распознавание оцифрованных произведений не предполагается. Однако в случае включение в состав участников ЭБ других организаций ситуация может измениться. Так, например ЭНИ “М.В. Ломоносов”, создаваемое в фонде ФЭБ, представлено не только в распознанном и откорректированном виде, но и снабжено глубокой разметкой, позволяющей реализовать много различных дополнительных сервисов для работы с книгами. Отказ от этих сервисов во имя единства фонда представляется нерациональным решением. Альтернативой является организация фонда в виде набора коллекций, обладающих различными функциональными возможностями.

Такие же коллизии возможны и относительно систем метаданных, используемых тематических классификаций и других свойств импортируемых произведений. Опыт показывает, как сложно добиться при децентрализованном комплектовании и обработки единой технологической дисциплины. В этих случаях также представляется возможным создание в составе фонда ЭБ различных по составу метаданных коллекций, при сохранении некоторых возможностей поиска по всему фонду. Собственно, эта идея и является основной при использовании технологий XML и RDFS.

Способы и источники комплектования.

Организация комплектования является главным фактором, влияющим на качество ЭБ. Постоянное противоречие между желанием обеспечить полноту комплектования и технологическими проблемами, вытекающими из взаимодействия с различными источниками, определяет сложность решения данной проблемы. Анализ российских потенциальных источников, приведенный выше, показывает, что число потенциальных источников комплектования очень велико. Однако возможности использования этих источников очень разнятся, в зависимости от качества подготовки информации в различных коллекциях. Теоретически верно было бы разработать технико-экономическую модель, которая бы позволила оценить затраты на комплектование для каждого случая по сравнению с базовым вариантом, который предложен и реализуется на первом этапе развития ЭБ. Однако, насколько нам известно, такой модели для ЭБ пока не существует.

Вообще существуют 4 основные технологии комплектования ЭБ:

  1. Собственная оцифровка;
  2. Получение электронных версий документов в виде рукописей или оригинал-макетов изданий;
  3. Скачивание документов из Интернет;
  4. Получение документов от партнеров по согласованной технологии.

Достоинства и недостатки всех этих технологий, в том числе с экономической точки зрения, достаточно подробно рассмотрены в [1].

Функциональность ЭБ и используемые технологии

В принципе технологические вопросы создания ЭБ “Научное наследие России” в докладе не рассматриваются. Поэтому ограничимся здесь самыми общими замечаниями.

Выбор функциональности системы определяется, прежде всего, целями и задачами ЭБ, а также экономическими факторами. Понятно, что повышение функциональности конфликтует с экономичностью и что при тех же затратах можно увеличить коллекцию за счет функциональности и наоборот.

Подробно возможные функции ЭБ, разработанные на опыте полнофункциональной ЭБ “Русская литература и фольклор”, рассмотрены в [1]. Естественно, что этот набор может быть сокращен и принят более простой вариант, однако необходимая степень простоты должна быть вполне осознана и мотивирована.

Например, в созданной пилотной версии ЭБ вообще отсутствует тематическая классификация изданий и, следовательно, отсутствует возможность тематической навигации по публикациям. Такое упрощение возможности навигации для универсальной по тематике ЭБ кажется чрезмерным. По мере развития фонда, когда число введенных документов достигнет хотя бы нескольких сотен, организация тематической навигации окажется необходимой. Однако понятно, что для этой цели необходимо или рубрицирование всех документов ЭБ по единой классификации или создание переходных таблиц для импортируемых документов, использующих иные классификации.

То же можно сказать о лексическом поиске. Произведения, оцифрованные на первом этапе создания ЭБ, представлены в графическом формате, что исключает возможность лексического поиска по тексту. Однако комплектование ЭБ из других источников документами в символьных форматах позволяет организовать поиск по тексту без особенных дополнительных затрат. Отказ от такой возможности также требует обоснования.

Выводы

Из приведенного обзора с очевидностью следует, что в России существует множество источников информации, которые могут оказаться полезны для наполнения библиотеки “Научное наследие России”. При этом эти источники характеризуются значительной неравномерностью и рассеянием. В этих условиях приоритетной задачей является организация системы мониторинга электронных ресурсов — потенциальных источников комплектования рассматриваемой ЭБ. В качестве инструмента такого мониторинга могут использоваться информационные системы, которые были созданы и поддерживаются при непосредственном участии Российской ассоциации электронных библиотек:

Необходима разработка, обсуждение и утверждение заказчиком концепции ЭБ “Научное наследие России”, в которой должны быть определены основные параметры этой библиотеки с определением первоочередных этапов ее развития, а также в расчете на длительную перспективу. Важное место в концепции должна занять экономическая модель ЭБ.

Литература

  1. Антопольский А.Б., Майстрович Т.В. Электронные библиотеки: принципы создания. — Либерея, М. 2007, 284 с.
  2. Towards a Cultural Heritage Digital Library/ G. Crane, C. Wulfman etc. — Perseus Project, Tufts University, Medford MA 02155.
  3. Н.Е. Калёнов, Г.И. Савин, А.Н. Сотников Электронная библиотека “Научное наследие России”: технология наполнения (публикация в настоящем сборнике).
  4. Долгин А.Б. Экономика символического обмена. М.: Инфра-М, 2006.
!3!

ЭЛЕКТРОННАЯ БИБЛИОТЕКА “НАУЧНОЕ НАСЛЕДИЕ РОССИИ”: ТЕХНОЛОГИЯ НАПОЛНЕНИЯ

Калёнов Н.Е., Савин Г.И., Сотников А.Н.

Работы по созданию электронной библиотеки “Научное наследие России” (далее ЭБ) ведутся в рамках одноименной целевой программы Президиума РАН.

Основной целью создания ЭБ является предоставление всем желающим через Интернет информации о выдающихся российских ученых, внесших вклад в развитие фундаментальных естественных и гуманитарных наук, с возможностью ознакомления с полными текстами опубликованных ими наиболее значительных работ. Другой целью создания ЭБ является обеспечение сохранности оригиналов изданий, являющихся исторической ценностью — возможность работы с цифровыми копиями существенно снижает потребности в работе с печатными материалами, а каждая “книговыдача” на руки раритетных изданий сокращает срок их “жизни”. Третьей целью создания ЭБ является включение сведений об ученых и основных результатах их научной деятельности в Единое научное информационное пространство (ЕНИП) РАН. В этой части работа поддерживается РФФИ (проект 05-07-90116).

На начальном этапе реализации программы по созданию ЭБ необходимо было решить ряд принципиальных проблем, таких как выбор участников проекта, определение содержимого ЭБ, разработка технологии подготовки информации, разработка технологии загрузки и поддержки ЭБ, отработка технологии администрирования процессов наполнения и поддержки ЭБ. Остановимся подробнее на решении этих проблем.

Участники проекта

Общее руководство работой осуществляет Межведомственный суперкомпьютерный центр (МСЦ) РАН. Поскольку основные источники информации (полные тексты изданий) хранятся в фондах библиотек, в качестве исполнителей на начальном этапе разработки были выбраны центральные библиотеки РАН — БАН, БЕН (Центральная библиотека и ее отделения в Пущинском научном центре, Математическом и Физическом институтах РАН), ИНИОН. Основным разработчиком программных средств, обеспечивающих интеграцию ЭБ в ЕНИП, является ВЦ РАН.

В основу наполнения ЭБ был положен принцип скоординированной децентрализованной подготовки информации в сочетании с централизованной поддержкой хранилища данных.

МСЦ РАН осуществляет техническое обеспечение работ по оцифровке изданий — им предоставлены всем участникам бесконтактные сканеры и компьютеры для обработки изображений.

БЕН РАН (Центральная библиотека) обеспечивает технологическую поддержку процессов координации оцифровки изданий.

Наполнение ЭБ

Как уже указывалось, основной задачей ЭБ является предоставление информации об ученых и их публикациях, поэтому каждый раздел ЭБ, относящийся к конкретному ученому, включает три составляющих: сведение об ученом, список его основных публикаций, полные тексты наиболее значимых из них.

Сведения об ученом включают следующие элементы данных:

Сведения о публикациях представлены в виде перечня основных элементов библиографических описаний. Для каждой публикации они включают следующие элементы данных:

Издания, подлежащие оцифровке, кроме элементов библиографического описания, имеют ряд элементов данных, необходимых для диспетчеризации процессов оцифровки. К этим элементам относятся:

При формировании ЭБ, содержащих цифровые копии опубликованных изданий, наряду с чисто техническими проблемами, возникают проблемы, связанные с защитой авторских прав. В связи с этим, чтобы не заниматься достаточно сложной работой, связанной с получением разрешений на оцифровку изданий, было решено на начальном этапе формирования ЭБ ограничиться включением в библиотеку ученых, скончавшихся более 70-ти лет назад и полных текстов их книг, изданных до 1920-го года.

Круг ученых, на работах которых осуществлялась отладка технологии создания и поддержки ЭБ, выбирался с учетом охвата различных научных направлений специалистами — систематизаторами литературы БЕН РАН. В него было включено 75 ученых, работавших в области естественных и точных наук. Среди них — математики (Л. Эйлер, Н.И. Лобачевский, М.В. Остроградский, П.М. Чебышев и др.), физики и механики (М.В. Ломоносов, Н.А. Умов, П.Н. Лебедев, Н.Е. Жуковский и др.), химики (А.А. Воскресенский, А.М. Бутлеров, Д.И. Менделеев, Н.Н. Зинин и др.), биологи (К.М. Бэр, В.В. Марковников, К.М. Тимирязев, И.И. Мечников и др.), ученые в области наук о Земле (С.У. Ремезов, Ф.П. Литке, А.И. Воейков, Е.С. Федоров и др.), ученые в области технических наук (И.П. Кулибин, П.Л. Шиллинг, Н.П. Петров, И.А. Вышнеградский и др.). Источником сведений об ученых в большинстве случаев являлась информация, найденная на различных общедоступных сайтах в Интернет. Информация проверялась по энциклопедическим источникам, обрабатывалась, дополнялась копиями портретов и загружалась в технологическую систему (см. ниже).

Технология подготовки информации

Для осуществления координации действий участников создания ЭБ БЕН РАН поддерживает на своем сервере интерактивную систему, содержащую вышеперечисленные элементы данных, относящихся к ученым и их публикациям.

Система реализована на базе программного обеспечения SCIRUS [1, 2], разработанного специалистами БЕН РАН в рамках развития проекта “Наука России” [3], поддерживаемого РФФИ. Система обеспечивает развитые поисковые возможности (запрос может включать значения любых элементов данных системы, соединенных операторами булевой логики; в результате обработки запроса может быть выдан список персон или публикаций, отсортированный в заданном порядке по значению любого поля). Кроме того, она обладает гибким аппаратом настройки на различные элементы данных, различные права манипуляции с данными для разных пользователей, различные форматы экспорта данных.

В настоящее время система поддерживает ряд баз данных — БД публикаций сотрудников РАН, справочник по библиотекам ЦБС БЕН РАН, БД диссертаций, формируемая в интерактивном режиме несколькими организациями страны в рамках проекта РФФИ, руководимого О.А. Лавреновой (РГБ). Система доступна по адресу http://scirus.benran.ru/scirus. Войдя в систему под именем guest без пароля, любой пользователь может осуществлять поиск в представленных базах данных.

Реализация, настроенная на диспетчеризацию наполнения ЭБ, устроена так, что каждый участник может, войдя в систему по своему паролю, осуществлять поиск информации, просматривать все записи, вводить новые данные и редактировать старые, но только введенные под его именем. При поиске может быть задано ограничение — выбирать записи, введенные данным пользователем (в меню предлагается список имен, зарегистрированных в системе). Пользователь, наделенный правами администратора, может редактировать информацию, введенную любым участником системы.

Руководствуясь согласованным списком ученых, каждая организация — участник создания ЭБ, определяет издания из своих фондов, которые она считает целесообразным включить в ЭБ. После этого, зарегистрированный представитель этой организации входит в систему диспетчеризации и проверяет, не зарегистрирована ли уже в ней данная публикация. Если в системе публикация отсутствует, он ее вводит, выбирая из предлагаемого списка значений поля “Текущий статус” “Предложено к оцифровке”. Если публикация уже введена в систему, она пропускается и обрабатывается следующая.

Администратор ЭБ (сотрудник МСЦ РАН) периодически входит в систему диспетчеризации, отбирает все документы со статусом “Предложено к оцифровке” и принимает решение по каждой из них о целесообразности ввода в ЭБ. Если документ подлежит оцифровке, в поле “Рабочий номер” вводится номер данного документа, под которым он будет введен в ЭБ, и значение поля “Текущий статус” меняется на “Зарегистрировано”. Если по какой-либо причине документ оцифровывать нецелесообразно, значение поля “Текущий статус” меняется на “Оцифровке не подлежит”.

Представитель организации, предложивший издания для включения в ЭБ, входит в систему диспетчеризации и выбирает свои записи, имеющие текущий статус “Зарегистрировано”. После подбора изданий и отправки на оцифровку их текущий статус меняется — в это поле вводится значение “В работе”. После завершения процесса оцифровки статус записей меняется на “Оцифровано”, после передачи в МСЦ — на “Сдано”.

Таким образом, в каждый момент времени административная группа ЭБ может получить сведения, сколько и каких изданий находится в работе, сколько и кем оцифровано и т.п.

Загрузка данных о научном наследии в ЕНИП РАН осуществляется в специальном формате, базирующемся на XML и RDFS. Выходные данные в этом формате автоматически формируются в рамках системы диспетчеризации с помощью опции “Экспорт в формате ВЦ РАН” для отмеченных записей и отправляются по электронной почте в ВЦ РАН.

Оцифровка изданий для ЭБ осуществляется с разрешением 600 dpi в формате tif. После собственно сканирования операторы осуществляют дополнительное форматирование и очистку изображения. Каждое отсканированное и обработанное издание проходит дополнительную стадию редактирования — проверку наличия и качества всех страниц.

При обсуждении формы представления и хранения оцифрованных изданий было решено отказаться от распознавания отсканированного текста и держать отдельные страницы в виде файлов изображений. Это обусловлено значительной трудоемкостью процесса преобразования отсканированной информации в текстовую, особенно с учетом специфики создаваемой ЭБ — многоязычности, наличия в тексте различных формул и пометок на полях, которые в ряде случаев сами по себе представляют историческую ценность.

Для обеспечения навигационного сервиса, достаточного для решения задач, стоящих перед ЭБ на данном этапе, было решено обрабатывать оглавления изданий и предоставлять пользователю возможность автоматического перехода на страницы выбранного раздела. Это потребовало не только работы с оглавлениями (распознавание текста, а в ряде случаев — ручной ввод), но и специальной обработки всего массива отсканированных страниц, целью которой является установление взаимно однозначного соответствия между номерами страниц издания и порядковыми номерами их цифровых копий (во многих случаях порядковые номера файлов отсканированных страниц не совпадают с нумерацией, принятой в книге).

Загрузка и поддержка ЭБ

Данные, формируемые участниками проекта, в настоящее время направляются в два адреса — в МСЦ для помещения в хранилище ЭБ, и в ВЦ РАН для загрузки в демонстрационную систему. Информация об ученых и списки их публикаций, подготовленные участниками проекта и введенные в технологическую систему, выгружаются из нее по запросу в формате МСЦ (таблица EXCEL) и в формате ЕНИП (XML/RDF). При этом возможны два варианта технологии — (а) выгрузку осуществляют представители МСЦ и ВЦ и сохраняют экспортные файлы на своих компьютерах или (б) экспортные файлы формируют создатели и отправляют адресатам по электронной почте. В настоящее время в системе реализован вариант (б), который оказался предпочтительнее с точки зрения контроля за отправкой материалов (исполнители сами заботятся о передаче информации и изменяют статус отправленных записей).

Отсканированные страницы (tif-файлы, содержащие в имени рабочий номер документа и порядковый номер страницы, а также размеченные файлы оглавлений изданий) загружаются на ftp-сервера исполнителей и забираются оттуда по паролю представителями МСЦ и ВЦ.

В настоящее время сотрудниками ВЦ РАН разработана пилотная демонстрационная версия ЭБ, доступная по адресу http: //nasledie.enip.ras.ru. Система позволяет искать ученых и их публикации по ряду элементов данных, просматривать найденную информацию, в том числе читать полные тексты книг, включенных в ЭБ, с возможностью перехода от оглавления книги на нужный раздел, а затем на выбранную страницу раздела. Интерфейс системы позволяет увеличивать/уменьшать изображение, поворачивать его в случае текста, представленного в альбомном формате.

Администрирование ЭБ

Основные принципы, заложенные в технологию администрирования ЭБ, были изложены выше по ходу рассмотрения различных технологических аспектов наполнения и поддержки Библиотеки. Серьезный вопрос, требующий решения, связан с принципами отбора информации и определения очередности ее ввода в ЭБ. На начальном этапе создания ЭБ, когда основной задачей являлась отработка технологических решений, выбор круга персоналий и работ был осуществлен, в значительной мере, волюнтаристски. В дальнейшем должна быть отработана методика и критерии для отбора данных, подлежащих загрузке в ЭБ. Это могут быть либо экспертные оценки, полученные от специально выделенных экспертов по каждому научному направлению, либо результаты массового анкетирования ученых, либо данные, основанные на обработке общепризнанных энциклопедий. Вопросом является также степень полноты отражения работ ученых в ЭБ. Здесь также возможны альтернативные варианты — вводить все изданные работы данного ученого, вводить только монографии, вводить наиболее значимые (по мнению экспертов) работы и т.п.

Для решения этих и подобных вопросов, вероятно, должен быть создан Совет системы, включающий как специалистов в области создания ЭБ, так и ученых в различных научных областях.

Заключение

В течение года, прошедшего с начала работ по Целевой программе, отработана технология распределенного создания ЭБ “Научное наследие РАН”, решены технические вопросы оцифровки изданий и представления информации пользователям, отработана методика загрузки и поддержки ЭБ, введены в ЭБ данные о 75-ти российских ученых, отсканировано несколько сотен книг. Таким образом, созданы предпосылки для широкого развертывания работ по развитию ЭБ. Очевидно, что эти работы могут быть продолжены только при наличии постоянного финансирования, причем финансирования не РАЗРАБОТКИ, а ПОДДЕРЖКИ ЭБ, что, к сожалению, в нашей стране и, в частности, в РАН практикуется достаточно редко. Перерыв в финансировании этих работ приведет к их прекращению, и даже при последующем возобновлении финансирования мы будем отброшены на несколько шагов назад по сравнению с современным состоянием.

Литература

  1. Сенько А.М. Информационная система SciRus: принципы построения и перспективы развития // Научный серис в сети ИНТЕРНЕТ: технологии параллельного программирования. Всероссийская науч. конф. Новороссийск, сент. 18-23, 2006. — М, 2006. — С. 58-59.
  2. Якшин М.М. WEB-интерфейс системы "Наука России" // Современные технологии в информационном обеспечении науки: Сб. науч. тр. под ред. Н.Е.Каленова. — М., 2003. — С. 47-52.
  3. Васильев А.В., Власова С.А., Глушановский А.В., Каленов Н.Е. Система "Наука России" и ее использование в информационно-библиотечной технологии// Информационное обеспечение науки: новые технологии // Сб. науч. тр. под ред. Н.Е. Каленова. — М.: БЕН РАН, 1997. — С. 86 — 88.
!4!

ПРОЕКТ “РЕЕСТР ЭЛЕКТРОННЫХ КОЛЛЕКЦИЙ”

Поляк Ю.Е.
(Некоммерческое партнерство “Электронные библиотеки”, Москва)

Некоммерческое партнерство “Электронные библиотеки” (НП ЭЛБИ) создано в феврале 2005 г. Председатель совета партнерства — генеральный директор РГБ В.В. Федоров, директор НП ЭЛБИ — профессор А.Б. Антопольский. Партнерство использует название “Российская ассоциация электронных библиотек” в качестве собственного бренда в рекламных, информационных и маркетинговых целях.

НП ЭЛБИ объединяет 37 организаций и 14 индивидуальных членов. Это — ведущие библиотеки страны РГБ, БЕН РАН, ГПНТБ, “Тургеневка”, “Ушинка”, крупнейшие библиотеки Новосибирска, Хабаровска, Орла; университеты Петрозаводска и Тюмени, истфак СПбГУ, РАГС и другие учебные заведения; ИПИ РАН, НТЦ “Информрегистр” и ряд других НИИ и органов НТИ; несколько общественных организаций и коммерческих фирм. Среди индивидуальных членов — программист, создатель самой известной в стране электронной библиотеки М.Е. Мошков, юрист В.Н. Монахов, ученые В.И. Ауссем, В.Н. Белоозеров, В.М. Хургин, журналист Г.И. Рузайкин, преподаватели И.М. Гарскова, В.А. Капустин, С.И. Корниенко и другие.

Партнерство ведет разностороннюю научно-методическую и культурно-просветительскую деятельность. Вот её основные направления:

За два с половиной года работы практически во всех этих сферах достигнуты значимые результаты. В частности, разработаны и опубликованы “Правовые рекомендации для создателей и владельцев электронных библиотек”, типовое “Положение о фонде электронных документов в библиотеке”; готовятся к публикации методические рекомендации по разработке профиля комплектования фонда сетевых электронных документов, методические рекомендации по разработке бизнес-планов для публичных электронных коллекций, методика определения типов и видов электронных ресурсов при их каталогизации. В “портфеле” законодательных инициатив — проекты концепции закона “Об электронных библиотеках”, Информационного кодекса Российской Федерации, новой редакции ФЗ “О библиотечном деле”, закона о внесении изменений в ФЗ “Об обязательном экземпляре документов” (в части поставки электронных документов). Выполняются исследовательские проекты по заказам федеральных министерств и ведомств. В частности, НП ЭЛБИ выиграло конкурс на получение государственной поддержки в сфере электронных СМИ Федерального агентства по печати и массовым коммуникациям по проекту “Интернет-портал “Электронные библиотеки России””.

Среди создаваемых членами партнерства электронных коллекций — электронные библиотеки по проблемам электронного документного пространства http: //library.elibra.ru, “Технологии информационного общества в России” http: //library.infosoc.ru , “История и современное состояние российско-белорусских этнокультурных связей” http: //by.ethnology.ru , электронная музыкальная библиотека. Выпускается бюллетень “Электронные библиотеки России” и серия препринтов. ЭЛБИ участвует в издании журнала Росинформресурса “Информационные ресурсы России”. На базе РГБ проводятся регулярный семинар “Электронные библиотеки, теория и методика” и научная конференция “Электронные библиотеки России”. Информация обо всем этом и многом другом содержится на сайте партнерства http://elibra.ru.

Одной из основных целей НП ЭЛБИ является содействие созданию единого и структурированного электронного документного пространства в российском сегменте Интернета на основе эффективного взаимодействия организаций-генераторов электронных коллекций и других заинтересованных организаций. Среди ряда проектов, направленных на достижение этой цели, важное место занимает создание сводного реестра наиболее значительных электронных библиотек и коллекций. Этой работе предшествовала оценка существующих каталогов ЭБ, выработка требований к формату описания и к качеству аннотируемых ресурсов. С целью обеспечения необходимой полноты реестр формируется на основе нескольких информационных источников, разработанных ранее членами ассоциации. К важнейшим из них относятся Перечень ЭБ, созданный в Фонде “Фундаментальные электронные библиотеки”; база данных по информационным ресурсам рунета “Internet Stock”, Навигационная система по информационным ресурсам в сфере науки и инноваций http://scireg.informika.ru, Госрегистр БД, Федеральный депозитарий электронных изданий и другие.

Только первый из указанных источников специально создавался как список электронных библиотек, другие разработки изначально преследовали иные цели. При этом “Перечень…” представляет собой текстовый файл и содержит порядка 800 названий; база “Internet Stock”, оболочка которой создана более 10 лет назад на MS Access, включает свыше 55000 записей; а в “Навигационной системе” более 5000 записей. Интеграция указанных источников затруднена различиями в форме представления информации, структуре и формате данных (см. рис.1-3), а также значительным количеством записей, дублирующихся в этих независимых коллекциях. Для решения проблемы была разработана автоматизированная процедура слияния этих ресурсов с последующей ручной проверкой и заполнением недостающих полей. В конце 2006 года создана единая база данных (на основе MS SQL Server), а также разработано веб-приложение на основе технологии ASP.Net 2.0 для удаленной работы с информацией. Уникальность скомпонованного массива данных связана с единственным в своем роде набором полей, определяющим его структуру и потенциальную информационную ценность (за основу взяты обязательные поля трех указанных источников и рубрикатор ГРНТИ). Информация, предназначенная для открытого доступа, размещена на сайте ассоциации и, возможно, позднее появится на зеркале, расположенном в РГБ.

Рис.1. Описание портала “Аудиториум” в Навигационной системе

Рис.2. Описание портала “Аудиториум” в Перечне электронных библиотек Фонда ФЭБ

Рис.3. Описание портала “Аудиториум” в базе данных “Internet Stock”

Для каждого из перечисленных источников информации приведем структуру его полей (обязательные элементы подчеркнуты).

“Перечень электронных библиотек”:

База “Internet Stock”:

“Навигационная система”:

На основе анализа приведенных наборов полей, после консультаций с ведущими специалистами в области каталогизации информационных ресурсов была принята следующая структура “Реестра электронных библиотек”:

Помимо перечисленных, в структуре предусмотрено поле с условным названием “ДСП”, предназначенное для примечаний, технических пометок, неофициальных рейтингов и прочей информации, не подлежащей открытому доступу.

Большинство полей являются текстовыми; в ряде случаев (напр., рубрика, формат, язык) предусмотрен выбор из списка значений.

Зарегистрированный пользователь после ввода учетного имени и пароля получает доступ к функциям редактирования и ввода/удаления записей, а также к расширенному режиму поиска.

При этом содержимое ряда полей выбирается из списков допустимых значений. В частности, допустимые значения для поля “Рубрики" определяются рубрикатором ГРНТИ. Возможные варианты для поля “Статус” — “Все”, “Публиковать” и “Не публиковать”. Значения полей “Источник” и “Редактор” определяются соответствующими перечнями по состоянию на момент поиска. Для поля “Дата изм. записи с… по…” предусмотрен диапазон значений с возможностью задания нижней и/или верхней границы. Поле “Идентификатор” задается его точным значением. Для остальных полей (“Наименование”, “Аннотация”, “Адрес”, “Владелец”) предусмотрена возможность ввода фрагментов; минимально допустимым квантом является буква.

Идентификатор:

1984

Источник:

Vygur 3

Наименование:

Примеч. Поле обязательно для ввода

Аннотация:

Примеч. Поле обязательно для ввода

Адрес 1:

Адрес 2:

Адрес 3:

Почтовый адрес:

Примеч. Необходимо ввести один из адресов

Владелец:

Город:

Телефон:

Email:

Дата созд ресурса:

Дата изм ресурса:

Дата созд записи:

Дата изм записи:

Редактор:

Актуальность:

Формат:

Жанр:

Объем (записей):


Примеч. Целое значение

Объем Гб:


Примеч. Числовое значение

Доступ:

Язык:

(по умолчанию)

Структура:

Публиковать:

СМИ

ДСП:

Сохранить Закрыть Рубрики Удалить

Рис.4. Форма для ввода и коррекции записей Реестра

 

Рис.5. Скриншот страницы Реестра

Создание такого реестра, функционирующего в полном объеме, даст пользователям сети еще один качественный навигационный инструмент — аннотированную информационную систему с функциями поиска по различным критериям, а владельцам информационных ресурсов предоставит дополнительное средство продвижения их разработок. Ассоциация электронных библиотек получит аналитический инструмент, необходимый для выполнения многих важных проектов и, в перспективе — новых членов из числа разработчиков электронных коллекций, включенных в реестр.

!5!

К ВОПРОСУ О ДОЛГОСРОЧНОМ СОХРАНЕНИИ ЦИФРОВОЙ ИНФОРМАЦИИ

Шварцман М.Е.
(РГБ)

Количество оцифрованных книг и материалов, созданных изначально в цифровой форме (Web-сайты, CD, DVD), растет стремительно. При этом оцифрованные материалы хранятся в библиотеках так же, как и привычные печатные. Оцифровали, записали на диск и поставили на полки.

Однако принципы хранения цифровых материалов во многом отличаются от привычных нам принципов хранения книг.

Один из главных вопросов — “что сохранять”. Так же, как в традиционном комплектовании библиотек существует профиль комплектования, определяющий тематику и форму собираемой литературы, при комплектовании цифровых библиотек (DL) должны быть выработаны принципы отбора.

Во многих странах законом на Национальные библиотеки возложена обязанность сохранения цифрового наследия страны.

Сразу же встает вопрос, что сюда включать, и многие страны этот вопрос решают по-разному. Различают следующие типы цифровых материалов (ЦМ):

Поскольку в задачу автора не входит разработка классификации цифровых материалов, она не претендует на полноту и строгость принципов отбора.

После того, как мы решим, какие виды материалов нужно сохранять, нужно понять, что существует принципиальное отличие ЦМ от печатных материалов. Они могут постоянно меняться. Новостные агентства публикуют свои новости постоянно, они могут снимать устаревшие сведения или сведения, опубликованные по ошибке. Задавая любую разумную периодичность копирования новостного сайта, мы заранее понимаем, что можем что-то потерять, возникающее и исчезающее в этих промежутках.

Изменчивость ЦМ также должна отражаться и в их библиографическом описании. Может быть, нам нужно делать постоянно меняющееся библиографическое описание, что технически возможно, или идти по пути описания журналов, где фиксируют все прежние варианты названия, и тоже фиксировать все изменения и хранить все варианты описаний. Меняться может многое (адрес, наименование, автор, владелец и т.п.).

В процессе создания и бытования ЦМ они проходят множество этапов, на каждом из которых претерпевают изменения, как по форме, так и по содержанию. Например, при оцифровке старой книги мы сначала получаем изображение страниц в формате RAW, затем отрабатываем их и переводим в TIFF, затем делаем из них одну книгу — файл в формате PDF и набор HTML и JPG — файлов для опубликования книги на сайте. Какую из форм нам нужно хранить? Все?

Сохраняя печатный документ, мы сохраняем одновременно и форму и содержание, поскольку в этом виде они неотделимы. Для ЦМ возможно существование в различных формах. Так (приводя примеры уже из российской практики), компания “Интегрум-техно” сохраняет только текст журнальных публикаций, East-View — текст с сохранением разбиения на страницы, а для Петровских ведомостей РГБ сохраняет полностью отсканированные страницы без распознавания текста. Какой путь лучше?

Также существуют многочисленные вопросы авторского права на oн-лайновые ресурсы, и сохранение таких ресурсов затруднено отсутствием ответов на них.

Кроме теоретических вопросов (а мы еще их не все перечислили), существуют и практические (хотя тоже нуждающиеся в теоретическом исследовании) вопросы. А смогут ли будущие поколения (а мы — библиотекари мыслим вечными категориями) прочесть то, что мы сохранили? И здесь две стороны вопроса. Могут ли они прочитать технически, например, 5-ти дюймовые дискеты, которые через 100 лет не будут читаться нигде? Возможно, CD через 200 лет тоже не прочитаются. Также нужно позаботиться, чтобы сохраненные ресурсы могли быть прочитаны программно. Все, что было сделано для ZD-Speсtrum и т.п., не так просто сейчас прочитать. Базы данных, созданные под DOS, тоже не всегда корректно работают. Может, через какое-то время и формат PDF, в котором многие хранят ЦМ, тоже исчезнет?

Все выше перечисленные проблемы встали не вчера. Для их решения на международном уровне и внутри многих стран существуют программы, проекты, рабочие группы и т.п. Так, в Германии для исследования теоретических основ проблем сохранности ЦМ существует совместный проект ведущих библиотек NESTOR “Network of Expertise in Long-term Storage of Digital Ressources”, в рамках которого издаются руководства, методические рекомендации, проводятся семинары. Примером практической деятельности является проект KORAL (Cooperative development of a long-term archive for digital information), финансируемый министерством образования, в рамках которого немецкая национальная библиотека во Франкфурте и университетская библиотека в Геттингене разработали программное обеспечение совместно с IBM Германия для создания хранилища ЦМ. В этом году проект кончается и пока непонятно, кто будет его поддерживать дальше. Во многих странах также существуют аналогичные проекты, например, в Канаде — это проект Interpares и т.п.

В рамках Европейского сотрудничества существуют несколько проектов, поддерживаемых в рамках Framework Programme 6 Call 5. Проект Planets с бюджетом 14 000 000 € начался 1 июня 2006 года и направлен на обеспечение интероперабельности, согласования форматов хранения и ликвидацию пробелов в теоретическом обеспечении проблем. Проект рассчитан на 4 года.

Аналогичные задачи осуществляют проекты “Digital preservation Europe” и CASPAR.

Среди европейских стран лучшими результатами могут похвалиться Нидерланды. В королевской библиотеке создан отдел долговременной сохранности ЦМ (Digital Preservation Department). В штате отдела состоят 8 человек, работающих полный день. При этом отдел занимается только теоретическими разработками и выдачей рекомендаций отделам библиотеки, которые занимаются оцифровкой или комплектованием ЦМ.

В этих рекомендациях основное соображение следующее: проблему долговременного сохранения ЦМ нужно начинать решать на этапе их создания. По их оценкам более 65% стоимости технологического процесса жизненного цикла ЦМ от создания до сохранности составляет именно обеспечение сохранности, и, со временем, эта доля будет увеличиваться. Нельзя решать проблему сохранности отдельно, она должна быть увязана в единый технологический цикл создания — обработки — хранения — использования ЦМ.

Ряд стран уже поняли актуальность этой проблемы и предприняли определенные шаги. Так, Латвия завершила тендер на разработку ПО (выиграл Microsoft) и поставку технических средств для кооперативного хранилища данных латвийских библиотек. Чехия уже закупила два хранилища производства IBM, соединенные оптикой, и сейчас планирует объявлять конкурс на ПО. Архивированием Интернет ресурсов успешно занимаются скандинавские страны.

В РГБ в настоящее время начались работы по созданию электронного депозитария, обеспечивающего “вечную” сохранность электронных информационных ресурсов (ЭИР) РГБ и создание объективных условий обеспечения возможности воспроизведения всех ЭИР, с учетом замены (модернизации) программно-аппаратной среды.

Архитектурно депозитарий состоит из трех уровней: пользователи депозитария образуют презентационный уровень, метаданные — логический уровень, а устройства хранения — уровень данных.

Конечные пользователи депозитария имеют доступ только к презентационному уровню.

Логический уровень содержит бизнес-логику управления данными внутри депозитария. С архитектурной точки зрения бизнес-логика управления данными полностью задается метаданными, хранящимися в депозитарии.

Доступ к данным и физическая передача данных осуществляются на третьем уровне — уровне данных. Уровень данных представляет собой множество программных компонент депозитария — агентов, установленных на различных узлах хранения. Агенты — это серверы, которые служат промежуточным звеном между физическими устройствами хранения и депозитарием. Агенты взаимодействуют с физическими устройствами хранения с помощью драйверов, а взаимодействие с остальной частью депозитария осуществляется по сетевому протоколу.

Сервер метаданных представляет собой выделенный узел с установленной на нем реляционной базой данных (СУБД), в которой хранятся метаданные. Сервер метаданных может быть реплицирован с использованием утилит, входящих в дистрибутив базы данных.

Сервер депозитария взаимодействует с сервером метаданных. Сервер может быть установлен, как на тот же узел, что и сервер метаданных, так и на другой.

Сервер депозитария используется для аутентификации и авторизации пользователей, запроса информации об объектах депозитария, хранения информации аудита и управления объектами данных.

На выделенный хост устанавливаются сервер метаданных, сервер депозитария, Web-сервер и интерфейс администратора депозитария. Администратор может менять параметры не только у сервера депозитария, но и опосредованно у сервера метаданных.

Библиографы подключаются к Web-серверу с помощью браузеров. Web-сервер, в свою очередь, подключен к серверу депозитария.

На ресурсах хранения устанавливаются агенты депозитария и интерфейсы администратора ресурса. Администратор ресурса хранения с помощью своего интерфейса подключается к серверу депозитария и может добавлять, модифицировать и удалять директории, которые доступны для хранения данных депозитария. Все изменения проходят через сервер депозитария и сервер метаданных. Подключиться напрямую к агенту, установленному на этом же хосте, администратор ресурса хранения не может.

Описываемая система в настоящее время находится в стадии опытной эксплуатации в РГБ и показала себя с хорошей стороны.

!6!

КОМПЛЕКС ПРОГРАММ ДЛЯ СОЗДАНИЯ ПОЛНОТЕКСТОВОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ

Погорелко К.П.
(Библиотека Математического института
им. В.А. Стеклова РАН — отдел БЕН РАН)

В библиотеке Математического института им. В.А. Стеклова (отдел БЕН РАН) с 2004 года создается полнотекстовая электронная библиотека (ЭБ). Для обеспечения функционирования этой библиотеки созданы и, на основе опыта эксплуатации, постоянно обновляются программные средства. В настоящее время библиотека работает над созданием полнотекстовой коллекции по истории РАН (тема "История Российской академии наук в документах" поддержана грантом РГНФ 07-01-12101в). Помимо общедоступного ресурса в Интернете предполагается создание версии на СD-ROM для библиотек, научных и образовательных учреждений. В настоящее время программные средства обеспечивают обработку изображений для исправления дефектов сканирования, ввод метаописания книги, создание электронного оглавления, поддержку системы постраничного представления публикации в Интернет и системы генерации pdf-файлов для выбранных пользователем частей документов.

Полные тексты хранятся в ЭБ в постраничном виде в формате tiff. Формат представления черно-белый, разрешение 600 точек на дюйм, сжатие по алгоритму CCITT G4. В случае, когда для отображения страницы недостаточно черно-белого представления, допускается использование серого формата без сжатия. Все изображения для каждого документа находятся в отдельной директории. Структура директорий для организации хранения документов на сервере поддерживается автоматически. Метаописания документов хранятся на Microsoft SQL сервере.

Для обработки отсканированных изображений разработана и используется программа редактирования tiff-файлов TifEdit. Данная программа позволяет устанавливать размер результирующих страниц и полей, проводить “обрезку” или увеличение размеров входного изображения до результирующего размера, автоматически расчищать поля. Программа также позволяет использовать опции улучшения качества изображения за счет встроенных алгоритмов удаления “серого” шума (лишние пиксели черного цвета) и “белого” шума (пиксели белого цвета в изображении букв). В программе также имеются средства для просмотра изображения в увеличенном виде (zoom) и ручной коррекции изображения (“ластик”). Обработка изображений возможна, как с заменой отредактированным изображением исходного, так и с копированием отредактированных изображений в другую директорию. Переход к следующему изображению осуществляется нажатием одной кнопки. Программа реализована на языке C# в среде .net 2.0.

Составление метаописания документа осуществляется программой BookOgl. Данная программа позволяет копировать набор изображений на сервер по протоколу http, с сопровождением структуры хранения документов на сервере. Также программа позволяет составлять метаописание документа, устанавливать ссылки на вновь создаваемый документ из сводного каталога математической литературы, вводить электронное оглавление документа, служащее для навигации по документу. Для составления оглавления и метаописания документа можно использовать символы юникода, что позволяет составлять оглавление в соответствии с языком оригинала. Оглавление имеет древовидную структуру, что позволяет вводить отношения иерархии (например: раздел — глава — часть — параграф). Для составления оглавления в качестве основы можно использовать отсканированное и распознанное оглавление исходного печатного документа. При составлении оглавления возможен просмотр изображений страниц документа и привязка к ним. Промежуточные результаты работы можно сохранить в xml-файле. Возможна также загрузка уже введенного оглавления из базы данных для его редактирования и коррекции. Программа реализована на языке C# в среде .net 2.0.

Для представления полных текстов в Интернет используется программный комплекс на базе Microsoft IIS 6.0. Презентационная часть обеспечивает возможность постраничного просмотра документа, навигации по иерархическому оглавлению документа, возможность изменения размеров просматриваемых изображений. По желанию читателя выбранная часть документа может быть представлена ему в виде pdf файла. В реализацию презентационной части встроен механизм, обеспечивающий возможность задания и контроля прав доступа к документам.

Алгоритмы преобразования изображений, используемые стандартными Интернет браузерами при изменении размеров демонстрируемого изображения, приводят к эффекту, при котором изображения, отражающие отсканированный текст, теряют качество “читаемости” этого текста. Кроме того, формат tiff не является стандартным форматом для большинства браузеров. Поэтому в системе реализован механизм преобразования изображений из формата tiff в формат png с приведением к требуемому разрешению на основе оригинального алгоритма. Веб сайт, отвечающий за презентацию, реализован на языке C# в среде asp.net версии 2.0. Части, отвечающие за преобразование изображений и генерацию pdf файлов, требуют больших вычислительных ресурсов и являются критичными с точки зрения производительности. Эти части реализованы на языке C++ и используют технологию ISAPI.

Разработка первоначального варианта комплекса проводилась при поддержке гранта РФФИ. В настоящее время на базе этого комплекса реализуется презентационная часть проекта “Научное наследие РАН”.

!7!

К МЕТОДИКЕ СОЗДАНИЯ ОБЩЕГОСУДАРСТВЕННОЙ СИСТЕМЫ КЛАССИФИКАЦИИ НАУЧНОЙ И ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ

Белозеров В.Н.
(ВИНИТИ РАН)

Эффективное использование распределённого фонда информационных ресурсов невозможно без обеспечения его комплексом разноплановых средств классификации, поиска и оценки отдельных документов. Существующая ныне система регистрации и систематизации научной и технической информации (НТИ) использует разработанный ещё в советское время Рубрикатор ГАСНТИ. Этот механизм обеспечен нормативно-правовой и организационной поддержкой, которую осуществляет ВИНИТИ путём организации работы Методического совета по рубрикаторам НТИ, Технического комитета по стандартизации в области НТИ. Эта поддержка также включает ведение и распространение эталонов рубрикатора и других классификаций, разработку стандартов на проведение и представление результатов научных исследований и на информационное обслуживание по их содержанию. Для этой деятельности ВИНИТИ обладает развитой информационной инфраструктурой, всеми современными технологиями и имеет постоянный доступ к официальным информационным потокам, являясь головным органом ГСНТИ и основным российским поставщиком НТИ, прошедшей аналитико-синтетическую обработку.

Тематика ГРНТИ имеет универсальный характер, включая все области знания. Наряду с этим функционируют и другие классификационные системы, имеющие специализированное назначение. Это, в первую очередь, Универсальная десятичная классификация (УДК), которая обеспечивает сопряжение отечественной информации с международными информационными потоками. УДК также является основным средством систематизации фондов научных и технических библиотек. В сфере культуры и гуманитарных знаний значительная часть информации не может рассматриваться как “научно-техническая”. Это оправдывает использование там особой отечественной классификационной системы — “Большой” Библиотечно-библиографической классификации (ББК). В сфере образования учебные материалы классифицируют по дисциплинам подготовки специалистов, представленных в двух классификаторах:

К тому же на сайтах информационных ресурсов имеются собственные классификаторы, описывающие источники по различным фасетам — по областям знания, по уровню подготовки, категориям пользователей, жанру, материальной форме носителя данных и др.

Эта существующая сейчас система классификации и поиска информационных ресурсов обладает рядом недостатков, преодоление которых позволило бы повысить эффективность использования научно-технических достижений путём вовлечения их в хозяйственный оборот и сопряжения с мировым информационным пространством. В этом направлении следует провести определённые работы по развитию комплекса средств систематизации информации, имея в виду обеспечить: (1) преемственность по отношению к действующей системе, (2) информационную интеграцию сфер науки, техники, культуры и высшей школы, (3) повышение эффективности государственного участия в реализации научно-технической политики.

В ходе этих работ потребуется решить следующие задачи:

Эта программа работ требует для своего выполнения довольно продолжительного времени, значительного финансирования и сотрудничества различных информационных органов и библиотек. Но поскольку в её проведении заинтересованы в конечном итоге все информационные центры, их собственная работа должна строиться с ориентацией на то, чтобы постепенно достигались вышеперечисленные цели.

Наши работы в ВИНИТИ исходят из представления, что оптимальная схема требуемой общегосударственной системы классификации НТИ имеет вид базы данных согласованных и взаимоувязанных средств индексирования и поиска документов, характеризующихся достаточно большой глубиной классификационной иерархии. Основанием этой системы может служить ныне действующий ГРНТИ. Рубрики его уже в настоящее время связаны с классами УДК и НСНР. Трёхуровневая иерархия ГРНТИ может быть дополнена вплоть до 9-го уровня глубины за счёт применения рубрикаторов информационных изданий ВИНИТИ. На следующих этапах работ будут установлены связи с классификациями образовательных ресурсов. Интеграция с ресурсами в области гуманитарных наук и культуры будет достигнута установлением связей ГРНТИ с классами ББК. Связь системы НТИ с потребностями коммерческой и инновационной деятельности целесообразно установить через сопоставление ГРНТИ с Общероссийским классификатором видов экономической деятельности и с Международной патентной классификацией. Установление связей между классификационными системами должно быть основано на системе семантических соответствий, разработка которой ведётся на материале ГРНТИ, УДК, НСНР и ряда отраслевых классификаций.

Дополнительно к ГРНТИ, представляющему собой тематическую классификацию, в структуру общегосударственной системы классификаций должны быть включены независимые фасеты, описывающие другие аспекты характеристик информационных ресурсов. Из действующих каталогов можно заимствовать фасеты читательского назначения литературы, физической формы документа, жанра произведения и др.

Создание и применение общегосударственной системы классификаций НТИ должно быть поддержано принятием рядя нормативных актов. Дополнительно к ГОСТам на ГРНТИ следует разработать стандарт (или даже законодательный Технический регламент) на состав, порядок применения и ведения общегосударственной системы классификации НТИ. В целях обеспечения доступа и сохранности информационных ресурсов России следует сделать обязательным применение стандартов системы СИБИД.

Пилотная версия общегосударственной системы информационных классификаций может быть представлена аппаратом автоматизированного ведения и сопоставления классификаций на SQL-сервере ВИНИТИ. В нем рубрики ГРНТИ связаны ссылками с Рубрикатором информационных изданий ВИНИТИ, УДК, НСНР, Международной тематической классификацией по математике, Перечнем приоритетных направлений и критических технологий, Международной патентной классификацией. Новое издание ГРНТИ представлено как модель общегосударственной системы и включает в качестве факультативного для использования углублённый до 4-го уровня раздел по математике.

!8!

ВОЗМОЖНОСТИ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ РОССИЙСКОЙ НАУКИ И ОБРАЗОВАНИЯ РЕСУРСАМИ ИЗДАТЕЛЬСТВА “ЭЛЬЗЕВИР”

Уткин О., Якшонок Г.
(Издательство “Эльзевир”)

Анализируя экономические показатели России по сравнению с другими западными странами (источник: CIA World Book of Facts 2007), можно отметить, что они заметно улучшаются. Так, ежегодный рост ВВП России превышает аналогичный показатель США и Великобритании (табл.1).

СТРАНА Россия Румыния Польша Испания Великобритания США
Рост ВВП (%) 6,6 6,4 5,3 3,6 1,9 3,2

Табл. 1

Но, если анализировать расходы государства на науку (источник: UNESCO, Internetworldstats.com), то в этой области Россия заметно отстает (табл. 2).

Страна

Россия

Румыния

Польша

Испания

Велико-британия

США

Годовые расходы на науку (млн. $)

20,676

789

3,256

11,770

34,360

332,370

Расходы на науку (% от ВВП)

1.2%

0.4%

0.6%

1.1%

1.9%

2.7%

Количество исследователей (тысяч)

475

21

62

88

165

1,372

Годовые расходы на одного исследователя, $

43,528

37,570

52,520

134,054

208,240

242,250

Табл.2

В частности, по сравнению с Великобританией, в России число ученых на 1 млн. населения превышает в 1,2 раза, в то время как расходы на одного ученого у нас почти в 5 раз меньше, чем в Великобритании.

Таким образом, имея хорошие экономические и кадровые предпосылки, в России наблюдается существенное недофинансирование в области науки, по сравнению с другими западными странами.

В мировой практике, роль университетов складывается таким образом, что именно они являются не только образовательными, но и научными центрами. В России же на сегодняшний день образовательная функция университетов существенно превалирует над научной.

Табл. 3

Так, согласно рейтингам (табл. 3) THES (The Times Higher Education Supplement, www.thes.co.uk) и Института Высшего Образования Шанхайского Университета Цзяо Тун (http://www.ed.sjtu.edu.cn/ranking.html), только 2 российских ВУЗа попадают в “когорту” мировых лидеров высшего образования: МГУ им. М. Ломоносова и СПбГУ.

С точки зрения анализа публикаций (база данных Scopus), результаты российской науки также не впечатляют.

Так, доля России в количестве статей, индексируемых в Scopus, составляет всего 0.016%, в то время как доли США и Великобритании стабильно высоки. Польша и Испания сокращают отставание от Великобритании по числу опубликованных в мире статей, в то время как Россия уступает по этому показателю даже Румынии. США же и Великобритания приносят 32.3% всех научных публикаций представляя всего 5.5% населения мира.

Рассматривая качество научных публикаций российских авторов (Рис. 1), по данным Thompson Scientific) можно отметить, что средний уровень цитируемости их работ растет.

Рис. 1

Но если эти данные сравнить с динамикой развития среднего уровня цитируемости авторов некоторых других стран (Венгрии, Польши, Испании), то показатели российских авторов — заметно ниже.

Существенную роль в развитии науки каждой страны имеет ее информационное обеспечение. На сегодняшний день, являясь мировым лидером в информационном обеспечении науки и образования, издательство “Эльзевир” предоставляет лучшие ресурсы для России.

Издательство “Эльзевир” основано в 1580 г. Группа Reed Elsevier имеет 35,000 сотрудников в более чем 200-х отделениях по всему миру, обслуживая более 30 миллионов ученых, студентов, специалистов в информационной области и области здравоохранения по всему миру.

В настоящее время Группа Reed Elsevier, в которую входит ряд ведущих научных издательств, издает около ј всех научных статей, выходящих в мире; она разработала и реализует концепцию “электронной библиотеки” Science Direct.

Science Direct — полнотекстовая электронная библиотека (ЭБ) издательства “Эльзевир” обеспечивает комплексный доступ к более чем 2000 журналов, которые включают около 25% опубликованных в мире научных статей.

Материалы, представленные в ЭБ, охватывает следующие тематические разделы науки:

Свыше 7 миллионов исследователей (из общего числа приблизительно 10 миллионов) во всем мире имеют доступ к ScienceDirect. В последние годы значительно увеличен доступ к журналам — в режиме on-line доступно около 2000 наименований собственных и более 200 журналов других издательств. Количество загруженных статей удваивается ежегодно на протяжении ряда лет. В большинстве стран более 50% всех загрузок полнотекстовых статей приходится именно на ScienceDirect. ScienceDirect доступен 99% времени без перерывов на профилактику и т.п. В настоящее время система содержит более 8,4 млн. статей в журналах, начиная с первого номера первого года их выпуска. Электронные версии более чем 95% статей доступны раньше печатных версий (т.н. articles in press). В системе обеспечивается детальная статистика использования информации (количество загруженных статей, читательских сессий, общее число пользователей и т.п.).

Scopus — самая большая в мире реферативная база данных научных журналов, патентов и цитирования издательства “Эльзевир”. База данных была создана с участием ведущих международных научных центров и специально спроектирована для осуществления быстрого и качественного поиска научных публикаций, выходящих в мире. Содержание базы охватывает:

Основные предметные области, которые представлены в Scopus, это: естественные и технические науки (Physical Sciences) — 5500 изданий; биомедицина (Health Sciences) — 5300 изданий; науки о жизни (Life Sciences) — 3400 изданий; социальные науки (Social Sciences) — 2850 изданий.

Основные преимущества Scopus:

Области применения Scopus:

Выводы

!9!

ИНФОРМАЦИОННЫЕ РЕСУРСЫ ПО НАУКАМ О ЗЕМЛЕ И КОСМОСЕ

Ефременкова В.М., Круковская Н.В., Седякина А.Н.,
Старцева О.Б., Чумакова Н.Ф., Щербина-Самойлова М.Б.
(ВИНИТИ РАН)

Введение

Возникшие в прошлом веке информационные технологии предоставляют уникальные возможности получения данных, практически, по любым вопросам науки и техники, в т.ч. о веществах, процессах и явлениях, происходящих во Вселенной и на Земле как космическом теле и среде обитания живых существ. Наиболее ранние исследования небесных явлений, относящиеся к 4–3 тыс. до н.э. (Междуречье, Египет, Китай, Индия), легли в основу одной из самых древних наук — астрономии. Как область знания, астрономия — “наука о строении и развитии космических тел, их систем и Вселенной в целом” впервые была отражена в системах Классификации знания Демокритом (460–370 гг. до н.э.). Основным признаком деления наук он выбрал объекты изучения, которые подразделялись на четыре области: Космос — Человек — Мышление — Методология. Античная наука понимала значение опытного познания. В трактатах Аристотеля “О небе”, “О метеорологических вопросах” впервые проявляется общность подхода к изучению проблем Земли и Космоса. Классификация наук о Земле была дополнена только в 1795 г. (Классификация Конвента), когда в ней появились разделы минералогии и в прикладных дисциплинах — горное дело; география была отнесена к гуманитарным областям знания. Геодезия и картография как науки, занимающиеся изучением размеров и фигуры Земли, ее гравитационного поля, способами изображения земной поверхности на картах и планах, включены в научную терминологию лишь в конце 18 в.

К настоящему времени накоплено огромное количество разнообразных сведений по изучению Земли и космического пространства, большая часть из которых является междисциплинарными. Библиографическая информация и фактографические данные собраны в политематических и специализированных базах данных (БД), гео- и космофизических информационных службах и системах.

Целью данной работы является изучение и анализ научно-технической информации по наукам о Земле и исследованиям космического пространства, собранной в национальных и специализированных службах и БД.

Выбор БД и тематический анализ информации по БД

Библиографические БД

В настоящее время информационная поддержка научных исследований по геологии, геофизике, горному делу, охране окружающей среды, астрономии и космонавтике в России осуществляется через:

Банк данных ВИНИТИ предназначен для обслуживания ученых в области точных, естественных и технических наук. Годовой объем составляет около миллиона описаний отечественных и зарубежных первоисточников (статей из сериальных изданий, книг, трудов конференций, депонированных рукописей, диссертаций и т.д.) практически по всем областям науки и техники. На основе “Государственного рубрикатора научно-технической информации” (ГРНТИ) в ВИНИТИ в настоящее время формируется 28 тематических фрагментов, которые включают 46 отраслей знания из 69, представленных в ГРНТИ. По рассматриваемой проблеме генерируются 5 фрагментов БД:

БД/РЖ Тематическое содержание Ретрофонд
Астрономия

астрономия, геодезия и аэросъемка, исследования космического пространства и Земли из космоса

407 тыс. док., 1989–2006 гг.
Геология

стратиграфия, палеонтология, геоморфология, минералогия, геохимия, геофизика, месторождения полезных ископаемых, гидрогеология, инженерная геология, мерзлотоведение

819,2 тыс. док., 1985–2006 гг.
Геофизика

метеорология и климатология, океанология, гидрология суши, гляциология, физика Земли

315,6 тыс. док., 1986–2006 гг.
Горное дело

разработка и обогащение полезных ископаемых

552,7 тыс. док., 1981–2006 гг.
Охрана окружающей среды

охрана природы и воспроизводство природных ресурсов, экология человека, системы, приборы и методы контроля качества окружающей среды, охрана и улучшение городской среды, технол. аспекты охраны окружающей среды

461,85 тыс. док., 1981–2006 гг.

Сеть STN International основана в 1977 г. и находится в совместном управлении Fachinformationszentrum (FIZ) — Германия; Chemical Abstracts Service (CAS) — США и Japan Information Center for Science and Technology (JICST) — Япония.

Для удобства пользователей базы данных в STN тематически объединены в 48 кластеров, 30 из которых содержат информацию по естественным наукам, технике и технологии. Кластер “Геонауки” включает 22 БД. Полнотекстовая информация — в 20 БД сети STN (это БД с окончанием FULL), а также избирательно полные тексты публикаций могут быть получены на платформе ScienceDirect (Elsevier). Полные тексты документов можно заказать в отделе научных фондов ВИНИТИ или в Технической библиотеке Ганновера.

Информационная сеть компанииProQuest Cambridge Scientific Abstracts (CSA) включает более 100 БД, в которых отражено более 60 млн. записей. В CSA имеются 12 тематических коллекций ресурсов, включающих научные журналы, патенты, отчеты; книги, монографии, отраслевые издания, труды конференций, карты, каталоги, Интернет-ресурсы. Рассматриваемые в работе проблемы представлены следующими тематическими коллекциями:

CSA предоставляет on-line версию уникального справочника сериальных изданий “Ulrich’s International Periodicals Directory”, содержавшего к концу 2006 г. информацию о 205,6 тыс. наименований, среди которых имеется перечень сериальных изданий по астрономии и наукам о Земле.

Информационная служба и издательство EBSCO, имеющие на своей платформе более чем 190 БД (ретроспектива с 1886 г.) по экономике, менеджменту, социологии, политологии, информатике и др. дисциплинам, объединены в тематические кластеры, среди которых есть интересные для специалистов рассматриваемой тематики:

На платформе EBSCO помимо собственных ресурсов имеется ряд БД ведущих информационных служб мира:

Издательство и информационный центр компании Elsevier (Нидерланды) предоставляют архивы полнотекстовых печатных изданий, которые являются в настоящее время одними из наиболее полных. С 1999 г. формируется электронный ресурс научно-технической и медицинской информации — ScienceDirect, предоставляющий доступ к нескольким тысячам журналов и нескольким миллионам полных текстов публикаций, в том числе:

БД

Тематика

Ретрофонд

EiCompendex

технические науки

с 1969 г., 3000 журналов, ~8 млн. статей, 1,5 тыс. материалов конференций

GEOBASE

география, геология и экология

с 1980 г., ~1,3 млн. статей

OceanBase

океанография и судостроение

с 1993 г., ~130 тыс. статей

ScienceDirect Navigator

политематическая БД

с 1966 г., 7000 журналов, около 16 млн. статей

Помимо книжных коллекций Elsevier предоставляет в печатном и электронном виде справочно-энциклопедические издания: Encyclopedia of Geology, Encyclopedia of Geochemistry, Encyclopedia of Atmospheric Science, Encyclopedia of Ocean Science.

С апреля 2001 г. доступна специализированная поисковая машина Scirus для поиска сайтов с высокой степенью информативности и достоверности.

2002 г. — начало генерации реферативной БД SCOPUS, в которой отражаются более 15 тыс. наименований журналов. В результате по запросу пользователь одновременно получает информацию о количестве публикаций из журналов, трудов конференций, отчетов и др., а также патентов и web-сайтов. Особенностью выдачи по запросу является предоставление статистических данных по распределению публикаций по тематике, типу документов и журналам. К недостаткам поисковой системы SCOPUS следует отнести отсутствие развитого классификатора, в системе присутствует только информация о распределении по предметным областям: науки о Земле и космическом пространстве, физика и астрономия, охрана окружающей среды.

Анализ информационных систем и сетей позволяет выделить основную особенность их формирования в настоящее время — это сочетание научно-технических ресурсов с экономическими. Поэтому при мониторинге работ в сферах высоких технологий или приоритетных направлений специалист может проводить мультидисциплинарный поиск в нескольких БД различного профиля, что возможно в режиме кросс-файлового поиска.

Выбор БД, обеспечивающий наибольшую полноту и точность поиска по определенной проблеме, лучше начинать с ведущих мультидисциплинарных БД.

БД США Chemical Abstracts

Науки о Земле представлены следующими кодами Классификатора:

51

Горючие ископаемые, родственные продукты и производные

53

Минералогия и геохимия

59

Загрязнение воздуха и промышленная гигиена

60

Обработка и удаление сточных вод

61

Водные ресурсы

70-7

Космические лучи и космология

73-9

Астрофизические спектры

БД США Science Citation Index

В Классификации БД Science Citation Index можно выделить следующие тематические наименования кодов (нотация кодов отсутствует):

Аэрокосмическая техника и техника

Астрономия и астрофизика

Энергетика и топливо

Техническое обеспечение проблем охраны окружающей среды

Инженерная геология

Нефтехимическая промышленность

Охрана окружающей среды

Геохимия и геофизика

Геология

Геонауки, междисциплинарные аспекты

География

Метеорология и изучение атмосферы

Минералогия

Горное дело

Океанография

Водные ресурсы

БД Великобритании INSPEC

в которой, помимо физики — INSPEC-А, электроники и электротехники — INSPEC-В, вычислительной техники — INSPEC-С, информатики — INSPEC-D, с 2004 г. формируется массив по экономике, бизнесу, финансам и маркетингу в области наукоемких технологий — INSPEC-Е.

В Классификаторе INSPEC отражены проблемы: “Геофизика, астрономия и астрофизика” — раздел А9000, и “Науки о Земле” — раздел В7000:

А9100

Физика Земли

А9200

Физика гидросферы и низких слоев атмосферы

А9300

Геофизические наблюдения, инструменты, приборы и методы измерений (космическими средствами)

В7710

Инструменты, приборы и методы геофизических измерений

А9400

Аэрономия, физика космоса и космические лучи

А9500

Фундаментальная астрономия, астрофизика, инструменты, приборы и методы астрономических измерений

С3380Е

Астрономические инструменты

А9600

Солнечная система

А9700

Звезды

А9800

Звездные системы, внегалактические объекты и системы, Вселенная

В7600

Космические исследования, включающие вопросы космической техники и технологии

В7720

Методы контроля загрязнения космического пространства

БД Франции по точным и естественным наукам PASCAL

Раздел “Земля, Океан, Космос” (код 001Е) в Классификаторе БД PASCAL находится в области знания “Прикладные науки” — Е. Иерархическая таблица содержит три рубрики третьего уровня, которые могут, в зависимости от тематической направленности, подразделяться на рубрики 4–6 уровней.

001Е01

Науки о Земле

001Е02

Геофизика

001Е03

Астрономия

БД COMPENDEX (Нидерланды)

с преимущественной направленностью в области техники и технологии.

Иерархическая трехуровневая система классификации:

44

Вода и технологии водопользования,

47

Океан и технология подводных вод,

48

Инженерная геология,

50

Горное дело,

51

Технология нефтепереработки,

65

Космическая техника и технология.

БД Японии JICST

Основные разделы системы классификации по наукам о Земле и изучению космического пространства относятся к разделам:

D

Космология и науки о Земле, включающие рубрики:

DB

Космические лучи и астрофизика

DC

Геофизика

DD

Геохимия

DE

Геология

DF

География

S

Технологические аспекты охраны окружающей среды

U

Горное дело

БД США GeoRef

специализированная библиографическая БД, отражающая мировую литературу по наукам о Земле. Предметное содержание БД GEOREF отражено в Классификаторе линейного типа:

Минералогия

Геохимия

Геохронология

Космическая геология

Петрология. Магматические и метаморфические породы

Петрология. Седиментогенез

Геология морей и океанография

Палеонтология. Общая

Палеонтология. Палеоботаника

Палеонтология. Беспозвоночные

Палеонтология. Позвоночные

Стратиграфия. Историческая геология и палеоэкология

Региональная геология. Общая

Региональная геология. Карты и схемы

Общие вопросы геологии и математические методы в геологии

Структурная геология

Геофизика. Общая

Геофизика. Физика недр Земли

Геофизика. Сейсмология

Геофизика. Прикладная

Гидрогеология и гидрология

Охрана окружающей среды в геологии

Геология поверхности. Геоморфология

Геология поверхности. Четвертичная геология

Геология поверхности. Почвы

Экономическая геология. Общая и горное дело

Экономическая геология. Металлы

Экономическая геология. Неметаллы

Экономическая геология. Источники энергии

Инженерная геология

БД США Aerospace & High Technology

специализированная мультидисциплинарная БД по космическим исследованиям и высоким технологиям. В системе классификации отражаются 9 тематических направлений (99 кодов), связанных с изучением космоса: аэронавтика, химия и материаловедение, техника и технологии, геонауки, медико-биологические проблемы, вычислительная математика, физика, социальные науки, космология.

Коды

Тематика

1 — 9

Аэронавтика

12 — 20

Астронавтика

12 — 48

Геонауки

88 — 93

Астрономия и науки о космосе

Политематические БД, каждая из которых имеет преимущественную тематическую направленность, отражают общие тенденции состояния работ в той или иной области, а совокупность специализированных БД дает представление о круге проблем той области, в которых преимущественно ведутся работы.

Динамические характеристики суммарных массивов публикаций могут быть полезны с точки зрения выявления ранних публикаций, особенно патентов и анализа состояния работ в рассматриваемом направлении. В ряде случаев дополнительную и более детальную информацию дает выборка документов по типам, странам, языкам или ролям (теория или эксперимент, применение, использование и др.).

Некоторые электронные и фактографические ресурсы России

В России генераторами БД и информационных продуктов в электронной форме, доступных в режиме on-line, является ряд НИИ, информационно-издательских центров и компаний.

По наукам о Земле наиболее крупными, содержащими информацию о добыче и месторождениях угля; нефти, газа и нефтегазовой индустрии; рудных полезных ископаемых, являются следующие ресурсы.

В области геофизики и изучения космического пространства создан ряд БД, формирование которых осуществляется в рамках международного сотрудничества с ведущими институтами и обсерваториями мира.

Анализ динамики потоков публикаций

Знание величины ретрофондов БД и динамики их накопления важно для специалистов, изучающих Землю и космическое пространство, т.к. большинство данных в этих дисциплинах не стареет и полученная ранее информация бывает крайне необходима для интерпретации новых результатов.

На рис. 1 а, б показаны гистограммы суммарных массивов публикаций по наукам о Земле и исследованию околоземного пространства, построенные на основе данных, отраженных в политематических и специализированных библиографических БД ведущих стран мира. По гистограммам суммарных потоков публикаций видно, что, прежде всего, общество интересует то, что “ближе к телу”: соотношение потоков публикаций в области геологии и астрономии ~10:1.

b

Рис. 1.

Тенденция занятости специалистов в областях, связанных с космосом, начала меняться с начала 1960-х гг. в связи с развертыванием работ по программам космических исследований, материаловедческим и медико-биологическим проблемам, что согласуется с ростом ретрофонда публикаций по изучению космоса, начиная именно с 1960-х гг.

Динамика развития геологической науки указывает на несколько периодов интенсивного развития и спада работ: период до 1930-х гг. можно охарактеризовать как попытки изучения недр, накопления опыта исследований; предвоенный период — интенсивная разведка и освоение месторождений полезных ископаемых; далее — 1940–1945 гг. — спад, связанный со Второй мировой войной; с 1946 г. — резкий рост публикаций с небольшими осцилляциями по всем направлениям наук геологического профиля.

Развитие астрономической науки можно проследить по БД лишь с 1932 г., времени начала отражения публикаций в БД INSPEC: до 1960-х гг. — период стабильного накопления знаний о процессах во Вселенной с помощью традиционных для астрономов приборов (телескопов) и развитие теоретических моделей (рис. 2).

Рис. 2

Период 1960–1975 гг. известен как “Золотой век Общей Теории Относительности”, когда многие понятия и термины изменили представление о природе Вселенной. В тот же период запуск ИСЗ открыл эпоху внеатмосферной астрономии. Например, с помощью космической обсерватории им. Хаббла было исследовано более 25 тыс. объектов, обеспечено уникальной информацией более 3 тыс. работ. Наиболее интенсивные исследования — “точки роста” публикаций — можно проследить, используя статистические характеристики документальных потоков в политематических базах данных ведущих стран мира. Среди приоритетных направлений работ можно выделить, например, следующие: черные дыры, экстрасолнечные планеты и системы, гамма-всплески, сверхновые звезды, астрометрия, космические лучи, космическая геология.

Заключение

Использование статистических характеристик политематических и специализированных БД в сочетании с электронными информационными ресурсами Интернета позволяет определить области повышенного интереса в науке и пути дальнейшего развития приоритетных направлений в науках о Земле и Космосе.

!10

ФОРМИРОВАНИЕ РЕПЕРТУАРА ПОДПИСКИ БЕН РАН С УЧЕТОМ МНЕНИЯ ИНСТИТУТОВ РАН

Глушановский А.В.
(Библиотека по естественным наукам РАН)

В современных условиях, характеризующихся недостаточным финансированием библиотек и, в том числе, процессов комплектования, особое значение приобретает отбор репертуара иностранных журналов, выписываемых библиотекой. В этих условиях БЕН РАН решила обратиться за экспертизой к своим читателям — ученым РАН. Было решено выяснить мнение специалистов РАН с максимальной широтой. С этой целью был сформирован предварительный список из 780 наименований иностранных журналов, представляющих наибольшую ценность, по мнению специалистов-комплектаторов БЕН РАН. Этот список был организован по тематикам, соответствующим отделениям РАН (математика; физика; информационные технологии и вычислительная техника; химия и науки о материалах; биология; науки о Земле; энергетика, машиностроение, механика и процессы управления).

Список был разослан в 144 адреса институтов РАН указанных отделений с просьбой оценить предлагаемые журналы по двухбалльной шкале:

Журналы, не представляющие интереса, оставлялись без оценки. В случае, если институт считал необходимым дополнить список, он вносил в него дополнительные журналы, оценивая их аналогичным образом.

В ответ на рассылку было получено 98 списков из 92 институтов РАН. Разное число институтов и списков объясняется тем, что некоторые институты присылали более одного списка (при наличии в институте отделений, различающихся по тематике), в ряде случаев (например, Кольский филиал РАН) присылался один список на несколько институтов.

В целом, распределение институтов, приславших списки, по отделениям выглядит следующим образом:

Таблица 1. Распределение НИИ РАН по отделениям РАН

Название отделения

Число институтов

Отделение энергетики, машиностроения, механики и процессов управления

5

Отделение химии и наук о материалах

17

Отделение физических наук

21

Отделение наук о Земле

17

Отделение биологических наук

19

Отделение информационных технологий и вычислительных систем

8

Отделение математических наук

5

К предложенному списку было добавлено институтами около 1000 наименований журналов. Все списки были сведены в таблицы по отделениям РАН и затем — в результирующую сводную таблицу.

В итоговую таблицу включались журналы, имеющие суммарную оценку не ниже 2 баллов. В этой таблице оказалось 1209 журналов. Характерно, что максимальные оценки получили политематические общенаучные журналы “Nature” (106 баллов) и “Science” (92 балла). В целом, верхнюю часть списка составили журналы, представляющие интерес для ученых нескольких отделений РАН. Таблица характеризуется также явно выраженным “ядром”, половину всей суммы баллов набирают 194 журнала, 2/3 суммы — 314, а 80% суммы — 450 журналов, что составляет 37,2% от общего числа наименований.

На рис. 1 представлено распределение процента набранных баллов в зависимости от числа включенных названий.

Рис.1. Распределение процента набранных баллов.

Ниже приводится фрагмент итоговой таблицы, показывающий первые 20 журналов, имеющих наивысший суммарный рейтинг. В таблице указывается название журнала, издательство, страна издания, а также суммы баллов, набранные данным журналом по отделениям РАН и общая сумма баллов для этого журнала

Так как подписка на периодику ведется по издательствам, предлагающим определенные пакеты журналов, интерес представляет рейтинг издательств, полученный по данным той же таблицы. Журналы в таблице были рассортированы по издательствам и подсчитывалась сумма баллов, приходящаяся на долю каждого издательства, число журналов издательства, вошедших в список оцененных, и условная “цена” (средняя) одного журнала данного издательства в баллах. Такая оценка, в какой-то степени, отражает ценность издательства для пользователей и позволяет рассмотреть ее с разных сторон. Ниже приводится рейтинг основных зарубежных издательств, представляющих интерес для БЕН РАН.

Таблица 2. Первые 20 журналов, получившие наивысшую оценку экспертов

Название

Издательство

Страна

Математика

Физика

Энергетика, машиностроение, механика, процессы управления

Информ. технологии, выч. техника

Химия

Биология

Науки о Земле

Сумма

Nature

Nature Publ.Group.

England

6

26

3

6

13

41

11

106

Science

AAAS

USA

6

28

4

8

17

17

12

92

Physical Review .A,B,C.D.E.

APS

USA

6

42

3

7

10

8

11

87

Physical Review Letters

APS

USA

6

38

6

9

10

6

10

85

Journal of Applied Physics

AIP

USA

6

34

4

9

9

3

5

70

Reviews of Modern Physics

APS

USA

7

36

 

6

9

2

7

67

Applied Physics Letters

AIP

USA

4

35

2

6

10

3

5

65

Journal of Chemical Physics

AIP

USA

2

23

3

5

16

9

6

64

Applied Optics

Optical Soc.Amer

USA

4

30

3

7

9

4

5

63

Journal of Physical Chemistry. A,B.

Amer.Chem.Soc

USA

2

17

3

2

18

12

7

61

Chemical Physics

Elsevier

NLD

2

20

3

3

17

9

5

60

Journal of the American Chemical Society

Amer.Chem.Soc

USA

 

10

 

 

29

15

4

58

Chemical Physics Letters

Elsevier

NLD

2

16

2

3

15

10

6

55

Journal of Physics : Condensed Matter

IOP

England

 

31

 

5

11

2

5

54

Scientific American

Sci.Amer.Inc.

USA

4

18

2

8

6

8

8

54

Journal of Physics. A,B,D,G.

IOP

England

6

25

 

7

8

 

6

52

Applied Physics.Ser.A,B.

Springer

DEU

4

25

 

7

8

2

5

51

Journal of Geophysical Research. Complete

AGU

USA

3

15

2

 

4

 

26

50

Physics Letters. A,B,Physics Reports

Elsevier

NLD

6

26

 

4

7

 

7

50

European Physical Journal A,B,C,D,E.

Springer

DEU

3

25

 

5

7

2

7

49

Таблица 3. Рейтинг издательств.

Издательство

Сумма набранных баллов

Число журналов

"Цена" журнала в баллах

Elsevier

3223

211

15,3

IEEE

888

98

9,1

Springer

846

33

25,7

Academic Press

715

37

19,3

American Chemical Society

530

22

24,1

Wiley

508

32

15,9

American Institute of Physics

490

12

40,8

American Physical Society

239

7

34,1

Nature Publ. Group

206

6

34,3

Institute of Physics Publishing

203

7

29,0

IEE

178

13

13,7

American Geophysical Union

158

12

13,2

Royal Society of Chemistry

153

5

30,6

Opt. Soc. Of America

141

3

47,0

EDP

139

4

34,8

Taylor & Francis

125

7

15,7

SIAM

125

9

13,9

Oxford University Press

119

10

11,9

University of Chicago Press

118

6

19,7

Blackwell Publishing

113

8

14,1

AAAS (Science)

92

1

92,0

Cambridge University Press

92

5

18,4

American Mathematical Society

86

8

10,7

Cell Press

84

4

21

ACM

78

11

7,1

Scientific American Inc.

54

1

54

Portland Press

52

3

17,3

American Soc. of Microbiology

39

2

19,5

World Scientific Publishing

27

2

13,5

Как показывает таблица 3, данный рейтинг издательств, в основном, соответствует политике РФФИ и консорциума “НЭИКОН”, обеспечивающих online-доступ к журналам издательств, занимающих высокие места в представленном рейтинге.

Результаты анализа основных таблиц, полученных в ходе исследования, нашли практическое применение в комплектовании БЕН РАН иностранными журналами.

!11

ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОЙ ЗНАЧИМОСТИ ОТЕЧЕСТВЕННЫХ И ИНОСТРАННЫХ КНИГ ДЛЯ ПОЛЬЗОВАТЕЛЕЙ ПНЦ РАН

Харыбина Т.Н., Захарова С.С., Довбня Е.В.,
Черкасова И.Ю.
(Центральная библиотека Пущинского научного центра РАН — отдел БЕН РАН)

В своем стремлении усовершенствовать информационно-библиотечное обслуживание центральная библиотека Пущино (ЦБП) активно реагирует на современные потребности науки в целом, и специалистов Пущинского научного центра (ПНЦ) РАН в частности. Основой для данной успешной деятельности является анализ информационных потребностей специалистов ПНЦ, который заключается в ежегодном проведении анкетирования и опросов пользователей Центра. Также в рамках данного направления осуществляется сбор статистических данных по различным каналам выдачи литературы и получения информации: обслуживание на абонементе, в читальном зале, по МБА; обслуживание в информационно-библиографическом отделе для получения справочной, реферативной и полнотекстовой информации; электронная доставка документов. Данные результаты одновременно используются для определения массива наиболее информативных периодических изданий, отражающих тематику исследований не только ПНЦ РАН в целом, но и его отдельных научных коллективов и направлений. В текущем году проводился многоаспектный анализ использования читателями в ЦБП и в её филиалах отечественных и иностранных книг.

Фонд отечественных и иностранных книг в Центральной библиотеке Пущинского научного центра составляет 104 377 экземпляров. В фонде представлены издания с начала 19 века. Ядром книжного фонда являются научные, справочные, энциклопедические и учебные издания, несущие огромный объем важнейших знаний.

Возникшее в последнее время представление о том, что книги теряют свое значение в качестве источника информации абсолютно неверно. Сегодня научная книга несет в себе большую информационную ценность, каждая книга индивидуальна и является результатом многолетнего труда автора. Имеются лишь небольшие отклонения в роли различных видов изданий. По полученным статистическим данным за 2006 год, монографии и сборники статей прочно занимают второе место за периодическими изданиями, это составляет около 47% от общей книговыдачи, на третье место выходят труды конференций и совещаний, т.е. так называемая “серая литература”; около 7% авторские свидетельства. На пятое место по использованию выходят рукописи, это -диссертации, авторефераты диссертаций, препринты. Этот фонд небольшой, составляет всего около 4% от общей книговыдачи (3500 экземпляров), но пользуется у читателей устойчивым спросом. Наметившиеся в последние годы тенденции к сокращению поступлений книг ведут к качественному ухудшению фондов, которые, из-за определения тиража в соответствии с заказом, невозможно доукомплектовать, если источник вовремя не был приобретен. Поэтому такие пропуски вряд ли когда-нибудь можно восполнить. Если рассматривать книжный фонд ЦБП по времени формирования, то это более, чем на 70% книги, приобретенные до 1991 года. При этом следует учитывать, что фонд регулярно анализируется, и устаревшая, дублетная литература списывается, следовательно, регулярно объем “старого” фонда” сокращается, а новой литературы с 1991 по 2006 поступает в 3 раза меньше. Эти данные представлены на рис 1 и 2.

Рис. 1. Динамика поступлений в фонд ЦБП отечественных книг с 1981 года

Рис.2. Динамика поступлений в фонд ЦБП иностранных книг с 1981 года

Для изучения тенденций использования отечественных и иностранных книг и продолжающихся изданий пользователями ПНЦ в течение 2006 года был проведен сравнительный анализ использования данной литературы по областям знаний, как в Центральной библиотеке, так и в шести ее филиалах. Статистические данные по использованию отечественных и иностранных книг по всем каналам выдачи: абонемент, читальный зал, МБА, выставка новых поступлений в ЦБП и филиалах являются основополагающими для проведения настоящего анализа. Все Институты Пущинского научного центра РАН входят в состав Отделения биологических наук (сектор физико-химической биологии). Тем не менее, научные направления, по которым ведутся исследования, весьма разнообразны.

В задачи исследования входило:

Результаты исследования запросов на отечественные и иностранные книги от пользователей — основа для совершенствования их обслуживания в научной библиотеке. Проведенный анализ статистических данных позволяет оценить спрос на отечественные и иностранные книги как для ЦБП, так и для филиалов. Мониторинг использования книг по научным направлениям дал следующий результат. Наиболее значимыми, как следует из приведенных в таблице 1 данных, являются книги и продолжающиеся издания по биологии, химии, математике, вычислительной технике, почвоведению.

Таблица 1.

Тематич. разделы

ИМПБ

ИБ

ИБФМ

ИБП

ФИБХ

ИФПБ и

ИФХиБПП

ЦБП

ИТОГО

к\х

ч\з

Биология

243

1017

2202

166

1782

1992

7657

270

15329

Вычислительная техника

900

39

156

4152

9

96

1200

30

6582

Математика, Механика

3468

42

63

512

33

-

1110

210

5438

Химия

-

315

588

258

597

54

2680

300

4792

Русский язык, иностранные языки

582

216

297

672

180

384

540

1500

4371

Медицина

18

30

114

285

333

63

1320

1650

3813

Философия, Религия, Общественные науки в целом

273

78

99

288

249

273

1830

600

3690

 

 

 

60

 

 

3114

107

 

3281

Энергетика, Радиоэлектроника, Автоматика

228

36

30

2036

-

-

825

-

3155

Техника

150

6

6

2292

162

-

99

-

2715

Физика

552

63

36

1020

27

45

870

-

2612

Горное дело, Технология металлов, Строительство, Транспорт

90

12

51

1497

-

-

845

36

2531

 

-

-

9

-

-

1926

240

150

2325

Энциклопедии, Словари

258

-

-

-

-

-

108

1050

1416

Психология

30

-

-

-

-

-

996

15

1041

Наука в целом

144

3

33

222

-

-

360

60

822

Печать, Библиотечное дело

69

-

-

-

-

-

114

15

198

Более детальный анализ использования самых спрашиваемых разделов, таких как биология, химия, математика показал, что читатели Центра активно используют литературу по молекулярной биологии, биохимии, биофизике, математике в целом, а затем по микробиологии, биологическим наукам и почвоведению. Данные этого исследования представлены в таблице 2.

Таблица 2

 

ИМПБ

ИБ

ИБФМ

ИБП

ФИБХ

ИФПБ

ИБК

ИТОГО

к\х

ч\з

Биохимия

 

600

414

 

672

 

1260

 

2946

Биофизика

 

57

 

 

282

 

1940

 

2279

Математика

471

42

63

512

33

 

900

240

2261

Органическая химия

 

87

294

 

 

 

1450

 

1831

Микробиология

 

15

1095

 

 

363

340

 

1823

Биологические науки

243

30

42

166

222

306

530

270

1809

Почвоведение

 

 

42

 

 

1686

 

30

1758

Химия

общая

 

87

93

258

597

54

360

300

1749

Физиология, биофизика и биохимия животных

и человека

 

 

54

 

 

690

790

 

1534

Ботаника

 

18

216

 

192

594

195

 

1215

Общая экология

 

 

54

 

 

729

240

 

1023

Общая цитология

 

84

90

 

129

 

510

 

813

Математический анализ и функциональный анализ

798

 

 

 

 

 

 

 

798

Эмбриология, анатомия и гистология человека

 

6

 

 

 

360

360

 

726

Науки о земле

 

 

9

 

 

324

240

150

723

Теория вероятностей и математическая статистика

618

 

 

 

 

 

 

 

618

Вычислительная математика

576

 

 

 

 

 

 

 

576

Общая генетика

 

174

93

 

90

 

192

 

549

Аналитическая химия

 

72

132

 

 

 

270

 

474

Геофизические науки

 

 

 

 

 

462

 

 

462

Физическая химия

 

69

69

 

 

 

300

 

438

Специальное

растениеводство

 

 

 

 

 

435

 

 

435

Защита растений

 

 

 

 

 

432

 

 

432

Географические науки

 

 

 

 

 

402

 

 

402

Антропология

 

 

 

 

 

180

180

 

360

Элементарная,Высшая математика,Арифметика, Теория чисел

306

 

 

 

 

 

 

 

306

Алгебра

282

 

 

 

 

 

 

 

282

Зоология

 

12

54

 

 

 

210

 

276

Лесное хозяйство

 

 

 

 

 

273

 

 

273

Геометрия и топология

264

 

 

 

 

 

 

 

264

Мерзлотоведение

 

 

 

 

 

261

 

 

261

Общее

растеневодство

 

 

 

 

 

255

 

 

255

Геологические науки

 

 

 

 

 

243

 

 

243

Геодезические науки

 

 

 

 

 

234

 

 

234

Биохимия растений

 

 

 

 

 

 

210

 

210

Физиология растений

 

 

 

 

 

 

195

 

195

Общая

физиология, биофизика,

биохимия

 

21

120

 

 

 

 

 

141

Систематика растений

 

 

 

 

 

 

105

 

105

Общее животноводство

 

 

 

 

 

33

 

 

33

Изучение читательского спроса на отечественные, иностранные книги и продолжающиеся издания из фонда ЦБП и филиалов показало, что интерес к книжным публикациям не ослабевает. В связи с тем, что ученые Центра, в основном, ведут исследования фундаментального характера, большинство изданий 70-90 годов остаются востребованными до сих пор. Необходимо осуществлять оперативное и полное комплектование продолжающимися изданиями, особенно иностранными, фундаментального характера, такими как: Methods in Enzymology, Annual Rev. Biochemistry, Methods Molecular Biology и т.д.

Фонд книжных и продолжающихся изданий в ЦБП и филиалах скомплектован достаточно хорошо по тематике ПНЦ, но иностранная литература, в частности, иностранные книги в области физико-химической биологии представлены неравномерно, за последние годы большие лакуны. Если комплектование отечественными книгами осуществлялось достаточно полно и оперативно, то фонд зарубежных книг и продолжающихся изданий формировался нерегулярно, особенно в последние годы. Все это сказывается на информационно-библиотечном обслуживании пользователей.

Литература:

  1. Кудеярова А., Слащева Н., Мохначева Ю. Нужно пользователю, необходимо нам // Библиотека. — 2005. — № 8. — С. 36-37.
  2. Слащева Н.А., Харыбина Т.Н., Мохначева Ю.В. Информационная поддержка научных исследований в Центральной библиотеке Пущинского научного центра РАН // Информационные ресурсы России. 2006. № 6.- С.10-11.
  3. Слащева Н.А., Захарова С.С, Мохначева Ю.В., Кудеярова А.Ю. Анализ и оценка информационных ресурсов для науки и образования информационно-библиотечного обеспечения научных исследований // Труды 10- юбилейной международной конференции и выставки “LIBCOM 2006”. http://www.gpntb.ru/libcom6/disk/trud.html.
!12

ПРОЕКТ ПО СОЗДАНИЮ КАТАЛОГА РОССИЙСКИХ ЭЛЕКТРОННЫХ ПЕРИОДИЧЕСКИХ ИЗДАНИЙ.

Калёнов Н.Е., Левнер М.В.
(Библиотека по естественным наукам РАН)

В настоящее время целый ряд библиотек разного уровня и разной ведомственной подчиненности работают над созданием собственных электронных библиотек, а также обеспечивают доступ своим пользователям к разнообразным отечественным и зарубежным электронным ресурсам.

Анализ, проведенный в библиотечных системах, показал, что одним из наиболее востребованных ресурсов являются полные тексты периодических изданий. Однако, если по ресурсам зарубежных периодических изданий имеется целый ряд организаций (например, J-Store, Science Direct и т.д.), обеспечивающих по своим прейскурантам навигацию и доступ к полным текстам (как на своих сайтах, так и на сайтах правообладателей), то информация о доступе к отечественным периодическим изданиям (особенно научным) рассредоточена и комплексно не обобщена.

И если вопрос доступа к полным текстам отдельных газет и журналов решается на тех или иных условиях через ряд коммерческих посредников или при обращении непосредственно к правообладателям, навигационной системы или хотя бы сводного каталога отечественных периодических изданий, имеющих электронные версии, в настоящее время не существует. Целый ряд отечественных библиотек и библиотечных консорциумов пытаются обобщать данные о таких ресурсах, но реально действующей достоверной системы до сих пор нет.

Именно поэтому некоммерческое партнерство “Электронные библиотеки” (НП ЭЛБИ), созданное рядом крупнейших библиотек и держателей электронных ресурсов, выступило инициатором создания сводного каталога российских периодических изданий, доступ к полным текстам которых может быть получен на договорной основе у правообладателей. Решать эту проблему планируется в тесном взаимодействии с держателями ресурсов и заинтересованными библиотеками и библиотечными консорциумами.

В рамках реализации проекта в настоящее время решаются следующие задачи:

При развитии этой системы, если она будет востребована, возможно решение и дополнительных задач:

На первоначальном этапе создания навигационной системы критерием отбора периодических изданий для включения в каталог является профиль комплектования периодическими изданиями фондов Российской государственной библиотеки (РГБ).

Реализация проекта началась в 2006 г. при финансовой поддержке Федерального агентства по культуре и кинематографии. В 2007 г. он получил поддержку Федерального агентства по печати и массовым коммуникациям. НП ЭЛБИ рассчитывает и в дальнейшем изыскивать средства для постоянного поддержания проекта.

В настоящее время разработан дизайн сайта каталога, определены поля формируемой базы данных, создан пользовательский интерфейс, разработаны “администраторские” программы ввода (пакетного и диалогового) и корректировки данных, а также пользовательские программы, обеспечивающие поиск информации в каталоге через Интернет. Экспериментальная версия каталога доступна на сайте НП ЭЛБИ по адресу http://periodika.elibra.ru:8080/. Вход — по кнопке “Анонимно”.

Пользователю при входе в каталог предоставляется возможность просмотра изданий по алфавиту либо поиска по полям сформированной базы данных (“Поиск по ключам”). Обращаясь к любым из представленных на экране элементов справочной информации, пользователь имеет возможность получить инструкции по работе с разными направлениями поиска и получению отчетов по результатам поиска, а авторизованные пользователи, имеющие право на ввод и редактирование данных — инструкции по осуществлению этих функций. Для поиска по алфавиту в верхней части окна поиска расположен алфавитный навигатор, содержащий буквы кириллического и латинского алфавитов и цифры. При выборе нужной буквы или цифры на экран (порциями по 50 записей) выводится алфавитный список, содержащий ISSN, и наименования изданий с гиперссылками на их сайты (если они имеются). Ниже приведен фрагмент выводимого на экран списка журналов.

 

46. 

 

Вестник ВОГиС

 

http://www.bionet.nsc.ru/vogis

47. 

 

Вестник Военного университета

 

http://elibrary.ru/title_about.asp?id=11963

48. 

 

Вестник военной информации

 

http://dlib.eastview.com/sources/publication.jsp?id=694

49. 

 

Вестник воздушного флота — аэрокосмическое обозрение

 

http://elibrary.ru/title_about.asp?id=9760

Каждая запись сопровождается кнопкой просмотра страницы, содержащей расширенные сведения об издании и перечень хранителей полных текстов с указанием адресов доступа, условий доступа и глубины архивов (рис. 1).

Наименование издания

 Вестник военной информации

 ISSN

 

 Издательство

 -

 Место издания

 Москва

 URL

 http://dlib.eastview.com/sources/publication.jsp?id=694

 Дата основания

 

Организация-хранитель

Фор-
мат

Условия

доступа

Дата
первого
выпуска

Дата
последнего выпуска

Даты
пропущ.

выпусков

East-View Military

HTML

платно

1992

2003

 

Рис. 1

Для авторизованных пользователей, имеющих право корректировать каталог (ввод авторизованных пользователей и настройка их прав осуществляются администратором системы), каждая запись сопровождается дополнительно кнопками редактирования и удаления записей.

На экране с результатами поиска также имеются кнопки для вывода результатов поиска в виде таблиц, упорядоченных по изданиям (“общий реестр”) и по владельцам прав на электронные версии (реестр хранителей”).

При поиске по ключам пользователю предлагается, используя булевские операторы, составить запрос на поиск из любых элементов паспорта электронного издания. При этом поиск можно осуществлять с учетом или без учета регистра клавиатуры (Рис. 2).

Рис. 2

На начальном этапе создания каталога обобщались данные от крупнейших держателей ресурсов российских электронных периодических изданий: e-library, Интегрум, РГБ, East-View Publications. Понимая, что для коммерческих структур помещенная на общедоступном сайте информация о предоставляемом ими сервисе является дополнительной рекламой, многие предоставили такую информацию. Однако последовательная проверка данных показала, что не всегда указанные держателями URL периодических изданий соответствуют адресам полных текстов: некоторые адреса вообще не верны, а некоторые отсылают либо к оглавлениям, либо к аннотациям, либо просто к редакциям. Поэтому потребовалась полная проверка и ревизия данных, предоставленная держателями.

В настоящее время продолжается работа по выверке уже введенных данных и поиску новых источников информации об отечественных периодических изданиях, доступ к полным текстам которых возможен через Интернет на любых условиях.

Российская ассоциация электронных библиотек рассчитывает использовать в дальнейшем создаваемый каталог для координации оцифровки российских периодических изданий, не имеющих электронного аналога (с соблюдением законодательства об авторских и смежных правах) и для снижения затрат пользователей на доступ к таким ресурсам. Оцифровка периодических изданий будет решаться путем распределения источников для оцифровки между членами ЭЛБИ с выделением соответствующих финансовых ресурсов. Приглашаем всех, заинтересованных в развитии доступа к российским электронным периодическим изданиям, принять участие в создании, ведении и совершенствовании каталога и присылать в ЭЛБИ отсутствующие в каталоге сведения о российской электронной периодике. Будем рады получить любые конструктивные предложения по совершенствованию каталога. Надеемся, что он станет полезным инструментом для всех, кто занимается разработкой и комплектованием российских электронных библиотек.

!13

ФОРМАЛЬНЫЕ ПРИЗНАКИ РОССИЙСКИХ НАУЧНЫХ ЖУРНАЛОВ: ОТ СТАНДАРТНОГО БИБЛИОГРАФИЧЕСКОГО ОПИСАНИЯ К СЛОЖНЫМ МЕТОДИКАМ ОЦЕНКИ

Андронова М.Б., Малинина К.О.
(ВИНИТИ РАН)

Общественное использование научных журналов в библиотеках, информационных центрах связано с накоплением различного рода информации о самих журналах — библиографическими сведениями, данными об использовании журналов и т.п.

Сведения о научных журналах, получаемые в результате их описания в аннотированных указателях периодических и продолжающихся изданий, традиционных и электронных каталогах, получили название формальных признаков.

Формальные признаки научного журнала — широкое понятие, включающее в себя, как элементы стандартного и расширенного библиографического описания (БО), так и сведения о спросе на журнал у различных категорий читателей, данные о других формах его использовании в информационном обслуживании и т. п.

Количество формальных признаков, включаемых в каталоги, различно и зависит от целей и формы каталога. Наиболее обширными по количеству признаков являются (по видам) универсальные справочные каталоги и каталоги информационных служб, по форме — электронные каталоги. Так, в настоящее время, наибольшее количество полей (43) насчитывается в электронной справочной системе по периодическим и продолжающимся изданиям Ulrich’s Periodical Directory. В печатной версии этого же издания содержится 23 поля БО. Электронный каталог ВИНИТИ РАН содержит 37 полей БО. Каталоги научно-технических библиотек, независимо от формы представления, ограничиваются меньшим количеством полей, в пределах 10-ти. В то же время, справочные издания, выходившие в печатном виде в 1960-1970-х годах, содержали всего 4-5 полей БО (библиографический указатель “Мировая научная и техническая литература”, библиографический указатель ГПНТБ СССР, библиографический указатель изданий, реферируемых ВИНИТИ).

Несмотря на то, что, на первый взгляд, увеличение количества полей БО (формальных признаков) рассеивает внимание пользователя и усложняет работу с каталогом, в целом, эту тенденцию следует рассматривать как положительную и закономерную, в связи с преобразованием каталогов в разновидность электронных баз данных. Подробная информация о научных журналах, формализованная и объединенная в единую систему, снабженную современными автоматизированными средствами управления базами данных и специальным программным обеспечением, предоставляет широкие возможности для анализа и совершенствования информационного обслуживания. Проблема рассеяния внимания снимается программными средствами путем отбора выводимых полей по потребности пользователя.

В настоящее время анализ формальных признаков применяется как справочный материал при принятия решений о целесообразности общественного использования журнала — например, приобретения его в научные фонды информационных служб, библиотек [1, 2]. Однако появление в последнее время ряда работ в России и за рубежом указывает на интерес к более широкому использованию этой информации, особенно для “взвешенной” оценки научных журналов в традиционной печатной и электронной форме [2, 3, 4].

Общей чертой всех формальных признаков является то, что это — унифицированные элементы, не затрагивающие напрямую содержательное наполнение журнала, но в той или иной мере косвенно его характеризующие. Например, именно формальными признаками описываются такие важные свойства журнала как требования, предъявляемые издателем к публикуемым статьям (пристатейные библиографические списки, рецензирование), готовность издателя нести дополнительные расходы по созданию журнала (перевод резюме и оглавления на английский язык) или ведению архива (создание копий на небумажных носителях) и др.

Предпринятый в [5] анализ показал, что формальные признаки научного журнала могут быть однозначно поделены на признаки создания и признаки использования.

Наличие признаков создания у журнала целиком зависит от воли и желания издателя, и они могут быть произвольно изменены, удалены или добавлены на этапе допечатной подготовки издания. К признакам создания относятся элементы расширенного БО журнала: код ISSN, резюме на русском/английском языках, оглавление на английском языке, помимо русского, пристатейные библиографии, сведения о рецензировании и др.

Признаки использования либо зависят частично, либо вовсе не зависят от воли издателя и характеризуют степень спроса на уже вышедшее в свет издание у читателей, распространителей, библиотек, информационных служб.

Исследование взаимосвязей и взаимного влияния формальных признаков российских научных журналов позволяет выявить журналы, пользующиеся наивысшим спросом, как среди мировой научной общественности, так и внутри страны.

Применение полученных результатов возможно в двух направлениях. Во-первых, для совершенствования методик “взвешенной” оценки журналов, применяемых при принятии решения о целесообразности общественного использования журнала. Во-вторых, создаются предпосылки для ранжирования признаков создания журнала, пользующегося спросом, построения образа “идеального” журнала. Тогда становится возможным предложение рекомендаций издателям научных журналов по порядку работы с признаками создания, приводящие к повышению спроса на журнал.

Литература

  1. Калёнов Н. Е., Козлова Е. И., Гиацинтов О. М. Математическая модель оптимизации подписки на журналы в научной библиотеке // НТИ. Сер. 1. — 1999. — № 12. — С. 9-12.
  2. Кириллова О. В., Чернобровская Т. Н., Шапкин А. В., Березин А.Г., Зеленина Г. З. Комплексный подход к формированию перечня основных периодических и продолжающихся изданий России в области точных, естественных и технических наук // М., 2003. — 30 с. — Рукопись деп. в ВИНИТИ 16.09.2003, № 1680-В2003.
  3. Якимов В. И., Ефременкова В. М., Севастьнов В. Г. Методика оценки научной информативности сайтов // Информационное обеспечение науки. Новые технологии: Сб. науч. тр.. — М., 2005. — С. 71-83.
  4. Lopez-Ornelas M., Cordero-Arroyo G., Backhoff-Escudero E. Measuring the Quality of Electronic Journals /.- Electronic Journal of Information Systems Evaluation. — 2005. — V. 8.- № 2.- P. 133-142.
  5. Андронова М. Б., Малинина К. О. Классификация формальных признаков российских журналов по точным, естественным и техническим наукам// НТИ. Сер. 1. 2007.- № 3.- С. 31-36.
!14

ЭЛЕКТРОННАЯ ИНТЕРНЕТ-ВЕРСИЯ СИСТЕМАТИЧЕСКОГО КАТАЛОГА

Васильчиков В.В., Власова С.А., Соловьева Т.Н.
(Библиотека по естественным наукам РАН)

Актуальной задачей современных библиотек является ретроконверсия их традиционных каталогов в электронные. Если новые поступления почти повсеместно регистрируются в электронных каталогах, то перевод в электронную форму всего фонда остается непростой задачей для многих библиотек.

Крупные библиотеки, фонды которых насчитывают сотни тысяч единиц хранения, чаще всего идут по пути сканирования традиционных каталогов своими силами или привлекая к этой работе специализированные организации. Эта технология предполагает использование дорогостоящих сканеров для поточного сканирования, специального программного обеспечения и трудоемкой процедуры выделения элементов данных для организации точек доступа, исправления результатов распознавания текстов, сверки и корректировки информации перед загрузкой в электронный каталог. В связи с этим весь процесс ретроконверсии занимает не один месяц.

Представляется целесообразным так организовать процесс ретроконверсии, чтобы читатели могли воспользоваться результатом этой работы на как можно более ранней стадии. Для этого достаточно предоставить читателям возможность поиска информации в массивах отсканированных библиографических карточек одновременно с продолжением работ по распознаванию текстов, их коррекции и загрузки в электронный каталог.

Выбор каталога, подлежащего сканированию, зависит в первую очередь от того, с какой целью читатели чаще обращаются к традиционным карточным каталогам конкретной библиотеки. Если читатель приходит в библиотеку чаще всего за конкретным изданием, сканировать целесообразно Алфавитный каталог. Если среди читателей конкретной библиотеки больше доля лиц, ищущих литературу по интересующей их теме — сканировать целесообразно Систематический каталог. Производить ретроконверсию, опираясь на Систематический каталог, целесообразно и в том случае, когда читательский контингент “проблемно ориентирован”. Например, фонд Центральной библиотеки Пущинского научного центра охватывает почти все разделы ББК. В то же время в нем можно выделить несколько тематических разделов, к которым читатели проявляют наибольший интерес. Именно с этих разделов и целесообразно начинать сканирование.

Прежде, чем приступить к сканированию миллионов библиографических карточек Сводного каталога сети БЕН, целесообразно было отладить технологические приёмы и программные средства на фонде меньшего объёма. В качестве такого “опытного полигона” был выбран Систематический книжный каталог ЦБП. Сканирование производилось с помощью сканера ЭЛАР СКАМАКС 2000С. Скорость сканирования — 80 библиографических карточек в минуту. Так как Систематический каталог ЦБП организован по ББК, сканирование производилось пачками от разделителя до разделителя. Каждая пачка сохранялась на жестком диске в виде отдельной папки, в которой каждой карточке соответствовал файл в формате TIF объёмом 4-7 кб. Всего было отсканировано 132 стандартных каталожных ящика, на что ушло около 140 часов рабочего времени непрофессионального оператора.

Для просмотра полученных электронных карточек была разработана Интернет-система “Тематический поиск в ретро-каталоге”. Данная система имитирует работу читателя с традиционным каталогом: позволяет выбрать в диалоговом режиме нужную тематическую рубрику и просматривать образы библиографических карточек этой рубрики, расположенных в алфавитном порядке.

Система разработана под Microsoft SQL Server 2005, установленным в операционной системе WINDOWS 2003, с использованием стандартных средств сервера и IDC технологии. Работа пользователей с системой происходит с помощью стандартных Интернет-браузеров, таких как Internet Explorer и Netscape Navigator.

Система поддерживает базу данных, состоящую из 4-х таблиц. Первая таблица содержит перечень крупных разделов ББК (15 разделов), которые и выводятся на экран пользователя в начале работы. Кроме того, эта таблица содержит номера каталожных ящиков, относящихся к каждому разделу.

Вторая таблица содержит названия тематических рубрик, которые пишутся на лицевой стороне каталожных ящиков. В традиционном каталоге это — текст первых разделителей в ящиках.

Следующая таблица содержит тексты всех разделителей, стоящих в каталожных ящиках. Другими словами, это разделы ББК, реально отраженные в фондах данной библиотеки.

И, наконец, четвёртая таблица содержит отсылки на папки, содержащие отсканированные образы библиографических карточек, стоящих за конкретным разделителем.

Кроме того, для удобства просмотра образов карточек в системе предусмотрена специальная настроечная таблица, которая содержит числовые интервалы (шаги). Таких интервалов может быть любое число, и их значения могут быть также любыми. Настройка данной таблицы осуществляется администратором системы.

Для наглядного показа “каталожных ящиков” различных рубрик используется макет HTML-страницы, сформированный в Web-редакторе Macromedia Dreamweaver 8.

Система предоставляет пользователю два режима работы:

В режиме “Иерархический просмотр” пользователю сначала выдается на экран список предметных рубрик (крупных разделов ББК), которые являются активными гиперссылками.

После перехода по выбранной рубрике система раскроет HTML-страницу, имитирующую каталожные ящики. Названия каталожных ящиков являются, с одной стороны, тематическими рубриками выбранного раздела, с другой стороны — каждое название является активной гиперссылкой к списку “разделителей” выбранного ящика.

Выбрав “разделитель”, пользователь имеет возможность как последовательно “пролистывать” образы карточек, так и переходить от карточки к карточке через выбранный интервал как “вперед”, так и “назад”. При необходимости можно перейти к любым другим “разделителям” выбранного “ящика”.

В режиме “Поиск по ББК” пользователь должен ввести конкретный индекс ББК, после чего ему будет предоставлена возможность просмотра образов карточек, относящихся к введенному индексу ББК.

Безусловно, поисковые возможности описываемой системы значительно уступают возможностям электронного каталога, но дают выигрыш во времени, позволяющий малыми средствами обеспечить доступ читателей к каталогу в удаленном режиме.

Система “Тематический поиск в ретро-каталоге” в ближайшее время будет установлена на сервере Центральной библиотеки Пущинского научного центра РАН. В настоящее время тестовая версия системы доступна на сервере БЕН РАН по адресу:

http: //www.benran.ru/Magazin/crt/crt.htm.

!15

ФОРМИРОВАНИЕ ЖУРНАЛЬНОГО ФОНДА ЦБС С ПОМОЩЬЮ ИНТЕРНЕТ-ТЕХНОЛОГИИ

Афонина Н.И.
(МГТУ им. Баумана, кафедра ИУ5)
Каллистратова О.Д. Соловьева Т.Н.
(Библиотека по естественным наукам РАН)

Библиотека по естественным наукам РАН (БЕН РАН) возглавляет централизованную систему, включающую более 130 библиотек академических институтов и научных центров и располагает наиболее полными в стране фондами естественнонаучной литературы, содержащими около 12 млн. единиц хранения. Основную часть фонда составляют периодические издания, большая часть из которых — зарубежные издания.

До 1992 года основными источниками поступления зарубежных периодических изданий (ПИ) были централизованная покупка за валюту и международный книгообмен. Однако из-за недостатка финансовых средств, выделяемых БЕН РАН в последние годы, резко сократилось централизованное поступление ПИ. В то же время академические организации стали в большей степени использовать свои внебюджетные фонды для приобретения информации, что привело к увеличению децентрализованных поступлений зарубежных ПИ в библиотеки сети БЕН РАН.

Одной из важнейших задач БЕН РАН является ведение сводных каталогов литературы, поступающей в библиотеки ее сети. Для формирования электронного каталога фондов периодических изданий в БЕН РАН разработана система ДИСКАТ [2], которая поддерживает все основные операции ведения каталога и обеспечивает доступ к нему как пользователям локальной компьютерной сети БЕН, так и пользователям сети Интернет. В каталоге накапливается информация о томах и номерах поступивших выпусков ПИ и их распределении по сети с указанием года и номера недели поступления, а также кода источника поступления. Информация о централизованно поступающих журналах вводится по мере их поступления в систему комплектаторами БЕН РАН в режиме диалога и отображается в каталоге в течение 1-2-х недель. В соответствии с установленной технологией, информация о децентрализованных поступлениях ПИ передается в БЕН РАН из библиотек раз в квартал по электронной почте и в пакетном режиме добавляется в каталог. При этом для библиотек возможны два варианта. Если библиотека использует для регистрации журналов систему REGJURW (см. статью “Система регистрации журналов для библиотек ЦБС БЕН РАН” этого сборника.), она автоматически выгружает из нее децентрализованные поступления в рабочем формате и направляет их в БЕН. Если библиотека не использует компьютеры при регистрации ПИ (а таких пока, к сожалению, достаточно много), она формирует текстовый файл специальной структуры вручную.

С увеличением децентрализованных поступлений зарубежных ПИ повышаются требования к оперативности их отражения в сводном каталоге. Это, в свою очередь, требует существенной переработки технологии загрузки в сводный каталог информации о децентрализовано поступающих ПИ. В этой связи было решено реализовать систему интерактивного ввода данных о поступлениях ПИ в удаленном режиме.

Описание системы

Для реализации объектно-ориентированной системы были выбраны средства программирования, использование которых обеспечило устойчивое функционирование системы в среде корпоративной сети БЕН РАН, базирующейся на технологиях Microsoft.

При выборе системы управления базами данных учитывались следующие требования:

Программное обеспечение системы строится на основе интернет-технологий. Функции СУБД выполняет Microsoft SQL Server 7.0. Разработанная система функционирует в операционной среде Windows 2000/2003 Server и Windows XP. В настоящее время проходит опытную эксплуатацию.

Доступ к системе возможен только для авторизованных пользователей. При этом для различных категорий пользователей установлены различные уровни доступа. Пользователи категории “Администратор” имеют право осуществлять все функции, реализованные в системе. Пользователи категории “редактор” имеют право редактировать информацию. Пользователи категории “пользователь” имеют право только на поиск и просмотр информации.

Предметом обработки и анализа системы являются три основных объекта (сущности): журналы, поступления и библиотеки.

Под журналами понимается совокупность определённой информации о журнале, а именно:

Тематика, страна издания, издательство представляют собой отдельные сущности, имеющие собственные атрибуты. В тематике, соответствующей рубрикатору журналов, разработанному в БЕН РАН, наряду со словесным наименованием рубрик, используется двухсимвольный код тематики журнала; страна представлена полным наименованием и международным трехсимвольным кодом; издательство имеет наименование, адрес, дополнительную информацию.

Под библиотекой понимается совокупность следующей информации:

Поступления журнала — это совокупность следующей информации:

Каждый из перечисленных выше атрибутов объектов является полем в БД, в котором по мере необходимости можно производить определенные операции (корректировать или вводить новую информацию).

В настоящее время в состав системы входит 3 основных исполнительных блока, реализующие все операции по регистрации ПИ в сводном каталоге журналов ЦБС. Обращение к ним осуществляется из формы на главной странице системы.

В число блоков системы входят:

Все блоки поддерживают (с некоторыми отличиями) типовой интерфейс пользователя. На каждой странице блока раскрывается меню, отражающее основные операции над объектами (поиск, ввод, редактирование). Кроме того, на каждой странице есть главное меню, состоящее из трех пунктов: Журналы, Библиотеки, Поступления. Это меню позволяет пользователю легко попадать на нужные страницы, не возвращаясь на главную.

Данная система позволяет обеспечить своевременное и оперативное пополнение информации о ПИ в базе журналов ЦБС. Система является удобным средством для ввода информации о журналах с рабочих компьютеров библиотек сети в центральную базу журналов ЦБС.

Литература

  1. Я.Я. Докторов, Н.Е. Калёнов. Программный комплекс для работы с периодическими изданиями // Информационное обеспечение науки: новые технологии: Сборник научных трудов. — М., 1997. — С.97-101.
  2. О.Д. Каллистратова. Электронный каталог распределенного фонда периодических изданий в ЦБС// Применение ЭВМ в информационно-библиотечной технологии. — 1995, С. 52-57.
!16

СИСТЕМА РЕГИСТРАЦИИ ЖУРНАЛОВ ДЛЯ БИБЛИОТЕК ЦБС БЕН РАН

Докторов Я.Я., Соловьева Т.Н.
(Библиотека по естественным наукам РАН)

Система REGJURW (далее — просто система) разработана в БЕН РАН [1] и предназначена для регистрации поступлений в библиотеки периодических изданий. Она ориентирована на работу как отдельных изолированных библиотек, так и библиотек, входящих в ЦБС БЕН РАН.

В течение ряда лет система разрабатывалась в тесном контакте с пользователями библиотек ЦБС, конструктивная критика которых позволила нам пройти путь от первоначальной “опытной” эксплуатации до состояния ее внедрения. Начиная с 2000 года, система была внедрена во многих библиотеках сети, где успешно используется для формирования и поддержки локальных электронных каталогов журналов. Система предназначена для ведения каталога журналов под управлением ОС WINDOWS и позволяет:

Система поддерживает работу трех связанных между собой БД:

Связь между БД осуществляется по уникальному номеру (индексу) записи БДО.

Формат БД разрабатывался специалистами БЕН РАН и используется в различных технологических задачах.

Программное обеспечение системы

В настоящее время система включает в себя ряд приложений, поддерживающих следующие функции:

Ниже дается конспективное изложение всех указанных программ.

Программа установки служит для установки параметров функционирования системы, ввод которых осуществляется на двух страницах вкладок, которые называются “Директории системы” и “Параметры”. На первой странице расположены окна ввода необходимых путей и директорий для системы. На второй странице расположены окна ввода или выбора кода (сиглы) библиотеки из заданного списка и задания интервалов (в днях) индексирования БД.

Программы конвертирования используются однократно библиотекой, если она переходит с предыдущей версии системы на новую, и обеспечивают загрузку уже накопленной информации в новую базу данных, имеющую другую структуру.

Программа регистрации поступлений журналов с возможностью поиска журналов в БД по шифру, ISSN, по произвольному фрагменту названия издания и по начальному фрагменту (последнее введено по предложению пользователей для удобства работы с системой). Правила, по которым задаются условия поиска, отражены в отдельном окне “Как искать?”.

Кроме того, в каждый момент времени предусмотрена возможность получения соответствующей помощи при нажатии функциональной клавиши “F1”.

После успешного поиска в окне описаний выдается список найденных записей в виде таблицы полей описания журналов. Имеется возможность сортировки таблицы по столбцу “Шифр” и по столбцу “Название”. Предусмотрена возможность поиска в отсортированной таблице по заданным полям.

При выборе журнала из найденного списка пользователь получает список годов, в которых выписывался данный журнал. Каждому году заказа соответствует свой список поступивших выпусков в виде таблицы томов и номеров (ТТН) (случай пустого списка сопровождается соответствующим сообщением).

В этом режиме имеется возможность актуализировать как поступления, так и предварительные заказы на издание (Заказать, Исправить и Удалить). Любое удаление выбранного поступления или заказа сопровождается предупредительным переспросом.

Программа импорта. Эта программа служит для добавления в пакетном режиме новых поступлений в БД системы, сформированных в процессе централизованного распределения журналов для данной библиотеки в системе БЕН РАН.

Программа экспорта новых поступлений предназначена для передачи информации о децентрализованных поступлениях журналов в сводный каталог БЕН РАН. В процессе ее работы создается текстовый файл специальной структуры, в который автоматически заносятся данные о новых поступлениях журналов за указанный интервал времени.

Программа распечатки новых поступлений. Работа в этом режиме предельно проста и от пользователя требуется лишь ввести интервалы дат поступлений; ввод дат возможен как набором "вручную" в окнах ввода, так и выбором из выпадающего Календаря; после нажатия кнопки Создать файл в соответствующей директории создается текстовый файл, содержащий форматированный алфавитный список журналов, поступивших за заданный промежуток времени. Список может быть распечатан и сохранен в компьютере.

Программа индексирования служит для последовательного индексирования всех трех БД системы и осуществляет физическое удаление ранее логически удаленных записей, т.е. происходит "сжатие" файлов с соответствующими изменениями информации в файлах окружения БД.

Программа корректуры записей БДО служит для добавления, удаления и корректуры записей БДО. При добавлении описаний контролируется ввод дублей по шифрам хранения и номерам ISSN. При попытке ввести дублетную запись система выдает соответствующее сообщение, и запись при этом не будет сохранена.

Режим удаления снабжен дополнительным предупреждением.

Создание Интернет-каталога

Для решения задачи создания и предоставления пользователям Интернет-каталога журналов в БЕН РАН был разработан комплекс программ, подключаемых к системе регистрации журналов. По сути, Интернет-каталог в системе формируется по технологии и программам, используемым в технологии БЕН РАН [3].

С помощью программы конвертирования создаются из записей БД системы текстовые файлы специальной структуры, которые записываются в директорию, указанную при настройке системы. Каждая строка этих файлов является объединением значений некоторых полей записей БД системы, а именно: шифр журнала, тематика, ISSN, название журнала, год, том, номер поступления. Поступления расположены в порядке убывания по годам, номера изданий отсортированы в возрастающем порядке. Сформированные таким образом файлы являются входными для программ формирования Интернет-каталога журналов. Программы формирования Интернет-каталога были разработаны в БЕН РАН [2] и успешно используются в течение десятка лет для создания каталога журналов на сайте БЕН РАН.

Каталог формируется в несколько этапов. На первом этапе формируется алфавитная часть каталога. Формируются HTML-страницы описания журналов, алфавитные списки на каждую букву латинского и русского алфавита и главная страница электронного каталога, на которой представлено два алфавита — латиница и кириллица. На этом этапе закладывается основа электронного каталога — “алфавитный каталог”. Он может выступать самостоятельным продуктом в небольших библиотеках ЦБС БЕН РАН.

На втором этапе можно продолжить формирование электронного каталога и добавить к нему тематическую часть. На этом этапе используется входной файл, отсортированный по тематике в соответствии с рубрикатором, разработанным БЕН РАН. Формируются HTML-страницы с рубриками и подрубриками, а также списки журналов соответствующие подрубрикам. Поисковый рубрикатор добавляется на главную страницу электронного каталога. На страницах объединены названия рубрик и подрубрик на русском и английском языках. Фрагмент русско-английского рубрикатора представлен ниже.

Общие вопросы естественных наук =

General Problems of Natural Sciences

Естественные науки в целом. Hаука и техника
= Natural Sciences. Scienсe and technique

Общие реферативные журналы
= General abstracts

Журналы научных обществ
= Journals of scientific societies

Общие физико-математические и технические журналы
= Joint Physical-Mathematical and Technical Journals

Общие физико-химические журналы
= Joint Physical-Chemical Journals

Природоведение. Охрана природы. Человек и биосфера
= Environmentology. Ecology. Man and biosphere

Метрология. Стандарты. Наукометрия
= Metrology. Standarts. Scientometrics

Программы конвертирования и создания каталога объединены процедурой и выполняются последовательно одна за другой. Поэтому работа с ними предельно проста для пользователя. После запуска системы достаточно нажать на кнопку “Конвертировать”. В результате работы программ в рабочем каталоге, путь к которому указан в настроечном файле, создается Интернет-каталог журналов, который затем экспортируется на Web-сервер библиотеки.

Описанная система установлена и функционирует в Библиотеке ФИАН. Авторы выражают особую благодарность сотруднице библиотеки ФИАН Акинфиевой Ольге Иосифовне за ее конструктивный вклад в модернизацию системы.

Литература

  1. Я.Я. Докторов, Н.Е. Калёнов. Программный комплекс для работы с периодическими изданиями // Информационное обеспечение науки. Новые технологии: Сб. статей под ред. Н.Е. Калёнова. — М., 1997. — С.97-101.
  2. О.Д. Каллистратова, Т.Н. Соловьева. Электронный каталог журнального фонда БЕН РАН в ИНТЕРНЕТ // Информационное обеспечение науки. Новые технологии: Сб. статей под ред. Н.Е. Калёнова. — М.: БЕН РАН, 1997. — C. 71 — 73.
  3. Т.Н. Соловьева. Система баз данных на основе электронного журнального каталога БЕН РАН, доступная через ИНТЕРНЕТ// Современные технологии в информационно-библиотечном обеспечении научных исследований: 8-й научно-практический семинар. Таруса, 13 — 18 сентября 1999. М.,1999. — С. 97-99.
!17

СИСТЕМА ЦЕНТРАЛИЗОВАННОГО АВТОМАТИЗИРОВАННОГО УЧЁТА ОТЕЧЕСТВЕННОЙ ЛИТЕРАТУРЫ В ЦБС БЕН РАН.

Бочарова Е.Н., Кочукова Е.В., Наумова В.С.
(Библиотека по естественным наукам РАН)

Библиотека по естественным наукам РАН (БЕН РАН) является не только одной из ведущих библиотек Академии наук, но и центральным подразделением централизованной библиотечной сети (ЦБС). БЕН РАН и библиотеки её сети представляют уникальную систему, в которой основные библиотечно-информационные процессы централизованны. Фонды ЦБС формируются как единый отраслевой фонд, на базе которого обеспечивается библиотечное и информационно-библиографическое обслуживание ученых и специалистов естественнонаучного профиля. БЕН РАН осуществляет централизованное комплектование и обработку литературы для библиотек своей сети, ведёт сводные каталоги фондов ЦБС, обеспечивает централизованное обслуживание по межбиблиотечному абонементу, координирует информационную деятельность своих библиотек. Это позволяет существенно экономить средства, выделенные на приобретение и обработку литературы.

В ЦБС БЕН РАН входит 135 библиотек институтов, филиалов и научных центров Российской Академии наук, расположенных в Москве, Подмосковье и в других городах страны. Комплектование такого количества библиотек имеет свои особенности: большое количество источников комплектования, различные направления комплектования обслуживаемых институтов естественнонаучного профиля и др.

Источниками комплектования ЦБС БЕН РАН являются издательства, книготорговые организации, академические институты, Российская книжная палата (РКП). Кроме того, БЕН РАН получает дары от учреждений и частных лиц. Из РКП поступает бесплатный обязательный экземпляр (ОЭ), а от некоторых издательств — образцы их изданий, на основе которых осуществляется заказ литературы для библиотек сети. Иногда одно и то же издание может поступить в Отдел комплектования отечественной литературы из нескольких источников и соответственно по разным ценам.

С сентября 2004 года Отдел комплектования отечественной литературы (ОКОЛ) работает в системе “Библиобус”, которая разработана сотрудниками отдела автоматизации БЕН РАН. Эта система позволяет в автоматическом режиме регистрировать (с распечаткой приходных документов), распределять (с распечаткой расходных документов), каталогизировать, систематизировать, шифровать и инвентаризировать балансовую и безбалансовую литературу, а также формировать и распечатывать каталожные карточки, то есть осуществлять полный цикл обработки литературы.

При её создании учитывались особенности ЦБС БЕН РАН и традиционно сложившиеся формы учёта поступившей и выбывшей литературы. Формы актов приёма и отправки литературы утверждены Президиумом АН СССР в 1972 году. Позднее эти формы не пересматривались.

Исторически сложилось, что в библиотеках Российской Академии наук обязательны два вида учета: суммарный и индивидуальный.

Суммарный учёт даёт сведения об объеме фонда, составе его по содержанию, видам изданий, источникам поступления, стоимости литературы, а также о движении фонда. Единицей суммарного учета является партия литературы, поступившая или выбывшая по одному документу. Суммарному учёту подлежит вся литература независимо от её балансового признака.

Индивидуальный учёт даёт сведения о каждом отдельном экземпляре издания, поступившего в библиотеку или выбывшего из неё. Единицей индивидуального учета является печатная единица. Этот вид учёта ведётся в соответствии с балансовым признаком литературы в инвентарной книге или регистрационной карточке. Стоит отметить, что бухгалтерия относит на баланс учреждения стоимость лишь той литературы, которая записана в инвентарную книгу.

Система “Библиобус” позволяет существенно упростить и объединить эти два вида учёта.

Ещё одной особенностью ЦБС является объединение в ней библиотек с различными признаками комплектования: “без условий”, “взамен авизо”, по договору.

Библиотеки, комплектуемые по признаку “без условий”, отделами БЕН РАН в различных академических институтах и научных центрах. Литературу они получают бесплатно и о состоянии фонда отчитываются перед бухгалтерией и администрацией БЕН РАН. Сотрудники этих библиотек входят в штат БЕН РАН.

Фонды библиотек, комплектуемых “взамен авизо”, состоят на балансе своих институтов, и библиотеки отчитываются о поступлении литературы на основании сопроводительных актов и извещений, выданных БЕН РАН, перед администрацией и бухгалтерией своих институтов. Литературу они получают условно бесплатно за счет средств, выделяемых БЕН РАН Президиумом Академии наук.

Фонды библиотек, комплектующихся по договору, состоят на балансе своих институтов, и библиотеки отчитываются о поступлении литературы на основании сопроводительных документов, выданных ОКОЛ и бухгалтерией БЕН РАН. Они оплачивают поступившую к ним литературу, независимо от её балансового признака, и услуги по обработке этой литературы, а иногородние библиотеки — и почтовые расходы, связанные с отправкой к ним литературы, в соответствии со своими договорами.

Система “Библиобус” позволяет в автоматическом режиме:

В этой системе происходят все операции со счетами поступления литературы, связанные с созданием, управлением и распечаткой сопроводительных актов.

Перед регистрацией литературы необходимо выбрать или создать счет, по которому поступила партия литературы. При создании счета ему присваивается уникальный номер, а также он снабжается префиксом, представляющим собой код поставщика. Также вводится сумма счета, соответствующая сумме в приложенной к данной партии литературы товарной накладной и счёт-фактуре.

Приходные акты формируются динамически во время их печати и содержат в себе только актуальную информацию. Таким образом, после внесения изменений в данные регистрируемых изданий (например, в поля заголовка, цены и т.д.) выводимые в приходный акт данные будут актуализированы. Предусмотрен также режим просмотра актов с возможностью их последующей печати.

Специальные знаки в окне свойств счёта показывают этап выполнения регистрации в зависимости от соответствия стоимости зарегистрированных экземпляров и общей стоимости счёта. Специальные изображения информируют о том, что регистрация ещё не завершена, или что стоимость зарегистрированных изданий превышает общую стоимость счета. Если стоимость регистрации соответствует общей сумме счета, операция может быть завершена.

После регистрации изданий, поступивших по тому или иному счету, можно распечатать стандартную форму приходного акта, которая представлена на рис. 1.

Она представляет собой список изданий принятых по этому счёту, с указанием цены каждого экземпляра, сигл библиотек, куда распределено данное издание, а также балансового признака каждого экземпляра, потому что в одной партии литературы могут быть издания с разными балансовыми признаками. Также некоторые издания для библиотек с разными признаками комплектования (“без условий”, “взамен авизо”, по договору) имеют разные балансовые признаки. Например, продолжающееся издание в библиотеку, комплектующуюся по признаку “без условий” или “взамен авизо” попадет по безбалансовому акту, так как имеет признак “временного хранения”. А в библиотеку, комплектующуюся по договору, — по балансовому акту, в соответствии с договором комплектования.

Рис.1 Форма приходного акта

На основе распечатанных приходных актов и приложенных к ним финансовых документов формируется отчет для бухгалтерии и для администрации библиотеки о поступившей в отдел литературе. В данное время этот отчёт составляется в полуавтоматическом режиме (Excel-таблицы). В таблицу вносятся источник комплектования, общее количество и общая сумма поступившей литературы по каждому приходному акту, а также её балансовый признак. С помощью стандартных средств Excel формируются итоговые суммы. После распечатки получившейся таблицы она сдается в бухгалтерию вместе с приходными актами и финансовыми документами. Также эти таблицы являются основой для отчета о поступлении на баланс отдела литературы. Фрагмент отчёта о поступившей литературе представлен на рис. 2.

По завершении полного цикла обработки литературы каждый экземпляр издания может быть внесён в соответствующий расходный акт.

Формы расходных актов создаются системой также динамически, любой созданный расходный акт может быть повторно напечатан неограниченное количество раз. Все изменения, внесённые в БД, будут отражены в формируемых актах. Например, если после печати расходного акта обнаружена ошибка в стоимости издания, то после её исправления вновь напечатанный акт будет содержать обновленную информацию.

Рис.2 Фрагмент отчёта о поступившей литературе

Расходный акт является листом инвентарной книги учета фондов библиотек ЦБС.

На лицевой стороне акта указываются сигла библиотеки, признак её комплектования, издания, отправляемые в библиотеку, с ценой, а также общая сумма и количество отправляемых книг. На обратную сторону листа библиотеки уже сами вносят информацию об инвентарных номерах и шифрах, присваиваемых каждой книге индивидуально, в соответствии с принятыми в данной библиотеке правилами.

Нумерация формируемых расходных актов является сквозной для каждой библиотеки. Установка начальных параметров нумерации производится администратором системы.

Имеется также возможность изменения способа сортировки записей внутри акта: по номеру временного хранения, по шифру и по инвентарному номеру.

В режиме “Архив актов” можно распечатать дополнительные экземпляры созданного ранее акта, а также получить информацию о количестве напечатанных и отправленных документов, в том числе и за заданный временной интервал. Данный режим используется также для печати актов, информация в которых была изменена (отредактирована). Во всей системе реализована поддержка штрих — кода: оператор вызывает модуль архива актов и сканирует штрих — код ранее напечатанного расходного акта. В этом режиме можно также увидеть количество и общую сумму отправленной в данную библиотеку литературы по балансовым актам с сентября 2004 года, то есть с момента перехода ОКОЛ на работу в системе “Библиобус” (Рис. 4).

Рис.4 Архив расходных актов

Далее расходные акты регистрируются в специальных книгах учёта вручную. Им присваиваются порядковые номера. Нумерация актов начинается для каждой библиотеки с 1 января каждого года заново.

Сводные отчёты по отправке литературы формируются также в полуавтоматическом режиме (EXEL и WORD). В таблицы вносятся данные по зарегистрированным в данном месяце расходным актам по каждой библиотеке отдельно. В соответствии с ранее введёнными формулами, можно получить сведения о количестве и суммах отправленной литературы за месяц, квартал, полугодие и год в каждую библиотеку в отдельности и в библиотеки одного признака комплектования. Фрагмент отчёта о выбывшей литературе представлен на рис. 5.

Рис.5 Фрагмент отчета о выбывшей литературе

Данные отчеты сдаются в бухгалтерию, и по ним списывается выбывшая из ОКОЛ литература.

Практика работы в системе “Библиобус” показала, что у библиотечных специалистов существенно увеличивается производительность труда за счёт автоматизации многих процессов обработки литературы, в том числе и её учёта.

В настоящее время разрабатываются дополнительные программные средства, которые позволят связать систему “Библиобус” с бухгалтерской системой и, тем самым, полностью автоматизировать систему учёта литературы в ЦБС БЕН РАН.

!18

ЭЛЕКТРОННЫЕ РЕСУРСЫ ГНПБ ИМ. К.Д. УШИНСКОГО ДЛЯ ПЕДАГОГОВ И УЧЕНЫХ

Кабашева О.В.
(Государственная научная педагогическая библиотека им. К.Д.  Ушинского)

В соответствии с Постановлением Правительства РФ от 28 августа 2001 г. № 630 “О федеральной целевой программе “Развитие единой образовательной информационной среды (2001-2005 годы)” одной из задач является развитие информационных технологий сферы образования, включая создание электронных библиотек как средства накопления и распространения информационных методических ресурсов.

Государственная научная педагогическая библиотека им. К.Д. Ушинского приступила к осуществлению первых шагов по созданию электронной библиотеки.

Цель создания электронной библиотеки — реализация новых форм библиотечного и информационного обслуживания читателей путем:

В настоящее время коллекции электронных документов в мире разрастаются в геометрической прогрессии. Однако эти коллекции создаются и поддерживаются дилетантами, что значительно снижает качество контента и создает определенные неудобства пользователям при поиске информации. Проблема заключается в том, чтобы созданием электронных ресурсов занимались профессионалы, в число которых несомненно входят преимущественно библиотеки, которые владеют навыками обработки информации.

ГНПБ им. К.Д. Ушинского предоставляет пользователям широкие возможности пользования электронными ресурсами,

Рис. 1

расположенными на сайте библиотеки по адресу http://www.gnbpu.ru, а именно:

1. Функционирует электронный каталог, отражающий все поступления в фонды библиотеки с 1994 года.

В настоящее время каталог насчитывает более 270 000 записей, которые включают библиографические данные о монографиях, сборниках трудов институтов, материалах конференций, авторефератах диссертаций, учебных и методических пособиях, статьях из российской и зарубежной периодики, других материалах по всем направлениям педагогической науки и практики. (Книг — 171 000, статей из отечественных и иностранных журналов — более 67 000, авторефератов — более 35 000).

Каталог поддерживается системой WEB-ИРБИС на сайте Библиотеки.

Для удобства пользователей в базе данных предусмотрено несколько видов поиска.

Стандартный поиск — наиболее упрощенный. Он предоставляет возможность искать документы по ключевым словам, автору, заглавию или году издания.

Расширенный поиск по ключевым словам в заглавии, наименовании коллектива/мероприятия, предметной рубрики. Дополнительно можно уточнить запрос по таким параметрам, как тематическая рубрика, автор, вид документа, год издания, ISSN/ISBN. В этом виде поиска предусмотрено два вида формата вывода информации — краткий и полный (по новому ГОСТу).

Профессиональный. Этот вид предусматривает поиск по различным поисковым полям (всего 17 различных полей), объединенным различной логикой. Здесь возможно также составить комплексный поисковый запрос (имеется соответствующая инструкция по употреблению различных операторов).

Поиск по словарю. Этот вид поиска возможен для полей “ключевые слова”, “автор”, “заглавие”, “год издания”.

Навигаторы ГРНТИ и УДК. Государственный рубрикатор научно-технической информации и Универсальная десятичная классификация, применяемые для систематизации документов в электронном каталоге, позволяют пользователям при поиске уточнить необходимую тематику.

В электронном каталоге можно также получить сведения о поступлениях в фонды библиотеки за отдельные периоды времени (по месяцам). В этих подразделах каталога можно уточнить свой запрос, проведя стандартный поиск в уже найденных документах.

Кроме электронного каталога пользователям предлагается также база данных “Труды РАО”, которая является частью общего каталога и включает в себя публикации Российской академии образования и ее членов.

Развивая электронный каталог, планируется не только пополнять его новыми записями, но и подключить некоторые дополнительные возможности: возможность отобрать документы для печати или копирования в файл, добавить ссылки на полные тексты статей или авторефератов, доступных в других базах данных библиотеки.

Планы ГНПБ им. К.Д. Ушинского по созданию электронных ресурсов включают в себя также создание имидж-каталога той части фондов библиотеки, которая не вошла в электронный каталог. Фонд библиотеки формируется с момента образования библиотеки в 1925 году и в настоящее время насчитывает более 1,5 млн. единиц хранения, а значит, имидж-каталог сможет пополнить электронную базу данных порядка700 000 записями.

2. С 2000 года начата работа по созданию Полнотекстовой базы данных авторефератов диссертаций по педагогике и народному образованию. Для нее отбираются авторефераты наиболее значимых диссертаций на соискание степени кандидата или доктора педагогических наук. В базе данных в настоящее время насчитывается более 3500 документов. Полнотекстовая база данных привязана к электронному каталогу ГНПБ им. К.Д. Ушинского и доступна для пользователей в локальном режиме в библиотеке.

3. Создается аннотированный каталог образовательных ресурсов Интернет.

Работа над ним начата в 2002 году. В настоящее время он насчитывает более 600 ссылок на русскоязычные образовательные ресурсы, которые размещены в каталоге в соответствующих рубриках. Рубрикатор каталога построен по подобию рубрикатора периодического издания библиотеки “Литература по педагогическим наукам и народному образованию”. Помимо пополнения каталога, происходит постоянный мониторинг ресурсов, уже внесенных в каталог. При этом вносятся необходимые изменения, если меняются адреса ресурсов или их тематика, и удаляются недействующие ссылки. В планах работы над развитием Каталога — создание раздела, посвященного наиболее значимым зарубежным ресурсам по педагогике и образованию, а также раздела, в котором будут представлены библиотеки электронных текстов.

4. В ГНПБ им. К.Д. Ушинского разработан и внедрен поисковый педагогический тезаурус, который доступен специалистам в электронном виде на CD-ROM. С помощью тезауруса, включающего в настоящее время более 5000 дескрипторов, осуществляется систематизация всех документов, попадающих в электронный каталог библиотеки.

5. В библиотеке разработана и внедрена технология электронной доставки документов из фонда библиотеки любому пользователю, имеющему доступ к Интернет. Через эту службу читатели могут получить авторефераты диссертаций, статьи из сборников и периодических изданий, отдельные главы из книг.

6. Весной 2007 года введена в действие в тестовом режиме Виртуальная справочная служба, целью которой является удовлетворение информационных потребностей удаленных пользователей. Планируется выполнять справки:

Эти ресурсы создают серьезный задел для программы создания электронной библиотеки в области образования, которая будет доступна из любого региона России и из-за рубежа. Таким образом, Библиотека вносит существенный вклад в развитие единой образовательной информационной среды в России.

!19

ФОРМИРОВАНИЕ WEB-РЕСУРСА “БИБЛИОТЕКА” ИФТТ РАН.

Левченко О.И.
(Институт физики твердого тела РАН)

В связи с возросшими в последнее время информационными потребностями пользователей научной библиотеки изменились требования к формам обслуживания, сотрудникам библиотек. Возникла необходимость информационного обслуживания ученых на принципиально новом уровне, с использованием электронных ресурсов.

В настоящее время создание электронных документов, предоставление информации в электронном виде, организация ее в виде электронных изданий, разнообразных электронных коллекций и электронных библиотек, являются необходимыми. Обеспечение публичного, в том числе удаленного, доступа пользователей к информационным ресурсам стало одной из первоочередных задач обслуживания науки. Необходимы организация доступа к существующим распределенным ресурсам через информационные консорциумы, создание собственных БД, предоставление пользователю доступа к ресурсам посредством создания единой точки доступа.

Возможности библиотеки по созданию эффективной системы информирования специалистов института значительно расширились с развитием новых компьютерных технологий (электронной почты, доступа к удаленным электронным ресурсам, в том числе в режиме on-line, электронной доставки документов, использования в качестве носителей информации CD, DVD). Информационно-библиографическое обеспечение науки сегодня осуществляется посредством перечисленных средств.

В ИФТТ РАН было принято решение о создании web-страницы “Библиотека” и размещении ее на сайте института.

В работе по проектированию страницы приняли участие сотрудники библиотеки, программист, эксперт (научный сотрудник), что позволило осуществить комплексный подход в оценке ресурса с различных точек зрения: полноты предоставляемой информации; тематики и организационных форм научных исследований, проводимых ИФТТ РАН.

Проектной группой поэтапно были решены следующие задачи:

С целью создания представления о web-ресурсе рассмотрим составляющие элементы. На главной странице отражены график работы библиотеки, контактная информация и структура ресурса: блоки "О библиотеке", "Электронный каталог", "Диссертации", "Публикации", "Web-ресурсы", "Доска объявлений", "Обратная связь", установлен счетчик посещений.

Раздел “О библиотеке” содержит информацию о статусе библиотеки, её месте в ЦБС БЕН РАН, составе и принципах комплектования фондов, категориях читателей, обслуживаемых библиотекой; дана информация о периодичности выставок новых поступлений. Здесь же содержится исчерпывающая информация о технических возможностях библиотеки, дополнительных услугах, таких как копирование, сканирование, работа в Internet-классе, изготовление плакатов для участия в выставках и представления стендовых докладов на научных конференциях. Раздел снабжен фотографиями сотрудников, краткой информацией о каждом и о распределении обязанностей между ними.

Раздел "Электронный каталог" представляет собой сводный электронный каталог библиотеки, отражающий книжный и журнальный (с 1926 г.) фонды, снабженный удобной поисковой системой. Программное обеспечение основано на приложении Microsoft Access (2000). Электронный каталог обновляется автоматически с вводом информации в рубрику "Новые поступления". Существование электронного каталога расширяет возможности, как в процессе поиска информации, так и в широте охвата пользователей.

Сотрудниками библиотеки создана БД "Публикации сотрудников ИФТТ", "Диссертации", которые также представлены на странице в виде отдельных структурных элементов.

БД "Диссертации" включает сведения о диссертациях, защищенных в специализированном совете по защите докторских диссертаций ИФТТ РАН по специальности 01.04.07 — физика конденсированного состояния (глубина архива до 1978 г. — года создания специализированного совета).

Параллельно создается полнотекстовая БД, содержащая электронные версии диссертаций. В настоящее время ведется работа по созданию коллекции электронных версий, предоставляемых авторами, осуществляется их редактирование и перевод в PDF формат. Устанавливаются связи библиографических описаний диссертаций с полнотекстовой версией. В дальнейшем планируется оцифровка печатных версий диссертаций, защищенных в конце 70-х — 80-е г.г., когда электронных копий не создавалось. Открытый доступ предполагается к авторефератам диссертаций, доступ к полным текстам диссертаций предусмотрен для пользователей локальной сети.

Блок "Публикации сотрудников ИФТТ" включает списки публикаций, классифицированные по годам представления в печать, наполнен информацией о публикациях научных сотрудников ИФТТ с 2000 года. При создании раздела использовались имеющиеся списки публикаций, в которых библиографические записи не соответствовали ГОСТу, что потребовало значительного времени на редактирование и приведение их к унифицированному виду. В дальнейшем для единообразия в создании библиографических записей разработчиками предложено использовать стандартную форму, при вводе данных в поля формы, записи автоматически будут конвертироваться в БД "Публикации сотрудников",предполагается сопровождать данный ресурс поисковыми полями "Автор", "Ключевые слова", "Название журнала".

Важнейшей задачей любой научной библиотеки в информационной области является создание справочного аппарата по всему фонду, как традиционному, так и виртуальному. В связи с этим создана рубрика "Web-ресурсы", наполненная ссылками на внешние ресурсы, наиболее активно используемыми научными сотрудниками. Приведены электронные адреса с гиперссылками на ресурсы библиотек, издательств, журналов, что облегчает навигацию в сетевом пространстве.

Для удобства использования ссылки сгруппированы в подразделы

В связи с возросшей численностью студентов, обучающихся на базовых кафедрах ИФТТ, приведены ссылки на сайты, содержащие полнотекстовые версии учебников по основам науки. Для инженерно-технических работников приведена ссылка на навигатор по оглавлениям технических журналов.

В разделе “Доска объявлений” предполагается размещать текущую информацию, отражающую динамику работы библиотеки.

Раздел "Обратная связь" позволяет всем пользователям направить свои замечания и предложения по улучшению ресурса, обратиться за справкой и оперативно получить необходимую информацию.

Web-страница как инновационный продукт обеспечивает развитие библиотеки и формирует ее имидж. После размещения на сайте института создателям ресурса предстоит координировать работу по поддержанию жизнеспособности ресурса, его обновлению, устранению недоработок (технических, содержательных), обеспечению оптимальной навигации с включением интерактивных компонентов.

По окончании тестирования ресурса пользователи получат уведомления по электронной почте о возможности его использования.

В современных условиях развитие технических средств и сетевых технологий требует от сотрудников библиотек выполнения своих традиционных функций на принципиально новом уровне. При этом библиотечные и информационные работники остаются посредниками между учеными и информационной средой. Несмотря на развитие новых ИКТ, наличие Интернет и возможностей для пользователей самостоятельного доступа к различным информационным ресурсам, проблема отбора и поиска релевантной конкретному коллективу исследователей информации остается, и одной из важнейших функций академической библиотеки является ее решение.

Литература

  1. Качанова Е. Ю. Инновации в библиотеках.- СПб: Профессия, 2003.- 318 с.
  2. Мохначева Ю. В., Слащева Н. А., Харыбина Т. Н. Создание библиотечного web-сайта// Библиотека.- 2005.- № 8.- с. 36-37.
  3. Мохначева Ю. В., Слащева Н. А., Харыбина Т. Н. Роль Интернет-портала в системе информационного обслуживания пользователей Пущинского научного центра (ПНЦ РАН)// RELARN-2005.
  4. www.benran.ru
  5. http://www.chph.ras.ru/
  6. http://chglib.icp.ac.ru/lib11.html
  7. http://cbp.iteb.psn.ru/
!20

РЕШЕНИЕ ЗАДАЧ УПРАВЛЕНИЯ ЦБС БЕН РАН С ИСПОЛЬЗОВАНИЕМ КОМПЛЕКСНОЙ ИНТЕРНЕТ-ОРИЕНТИРОВАННОЙ СИСТЕМЫ СБОРА И ОБРАБОТКИ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ.

Калёнов Н.Е., Варакин В.П.
(Библиотека по естественным наукам РАН)

Процессы управления такой сложной структурой как централизованная библиотечная система (ЦБС) включают множество аспектов. В данной работе мы бы хотели остановиться на двух из них — формирование оптимальных фондов, в максимальной степени соответствующих информационным потребностям пользователей ЦБС, и максимальная оперативность обработки поступающей информации. Обе эти задачи не могут успешно решаться без сбора и обработки данных “обратной связи” различного рода.

Рассмотрим первую задачу. В условиях ограниченного финансирования, когда невозможно приобрести все выходящие в мире издания по тематике исследований обслуживаемых институтов, процессы централизованного комплектования требуют решения оптимизационных задач, результатом которого должен явиться отбор для приобретения изданий, имеющих максимальную информативность для пользователей Библиотеки. Исходной информацией для решения этих задач должна является степень важности тех или иных изданий для каждого конкретного коллектива. При этом, если для непериодических изданий имеется возможность сбора экспертных оценок по каждому наименованию, поступающему на книжный рынок (подобная интерактивная система реализована в БЕН РАН), то для периодических и продолжающихся изданий, существующих на информационном рынке не первый год, источником информации для принятия решений о продолжении или снятии подписки являются данные о спросе на них по различным каналам обслуживания. Для решения вопроса о первичной подписке на журналы, существующие несколько лет, являются данные о спросе по МБА на конкретный журнал. Решение вопроса о подписке на новые журналы может основываться исключительно на экспертных оценках.

Что касается второй задачи, то оперативность предоставления информации пользователям определяется сроками обработки поступающих изданий. Поэтому БЕН РАН в своей работе уделяет большое внимание контролю сроков обработки изданий и стремится их максимально сократить. Очевидно, что для решения этой задачи необходимо также иметь “обратную связь” — оперативные данные о текущих средних сроках обработки изданий и “сигналы” о задержках, необходимые для принятия соответствующих организационных мер.

Задачам обработки информации для получения данных “обратной связи” различного вида в автоматизированной системе (АС) БЕН РАН уделяется исключительно серьезное внимание, начиная с проектирования первой очереди системы в конце 1970-х годов. Соответствующие программные комплексы функционировали на ЕС ЭВМ и в DOS — версиях АС, реализованных на ПК первых поколений. Но если ранее системы обработки статистики были ориентированы на обработку информации какого-то одного вида (данные о копировании изданий, данные о книговыдаче из фондов, данные о запросах по МБА и т.п.), то в последние годы в рамках АС БЕН РАН развивается универсальная система, позволяющая одновременно обрабатывать различные данные “обратной связи” [1, 2].

Новая версия системы обработки статистики БЕН РАН (S-3.06, далее Система), являющаяся развитием ранее созданных версий, позволяет интегрировать данные о спросе на любые виды изданий по всем каналам обслуживания, связывает их с электронными каталогами и базой данных читателей [3]. Кроме того, за счет использования информации, формируемой в рамках программного комплекса BIBLIOBUS (разработка БЕН РАН, поддерживающая автоматизированные технологии комплектования и обработки литературы, поступающей в ЦБС), Система позволяет осуществлять оперативный контроль прохождения технологических процессов в библиотеке.

Система функционирует в среде Интранет/Интернет под управлением Windows 2000/2003 Server, установлена на Web–сайте БЕН РАН и в настоящее время проходит опытную эксплуатацию.

Программное обеспечение Системы базируется на использовании технологии ASP.

Поскольку Система является “внутренней”, доступ к ней возможен только для авторизованных пользователей. При этом для различных категорий пользователей установлены различные уровни доступа. Пользователи категории “Администратор” имеют право осуществлять все функции, реализованные в системе. Пользователи категории “редактор” имеют право редактировать информацию, причем каждый — в своей “зоне ответственности”. Пользователи категории “сотрудник” имеют право только на поиск информации.

Ниже мы остановимся на более подробном описании функций и возможностей системы.

В соответствии с функционирующей в настоящее время автоматизированной технологией в БЕН РАН формируются 6 потоков данных, отражающих спрос пользователей на издания из фондов и его удовлетворение (См. Рис. 1):

Система S-3.06 поддерживает две БД — буферную и основную. Буферная БД используется для текущего ввода информации, а основная предоставляется пользователям для осуществления целевых выборок данных.

В настоящее время в состав Системы входит 15 основных исполнительных блоков, реализующих многоаспектную выборку данных и требуемые вычисления (обращение к ним осуществляется из формы на главной странице Системы), а также дополнительный блок, обеспечивающий возможность оперативного контроля доступа к Системе в интерактивном режиме, вызываемый из блока АДМИНИСТРАТОР.

В число блоков Системы входят:

Все блоки поддерживают (с некоторыми отличиями) типовой интерфейс пользователя. В текущей версии Системы реализован режим обработки запросов, включающих до пяти поисковых полей одновременно. При формировании запроса пользователь выбирает имя поля из раскрывающегося списка, вводит необходимые значения, выбирает из раскрывающегося списка оператор отношения и логические связки со следующим полем. В качестве логических связок используются “И” (по умолчанию), “ИЛИ”, “НЕ”. Условие выбора поля (значение оператора отношения) может принимать следующие значения:

Отдельно может быть введено условие усечения значения поля: по умолчанию используется усечение справа; в случае, если поиск осуществляется на полное совпадение значений поля заданному, в отдельном окне “Усечение” выбирается опция ‘Нет’. Для усечения слева используется символ ‘%’ непосредственно перед значением поискового фрагмента.

Кроме обычных поисковых запросов в системе предусмотрена возможность выполнения дополнительных функций, в том числе:

“Счетчик” — с задаваемым именем поля (подсчет количества записей из числа удовлетворяющих сформулированному запросу, имеющих различные значения заданного поля);

“Сумма” — с задаваемым именем поля (подсчет суммы значений заданного поля в записях, удовлетворяющих сформулированному запросу)

Для уточнения логики запросов могут использоваться скобочные выражения (подобные арифметическим), определяющие приоритет выполнения операций “И”, “ИЛИ”, “НЕ”.

Система обеспечивает пользователю возможность настраивать перечень выводимых полей записей, удовлетворяющих запросу.

Благодаря универсальности, заложенной в Системе, с ее помощью можно формулировать и выполнять достаточно широкий спектр запросов. Приведем некоторые примеры.

1. Блок “СТАТ. + ЖУР.”

Запрос на выборку шифров хранения и названий журналов, а также значений количества обращений читателей ко всем журналам из каталога БЕН РАН за заданный временной диапазон с возможностью упорядочения в заданном порядке (по алфавиту названий, по шифрам, по количеству обращений в порядке убывания, по количеству обращений в порядке возрастания). Этот же запрос с указанием источника выдачи, номеров читательских билетов или институтов, в которых работают читатели, причем выдача может быть просуммирована по институтам. Получение суммированных или детализированных данных по спросу на журналы заданной тематики; получение данных по количеству страниц ксерокопий, выполненных из всех (или группы) журналов за заданный интервал времени с распределением заказов по институтам и читателям.

2. Блок “ФОНДЫ”

Запрос на количество выдач за заданный промежуток времени иностранных (отечественных) книг (продолжающихся изданий) с возможностью упорядочивания по годам изданий или количеству выдач. Этот же запрос, уточненный данными о читателе.

Для блоков “BIBLIOBUS” (см. Рис.3) и “Отчеты” введены операции отношения “Пусто” и “Не пусто”, а также функции “МИНИМУМ”, “МАКСИМУМ” и “СРЕДНЕЕ”. Реализованы функции редактирования названий поисковых и выводимых полей (возможна русификация), а также изменения заголовков столбцов и “шапок” итоговых таблиц.

В приведенном на Рис.3 примере сформулирован запрос на выборку минимального срока от регистрации до систематизации издания в заданный период времени поступления с условием, что он не должен быть равным 0.

При работе с комплексом BIBLIOBUS автоматически регистрируются дата поступления каждого экземпляра источника в БЕН РАН, дата распечатки приходных актов, даты отправки издания на каталогизацию, систематизации и шифровки, дата печати карточек и расходных актов (при отправке изданий в библиотеки ЦБС), дата отправки по почте и т.п.. Кроме того, в формируемые записи заносятся сведения об исполнителях, которые выполняют каждую операцию в процессе обработки источника. Благодаря этому с помощью Системы можно получать информацию о конкретных сроках обработки конкретного издания; о минимальных, максимальных и средних сроках обработки поступлений на различных технологических участках по “пути книги”, а также производительности исполнителей. Например, легко получить данные о времени (в днях), прошедшем с момента поступления издания в БЕН РАН до передачи его в читальный зал; о количестве изданий, обработанных за заданный промежуток времени конкретным каталогизатором.

Система может выдать количество и перечень изданий, на систематизацию (каталогизацию и т.п.) которых затрачено время, превышающее регламентируемое и т.д.

Итоговые результаты выборок по запросам могут быть сохранены в формате MS WORD и MS EXCEL с помощью штатных средств MS Internet Explorer.

Благодаря тому, что к БД подключены элементы библиографических описаний, Система обеспечивает выполнение “прямых” и “обратных” запросов на выборку данных: “По элементам результирующих статистических таблиц найти библиографию” и “По элементам библиографических описаний найти соответствующие записи статистики и осуществить заданную обработку информации”.

Для текущего управления библиотечными ресурсами представители соответствующих подразделений обычно используют постоянные запросы (например, данные о спросе на журналы в порядке возрастания количества обращений, распределение сроков обработки изданий с заданным шагом — до 5-ти дней, до 10 дней и т.д.). Для упрощения работы с постоянными запросами в Системе предусмотрена возможность их сохранения. При этом реализованы функции поиска и выполнения сохраненного запроса; его редактирования и удаления. Аналогично можно сохранять и вызывать, по мере надобности, типовые формы выдачи результатов.

Включенная в состав Системы подсистема “Регистрация читателей” обеспечивает выполнение следующих основных функций.

Для обеспечения защиты информации, наряду с применением стандартных средств безопасности Windows 2000/2003, IIS 5.0/6.0 и MS SQL Server 7.0/2000/2005, в Системе реализован дополнительный блок контроля доступа.

В набор функций, выполняемых блоком “АДМИНИСТРАТОР”, включены формирование учетных записей пользователей и администраторов системы, их удаление, присвоение и изменение паролей, а также определение прав пользователей на основе поддерживаемой системой матрицы доступа. Все страницы системы защищены от несанкционированного доступа. Разработан блок “Журнал доступа” (вызывается из блока “АДМИНИСТРАТОР”). С его помощью можно осуществлять оперативный контроль доступа к Системе с удаленных хостов и получать обобщенную статистическую информацию о входах пользователей в Систему по различным характеристикам (адресу в Интернет, СИГЛЕ, зафиксированной попытке обращения к Системе или блоку с незарегистрированными или неразрешенными для данного пользователя именем и/или паролем и т.п.).

С помощью Системы руководители отделов комплектования перед началом подписной кампании получают данные о спросе на конкретные журналы с указанием институтов, запросивших данный журнал, рейтинговые списки спроса на журналы по заданной тематике. Эта информация является (вместе с экспертными оценками ценности журналов. получаемыми из НИИ РАН) основополагающей при формировании подписки на журналы. руководство Библиотеки по запросам может получить данные о спросе на те или иные издания с целью перераспределения фондов (например, если литература из фондов Центральной библиотеки постоянно запрашивается сотрудниками одного и того же института, то логично передать ее в фонды библиотеки этого института). Существенную роль данные о спросе играют при решении вопросов о списании литературы старых годов издания.

Что касается управления технологическими процессами, то с помощью системы легко получить данные о временном распределении потоков поступающей литературы, о количестве изданий, обработанных конкретным сотрудником и сроках обработки, об изданиях, задержанных в отделах обработки и т.п.

Использование автоматизированной системы позволяет БЕН РАН постоянно следить за состоянием технологии обработки изданий и оперативно принимать меры по ее коррекции. Результатом этого являются достаточные короткие интервалы времени между поступлением издания в Библиотеку, отражением его в Интернет-каталоге и предоставлением читателям, составляющие. в среднем, 2-3 недели. Это на порядок меньше аналогичных сроков в других центральных библиотеках уровня БЕН РАН.

Литература

  1. В.П. Варакин, Н.Е. Калёнов. Автоматизированная система обработки статистической информации ЦБС БЕН РАН // Информационное обеспечение науки: новые технологии: Сб. науч. тр./Н.Е. Каленов (ред.) — М.: БЕН РАН, 2005. — 306 с. — С. 143-154.
  2. Варакин В.П., Калёнов Н.Е., Власова С.А., Глушановский А.В., Дмитриева З.Г.,Каллистратова О.Д., Соловьева Т.Н. Использование ИНТЕРНЕТ для сбора и обработки статистической информации ЦБС БЕН РАН // Научный сервис в сети ИНТЕРНЕТ. Всероссийская научная конференция, г. Новороссийск, сент. 19-24, 2005. — М.: МГУ, 2005. — С. 245-248.
  3. Варакин В.П., Власова С.А. ИНТЕРНЕТ в системе обслуживания читателей БЕН РАН // Научный сервис в сети ИНТЕРНЕТ. Всероссийская научная конференция, г. Новороссийск, сент. 20-25, 2004. — М., МГУ, 2004. — С. 70-71.
  4. Варакин В.П., Васильев А.В., Калёнов Н.Е. Комплексная Интернет-ориентированная система для сбора и обработки статистической информации ЦБС БЕН РАН// Научный сервис в сети ИНТЕРНЕТ. Всероссийская научная конференция, г. Новороссийск, сент. 18-23, 2006. — М., МГУ, 2006. — С. 212-216.
  5. Власова С.А., Калёнов Н.Е., Колерова Т.С. Комплексная автоматизированная система МБА // Российская библиотечная ассоциация. Бюллетень, 2006. — № 35. C. 144-147.
!21

АРХИТЕКТУРА ИНФОРМАЦИОННОЙ БАЗЫ БИБЛИОТЕКИ АКАДЕМИЧЕСКОГО НАУЧНО-ИССЛЕДОВАТЕЛЬСКОГО ИНСТИТУТА

Шабурова Н.Н.
(Государственная публичная научно-техническая
библиотека СО РАН)

Анализ публикаторской активности ученых Новосибирской области, которая характеризует тенденции развития научно-исследовательской деятельности, проведённый специалистами Государственной публичной научно-технической библиотеки Сибирского отделения Российской академии наук (ГПНТБ СО РАН) в 2000 г., выявил следующее соотношение: 75% публикаций докторов наук за 1991–1995 гг. представлено в секторе академической науки, 19% — в вузах и 6% — в отраслевых НИИ [8]. Поэтому закономерно, что от работы научных библиотек и, в первую очередь, именно научных библиотек академических НИИ, зависит качество информационного обеспечения (ИО) научных исследований.

Естественно, что любая академическая библиотека опирается в своей работе на ресурсную базу, которая включает как приобретаемые ею источники информации, так и совокупность всех доступных ресурсных возможностей, предоставляющихся в конкретной информационно-библиотечной среде, и формируется в результате слияния разнородных документных образований в систему фондов библиотеки. Поэтому важно знать, какой должна быть оптимальная система и что может сделать библиотека для обеспечения целостности ресурсной базы. Обобщение практической деятельности научных библиотек академических НИИ [9] даёт возможность выявить необходимую структуру информационной базы для ИО научных исследований [12] и определить принципы формирования системы фондов.

Как известно, в последнем десятилетии ХХ в. новые возможности информационной деятельности внесли глобальные преобразования в информационно-библиотечную среду сибирского региона. Её формирование велось в следующих направлениях [3]:

В русле этого развития использование электронных ресурсов для ИО научных исследований в библиотеках НИИ, в частности ИФП СО РАН, по мере развития источников на электронных носителях и накопления опыта работы с ними оформилось к началу ХХI в. в чёткую систему [11]. На рис. 1 представлена общая блок-схема электронных источников информации, которые помогают создавать информационную обстановку, обеспечивающую полноту и качество удовлетворения информационных потребностей специалистов в процессе ИО научных исследований в ИФП СО РАН.

Рис. 1. Структура электронных потоков в информационно-библиотечной среде ИФП СО РАН

Анализ публикаций специалистов ГПНТБ СО РАН и библиотек её централизованной библиотечной системы (ЦБС) [2, 4, 5, 6, 7] показал, что современное состояние информационно-библиотечной среды значительно повлияло также на уровень развития и их ресурсной базы. Системно-сетевые технологии сформировали устойчивую основу для обеспечения учёных необходимой информацией. А коммуникационная система, опосредованная Интернетом (рис. 2), открыла новые направления комплектования информационной базы для формирования системы фондов. Общая схема его структуры представлена на рис. 3. При этом немаловажной составляющей деятельности библиотек стала генерация собственных ресурсов, в частности, активизировалась работа по созданию электронных каталогов. В 2007 г. навигатор на странице электронной библиотеки ГПНТБ СО РАН объединил их в поисковый инструмент по фондам библиотек НИИ СО РАН
(http://www.spsl.nsc.ru/win/nelbib/nav_str1.htm).

Рис. 2 Коммуникационная система (традиционная и электронная) академического НИИ СО РАН

Рис. 3 Структура формирования системы фондов библиотеки академического НИИ традиционными изданиями и электронными ресурсами

Безусловно, важнейшим и основополагающим принципом формирования ресурсной базы библиотеки академического НИИ является максимальное использование в работе возможностей информационно-библиотечной среды, её информационной (рис. 1), коммуникационной (рис. 2) и организационной (рис. 3) составляющих. Вместе с тем, рассматривая степень соответствия информационной базы информационным потребностям учёных и специалистов, нельзя не учитывать расширение их потребностей в тематической структуре информации, связанное с развитием современных организационных форм научных исследований [10, 13]. Поэтому для определения оптимальных принципов формирования информационной базы для ИО современных научных исследований естественнонаучного направления не менее актуальным является вопрос увязки научно-технической информации с социально-экономической и общественно-политической. Использование положения, разработанного Д.И. Блюменау [1], о двух видах знаний: системных и ситуативных, в качестве методологической основы позволяет сформулировать ещё один принцип построения информационной базы для ИО современных научных исследований. Он касается её тематического аспекта.

В результате, слияние всех доступных информационных ресурсов, традиционных и электронных, предоставляющих как системные, так и ситуативные знания, в единую систему позволяет скомпоновать оптимальную ресурсную базу, которая представляет собой четырёхуровневую структуру. Её можно назвать информационной архитектурой НИИ, в которой: I уровень укомплектован фондом его библиотеки, содержащим, главным образом, системные знания; II уровень — это фонды центральной библиотеки ЦБС и библиотек НИИ её сети; III уровень — электронные библиотеки и ресурсы информационных центров, научных организаций и издательств, предоставляющие удалённый доступ к ним (ресурсы II и III уровней предназначены для предоставления как системных, так и ситуативных знаний); IV уровень — это библиотеки мира, предоставляющие по системе межбиблиотечного абонемента и доставки документов только ситуативные знания (табл. 1). Исходя из современных реалий, имеющихся в распоряжении библиотеки академического НИИ, структура позволяет не “перегружать” её фонд ресурсами, несущими ситуативные знания, а предоставлять их из других традиционных и электронных библиотек, которые выступают в качестве звеньев информационной архитектуры института. При этом следует учитывать, что в выстроенной архитектуре информационной базы акцент делается не на самой структуре, а на том, какой из её уровней должен предоставлять какой вид знаний, и что это идеальная четырёхуровневая система, идеальная модель, какой она должна быть при нормальных финансовых условиях.

Таблица 1. Информационная архитектура академического НИИ

Уровень

Характеристика ресурсов фонда и условия доступа

Основное назначение

Традиционные

Электронные

I

Библиотека НИИ

Монографии, сериальные, периодические и продолжающиеся издания, сборники научных трудов, препринты, авторефераты, материалы и тезисы докладов научных конференций, справочники, словари, СПА

Монографии, сериальные, периодические и продолжающиеся издания, материалы и тезисы докладов научных конференций, справочники, словари и библиографические и тематические БД на компакт-дисках и доступные в локальной сети; навигатор, тематические архивы, электронные каталоги, доступные в локальном режиме

Информационное обеспечение, предоставление системных знаний

Патентный отдел НИИ

Описания изобретений, промышленных образцов, полезных моделей, товарных знаков

-

II

Центральная библиотека ЦБС и библиотеки НИИ её сети

То же (доступно по системе МБА и ЭДД)

Электронные каталоги, библиографические, реферативные и полнотекстовые БД, электронная библиотека в удалённом доступе

Справочно-библиографическое обслуживание и информационное обеспечение, предоставление системных и ситуативных знаний

III

Издательства, научные общества, информационные центры, электронные библиотеки, предоставляющие ресурсы только в удалённом доступе

-

Навигаторы, электронные каталоги, библиографические, реферативные и фактографические, полнотекстовые БД и архивы в удалённом доступе

Информационное обеспечение, предоставление системных и ситуативных знаний

IV

Другие библиотеки мира

Все виды традиционных источников, доступные по МБА и ЭДД

-

Предоставление ситуативных знаний

Какие можно сделать выводы из рассмотренного материала? Прежде всего, отметим, что современная информационно-библиотечная среда составляет стабильную основу работы академических библиотек, и представленная архитектура информационной базы НИИ предполагает, что такая структура должна стать нормой в их работе, для чего должны измениться, в первую очередь, подходы к комплектованию. Ценность указанной архитектуры заключается в том, что она выполняет следующие важные для ИО научных исследований функции:

1. Обеспечивает целостность информационной базы, создание которой основано на применении новых направлений комплектования, путём формирования системы фондов совокупностью традиционных и электронных ресурсов как равноценных объектов и интеграции доступного документопотока (традиционного и электронного) из всех четырёх уровней в единую систему.

2. Даёт возможность удовлетворять выявленное расширение ИП специалистов естественнонаучного профиля не посредством переориентирования тематико-типологического плана комплектования своего фонда, а предоставлением изданий от других фондодержателей за счёт электронной подписки на тематические пакеты консолидированных больших информационных массивов и специализированные электронные ресурсы, и использованием соответствующих форм и методов доведения информации до научных сотрудников.

3. Позволяет выписывать и динамично развивать все доступные информационные ресурсы, предоставляющие как системные, так и ситуативные знания, которые распределены по четырём уровням. Первые три уровня предполагают возможность оперативного доступа к системной и ситуативной информации, которая в настоящее время значительно расширяется за счёт появления книг в электронном формате и отечественных электронных изданий.

Таким образом, для формирования системы фондов необходимо корректное использование возможностей современной информационно-библиотечной среды и соблюдение сбалансированности тематической структуры информационной базы. Эти принципы составляют основу для оптимального ИО современных научных исследований.

Литература

  1. Блюменау Д.И. Проблемы свертывания научной информации [Текст] / Д.И. Блюменау ; Всесоюз. ин-т науч. — техн. информ. АН СССР. — Л., 1982. — 166 с.
  2. Гуляева Л.Г. Электронный каталог отечественных и иностранных журналов. Опыт библиотеки Института математики им. С.Л. Соболева СО РАН [Текст] / Л.Г. Гуляева, Н.А. Кочетова // Научные б-ки в новом тысячелетии: проблемы взаимоиспользования ресурсов : материалы регион. науч. — практ. конф. (Иркутск, 2001 г.). — Иркутск, 2001. — С. 131-134.
  3. Елепов Б.С. Новое качество библиотек в условиях электронных технологий [Электронный ресурс] / Б.С. Елепов, О.Л. Лаврик, Е.Б. Соболева // Электронные библиотеки. — 2000. — Т.3. — Вып. 1. http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2000/part1/ELS — (29/08/06).
  4. Кириллова О.В. Новые формы информационного и библиотечного обслуживания в научно-исследовательском институте [Текст] / О.В. Кириллова, Н.А. Мазов // Информационные ресурсы. Интеграция. Технологии : материалы 3-й междунар. конф. (Москва, 1997 г.). — М. : ВИНИТИ, 1997. — С. 103-104.
  5. Ковязина Е.В. Электронные ресурсы библиотеки академического института: формирование и использование [Текст] // Библиотека и духовная культура нации : материалы регион. науч. — практ. конф. (Новосибирск, 2002 г.). — Новосибирск, 2002. — С. 61-64.
  6. Кожевникова Л.А. Тенденции развития библиотек региона в новом информационном пространстве [Текст] / Л.А. Кожевникова, Е.Б. Соболева // Научные б-ки в новом тысячелетии: проблемы взаимоиспользования ресурсов : материалы регион. науч. — практ. конф. — Новосибирск, 2002. — C. 12-28.
  7. Лаврик О.Л. Академическая библиотека в современной информационной среде [Текст] / О.Л. Лаврик ; ГПНТБ СО РАН. — Новосибирск, 2003. — 251 с.
  8. Павлова Л.П. О публикаторской активности ученых научно-образовательного комплекса Новосибирской области [Текст] / Л.П. Павлова, Е.Б. Артемьева, В.А. Дубовенко // Оптимизация информационно-библиографического обслуживания ученых и специалистов : сб. науч. тр. — Новоси-бирск, 2000. — С. 85-91.
  9. Шабурова Н.Н. Анализ использования полнотекстовых баз данных в информационно-библиотечном обслуживании научных исследований [Текст] // Библиосфера. — 2006. — № 2. — С. 7-12.
  10. Шабурова Н.Н. Моделирование системы информационного обеспечения современных форм научных исследований в академическом научно-исследовательском институте [Текст] : дис. на соиск. учен. степ. канд. пед. наук / Н.Н. Шабурова. — Новосибирск, 2006. — 281 с.
  11. Шабурова Н.Н. Система использования электронных ресурсов для информационного обеспечения научных исследований в библиотеке Института физики полупроводников СО РАН [Текст] // Формирование современной информационно-библиотечной среды : сб. науч. тр. / ГПНТБ СО РАН ; отв. ред. Б.С. Елепов. — Новосибирск, 2004. — С. 168-175.
  12. Шабурова Н.Н. Современные организационные формы научных исследований и подходы к их информационному обеспечению в ИФП СО РАН [Текст] // Библиосфера. — 2005. — № 2. — С. 79-84.
  13. Шабурова Н.Н. Специфика информационного обеспечения современных форм организации научных исследований [Текст] // Информационное обеспечение науки: новые технологии. — М., 2005. — С. 63-70.
!22

СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ДЛЯ НАУКИ И ОБРАЗОВАНИЯ: ВОЗМОЖНОСТИ БИБЛИОТЕК ПУЩИНСКОГО НАУЧНОГО ЦЕНТРА РАН

Харыбина Т.Н., Мохначева Ю.В., Бескаравайная Е.В.
(Центральная библиотека ПНЦ РАН — отдел БЕН РАН)

Одним из важных условий успешного выполнения научных исследований является их своевременное и эффективное информационное обеспечение.

Эта задача является достаточно сложной, особенно в условиях ограниченных финансовых ресурсов, что характерно для большинства отечественных, как академических, научных, так и университетских библиотек. Для рационального использования информационных ресурсов крайне необходима координация между отдельными библиотеками, осуществляющими информационное обеспечение науки и образования, а также применение высоких информационных технологий и создание библиотечных консорциумов. Особую роль в интеграционном процессе должна играть сеть различных библиотек, независимо от их ведомственной принадлежности.

В настоящее время при поддержке РГНФ, грант № 06-03-12135в, на базе Центральной библиотеки Пущинского научного центра РАН (ЦБП), разрабатывается модель единой автоматизированной информационно- библиотечной системы, объединяющей информационные ресурсы всех библиотек в десяти научно-исследовательских институтах Центра и Пущинского государственного университета.

Ценность такого объединения заключается в осознании каждым участником консорциума не только личной ответственности “каждого перед всеми”, но и общей ответственности “всех за каждого”.

Каждый участник интегрированной сети (академические библиотеки Центра и университетские) выполняет свои функции с учетом принятых организационных и технологических обязательств, выражающихся в подготовке сводных электронных ресурсов по единой технологии с предоставлением бесплатного доступа к ним. Сформирована общая политика комплектования фондов, а также обеспечена система передачи своих технологий и разрабатываемых программных продуктов участникам объединения.

В настоящее время ЦБП и входящие в ее централизованную систему (ЦБС) 7 библиотек 10 академических институтов Пущинского научного центра РАН (ПНЦ) и Пущинского государственного университета (ПГУ) являются ключевым звеном в информационном обеспечении научных исследований в Центре. Библиотеки ПНЦ РАН собирают информацию об информационных потребностях исследователей и о предложениях информационного рынка, а также обеспечивают формирование фондов в печатном и электронном виде, в наибольшей степени удовлетворяющих потребностям своих пользователей.

Процесс накопления информационных ресурсов, как приобретаемых у сторонних организаций, так и продуцируемых внутри библиотек ЦБС ЦБП, требует системы, отвечающей таким требованиям как: хранение, обновление, поиск и предоставление требуемых ресурсов, а также управление доступом к ним. Таким образом, созданная комплексная система информационного обеспечения научных исследований становится неотъемлемой составляющей ЦБС ЦБП. Система находится в постоянном динамическом развитии, чутко откликаясь на организационные и содержательные перемены в деятельности РАН. Система также позволяет оценить, как роль и эффективность использования информационных ресурсов, так и эффективность развития науки и образования в целом.

В ходе реализации данной системы создан центр корпоративной каталогизации. Система корпоративной каталогизации предусматривает одноразовое создание записей и многоразовое их использование всеми библиотеками

Данная система обеспечивает: формирование сводных электронных каталогов библиотек НИИ РАН и университетов в форматах, принятых в ЕИБС, на основании информации, поступающей из центральной библиотеки (БЕН РАН), и собственной обработки поступающих материалов; доступ к электронным каталогам через Интернет из научных и учебных организаций г.Пущино с возможностью интерактивного заказа изданий и копий материалов из них; реализацию в библиотеках НИИ и университетах технологии электронной доставки документов; автоматизированную поддержку библиотечной технологии, связанной с обслуживанием читателей (контроль сроков пользования материалами, постановка на очередь, анализ использования фондов).

Одним из важнейших элементов информационно-библиотечного обслуживания специалистов РАН, а также студентов и магистрантов ПГУ является предоставление им первичной и вторичной информации. В настоящий момент все пользователи ЕИБС, имеют возможность получать библиографическую, реферативную, полнотекстовую, патентную, фактографическую информацию из крупнейших мировых научных баз данных: Web of Knowledge (Thomson Scientific), Medline, BioMedNet, Pubmed, Igenta, Information Express и других, доступ, к которым имеют участники ЕИБС.

В существующих условиях, когда БЕН как "головная" организация в состоянии приобретать лишь один экземпляр ведущих иностранных научных журналов в печатном виде, доступ к электронным версиям электронных журналов, является надежным подспорьем в информационном обеспечении пользователей. В настоящее время ЦБС ЦБП предоставляет пользователям доступ к 7205 названиям электронных журналов ведущих зарубежных издательств, включая журналы открытого доступа, (Табл.1).

Таблица 1. Организации, к полным текстам журналов которых имеется доступ в ЦБП

E-Library

2017

Taylor& Francis

1323

Blackwell Synergy

855

Springer

1571

Free Access Journals

368

High Wire Press

297

Oxford University Press

196

Institute of Physics

52

American Chemical Society

37

American Institute of Physics

12

Portland Press

8

Sage Publications

461

Физ.-тех. Ин-т им. Иоффе

8

Анализ использования электронных изданий пользователями Центра, обслуживаемыми ЦБП, позволяет изучить потребности ученых ПНЦ и выявить закономерности и особенности работы с этими ресурсами. Система позволяет исключить дублирование технологических операций и рационально использовать технические ресурсы и предоставляет библиотечным специалистам аппарат, позволяющий определять наиболее эффективное соотношение между традиционным комплектованием фондов и приобретением прав доступа к сетевым электронным ресурсам.

В этих условиях крайне важна роль библиотечно-информационного работника, которая уже заключается не только в распространении и предоставлении знаний, но и в нахождении новых путей использования информационных продуктов, уделяя особое внимание удовлетворению информационных потребностей пользователей. Также крайне важно оценить преимущества и недостатки представленных баз данных, проанализировать их информационные возможности, хронологический охват, скорость получения информации, способы предоставления результатов поиска пользователю.

Сетевые технологии широко используются в процессах информационного обслуживания пользователей РАН. В частности, на сайте Библиотеки (http://cbp.iteb.psn.ru/) поддерживается тематический портал, который реализован как многофункциональная информационная система, обеспечивающая единую точку входа для доступа к информационным ресурсам по физико-химической биологии. В рамках портала специалистами ЦБП поддерживаются сводные электронные каталоги, списки новых поступлений литературы в ЦБС ЦБП, каталог электронных изданий, к которым приобретен доступ в интересах пользователей, электронная библиотека диссертаций, защищенных в ПНЦ, тематические базы данных по научным проблемам Центра. На сайте также реализована система заказов материалов по МБА

Сделать зарубежную и отечественную научную информацию более доступной для пользователей Центра — одна из важнейших задач при реализации комплексной информационной системы. В то же время главной стратегической нашей задачей является создание таких условий, при которых наличие этой информации приводит к созданию нового знания и нового уровня образования, чтобы эффективность финансовых средств, затраченных на информационное обеспечение, была бы максимальной. В настоящее время этот принцип на практике стараются воплотить сотрудники ЦБП.

Благодаря совместным усилиям библиотекарей ПНЦ и ученых Центра растет престиж научных исследований Центра в мире. Проведенный сотрудниками ЦБП наукометрический анализ, показал, что в базе данных Science Citation Index Expanded (Thomson Scientific) отражены 4,806 публикаций сотрудников НИИ ПНЦ РАН, это составляет 2,8% от общего числа статей российских ученых по естественным наукам за период 1996-2006 гг. Даже несмотря на то, что эта база охватывает только 107 российских журналов, из которых журналы в области физико–химической биологии составляют не более 15%, суммарное цитирование статей сотрудников НИИ ПНЦ РАН составило 28980 ссылок за указанный период, а среднее цитирование в год одной статьи — 5,92. Необходимо также подчеркнуть, что за указанный период 2% статей (82 публикации) были процитированы более 50 раз. Это хороший показатель, учитывая специфику отражения цитирования российских периодических изданий в ресурсах “Thomson Scientific”.

Исследование динамики количества публикаций ученых Центра показало некоторое их снижение в последние годы, тем не менее, число публикаций держится на достаточно высоком уровне, что, в свою очередь, характеризует некоторую стабилизацию (табл.2). В то же время, цитируемость статей из года в год стабильно существенно увеличивается (табл.2). Следует отметить, что в последнее время сильно увеличилась доля публикаций в ведущих зарубежных периодических изданиях, что говорит об увеличении темпов интеграции деятельности наших ученых в мировую науку.

Таблица 2. Динамика количества публикаций и их цитируемости (по данным Science Citation Index Expanded (ISI) 1996-2006 гг.)

 

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

Цитирование

82

588

1105

1557

2080

2382

2860

3484

3759

4477

4735

Публикации

495

500

491

470

439

348

430

404

408

427

348

Реализуемый в Библиотеках Центра проект решает практически все проблемы в комплексе, который направлен на объединение усилий по накоплению и обеспечению сохранности культурного и научного наследия академических и университетских библиотек, свободный доступ пользователей к различным информационным ресурсам в традиционном и электронном виде, развитие сервиса на основе современных технологий.

Литература

  1. Кудеярова А., Слащева Н., Мохначева Ю. Нужно пользователю, необходимо нам // Библиотека. — 2005. — № 8. — С. 36-37.
  2. Слащева Н.А., Харыбина Т.Н., Мохначева Ю.В. Информационная поддержка научных исследований в Центральной библиотеке Пущинского научного центра РАН // Информационные ресурсы России. 2006. — № 6. — С. 10-11
!23

ПРИНЦИПЫ И МЕТОДЫ ИЗБИРАТЕЛЬНОГО РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ НА СОВРЕМЕННОМ ЭТАПЕ (ИЗ ОПЫТА РАБОТЫ ЦЕНТРАЛЬНОЙ БИБЛИОТЕКИ ПУЩИНСКОГО НАУЧНОГО ЦЕНТРА РАН)

Мохначева Ю.В., Харыбина Т.Н.
(Центральная библиотека Пущинского научного центра РАН — отдел БЕН РАН)

В настоящее время наблюдается бурный рост как собственно информации, так и количества источников информации, что влечет за собой повышение роли библиотеки в посредничестве между пользователями и растущими информационными потоками. Именно в данном аспекте возрождается такая услуга, как избирательное распространение информации (ИРИ).

Система ИРИ активно использовалась в информационном обслуживании абонентов еще в 60-70-е гг. ХХ века как за рубежом, так и внутри нашей страны. На протяжении всего времени существования Центральной библиотеки Пущинского научного центра (ЦБП ПНЦ РАН), избирательное распространение информации активно применяется для информационного обеспечения научных сотрудников научно-исследовательских институтов Пущинского научного центра РАН (ПНЦ РАН). В 70-е годы ЦБП включилась в работу по автоматизации информационного обслуживания пользователей с использованием баз данных ВИНИТИ. К концу 1987 года ЦБП обслуживала в режиме ИРИ более 200 коллективных абонентов из восьми НИИ. Данная система пользовалась большим интересом у наших ученых, однако, перемены, произошедшие в стране и повлекшие за собой финансовые и другие проблемы, привели к тому, что, начиная с 1991 года, данный вид информационного обслуживания прекратил свое существование, несмотря на большую заинтересованность со стороны ученых Центра.

Во второй половине 90-х годов ХХ века радикально изменилось мировое научное информационное пространство. С каждым годом появлялось все больше и больше электронной информации: журналы в on-line доступе, электронные книги, библиографические и реферативные базы данных. Интернет постепенно вошел не только в каждую лабораторию, но и стал неотъемлемой частью научно-исследовательского процесса.

Потребность в избирательном распространении информации не только не снизилась, а наоборот, выросла, но данный вид информирования потребовал некоторого пересмотра ранее существовавших методик и технологий из-за возникшей проблемы — избыточного объема информации, захлестнувшей пользователей. В настоящее время в Центральной библиотеке Пущинского научного центра РАН и во всех ее библиотеках-филиалах имеется авторизованный и свободный доступ к 7800 наименованиям журналов, размещенных в Интернет в режиме on-line. Кроме того, имеется доступ к большому количеству электронных книг. Обратный процесс идет в отношении получения печатных версий журналов — все меньше и меньше наименований журналов ЦБП получает по подписке, особенно это касается иностранных журналов. Надо сказать, что подобный процесс наблюдается как в нашей стране, так и за рубежом. Кроме того, современные пользователи все большее предпочтение отдают электронным журналам.

Для эффективного использования новых возможностей, дирекцией Пущинского научного центра было принято решение о проведении избирательного распространения информации по ключевым научным направлениям Центра.

В рамках поставленной задачи, ЦБП разработала комплексную методику по осуществлению ИРИ, которая включает в себя несколько этапов. Первый этап — подготовительный, который предполагает следующие действия:

Для выявления источников информации сотрудники информационно-библиографического отдела Библиотеки использовали помимо традиционного анкетирования и интервьюирования метод цитат-анализа. В чем заключается этот метод? Рассмотрим его на примере одной из ключевых тем информирования — “Фотосинтез”.

С помощью БД Science Citation Index Exp. (1975-2002) (Thomson Scientific), входящей в состав ресурса Web of Science на платформе Web of Knowledge, были выявлены статьи авторов, работавших над проблемами фотосинтеза за период 1997-2002 гг. Из всех найденных работ был выгружен весь массив пристатейной библиографии, после статистической обработки которого обозначился круг источников информации, статьи из которых наиболее часто цитировались. (Табл.1). Кроме того, выявлен круг источников, в которых наиболее часто публикуются авторы, работающие по обозначенной теме (Табл.2).

Таблица 1. Ядерные журналы по теме информирования (фотосинтез)

Название журнала

кол-во ссылок на статьи из журналов 1997-2002 гг. выпуска

Biochemistry-US

124

Photosynth Res

95

FEBS Lett

83

BBA Bioenergetics

76

J Phys Chem B

51

Biochemistry-Mosc

47

PNAS

39

Fiziol Rast

34

Int J Hydrogen Energ

34

Physiol Plantarum

25

J Biol Chem

22

Planta

21

Biol Membrany

20

Biotechnol Bioeng

18

Plant Physiol

18

FEMS Microbiol Lett

16

Appl Microbiol Biot

15

Chem Phys Lett

14

J Bacteriol

14

Nature

14

Annu Rev Plant Phys

12

Biofizika

11

J Chin Soc-TAIP

11

Appl. Biochem. Microbiol.

10

Dokl Akad Nauk

10

Photosynthetica

10

Plant Cell Physiol

10

Таблица 2. Источники, в которых наиболее часто публиковались авторы, работающие по теме информирования “Фотосинтез” (1997-2002 гг.)

Название журнала

Кол-во публикаций

Биофизика

22

Biochemistry

21

Физиология растений

21

PHOTOSYNTHESIS RESEARCH

18

Биохимия

15

BIOCHIMICA ET BIOPHYSICA ACTA-BIOENERGETICS

13

FEBS LETTERS

11

Биологические мембраны

9

INTERNATIONAL JOURNAL OF HYDROGEN ENERGY

8

Микробиология

5

PLANT PHYSIOLOGY

5

PROCESS BIOCHEMISTRY

5

Прикладная биохимия и микробиология

4

PLANT GROWTH REGULATION

4

PLANTA

4

Подобный анализ был проведен и на предмет выявления авторов, чьи статьи представляют наибольший интерес для абонентов (Табл. 3).

Таблица 3. Авторы, чьи статьи цитировались наиболее часто (данные за 1997-2002 гг.) по ключевой теме — фотосинтез

ФИО

Цитирование за 1997-2002 гг.

VOS MH

43

STEMLER A

29

RENGER G

25

ASADA K

19

KIRMAIER C

18

LICHTENTHALER HK

18

BRITTON G

17

BERTHOLD DA

16

FRANKEN EM

16

GOODWIN TW

16

ORMEROD JG

15

SCHMIDT S

15

DEBUS RJ

14

DINER BA

14

LAEMMLI UK

14

MILLS R

14

SCHEER H

14

STRELTSOV AM

14

TAMURA N

14

ALLEN JF

12

BARBER J

12

HEBER U

12

ARNON DI

11

BRADFORD MM

11

FOYER CH

11

GHIRARDI ML

11

BIXON M

10

BLANKENSHIP RE

10

BLUBAUGH DJ

10

BRETON J

10

DAVIES BH

10

DEMMIGADAMS B

10

GOVINDJEE

10

HOFF AJ

10

KLYACHKOGURVICH GL

10

KOBAYASHI Y

10

MIYAKE C

10

NANBA O

10

PARSON WW

10

TELFER A

10

VASS I

10

WYDRZYNSKI T

10

BOYER PD

10

Второй этап — выявление необходимой информации.

На данном этапе большая роль отводится экспертам, которые, просматривая выставки новых поступлений, размечают наиболее интересные статьи по теме информирования. Эти сведения в дальнейшем поступают в информационно-библиографический отдел ЦБП для последующей обработки.

Информационно-библиотечные работники также активно вовлечены в процесс отбора информации. Осуществляется подписка на оглавления журналов, которые вошли в число “ядерных” с последующим тщательным их просмотром, а также производится тематический поиск и поиск по авторам (наиболее цитируемым) в реферативных базах данных. Надо отметить, что в ЦБП практикуется сбор только той информации, которая доступна в виде полных текстов, другая информация игнорируется, хотя она, возможно, является важной. Целью и основной задачей нашего ИРИ является предоставление пользователю не только вторичной информации, но, что главное, — гарантированное быстрое получение первичного документа в виде электронной копии статьи.

Третий этап — обработка информации.

Вся отобранная информация заносится в таблицу, которая должна вмещать в себя не более 150 записей и содержать следующую информацию: ФИО автора статьи, название статьи, название журнала, год, том, номер, страницы, гиперссылка на полный текст. Далее эта таблица трансформируется в список рассылки, в котором создается поле для заказа статей, заинтересовавших абонентов. Гиперссылки для абонентов не обозначаются. Оповещение абонентов осуществляется с помощью электронной почты с периодичностью 1 раз в месяц. После просмотра и обработки информации абонент пересылает размеченный список обратно в информационно-библиографический отдел Библиотеки, где в последующем абоненту предоставляются электронные копии необходимых статей.

ФИО

Название статьи

Журнал

Год изд

Том

Номер

Страницы

Ключевые слова

Заказ

S. Maritano, S.A. Fairhurst, R.R. Eady

Novel EPR signals associated with FeMoco centres of MoFe protein in MgADP-inhibited turnover of nitrogenase

FEBS Lett.

2001

505

1

125-128

Heterologous nitrogenase, Tight complex, Electron paramagnetic resonance, MgADP-inhibited turnover, Clostridium pasteurianum, Klebsiella pneumoniae

 

C. Funk, W.P. Schroder, R. Wiklund, C. Jansson

D1' CENTERS ARE LESS EFFICIENT THAN NORMAL PHOTOSYSTEM II CENTERS

FEBS Lett.

2001

505

1

113-117

D1, D1', Photosystem II, psbA, Synechocystis

 

Рис. 1. Пример списка рассылки литературы

Собранная информация служит основой для генерации проблемно-ориентированых баз данных с одновременным созданием архива электронных копий документов.

Созданная система ИРИ в ЦБП отвечает всем необходимым требованиям, предъявляемым к данному виду информирования:

На рис. 2 показан анализ востребованности отправленной абонентам информации за 2005-2006 гг.

Рис. 2. Востребованность новой информации (2005-2006 гг.)

Как видно из рис. 2, около 30% всех отобранных статей было заказано более 1 раза. Всего заказано 83% статей. По тем или иным причинам, не заказанными остались 17% статей.

Данный вид обслуживания пользуется большим спросом у наших пользователей и позволяет им получать “рафинированную” информацию быстро и комфортно.

!24

НОВЫЕ ЧИТАТЕЛЬСКИЕ СЕРВИСЫ В ИНФОРМАЦИОННОЙ СИСТЕМЕ БИБЛИОТЕКИ МАТЕМАТИЧЕСКОГО ИНСТИТУТА ИМ. В.А. СТЕКЛОВА.

Погорелко К.П.
(Библиотека Математического института
им. В.А. Стеклова РАН — отдел БЕН РАН)

Информационной системе библиотеки Математического института им. В.А. Стеклова уже более 10 лет. С самого начала информационная система разрабатывалась из расчета использования Интернет технологий, в особенности, для обеспечения доступа читателей к электронным ресурсам библиотеки. В качестве базы для разработки с самого начала были выбраны продукты компании Microsoft. Для обеспечения хранения и доступа к данным использовался SQL сервер. Первоначальный вариант системы разрабатывался на основе технологии ISAPI как наиболее производительной, поскольку тесты показали, что компьютеры, имевшиеся в распоряжении в то время, не могли обеспечить удовлетворительное время отклика. Технология ISAPI предполагает программирование на языке C++ библиотек, которые встраиваются в состав процесса Интернет-сервера (IIS), что и обеспечивает высокую производительность. Однако этот подход достаточно трудоемкий, требует тщательной отладки приложений и крайне затрудняет дальнейшее сопровождение и модификацию программного обеспечения информационной системы.

Для обеспечения динамичного развития системы требовался переход в другую среду программирования. Поэтому, как только рост производительности компьютеров и развитие новых технологий программирования позволили, программное обеспечение информационной системы библиотеки было переведено на технологию активных серверных страниц (asp), в основе которой лежит язык VBScript. Этот перевод совпал с дальнейшим развитием информационной системы — созданием сводного каталога математической литературы. Этот каталог объединяет каталоги периодической литературы библиотек Математического института (МИ), Петербургского отделения Математического института (ПОМИ) и Вычислительного центра РАН (ВЦ). Дальнейшее развитие информационной системы (создание каталога журнальных статей, сводного книжного каталога, электронной полнотекстовой библиотеки, электронного абонемента) вплоть до последнего времени базировалось на технологии asp. Однако за это время выяснился ряд недостатков этой технологии создания программного обеспечения. Программы, реализованные в среде asp, представляют собой смесь фрагментов html и внедренного в них программного кода, обеспечивающего генерацию динамического содержимого страниц. При реализации сложных диалогов и росте объемов программного обеспечения такая “смесь”, даже при условии “аккуратного” программирования и документирования программ, становится весьма запутанной, что затрудняет сопровождение системы и ее дальнейшее развитие. Усугубляет ситуацию также тот факт, что реакция системы на действия пользователя на конкретной странице оказывается запрограммированной на нескольких других страницах, куда мог быть осуществлен переход с данной страницы. Другим недостатком среды asp является то, что там слабо поддерживаются современные технологии, такие как манипуляция с данными в формате xml и представление данных, для кодировки которых используется Юникод.

Все вышесказанное обусловило необходимость перехода на новые современные технологии программирования. Для реализации новой версии программного обеспечения информационной системы библиотеки МИ была выбрана технология asp.net версии 2.0 с базовым языком программирования C#. Данная технология свободна от недостатков старых технологий и в настоящее время представляется наиболее перспективной.

В предыдущих реализациях информационной системы сервисы, предоставляемые читателю, были обезличенными и сводились, в основном, к доступу к каталогам библиотеки и другим базам данных. Новая реализация обеспечивает качественно другие сервисы, которые являются персонифицированными. Для обеспечения доступа к персонифицированным сервисам при регистрации читателя (на абонементе библиотеки) ему присваивается логин и пароль, которые в дальнейшем используются для входа в систему. Также читатель обязан предоставить адрес электронной почты, по которому в дальнейшем с ним будет осуществляться связь.

Доступ к каталогам библиотеки по-прежнему возможен и в анонимном режиме, как и в предыдущих реализациях. Однако, пройдя процедуру аутентификации, читатель получает в свое распоряжение новые возможности.

Во-первых, он может узнать свои персональные данные — издания, которые за ним числятся, и срок их возврата или перерегистрации. В случае нарушения сроков система периодически отправляет напоминания читателю на его адрес электронной почты.

Во-вторых, читатель получает возможность удаленного заказа литературы. Отобрав в каталогах интересующие его издания, читатель имеет возможность заказать их подборку к определенному сроку. Форма заказа имеет свободное текстовое поле, которое используется для комментариев к заказу или (в тех случаях, когда определение интересующей читателя литературы в каталогах вызывает затруднения) для ввода заказа. В последнем случае читатель имеет возможность сформировать запрос в произвольной текстовой форме. После того, как форма заказа заполнена и отправлена, на рабочем месте сотрудника абонемента “всплывает” уведомление о вновь поступившем заказе. Сотрудник абонемента имеет возможность распечатать поступившую заявку и подобрать в хранилищах требуемую литературу. После этого сотрудник абонемента отмечает подобранную литературу в форме выполнения заказа. Если литература отсутствует (например, занята), имеется возможность указать этот факт. После заполнения формы сотрудник абонемента получает распечатанные на принтере заполненные требовательные листки, а читатель на адрес своей электронной почты — уведомление о том, что его заказ подобран. После этого читатель имеет возможность получить свой уже подобранный заказ в помещении библиотеки, расписавшись в готовых требовательных листках. В случаях, когда требуемая литература занята, сотрудник абонемента имеет возможность послать уведомление читателю, пользующемуся литературой, что эта литература требуется другому читателю.

В-третьих, читатель имеет возможность удаленно заказать и получить на адрес своей электронной почты (в пределах разумных ограничений) полный текст фрагментов изданий, доступ к которым имеется только из помещения читального зала библиотеки. К таким ресурсам относятся полнотекстовые версии журналов как иностранных, на которые имеется соответствующая подписка, так и отечественных через систему MathNet.RU. В случае отсутствия электронной версии публикации печатная версия может быть отсканирована.

Таким образом, новые персонифицированные читательские сервисы позволяют повысить качество информационного обслуживания читателей библиотеки.

!25

ОБ ОПЫТЕ ФОРМИРОВАНИЯ И ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ В УНИВЕРСИТЕТСКОЙ БИБЛИОТЕКЕ.

Биренбаум Т. В
(Зональная научная библиотека Воронежского государственного университета)

Университетская библиотека сегодня — это сложная, динамично развивающаяся система, ориентированная на поддержку образовательного и научно-исследовательского процессов, формирующая ядро информационного и культурного пространства данного вуза, создающая условия для самообразования и профессионального роста своих пользователей. Роль университетской библиотеки не может ограничиваться только функциями предоставления читателям единиц хранения из своих фондов. Библиотека становится проводником новых технологий, предоставляя максимально полную информационную поддержку всем категориям читателей и, тем самым, обеспечивая не только повышение качества образования в университете, но и создавая условия для информационного обеспечения научных исследований в данном вузе.

В настоящее время университетская библиотека, являясь одним из ключевых звеньев в информационном обеспечении деятельности университета, большое внимание уделяет современным формам накопления и представления информации. Процесс накопления электронных ресурсов, как приобретаемых у сторонних организаций, так и продуцируемых внутри университета, требует создания системы, обеспечивающей хранение, обновление, поиск и извлечение требуемого электронного ресурса, а также управление доступом к этим ресурсам. Таким образом, создание электронной библиотеки становится неотъемлемой функцией традиционной университетской библиотеки.

Зональная научная библиотека Воронежского государственного университета (ЗНБ ВГУ) приступила к активному внедрению информационных технологий во все сферы своей деятельности с начала 90-х годов. Помимо использования автоматизированных библиотечных систем (АБИС), позволяющих автоматизировать процессы, связанные с комплектованием фондов, каталогизацией поступающих документов и обслуживанием читателей, в библиотеке активно создаются собственные электронные ресурсы: электронный каталог, библиографические базы данных, полнотекстовые электронные коллекции разнообразной тематики. Кроме того, библиотека обеспечивает доступ к сетевым ресурсам, которые представлены базами данных научных электронных журналов отечественных и зарубежных организаций.

Первые попытки создания электронной библиотеки (ЭБ) в Зональной научной библиотеке Воронежского государственного университета (ЗНБ ВГУ) относятся к 2000 году. Коллекцией, послужившей основой для формирования ЭБ, явились публикации ученых ВГУ в “Вестнике Воронежского государственного университета”.

За истекший период времени работы по формированию ЭБ продолжались в нескольких направлениях. В настоящее время электронная библиотека ВГУ включает в себя ресурсы следующих видов:

Электронная библиотека ВГУ является универсальной как по содержанию (в ней представлены все научные направления, развивающиеся в ВГУ), так и по временному охвату, поскольку наряду с современными публикациями в ней размещены и электронные копии изданий прошлых лет.

В настоящее время ЭБ ВГУ формируется и поддерживается средствами АБИС "Руслан".

Описание объектов электронной библиотеки выполняется в формате RUSMARC в соответствии с Российскими правилами каталогизации и рекомендациями Российской библиотечной ассоциации для электронных изданий [10, 11], а также в соответствии с [3, 4, 5, 6, 7]. Интероперабельность достигается путем поддержки протокола Z39.50 [2] для доступа к библиографическим записям на электронные документы ЭБ, содержащимся в онлайновых каталогах ЗНБ, использованием формата PDF для представления полнотекстовых материалов, применением стандартных программ-браузеров для поиска и извлечения объектов ЭБ.

Помимо формата PDF для электронных аналогов больших по объему изданий (книг) применяется также формат DjVu [15], позволяющий создавать файл меньшего размера по сравнению с файлами PDF того же содержания. Его уникальной особенностью является чрезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). Для изображений, полученных на планшетном сканере, в библиотеке используется следующий набор программного обеспечения — простой, технологичный, надежный, обеспечивающий хорошие результаты: DJVU Editor-Pro_rus, Djvu Reader, DjVu Browser plugin v4.5, DJVUOCR 2.1, ScanKromsator v6.5.

В настоящее время одним из приоритетных направлений формирования электронных ресурсов является создание цифровых копий изданий, хранящихся в отделе редких книг. Принимая решение о создании коллекции электронных копий изданий из отдела редких книг, администрация библиотеки руководствовалась следующим:

Таким образом, создаваемая электронная коллекция не только позволит сохранить для последующих поколений исследователей бесценные историко-культурные материалы, в том числе и по краеведению, но и расширит аудиторию читателей, заинтересованных в работе с редкими книгами.

Для создания электронных копий редких и ценных книг, максимально приближенных к печатному оригиналу, в качестве метода оцифровки был выбран вариант получения изображений с помощью цифровой фотокамеры, установленной на штатив вместе с источниками освещения. Скорость фотосъемки по одной странице на кадр немного ниже скорости ксерокопирования, и гораздо выше скорости сканирования на планшетном сканере, составляя 5-10 страниц в минуту. Но основное преимущество — щадящий режим, исключающий вредное воздействие на старинные книги источников тепла и повреждение изданий во время изготовления цифровых копий. К сожалению, в настоящее время финансовые возможности библиотеки не позволяют приобрести книжные сканеры-копиры, которые обеспечивают высокую эффективность получения цифровых копий различных видов изданий.

Все электронные документы, предназначенные для размещения в ЭБ, отражаются в электронном каталоге ЗНБ и в каталоге ЭБ. Такое дублирование обусловлено следующими причинами: во-первых, пользователь, начиная поиск необходимого издания, находящегося в фонде библиотеки, прежде всего, обратится к электронному каталогу, при этом в результате поиска он получит перечень изданий, в том числе и электронных; во-вторых, большинство объектов ЭБ ВГУ являются электронными копиями существующих традиционных документов. Читатель вправе сам выбрать форму, в которой он хотел бы получить интересующее его издание. Для поиска только тех изданий, которые присутствуют в электронном виде, существует каталог электронной библиотеки.

Формирование электронной библиотеки ВГУ способствует решению следующих задач:

В ЭБ реализован атрибутный поиск — информационный поиск объектов по значениям их характеристик (метаданных). Поиск возможен как по отдельным полям в библиографической записи, так и по их комбинации с использованием логических операторов, например, по автору, названию и году издания. Возможен поиск по любому полю из множества полей формата RUSMARC. Тематический поиск возможен с использованием предметных рубрик, а также неконтролируемых предметных терминов (ключевых слов). Существующая структура ЭБ не позволяет проводить полнотекстовый лексический поиск, что является существенным недостатком ЭБ в ее нынешней реализации.

Ресурсы электронной библиотеки размещаются на собственных серверах ЗНБ ВГУ. Полный доступ к ресурсам электронной библиотеки ВГУ осуществляется в пределах интрасети ВГУ. Пользователям глобальной сети Интернет предоставляется полный (открытый) доступ к описаниям ресурсов электронной библиотеки в ее электронном каталоге, а также к публикациям ученых ВГУ, периодическим и продолжающимся изданиям, электронным учебным и иным изданиям сотрудников ВГУ, если условие свободного доступа через Интернет оговорено в договоре с автором.

Представленная структура ЭБ, основанная на использовании АБИС и организации связывания объекта ЭБ с его метаописанием посредством указания в поле 856 библиографической записи, выполненной в одном их форматов семейства MARC, электронного адреса данного ресурса, не нова и не претендует на оригинальность [8, 9]. Данное решение является, скорее, типовым для большинства библиотек вузов, поскольку обеспечивает создание ЭБ на базе уже имеющегося программного обеспечения — типовой АБИС — без дополнительных финансовых затрат. Кроме того, читатель-пользователь ЭБ, освоив навыки работы с электронным каталогом библиотеки, без труда осуществляет поиск необходимых электронных документов в электронном каталоге ЭБ.

Описанная структура ЭБ в существующем виде не соответствует в полной мере тем требованиям и критериям, которые предъявляются к полнофункциональной ЭБ [1, 2].

Существующие проблемы связаны с тем, что используемое для формирования ЭБ программное средство изначально не было предназначено для управления объектами ЭБ, отсутствуют механизмы эффективного контроля использования ресурсов ЭБ, не предусмотрена возможность лексического поиска по полным текстам электронных документов.

В 2005-2006 гг. сотрудниками ЗНБ проводились работы по выявлению и анализу свободно распространяемого программного обеспечения, на базе которого возможна реализация электронного репозитория, являющегося фундаментом для создания качественно новой электронной библиотеки ВГУ [12].

Среди выявленных ресурсов наибольший интерес для реализации качественно новой электронной библиотеки университета представляют FEDORA [18], DSpace [17] и Greenstone [14]. Обсуждению достоинств и недостатков перечисленных программных средств, а также проектов, реализованных на их базе, посвящено множество различных публикаций, анализ которых остается за рамками данной работы. Прототип репозитория, созданного с использованием программного обеспечения FEDORA, был реализован в ЗНБ в 2005 году, но в связи с отсутствием целевого финансирования и необходимого оборудования не перешел в фазу рабочего проекта.

Как коробочный вариант, причем снабженный и русскоязычной документацией, и русскоязычным интерфейсом, представляет интерес для создания электронной библиотеки такой программный продукт, как Greenstone.

С февраля 2007 года разработчиками Greenstone предлагается новая версия — Greenstone 3, в которой реализованы новые возможности, расширяющие как функциональность системы, так и ее способность поддерживать распределенные электронные библиотеки. В настоящее время в библиотеке ВГУ ведутся работы по апробации данного программного продукта и рассматривается возможность его использования в качестве основного для создания новых электронных коллекций и миграции уже существующих.

Одним из вариантов дальнейшего развития ЭБ ВГУ представляется использование XML-формата для описания объектов ЭБ как наиболее универсального, позволяющего формализовать структуры данных. Использование XML-формата позволит реализовать возможность обмена информацией с системами, поддерживающими функции импорта-экспорта данных в XML [13, 16]. В сотрудничестве со студентами факультета компьютерных наук разработан конвертер, позволяющий преобразовывать метаописания объектов электронной библиотеки из формата RUSMARC в Dublin Core.

Помимо электронных информационных ресурсов, создаваемых силами сотрудников библиотеки, важным источником актуальной информации для всех категорий пользователей библиотеки являются электронные реферативные журналы ВИНИТИ. На протяжении многих лет библиотека приобретает их на компакт-дисках, где каждому номеру журнала соответствует файл с записями в формате ISO 2709. С помощью разработанного в ЗНБ ВГУ конвертера эти файлы преобразовываются в формат RUSMARC с последующей загрузкой на сервер баз данных, что обеспечивает доступ к электронным реферативным журналам из интрасети ВГУ с возможностью поиска информации по любому атрибуту библиографического описания. Такое решение позволило расширить аудиторию читателей реферативных журналов и приблизить информацию к ее основным потребителям — ученым, преподавателям, аспирантам, студентам старших курсов.

Литература

  1. Антопольский А.Б. Лингвистическое обеспечение электронных библиотек / А.Б. Антопольский.- М. : Информрегистр, 2003.
  2. Армс В. Электронные библиотеки / В. Армс; пер. с англ. С.А. Арнаутова; науч. ред. Н.В. Максимов.- М. : ПИК ВИНИТИ, 2002.
  3. Библиографическое описание электронных ресурсов : методические рекомендации /Рос. гос. б-ка, Межрегион. комитет по каталогизации; сост. Т.А. Бахтурина и др. ; отв. ред. Н.Н. Каспарова. — М. : Пашков дом, 2002.
  4. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание: общие требования и правила составления / Междунар. совет по стандартизации, метрологии и сертификации. — М. : Изд-во стандартов, 2004.
  5. ГОСТ 7.59-2003. Индексирование документов. Общие требования к систематизации и предметизации. — Минск: Изд-во стандартов, 2003.
  6. ГОСТ, 7.82-2001. Библиографическая запись. Библиографическое описание электронных ресурсов: Общие требования и правила сост. — Минск: Межгос.совет по стандартизации, 2001.
  7. ГОСТ, 7.83-2001. Электронные издания: основ. виды и выход. сведения. / Межгос. совет по стандартизации, метрологии и сертификации. — Минск: Изд-во стандартов, 2002.
  8. Жукова Н.А. Практический опыт каталогизации электронных ресурсов для электронной библиотеки РГБ / Н.А. Жукова, О.И. Медведева, Б.С. Перли // Электронная библиотека РГБ: проблемы формирования и использования: сб. статей / Рос. нац. б-ка. Науч.-исслед.отдел библиотековедения; сост. Т.В. Майстрович.— М.: Пашков дом, 2003.- с.100-104.
  9. Лавренова О.А. Структура и реализация электронной библиотеки диссертаций в РГБ/ О.А.Лавренова, А.А. Вежневец // Труды 5-ой Всероссийской научной конференции “Электронные библиотеки: перспективные методы и технологии, электронные коллекции” — RCDL2003. — СПб., 2003.
  10. Национальная служба развития системы форматов RUSMARC. -http://www.rba.ru/rusmarc/index.html
  11. Российский коммуникативный формат. Электронные ресурсы: методические материалы.-http://www.rba.ru/rusmarc/discuss/er/er.htm
  12. Digital Library Resources and Projects. — http://www.infolibrarian.com/dlib.htm
  13. Dublin Core Metadata Initiative. — http://dublincore.org
  14. Greenstone software. — http://www.greenstone.org/cgi-bin/library?a=p&p=home
  15. Lizardtech. — http://www.lizardtech.com/
  16. Metadata Encoding & Transmission Standard (METS). — http://www.loc.gov/standards/mets/
  17. The DSpace digital repository system. — http://www.dspace.org/
  18. The Flexible Extensible Digital Object and Repository Architecture (Fedora). — http://www.fedora.info
!26

ОПЫТ ПРИМЕНЕНИЯ LINK RESOLVER ОТ CHEMICAL ABSTRACTS SERVICE И ОТ GOOGLE

Круковская Н.В., Зибарева И.В.
(Институт органической химии им. Н.Д. Зелинского РАН)
(Институт органической химии им. Н.Н. Ворожцова СО РАН)

С середины 90-х годов наиболее авторитетные научные издательства стали выпускать журналы в электронном виде, следующим шагом издателей было создание электронных архивов. За прошедшее десятилетие электронные журналы получили широкое распространение, читатели превратились в пользователей. В России началом массового доступа к электронным версиям научных журналов можно считать конец 90-х годов, когда возникла научная электронная библиотека, размещенная по адресу www.elibrary.ru. В 2004 году РФФИ предоставил online доступ к полным текстам научных журналов непосредственно на сайтах издательств, таких как Springer, RSC, Blackwell и т.д. Большую роль в настоящее время в информационном обеспечении научными электронными ресурсами играет организация НЭИКОН, которая предоставляет online доступ к полнотекстовым версиям журналов на сайтах других издательств. Кроме того, многие академические институты, ВУЗы и университеты начали самостоятельно организовывать подписку на электронные версии журналов, к которым нет доступа через НЭИКОН и/или РФФИ.

И сразу же возникла проблемы — как узнать, к каким именно журналам и за какой временной период имеется полнотекстовый доступ на сайтах издателей и/или агрегаторов? Если на сайте www.elibrary.ru существовал общий для всех издательств каталог, то с переходом к online доступу на сайтах издателей/агрегаторов единого каталога в электронном виде не существует. Одним из способов ответить на вопрос о наличии полнотекстового доступа является использование Link Resolver — программного обеспечения, позволяющего быстро найти необходимую статью на сайте издателя и/или агрегатора.

В настоящей работе сравниваются Link Resolver от двух производителей — Chemical Abstracts Service (CAS) и Google. Институт органической химии им. Н.Д. Зелинского одним из первых начал использовать базы данных STN International, где представлено около 200 баз данных в режиме online, а с 2002 в ИОХ РАН установлена электронная версия журнала Chemical Abstracts на компакт-дисках. Все электронные информационные ресурсы, производимые CAS, имеют соответствующее программное обеспечение для перехода от библиографической ссылки к полному тексту документа — CHEMPORT (1999 год). Как правило, издательства предлагают приобретать Link Resolver за отдельную плату, но в случае с CAS стоимость CHEMPORT уже включена в цену информационных ресурсов.

Google предлагает бесплатную систему Google Scholar, позволяющую проводить поиски на сайтах издательств, научных сообществ, университетов. Для перехода от результатов поиска системы Google Scholar к полным текстам документоы было создано программное обеспечение SFX (2005), которое в перспективе должно стать коммерческим продуктом, но в настоящее время для членов IFLA предоставлено бесплатно. Наличие доступа к этим Link Resolver’s и позволяет провести сопоставление их функциональных характеристик.

Необходимо также отметить, что сравниваются только функциональные особенности программного обеспечения для перехода от результатов поиска в виде ссылки к полному тексту, а не сами поисковые системы — проиндексированные библиографические базы данных (для CAS) и поисковая машина-робот, просматривающая сайты и сортирующая их в соответствии с заданными приоритетами (для Google). Но так как функциональные характеристики программного обеспечения отчасти обусловлены теми целями, которые заложены в поисковых системах, следует подчеркнуть, что для CAS основной задачей является поиск информации по естественным наукам, а для GoogleScholar гуманитарные, социальные и естественные науки являются равнозначными.

Ресурсы открытого доступа (OPEN ACCESS) включены и в CHEMPORT, и в SFX. Но для CHEMPORT, помимо журналов OPEN ACCESS по естественным наукам, добавлены сайты патентного ведомства США, Европейского патентного ведомства и Micropatents с полнотекстовыми базами данных. В Google Scholar как ресурсы открытого доступа включены материалы музеев.

Конечно же, воспользоваться возможностями перехода от результатов поиска к полным текстам в базах данных STN International, можно, только если есть результаты поиска, проведенного в этих БД в виде файла. Для CA on CD (на компакт дисках) это функция доступна только на компьютере с лицензионным программным обеспечением (только четыре рабочих места на организацию). Но на сайте CAS любому пользователю доступна информация о 6700 электронных версиях журналов от 240 издательств с переходом на сайты издателей или на основную страницу электронных журналов. Это очень удобно, так как не каждый библиотекарь помнит, какой журнал принадлежит какому издательству, не говоря уже о научных сотрудниках. Для пользователей, имеющих подписку на БД STN International, помимо доступа к полным текстам электронных журналов, существует возможность заказа полных текстов через CAS DDS — специальную службу по заказу документов, как тех, что существют в электронном виде, так и тех, которые изданы только в печатной форме. Цена таких заказов больше, чем цена получения электронного документы с сайта издателя, так как помимо оплаты авторских прав издателю, включает в себя стоимость доставки — по факсу, авиапочтой или через курьеров типа UPS или DHL.

Для SFX неизвестно, какое количество издателей участвует в проекте и какое количество журналов включено в систему. Без специального пароля администратора эти данные являются недоступными.

И тот, и другой Link Resolver настраиваются администраторами, чтобы можно было уже на результате поиска в виде ссылки увидеть, имеется ли доступ к полному тексту самого документа в данной организации.

Подводя итоги по сравнению функциональных возможностей Link Resolver с точки зрения пользователя, можно сделать вывод, что оптимальный вариант — иметь лицензию на ресурсы производства CAS. В этом случае проблемы доступа к полным текстам документов при наличии электронной подписки на ресурсы РФФИ и НЭИКОНа решены на 60-70%. При наличии дополнительных средств на счету CAS проблемы доступа к полным текстам документов нет — можно получить около 100%. Если же организация не имеет ресурсов CAS (как и бывает в подавляющем большинстве случаев в России), то, располагая краткой библиографической ссылкой (полное или сокращенное название журнала, год выпуска, том, номер выпуска, номера страниц), следует через бесплатную поисковую систему CHEMPORT найти стартовую страницу журнала и перейти на поисковую систему этого ресурса (около 75%). Если есть полная библиографическая ссылка (помимо вышеперечисленных данных — заголовок документа, авторы), то можно воспользоваться поисковой системой GoogleScholar, задавая в поисковом окне или название статьи полностью, или его часть. Тогда, в большинстве случаев, есть возможность перехода к полному тексту документа. Наличие поисковых систем в электронном мире с дальнейшим переходом к полным текстам документов — это то, что через 5 лет станет таким же обычным явлением, как и журналы в электронном виде.

!27

АНАЛИЗ ИНФОРМАЦИОННЫХ РЕСУРСОВ ПО ЭКОЛОГИИ В КАЗАХСТАНЕ

Хасенова С.К.
(Национальный центр научно-технической информации Республики Казахстан)

Развитие науки во все времена невозможно без научно-технической информации, в том числе основного ее источника — научно-технической литературы. Ежегодно в мире публикуются миллионы статей, в которых приводятся результаты научных исследований. Для решения многоцелевых проблем в области охраны окружающей среды и рационального использования природных ресурсов актуально создание информационных систем, как на глобальном, так и на региональном уровне. Эффективная система получения информационных материалов о воздействии на окружающую среду технических и технологических факторов и их системное отражение в реферативных журналах и базах данных могут быть использованы для успешного решения проблем устойчивого развития [1, 2].

В Казахстане в целях оперативного информационного обеспечения ученых и специалистов экологической информацией издается реферативный журнал серии 1 с разделом “Охрана окружающей среды. Экология человека”, в котором отражены работы казахстанских авторов по приоритетной проблеме “Экологическая безопасность” [3].

Ресурсную основу реферативного журнала составляет входной поток отечественной литературы, опубликованной как в Казахстане, так и за рубежом, по приоритетным для государства фундаментальным и прикладным исследованиям.

Анализ информационного массива документальной структуры показал, что основу реферативного журнала по экологии составляют статьи из периодических и продолжающих изданий — 64,3% (1135 док.), статьи из книг–сборников — 31,6% (557 док.), монографии — 2,6% (45 док.), патенты — 0,8% (15 док.) и стандарты — 0,7% (13 док.) (таблица 1).

Таблица 1. Документальная структура информационного массива по экологии

Вид документа

Годы

Всего

2004

2005

2006

Кол-во доку-

ментов

%

Кол-во доку-

ментов

%

Кол-во доку-

ментов

%

Кол-во доку-

ментов

%

Статьи из периодических изданий

388

57,5

367

56,8

379

85,4

1135

64,3

Статьи из сборников научных трудов

249

36,9

247

38,2

61

13,7

557

31,6

Патенты

15

2,2

-

-

-

 

15

0,8

Монографии

23

3,4

19

3,0

4

0,9

45

2,6

Стандарты

-

0

13

2,0

-

-

13

0,7

Итого

 

,0

646

100,0

444

100

   

Анализ документальной структуры показывает, что в 2006 г. количество статей в периодических изданиях значительно возросло по сравнению с предыдущими годами (2004 г. — 57,5%, 2005 г. — 56,8%) гг. и составило 85,4% от всего потока публикаций Процент статей из сборников трудов и научных конференций снизился в среднем до 13,7%.

Проведен статистический анализ по распределению исследуемого массива документов за отчетный период по странам и языкам их опубликования. Установлено, что около 98% потока научно-технической литературы по экологии составляют работы казахстанских авторов, опубликованные в республиканских изданиях. На российские издания приходится 1,0%, на другие страны ближнего зарубежья — 0,3% и дальнего зарубежья — 0,7% публикаций. География информационного потока РЖ представлена 7 странами: Казахстан, Россия, Туркменистан, Узбекистан, США, Великобритания, Германия, Нидерланды.

Среднее количество публикаций на русском языке составляет 97,1%. По сравнению с 2004 г (0,3%) отмечен рост статей на государственном казахском языке — 1,7%. Увеличилось число публикаций на английском языке (с 0,6% в 2004 г до 2,5% в 2006 г.).

Насущные проблемы экологии обусловливают издание новых журналов. Так, за последние годы в Казахстане появились такие новые периодические издания, как: “Экология и устойчивое развитие”, “Дуние” (на каз. яз.), “Экология и промышленность Казахстана”, “Экологическое образование”, “Олкетану — Краеведение” и др. К этому следует добавить ряд экологических изданий неправительственного сектора: Вестник “Зеленое спасение”, “Herald” (печатные), “Казахстанская Экоправда”, “Экологические вести”, “Информационный бюллетень РЭЦ ЦА”, “Экология и общество”, “Жемчужина Казахстана” и другие электронные издания.

Основными источниками реферирования являются научные статьи, опубликованные в периодических и продолжающихся изданиях. По данным ВИНИТИ именно они содержат около 70% всех научных публикаций. Как известно, определение продуктивности научных журналов по Бредфорду способствует оптимальному формированию фондов и аналитико-синтетической обработке научно-технической информации. Приблизительно 50% информации по соответствующей тематике сконцентрировано в нескольких узкоспециализированных (профильных) журналах, в то время как вторая половина — рассеяна по большому кругу смежных и других изданий. На примере анализа входного потока НТЛ, включенной в раздел “Охрана окружающей среды. Экология человека” РЖ серии 1 за 2004-2006 гг. выявлено ядро основных (продуктивных) источников в области экологии в Казахстане. Для выявления ядра основных изданий проведен анализ научных публикаций казахстанских авторов, содержащихся в отечественных периодических и продолжающихся изданиях, а также в изданиях дальнего и ближнего зарубежья. Анализ списка журналов, ранжированного по частоте отраженных в них публикаций, выявил наиболее продуктивные из них, а также позволил оценить объем менее продуктивных журналов в рассматриваемом тематическом направлении. Наиболее продуктивны 10 экологических журналов, что составляет 60,2% от общего количества периодики, включенной в процесс реферирования. Наибольший процент приходится на следующие специализированные журналы в области охраны окружающей среды и экологии: “Вестник Казахского Национального университета. Серия экологическая”, “Наука и образование Южного Казахстана. Серия “Экология. Охрана окружающей среды и рациональное использование природных ресурсов”, “Гидрометеорология и экология”, “Экология и промышленность Казахстана”, “Нефть и газ”, “Медицина труда и промышленная экология”, “Промышленность Казахстана”, “Вестник сельскохозяйственной науки”, “Вестник Казахского Национального медицинского университета””. Остальная часть работ рассредоточена в 47 журналах с различной тематикой, что составляет 39,8% публикаций. Перечень используемой литературы для реферирования пополнился новыми наименованиями журналов, такими как: “Горный журнал Казахстана”, “Казахстан-спектр”, “КИПиА в Казахстане”, “Деловой мир”, “Механика и моделирование процессов”, “Труды ВНИИцветмет”, “Олкетану — краеведение”, “Эковести: информационно-аналитический бюллетень”, “Вестник Карагандинского университета. Серии: Биология. Медицина. География”, “Экологическое образование в Казахстане”.

Анализ публикационной активности НИИ, вузов и других организаций по охране окружающей среды и экологии человека показал, что проблемами экологии занимаются ученые из более чем 300 организаций различных отраслей экономики (таблица 2).

Таблица 2. Публикационная активность организаций в области экологии

Наименование организации

Количество

публикаций

%

Казахский национальный университет им. аль-Фараби

141

7,9

Южно-Казахстанский государственный университет им. М.А. Ауезова

109

7,7

Таразский государственный университет им. М. Х. Дулати

66

3,7

Казахский национальный технический университет им. К. Сатпаева

35

2,0

Национальный центр комплексной переработки минерального сырья РК

30

1.7

Восточно-Казахстанский государственный технический университет им. Д. А. Серикбаева

28

1,6

Карагандинский государственный университет им. Е. А. Букетова

28

1,6

Семипалатинский государственный университет им. Шакарима

25

1,4

Казахский НИИ экологии и климата

24

1,4

Казахский национальный аграрный университет

24

1,4

Павлодарский государственный университет им. С. Торайгырова

24

1,4

Казахский национальный медицинский университет им. С. Д. Асфендиярова

22

1,2

Казахский национальный педагогический университет им. Абая

19

1,1

НЦ гигиены труда и профзаболеваний

19

1,1

Кокшетауский государственный университет им. Ш. Уалиханова

18

1,0

Институт химических наук им. А. Б. Бектурова

17

1,0

Институт катализа и электрохимии им. Д. В. Сокольского

17

1,0

Институт физиологии, генетики и биоинженерии растений

16

0,9

Казахский НИИ водного хозяйства, г. Тараз

15

0,8

Северо-Казахстанский государственный университет

14

0,8

Институт географии МОН РК

14

0,8

Прочие организации (менее 0,8%)

1060

60,1

Итого

1765 100

Установлено, что публикационная активность в высших учебных заведениях выше, чем в научно-исследовательских институтах. Наибольшее количество публикаций (705 документов — 39,9% от общего числа работ) принадлежит 21 организации. Ведущее положение по количеству публикаций занимает Казахский национальный университет им. аль-Фараби (7,9%), Южно-Казахстанский государственный университет им. М. Ауезова (7,7%), Таразский государственный университет им. М. Х. Дулати (3,7%).

Тематика исследуемого информационного ресурса обширна и охватывает 19 рубрик МРНТИ (таблица 3).

Таблица 3. Тематическая направленность публикаций по охране окружающей среды и экологии человека

Код

МРНТИ

Наименование рубрики

Количество документов

2004 г

2005 г

2006 г

Всего

%

87.01

Общие вопросы охраны окружающей среды и экологии человека

69

68

21

158

9,0

87.03

Теория и методы изучения охраны окружающей среды, использование природных ресурсов и экологии человека

49

68

18

135

7,6

87.05

Международное сотрудничество

-

2

1

 

0,2

87.15

Загрязнение среды. Контроль загрязнения

11

104

72

187

10,5

87.17

Загрязнение и охраны атмосферы

78

34

51

163

9,1

87.19

Загрязнение и охрана вод, суши, морей и океанов

64

67

46

177

10,0

87.21

Охрана почв

47

53

25

125

7,1

87.23

Охрана недр

3

1

1

5

0,3

87.24

Экологические основы жизнедеятельности населения

9

14

-

23

1,3

87.25

Воздействие антропогенных изменений окружающей среды на здоровье и социально-трудовой потенциал населения

25

29

34

88

5,0

87.26

Воздействие загрязнения окружающей среды на состояние природных экосистем, популяции и отдельные организмы

51

48

53

152

8,6

87.27

Охрана растительного и животного мира

15

10

5

30

1,7

87.29

Антропогенное воздействие на ландшафт. Охрана и оптимизация ландшафта

12

8

7

27

1,5

87.31

Заповедное дело. Охраняемые природные территории и акватории

4

7

1

 

0,7

87.33

Стихийные бедствия и катастрофы антропогенного происхождения. Экологическая безопасность

22

6

7

35

2,0

87.35

Рациональное использование и воспроизводство природных ресурсов

34

22

18

74

4,2

87.51

Охрана окружающей среды и природных ресурсов в мире

3

1

-

4

0,2

87.53

Управление отходами. Малоотходная и безотходная технологии

177

102

83

362

20,7

87.55

Защита от шума, вибрации, электрических и магнитных полей и излучений

2

2

1

5

0,3

 

Итого

675

646

444

1765

100

Исследования казахстанских ученых в области обезвреживания, переработки и утилизации газообразных, жидких и твердых отходов (рубрика 87.53) охватывают 362 документа, что составляет 20,7% от общего числа публикаций данной рубрики. Основная часть работ этого раздела отражает проблему очистки поверхностных и сточных вод, проблему очистки воздуха от выбросов промышленных газов и автотранспорта. В остальных работах содержатся новейшие разработки в области малоотходной и безотходной технологий в промышленности.

Проблемы загрязнения окружающей среды и контроля загрязнения (рубрика 87.15) отражены в 187 документах, что составляет 10,5% от общего числа документов, включенных в РЖ. Данная рубрика включает вопросы организации мониторинга воды, воздуха как экологических объектов, посредством биологических и химических методов анализа. Имеются работы по влиянию нефтяного загрязнения на различные экосистемы: атмосферу, водный бассейн, почву и растительность. Часть работ посвящена радиационной экологии, проблемам, связанными с ракетно-космической деятельностью комплекса “Байконур” и опустыниванию территорий Приаралья.

Исследования по загрязнению и охране вод суши, морей и океанов (рубрика 87.19) составляют 10,0%. Рассматривается современное состояние водных ресурсов Казахстана. Отмечается, что практически на всей территории республики наблюдается напряженная водохозяйственная обстановка, обусловленная недостатком водных ресурсов и загрязнением водных источников промышленными предприятиями. Показана взаимосвязь между уровнями экономического развития страны и потреблением воды. Приведены основные задачи стратегии устойчивого водопользования на основе целевого и рационального использования водных ресурсов.

Исследования по изучению загрязнения и охраны атмосферы (рубрика 87.17) составляют 9,1%.

Работы по исследованию влияния антропогенных изменений окружающей среды на здоровье населения (рубрика 87.25) занимают 5,0% от общего количества документов. Ведущая роль в этой научной сфере принадлежит университетам медицинского профиля: КазНМУ им. С. Д. Асфендиярова, НЦ гигиены труда и профзаболеваний (г. Караганда), Южно-Казахстанской гос. медиц. академия (г. Шымкент). В публикациях отражены результаты исследований рабочих, работающих в нефтеперерабатывающей отрасли, подземных угольных шахтах, населения из экологически неблагополучных регионов. Дан анализ основных направлений по улучшению здоровья населения в регионах с радиоактивным загрязнением. Исследования по рациональному использованию и воспроизводству природных ресурсов (рубрика 87.35) составляют 4,2%, на остальные рубрики приходится 8,2% работ.

В целом в Казахстане в области экологии проводятся работы по улучшению экологической обстановки:

В Казахстане с целью повышения эффективности использования информационных ресурсов НТИ созданы и актуализируются электронные информационные ресурсы по экологии. Создание электронных ресурсов открывает реальные возможности использования систем информационного обслуживания пользователей в режиме удаленного доступа. Материалы баз данных позволяют осуществлять анализ и обобщение уровня научно-технических разработок, а также выявлять тенденции развития науки в Казахстане.

Литература

  1. Ефременкова Е. М., Мельникова М. М., Потапов И. И., Чумакова Н. Ф. Новые проблемно-ориентированные выпуски БД ВИНИТИ по охране окружающей среды // НТИ. Сер. 1 2002. № 4. С. 24-28.
  2. Алексеев В. М.. Ефременкова В. М., Кириллова О. В., Хачко О. А., Черный А. И. Разработка и применение критериев оценки мирового потока научно-технических журналов с целью оптимизации комплектования фондов ВИНИТИ // НТИ. Сер. 1. 2002. № 12. С. 23-26.
  3. Хасенова С. К., Карабаев Ж. А., Обревко Л. А. Анализ документального потока публикаций казахстанских авторов по охране окружающей среды и экологии человека // Информационные ресурсы России, № 6, 2004. С. 35-38.
!28

НЕКОТОРЫЕ АСПЕКТЫ БИБЛИОМЕТРИЧЕСКОГО АНАЛИЗА НАУЧНОЙ АКТИВНОСТИ УЧЕНЫХ РОССИИ, БЕЛАРУСИ И УКРАИНЫ

Харыбина Т.Н., Мохначева Ю.В., Слащева Н.А.
(Центральная библиотека Пущинского научного центра РАН — отдел БЕН РАН)

За последние десятилетия библиометрия стала незаменимым инструментом при выработке научной политики в управлении исследованиями. Подобные исследования начались задолго до появления термина “библиометрия” — в XVIII—ХIХ веках.

История возникновения современных цитатных указателей восходит к “Парижской библиографии”, изданной в Париже в 1771-1772 гг. Это библиография рецензий из двух журналов на книги, изданные в Париже в 1770 году — упорядоченный массив материала по рецензируемым книгам. В научном наследии К. Фреммихена и А. Бальби также можно найти примеры использования количественных показателей для исследования культурных и научных явлений. А в 1873 г. появился “Указатель ссылок Федерального законодательства” Шепарда (США). Он стал прототипом первого Указателя цитирования в науке — Science Citation Index (предшественника ресурса Web of Science). Основоположником внедрения и развития данного Указателя стал доктор Ю. Гарфилд, который в 1955 г. определил структуру и характеристики будущего первого указателя ссылок для естественнонаучной литературы.

Основоположниками этого направления можно считать и российских ученых Шторха А.К. и Аделунга Ф.П. В 1810 г. они анализируют собственный указатель отечественной литературы “Систематическое обозрение литературы в России: 1801—1806 гг.”, и пытаются “сравнивать один период с другими и через сравнение это видеть приращение или ущерб литературы”!

Продолжая данную тему, в 1895 году на 1 Библиографическом съезде России Н.М. Лиссовский ввел термин “библиографическая статистика” и практически реализовал его в своих работах.

За рубежом изучение документального потока в 1920—60-е гг. ведется в нескольких направлениях. С. К. Бредфорд открывает закономерность рассеяния профильных публикаций в периодических изданиях по прикладной геофизике. Его работы по анализу ссылок, статистическим исследованиям, анализу видового состава документального потока и в настоящее время служат теоретической основой для библиометрических исследований. В 1956 г. Дирек Прайс предложил концепцию экспоненциального роста документального потока, что привело к выделению “статистической библиографии”, а затем — к активному развитию библиометрии и наукометрии

В 1969 г. английский ученый А.Притчард впервые ввел термин “библиометрия”(от греч. biblion — книга и metria — измерение), вместо “статистическая библиография”. С тех пор библиометрические показатели в обязательном сочетании с другими статистическими показателями, используют как инструмент управления наукой.

Во многих странах мира для оценки состояния и развития науки, как правило, используются три группы показателей:

Необходимо также учитывать и другие показатели, — такие как: участие в научных мероприятиях, членство в научных организациях, образовательная деятельность, количество наград, премий, грантов и др.

В настоящее при поддержке РГНФ, — грант № 07-03-90305а/Б, на базе Центральной библиотеки Пущинского научного центра РАН (отдел БЕН РАН) ведутся работы по оценке исследовательской активности различных стран, включая Беларусь и Россию. Объектами библиометрического анализа являются публикации ученых. В рамках проводимых исследований обеспечивается сбор и анализ сведений о количественном и качественном составе научных публикаций (по авторам, научным подразделениям, организациям, источникам публикаций), как своего рода показателе вклада в производство знаний; их цитируемости, характеризующей влияние исследований на развитие науки; соавторстве для оценки научных связей между учеными, организациями и странами.

Все исследования ведутся на основе данных, полученных с помощью электронных ресурсов компании Thomson Scientific: Web of Science (1991-2007), Essential Science Indicators (1997-2007), Journal Citation Report (2005).

Для выявления картины публикационной активности различных стран использовалась БД Web of Science (1991-2007 гг.). Были проанализированы публикации 2001-2006 гг. Следует отметить, что в перечисленных выше базах данных отражены публикации из источников, которые расписываются компанией Thomson Scientific, поэтому количество публикаций и другие показатели не являются абсолютными.

Рис. 1. Количество публикаций 2001-2006 гг. Россия, Украина, Беларусь

Как видно из рис.1, во всех трех странах ситуация по динамике публикаций схожа: прироста нигде не наблюдается, скорее наоборот, происходит некоторое снижение количества публикационной активности.

Рис 2. Суммарное цитирование публикаций 2001-2006 гг. Россия, Украина, Беларусь.

Рис. 3. Сравнение средних показателей цитируемости российских, украинских и белорусских публикаций 2001-2006 гг. со среднемировыми показателями цитируемости.

Как видно из рис. 3, средние показатели цитируемости на одну статью во всех трех странах примерно одинаковые, но они значительно ниже среднемировых показателей за аналогичный период.

Следующее направление библиометрического анализа научной деятельности России, Беларуси и Украины — выявление приоритетных предметных областей внутри этих стран.

Таблица 1. Ведущие предметные рубрики и распределение публикаций внутри них. Россия (2001-2006 гг.)

Предметная область

Кол-во публикаций

Физика

67468

Химия

37741

Биология, биохимия, мол. биол., генетика, микробиология, нейронауки

21317

Инженерные науки

19598

Науки о Земле (геонауки)

14887

Медицинские науки

14685

Материаловедение

12615

Математика

8422

Науки о космосе

6207

Информатика

3741

Экология и науки об окружающей среде

2002

Сельскохозяйственные науки

1294

Таблица 2. Ведущие предметные рубрики и распределение публикаций внутри них. Беларусь (2001-2006 гг.)

Предметная область

Кол-во публикаций

Физика

3162

Химия

1751

Биология, биохимия, мол. биол., генетика, микробиология, нейронауки

1022

Материаловедение

916

Медицинские науки

799

Инженерные науки

705

Математика

431

Информатика

216

Науки о Земле (геонауки)

102

Экология, науки об окружающей среде

96

Сельскохозяйственные науки

38

Таблица 3. Ведущие предметные рубрики и распределение публикаций внутри них. Украина (2001-2006 гг.)

Предметные рубрики

Кол-во публикаций

Физика

12507

Химия

6297

Материаловедение

5201

Инженерные науки

4151

Биология, биохимия, мол. биол., генетика, микробиология, нейронауки

2645

Математика

2557

Медицинские науки

1673

Науки о космосе

917

Науки о Земле

869

Информатика

276

Экология

276

Сельскохозяйственные науки

70

Рис. 4. Доли научных направлений в общем количестве публикаций Россия, Украина, Беларусь

Как видно из рис. 4, во всех трех странах наиболее приоритетными являются физика (чуть более 30% от общего количество статей) и химия (чуть менее 20% от общего количества публикаций). На третьем месте по значимости в России и Беларуси — биологические науки, на Украине — материаловедение.

Еще одно направление исследований — анализ взаимного научного сотрудничества России, Беларуси и Украины.

Таблица 4. Распределение доли совместных публикаций 2001-2006 гг. среди общего количества публикаций России, Беларуси и Украины

 

2001

2002

2003

2004

2005

2006

Украина

4371

4301

4059

4186

4310

4177

Россия-Украина

334

307

299

323

351

297

 

7,64%

7,14%

7,37%

7,72%

8,14%

7,11%

 

 

 

 

 

 

 

 

2001

2002

2003

2004

2005

2006

Россия (всего)

26802

27727

26720

26931

26701

25449

Россия-Украина

334

307

299

323

351

297

 

1,25%

1,10%

1,12%

1,20%

1,30%

1,17%

 

 

 

 

 

 

 

 

2001

2002

2003

2004

2005

2006

Россия (всего)

26802

27727

26720

26931

26701

25449

Россия-Беларусь

98

151

137

142

163

133

 

0,37%

0,54%

0,51%

0,53%

0,61%

0,52%

 

 

 

 

 

 

 

 

2001

2002

2003

2004

2005

2006

Беларусь (всего)

1016

1081

1043

1027

1037

1023

Беларусь-Россия

102

152

137

145

166

135

10%

14%

13%

14%

16%

13%

Из Таблицы 4 видно, что Россия остается для Беларуси и Украины главным научным партнером. Очевидно, также, что для России научное сотрудничество с Беларусью и Украиной не является приоритетным и держится на достаточно невысоком уровне.

Литература

  1. Shepard's Citation. Chicago, 1873.
  2. E.Garfie1d. Citation indexes for science.- Sci. 1955, 122, N 3, p.108-111. E.Garfield. Science citation index — a new dimension in indexing.- Sci. 1964, 144, p.649-654.
  3. Гиляревский Р.С., Мульченко З.М., Терехин А.Т., Черный А.И. Опыт изучения Sience Citation Index //Прикладная документалистика / АН СССР. Науч. совет по кибернетике. — М.: Наука, 1968. — С.32-53.
  4. Иваницкий Г.Р., Слащева Н.А., Цыганов М.А. Легенда о Диогене // Вестник РАН. — 2004.- Т. 74, N6. — С. 483-487.
  5. Маркусова В. А. Наука о науке // Мир библиографии.- 1998.- № 2.- С. 21- 24.
  6. Мохначева Ю.В., Слащева Н.А. Научная публикация как объект наукометрических исследований (Из опыта Центральной библиотеки Пущинского научного центра РАН- отдел БЕН РАН) //Библиотеки Национальных академий наук: проблемы функционирования, тенденции развития. Вып.4.-Киев, 2006.- С.:67-79.
  7. Налимов. В.В., Мульченко З.М. Наукометрия.- М.: Москва, 1969.
  8. Слащева Н.А. Наукометрические исследования в библиотеке (на примере Центральной библиотеки ПНЦ РАН) // Науковедение. — 2002. — № 3. — С. 147-154.
  9. Слащева Н.А., Мохначева Ю.В. Электронная информация в наукометрических исследованиях // Научно-техническая информация. Сер. 1. Организация и методика информационной работы. — 2003. — № 5. — С.21-27.
  10. Слащева Н.А. Публикации ученых как объект наукометрических исследований // Роль книгоиздания в развитии международных научных и культурных контактов: Материалы международной научной конференции, Москва, 21-23 сентября 2005 г. — М.: Наука, 2005. — С. 265-270.
  11. Шторх А.К., Аделунг Ф.П. Систематическое обозрение литературы в России. СПб., 1808.
!29

НАУЧНЫЕ ЖУРНАЛЫ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ: ПРЕДСТАВЛЕНИЕ ДАННЫХ ДЛЯ ВНУТРЕННИХ И ВНЕШНИХ ПОЛЬЗОВАТЕЛЕЙ ВИНИТИ РАН

Солошенко Н.С., Кириллова О.В.,
Соколова И.С., Хачко О.А.
(ВИНИТИ РАН)

Реструктуризация науки, и высшей школы напрямую влияют на развитие структуры и состава потока научных изданий РАН и государственных высших учебных заведений Минобрнауки. Реструктуризация ВАКа неизбежно повлекла изменение “Перечня ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук”, что, в свою очередь, не могло не отразиться на издательской политике научно-исследовательских организаций и вузов.

Периодические и продолжающиеся издания учреждений Минобрнауки являются частью российского потока научно-технической литературы (НТЛ), поступающей на вход информационного центра ВИНИТИ РАН. Для обеспечения полноты их поступлений в ВИНИТИ в свое время было подготовлено Распоряжение Минобрнауки (2002 г.), рекомендующее всем издающим организациям этого ведомства поставлять в ВИНИТИ один экземпляр выпускаемых ими изданий для непосредственного отражения их содержания в его информационных продуктах. Этот документ был направлен во все организации министерства. Издания, поступающие непосредственно из организаций этого ведомства, а также организаций РАН, были определены как “малотиражные”, и в соответствии с этим был назван канал поступлений (МИ). Однако нельзя сказать, что указанный документ способствовал значительному увеличению потока изданий — только примерно 30% организаций Минобрнауки стали прямыми поставщиками своей литературы в ВИНИТИ. Основная часть этих изданий поступает из РКП в качестве обязательного экземпляра. Поэтому для того, чтобы сделать верное заключение о структуре и содержании этой части входного потока, необходимо было провести анализ поступлений малотиражных изданий по всем каналам.

В рамках данного проекта также была поставлена задача наиболее полного представления расширенных описаний изданий Минобрнауки в Электронном каталоге ВИНИТИ (http://catalog.viniti.ru), возможности которого позволяют предъявить пользователям формальные и неформальные характеристики изданий, включающие в себя редакционно-издательские, информационно-коммуникативные и оценочные показатели.

Информационный массив изданий входного потока ВИНИТИ РАН содержит две взаимосвязанных части, сформированных на основе функционирования “Автоматизированной системы комплектования и регистрации” (АСКР): “Массив описаний сериальных изданий” (“Базовый массив” — БМ), предназначенный для первичного ввода информации об издании и технологического использования специалистами ВИНИТИ (“внутренними” пользователями), и “Электронный каталог” (ЭК), предоставляющий информацию внешним пользователям с сайта ВИНИТИ. Перечень основного набора полей данных, описывающих российские издания в АСКР ВИНИТИ, приведен в работе О.В. Федорца и др. [1]. Этот перечень постоянно модернизируется и в настоящее время содержит около 100 полей. В последние годы состав полей описания российских сериальных изданий в АСКР существенно увеличился, что связано, в первую очередь, с разработкой нового подхода к описанию отечественных изданий, который позволяет получить более полные сведения о существующем потоке российских периодических и продолжающихся изданий по точным, естественным и техническим наукам [2-4].

Разрабатываемая методика предусматривает получение, как формализуемых данных, позволяющих производить статистическую обработку, так и не формализуемых — редакционно-издательских и информационно-коммуникативных, описывающих адресную и содержательную информацию об изданиях, включая характеристики представления их в Интернет. Эти сведения по составу в значительной степени напоминают данные из всемирно известной базы данных, содержащей развернутые описания периодических и продолжающихся изданий всех стран — Ulrich’s Periodicals Directory (США). Они могут быть использованы для получения суммарного (оценочного) коэффициента (СК). Для удобства подсчета этого коэффициента была проведена работа по формализации формирующих его показателей. В настоящее время подсчет СК осуществляется программными методами, что позволяет обновлять данные подсчета после актуализации сведений об издании. Ниже приведен перечень редакционно-издательских и информационно-коммуникативных сведений об издании, учитывающихся при подсчете СК.

Элементы данных, учитывающиеся при автоматическом подсчете суммарного коэффициента

При подсчете СК (каждый элемент данных учитывается как “1”, кроме данных о реферативных службах, где как “1” учитывается каждая служба, отражающая сериальное издание) суммировались показатели наличия следующих элементов данных: заглавие переводной версии (критерий — наличие переводной версии); ISSN (критерий — наличие ISSN); язык(и) оглавления, если есть оглавление на английском языке; язык(и) резюме (таким образом определяется наличие резюме); заглавие переводной версии; ISSN; наличие пристатейной библиографии; наличие рецензирования статей; URL издания; наличие CD — ROM версии; наличие микроформ; online доступ к оглавлениям и резюме; online доступ к полным текстам; импакт-фактор; принадлежность к изданиям РАН; включен в список ВАК; использование журнала при обслуживании академиков РАН в системе СИО “Наука” ВИНИТИ (участок “Группа обслуживания академиков” — ГА); реферативные службы, обрабатывающие издание — подсчитывается количество всех реферативных служб и суммируется со всей полученной суммой; отражение в БД ВИНИТИ по отраслям (если по данным года отражение превышало 20 статей); разметка ВИНИТИ по данным двух лет (если по данным двух лет ежегодная разметка превышала 20 статей); тип (характер) издания (принимаются во внимание значения, определенные словарем).

Перечисленные данные доступны внешним пользователям с сайта ВИНИТИ из Электронного каталога [5]. Пример сохраненного из ЭК полного описания издания приведен на рис. 1.

КСИ

104619

ISSN I

0234-5439

Загл. осн. полн.

Вестник Воронежского государственного университета

Обозн. и N серии полн., Загл. серии осн. полн.

Сер. География. Геоэкология

Загл. осн. сокр.

Вестн. Воронеж. гос. ун-та. Сер. Геогр. Геоэкол.

Периодичность

2

Язык(и) статей СИ

рус.

Язык(и) резюме СИ

рус.

Язык(и) оглавления

рус.

Год основания

1993

Тираж

250

Рецензирование статей

Да

CD-ROM версия

Да

Наличие пристатейных списков библиографии

Да

Адрес издания в Интернет

http://www.vestnik.vsu.ru/content/geograph/

Доступ on-line к полным текстам, оглавлениям и резюме

http://www.vestnik.vsu.ru/content/geograph/

Условия online доступа

свободный

Временной охват

2000-

Издательство I

Воронежский государственный университет

Город I

Воронеж

Адрес издающей организации (изд-ва I)

394068, г. Воронеж, ул. Хользунова, д. 40, к. 204

Редакция

Редакция журнала "Вестник Воронежского государственного университета. География, геоэкология"

Адрес редакции

394693, Воронеж\Университетская пл., 1\Тел. (4732) 13-56-54\ e-mail: root@geogr.vsu.ru

Издатель — телефон

(4732) 13-56-54

Издатель — e-mail

root@geogr.vsu.ru

Редактор

гл. ред. Федотов Владимир Иванович

Учредитель

Воронежский государственный университет

Коды ГРНТИ

38.15.01\87.03.15

Тематика издания

география\геоэкология\краеведение\методика преподавания\история науки\научные архивы

Аннотация

Освещает результаты научных исследований в области географии, природопользования и геоэкологии. Изучает ландшафтно-географические закономерности региона и планеты в целом. Представляет экономико-географические принципы территориальной организации хозяйства и общества. Рассматривает основы рационального природопользования, охраны и мониторинга окружающей среды. Затрагивает вопросы ландшафтного дизайна, геоинформационных технологий и др. Публикует оригинальные статьи сотрудников университета и других авторов, как правило, представивших материалы на научном семинаре университета, научные обзоры, рецензии, краткие сообщения по актуальным проблемам науки, хронику, информацию

Суммарный коэффициент

11

Дата-время актуализации описания СИ

30.05.2007 14:58:00

Рис. 1. Формат представления расширенного описания издания в Каталоге ВИНИТИ (отображаются только непустые элементы данных).

Так как ВИНИТИ заинтересован в поступлении малотиражных изданий, прежде всего, из учреждений РАН и вузов, в АСКР были разработаны дополнительные программные средства, позволяющие производить учет поступлений из организаций этих ведомств. Таким образом, в последние годы стало возможным получать статистические сведения об изданиях, поставляемых организациями по каналу МИ, а также составлять списки организаций, не выполняющих рекомендации своих ведомств (разработана специальная программа “Списки СИ”). Для выявления изданий вузов, поступающих по другим каналам, была разработана методика составления SQL-запросов к базе данных, и возможно полно проанализированы поступления изданий учреждений Минобрнауки в БД ВИНИТИ. Кроме того, был проведен анализ сайтов издающих организаций вузов для выявления печатных и электронных изданий, информация о которых не предоставляется издателями в РКП и непосредственно в ВИНИТИ.

Получение наиболее полного списка периодических и продолжающихся изданий учреждений Минобрнауки позволило ввести и заполнить признак “МИНОБРАЗ” в описании изданий в АСКР. Кроме того, специфика малотиражных изданий вызвала необходимость ввести в описание дополнительное поле организации-учредителя, так как сведения об издателе или издательстве не всегда демонстрируют связь журнала с вузом или научно-исследовательским институтом. В результате внесенных в программу “Списки” изменений появилась возможность выделения массива описаний этих изданий с заданным набором элементов. Вывод данных возможен в двух формах: краткой — в виде отчета и полной — в формате Excel.

В результате выявления, описания и анализа входного потока малотиражных сериальных изданий вузов был выделен массив, содержащий описания поступлений в ВИНИТИ в последние годы изданий, учредителями которых являются около 200 вузов Минобрнауки. В эту категорию не были включены сериальные издания МГУ и СпбГУ. Первый из них не подчиняется Министерству образования и науки РФ и имеет самостоятельный статус, второй должен получить подобный статус в 2007 году в соответствии с проектом федерального закона об особом статусе МГУ и СпбГУ. Примерно 60% учитываемых изданий составляют “Вестники” и “Известия” вузов, издаваемые как политематические журналы или сериальные комплексы, содержащие от двух до нескольких десятков серий (Тульский государственный университет, Российский университет дружбы народов и др.).

Одна четвертая часть списка включена в новый “Перечень ведущих рецензируемых научных журналов и изданий” ВАК. Всего же около 200 журналов входят в прежний и новые перечни ВАК, что позволяет номинально оценивать более 40% малотиражных вузовских журналов как высокоценные издания, рекомендуемые экспертами профессиональному сообществу. В верхнюю часть списка вузовских изданий, ранжированных по показателю СК, входят различные серии “Известий вузов”, а также некоторые тематические выпуски “Вестника МГТУ им. Н.Э. Баумана”.

Анализ вузовских малотиражных изданий, имеющих в ЭК ВИНИТИ расширенное описание (более 70%, поступающих в ВИНИТИ), показал, что:

Интернет-характеристики журналов являются динамическими, и развитие данного исследования предполагает постоянный мониторинг выделенной категории изданий с целью дальнейшего изучения издательских тенденций в научно-образовательном пространстве.

Результаты представленного исследования могут быть интересны не только комплектаторам информационных центров, научных и учебных библиотек, но и всем членам научного сообщества — конечным пользователям и авторам вузовских изданий.

Литература

  1. Федорец О.В., Шапкин А.В., Батюшко А.А., Хачко О.А. Автоматизированная система комплектования входного потока сериальных изданий ВИНИТИ: развитие модели данных и инструментальных средств в 2000-2002 гг. // НТИ-2002. Информационное общество, интеллектуальная обработка информации, информационные технологии: Материалы междунар. конф. — М.: ВИНИТИ, 2002 — С. 356-361.
  2. Кириллова О.В. и др. Комплексный подход к формированию списка основных периодических изданий России в области точных, естественных и технических наук /Кириллова О.В., Чернобровская Т.Н., Шапкин А.В., Березин А.В., Зеленина Г.З./. — М., 2003. — 30 с. — Рукопись деп. в ВИНИТИ 16.09.2003, № 1680-В2003.
  3. Кириллова О.В. и др. Анализ и оценка основного потока сериальных изданий России по точным, естественным и техническим наукам / Кириллова О.В., Андронова М.Б., Батюшко А.А., А.Г. Березин, Т.Ю. Дивильковская, Г.З. Зеленина, Т.Н. Чернобровская, А.В. Шапкин. // Информационное обеспечение науки: новые технологи: Сб. науч. статей. — М., 2005. — С.30-44. [http://www.benran.ru/Magazin/cgi-bin/Sb_05/pr_05.exe?!4!].
  4. Кириллова О.В., Андронова М.Б., Дивильковская,Т.Ю., Хачко О.А. Новые подходы и результаты оценки информационным центром российского потока научных журналов: критерии и представление ранжированных данных [Электронный ресурс] // Образовательные технологии и общество = Educational Technology & Society.- 2006.- V.9, N 3. — [http://ifets.ieee.org/russian/depository/v9_i3/html/10.htm]
  5. Фишер А.М., Шапкин А.В., Вопросы управления доступом к электронному каталогу поступлений ВИНИТИ // Крым-2004. Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса. Материалы 11-й международной конференции (судак, 5-13 июня 2004 г.) — [http://gpntb.ru/win/inter-events/crimea2004/disk/index.html].
!30

АГРЕГАТОРЫ И ИЗДАТЕЛИ БАЗ ДАННЫХ НАУЧНЫХ ЖУРНАЛОВ ЛАТИНСКОЙ АМЕРИКИ И ИСПАНИИ.

Хачко О.А.
(ВИНИТИ РАН)

Издатели, агрегаторы или вендоры создают на своих серверах архивы статей из научных журналов разной направленности. В докладе рассматриваются наиболее известные агрегаторы и издатели баз данных научных журналов Латинской Америки, Испании и Португалии. Сравнительный анализ проводится по следующим аспектам: методология отбора журналов, тематика и рубрики, варианты поиска возможности, языки интерфейса, обратная связь (наличие контактов с издателем, типы контактов).

При формировании перечня отражаемых источников в SciELO (Scientific Electronic Library Online), Redalyc (La Red de Revistas Cientнficas de Amйrica Latina y el Caribe, Espaсa y Portugal), TECNOCIENCIA (научные журналы Испании) и LILACS ((Latin American and Caribbean Literature on Health Sciences)используется методика отбора электронных изданий. В SciELO была создана методология, основанная на методике оценки электронных изданий, разработаной LATINDEX (http://www.latindex.org). Это совместный проект, осуществленный при участии FAPESP — Fundaзгo de Amparo а Pesquisa do Estado de Sгo Paulo и BIREME — Centro Latinoamericano y del Caribe de Informaciуn en Ciencias de la Salud de la Organizaciуn Panamericana de la Salud. Модель SciELO подразумевает создание национальных и тематических сайтов, использующих единую систему организации интерфейса и единую систему отбора источников. В ходе развития были созданы национальные (Аргентина, Бразилия, Чили, Колумбия, Куба, Португалия, Испания, Венесуэла) и тематические сайты (Здравоохранение, Социальные науки — англоязычная версия). Согласно разработанной методике, для того, чтобы издание было включено в электронную библиотеку, предполагается предварительное рецензирование его содержания с точки зрения наличия в нем оригинальных научных исследований. Издательский совет журнала должен состоять из признанных специалистов данной области знания. Важна периодичность выхода и количество публикуемых статей. Так, минимальная периодичность для изданий по точным наукам и изданий по сельскому хозяйству — 3 раза в год, наукам о жизни — 4 раза в год, социальным гуманитарным наукам — дважды в год. Для количества статей минимальными цифрами соответственно являются:18, 32 и 10 (статей в год). Важным моментом является своевременность выхода очередных номеров. Заголовки статей должны быть снабжены переводами на английский язык, отмечается также наличие резюме статьи и ключевых слов на английском языке в том случае, если статья опубликована на любом языке, кроме английского. Статьи должны содержать данные о принадлежности автора к какой-либо организации, а также подробные сведения о его местоположении. Учитывается импакт-фактор журнала по сравнению с другими журналами данной области знания. Публикация статей должна осуществляться по нормам, предлагаемым журналом, в том числе это касается и библиографических ссылок. Журнал должен иметь ISSN. Учитывается также и то, отражается ли его содержание международными реферативными службами. Каждый журнал описывается и оценивается по крайней мере по 4-м выпускам. Журналы, получившие самые высокие оценки, включаются в базы данных.

Ниже в табличной форме представлены некоторые сравнительные характеристики рассматриваемых баз данных.

Тематика

Название базы данных периодических изданий

Перечень тематик

REVICIEN — Red de Revistas Cientнficas Espaсolas, испанские научные журналы

http://www.revicien.net/

Сельское хозяйство, Технология производства продуктов питания, Науки о Земле, Науки о жизни, Физика и астрономия, Техника и технология, Математика, Медицина, Окружающая среда, Химия, Политика в области науки.

SCIELO -

http://www.scielo.org

Сельское хозяйство, Ветеринария, Прикладные социальные науки, Технология, Точные науки и науки о Земле, Медико-санитарные дисциплины, Гуманитарные науки, Одонтология, Психиатрия, Психология, Здравоохранение.

TECNOCIENCIA — научные журналы Испании.

http://www.tecnociencia.es/e-revistas/proyecto/proyecto4.jsp

Присутствуют тематики по классификации ISI: Ботаника, Демография, Дерматология и венерические заболевания, Кино, Криминология и уголовное право, Кристаллография, Материаловедение, Наука и технология производства продуктов питания, Поведенческие науки, Политика, Право, Связь, Сердце и сердечно-сосудистая система, Социальные науки, Телеуправление, Хирургия, Экология, Экономика и финансы.

Redalyc (La Red de Revistas Cientнficas de Amйrica Latina y el Caribe, Espaсa y Portugal)

http://redalyc.uaemex.mx/

Естественные и точные науки, медицина, сельское хозяйство, социальные и гуманитарные науки

E-journal — только электронные журналы

http://www.ejournal.unam.mx/

Естественные и точные науки, Гуманитарные и поведенческие науки, Науки о жизни, Социальные науки (включая право, социологию, историию, экономику), Финансы и администрирование, Прикладные исследования и технология, Медицина

LILACS (Latin American
and Caribbean Literature
on Health Sciences)

http://bases.bireme.br/cgi-bin/wxislind.exe/iah/online/

Все отрасли медицины и здравоохранения, связанные со здоровьем человека: Одонтология, Санитарно-гигиенические мероприятия, Фармация и химия, Биология, Питание, Психология, Экология и окружающая среда и др.

Ediciones Doyma — Издательство медицинской литературы.http://db.doyma.es

Акушерство и гинекология, Аллергология, Гематология и гемотерапия, Гериатрия, Дерматология, Зубное протезирование и др. разделы медицины

Medigraphic литература в области биологии и медицины

http://www.medigraphic.com

Аллергология, Анестезиология, Ветеринария, Воспитание детей младшего возраста, Гепатология, Гигиена и санитария, Дерматология, Иммунология и др.

Imbiomed — Журналы стран Латинской Америки в области биологии и медицины

http://www.imbiomed.com

Администрация больниц, Биоинженерия, Ветеринария, Гастроэнтерология, Дерматология, Диагностика, Иммунология, Интенсивная терапия и др. разделы медицины

Разновидности поиска:

REVICIEN

  1. по тематике
  2. по изданию
  3. простой поиск (по ключевым словам и/или фразам в любом поле)
  4. при помощи конструктора запросов по набору элементов данных — заголовок, реферат, ключевые слова, автор, год, том, номер первой страницы, ISSN и некоторые другие
  5. быстрый доступ (по любому фрагменту)

SCIELO

  1. По источникам: Алфавитный указатель, указатель тематик, поисковая форма
  2. По статьям — Алфавитный указатель, указатель тематик, поисковая форма

TECNOCIENCIA

  1. По библиографическим полям — автор, название, резюме и ключевые слова
  2. По названию источника
  3. По тематике (классификация ISI)
  4. По дате выхода в свет

Redalyc

  1. Тематический
  2. По источникам
  3. По автору и названию статьи
  4. По стране — издателю журнала

E-journal

  1. Простой поиск — по названию и автору
  2. Расширенный поиск — по названию журнала, статье и автору, по ключевым словам (на испанском и английском языке),

LILACS

  1. Свободный поиск по любому полю с возможностью использования операторов И/ИЛИ.
  2. Расширенный поиск по дескрипторам, слову из названия статьи, названию журнала, автору, коллективному автору, тексту резюме, типам публикаций, языку, уникальному идентификатору, электронному носителю и др.

Doyma

  1. Простой поиск — по названию и автору
  2. Расширенный поиск — по названию журнала, статье и автору, по ключевым словам (на испанском и английском языке),

Medigraphic

  1. Простой поиск — по названию и автору
  2. Расширенный поиск — по названию журнала, статье и автору, по ключевым словам

Imbiomed

По каталогу журналов, по каталогу статей

Языки интерфейса

REVICIEN

Испанский, английский

SCIELO

Английский, испанский, португальский

TECNOCIENCIA

Испанский

Redalyc

Испанский

E-journal

Испанский

LILACS

Испанский, английский

Doyma

Испанский, английский

Medigraphic

Испанский

Imbiomed

Испанский

Раздел Статистика

Раздел имеется только в БД Redalyc. Представлена разветвленная система статистики — по использованию статей, источников, количественные характеристики журналов.

Доступ

REVICIEN

Свободный до уровня резюме

SCIELO

Свободный до уровня статей

TECNOCIENCIA

Свободный до уровня статей

Redalyc

Свободный до уровня статей

E-journal

Свободный до уровня статей

LILACS

Свободный до уровня статей

Doyma

Свободный до уровня оглавлений, полный текст — платный

Medigraphic

Свободный до уровня статей

Imbiomed

Свободный, регистрация

Каждая из информационных систем специализируется на определенных предметах исследования. Применение многоплановых критериев отбора изданий для использования в базах данных научных журналов повышает научную ценность информации, предоставляемой широкому кругу пользователей, а также повышает престиж организаций, столь тщательно подходящих к проблеме улучшения качества информационного продукта.

!31

SOS — SOS — SOS

Жучков А.В., Кравченко А.В., Твердохлебов Н.В.
(Институт химической физики им. Н.Н Семенова РАН,
Москва)

Введение

Ответ на вопрос о коэффициенте полезного действия современных информационных технологий, конечно, может быть разным в зависимости от того, кто и в какой ситуации отвечает на него, однако очевидно, что все, а особенно потребители информации, согласятся с тем, что он несоразмерно низок относительно затрат на эти информационные технологии. Причину многие видят в компаниях — поставщиках решений — Application Service Provaiders (ASP). Простое объяснение — компании предлагают неудачные решения или недостаточно компетентны. Однако, скорее всего причина глубже, ведь в подавляющем большинстве ASP — не что иное, как операторы чужих решений, опирающиеся только на свои связи с поставщиками и клиентами.

Как получить услугу напрямую у разработчика с поддержкой, легально и дёшево? Оказывается, что такая возможность существует. И это — не покупка и эксплуатация программ (прикладных или системных), а использование среды сервисов. При этом не надо думать о других программах, установленных или нет на твоем компьютере, о том, заработает ли купленное программное обеспечение, хватит ли ресурса у твоей машины, как быстро придётся обновлять версию и т.д., а надо просто заказать решение своей задачи при помощи доступного экземпляра нужного сервиса.

Следует сказать, что учёные уже активно пользуются такими средами, например OSG (http://www.opensciencegrid.org/), EGEE (http://www.eu-egee.org/) или Виртуальные обсерватории (http://www.virtualobservatory.org/). Практически все эти среды создаются с применением Грид-технологий. Критическая масса таких инструментальных средств фактически создаёт новую технологическую версию обеспечения науки — Science2.0/

Сервис-ориентированный подход и Science2.0

Известно, что Грид-концепция родилась в среде научного сообщества, которое испытывало острую потребность в развитых средствах поддержки сотрудничества. Современные методы научно-исследовательской работы таковы, что ни один крупный научный проект не осуществляется силами одного, административно-замкнутого коллектива исследователей. Исследования ведутся в колаборациях ученых как географически, так и административно распределенных. Виртуальные организации (ВО) [1], как объединение ИТ-инфраструктуры и ученых явились крайне удачной абстракцией, поддерживающей различные формы взаимодействия.

При этом компьютерно-ориентированные исследования, исследования in silico, как ни какая иная сфера деятельности оперирует огромнейшими массивами этих данных. В процессе работы над научными проектами продуцируются огромные массивы данных, разнородных по своей природе, которые накапливаются как в закрытых, так и в открытых, доступных через Интернет источниках. Когда данных становится очень много, они как бы сами начинают порождать новые данные. Многие стали говорить — теперь это не Silico Oriented Science (SOS), а Silo Oriented Science (SOS) [2]. Эта игра слов подчёркивает ситуацию, в которой научные данные многих проектов, по сути, представляют собой эти самые слабо структурированные и слабо связанные данные — “силосные хранилища”, работа с которыми очень сложна.

Действительно, в ВО учёные, как правило, взаимодействуют именно со слабо структурированными и слабо связанными данными. Следуя современной терминологии, будем называть их пространствами данных (ПД) [3].

Есть ещё одно важное наблюдение: ученые вообще не очень любят работать с БД. В информационном хаосе легче найти новые знания, нащупать новые подходы, есть больше возможностей применить свою интуицию и нестандартные варианты решений. То есть, очевидно, что в этой среде придётся мириться с существованием ПД, а тогда практически единственным выходом из такой ситуации является наполнение такой среды информационными сервисами. Этот сервис-ориентированный подход и должен привести к построению Service Oriented Science (SOS).

Сервисный подход — это, по сути, эволюция ПО. Он провозглашен достаточно давно, но становится востребованным именно теперь и во многом из-за необходимости обслуживания ВО. Основным достижением Грид-технологов, бесспорно можно считать разработку стандарта архитектуры программного обеспечения Грид — Open Grid Service Architecture (OGSA), которая рассматривает сервис (службу) в качестве основного объекта Грид [4]. Таким образом, любое ПО в GRID-среде, должно являться доступным по сети компонентом Грид-службы (сервисом), обеспечивающим требуемую функциональность. Грид-службы могут быть как статическими, так и создаваться динамически и, согласно OGSA, обладают состоянием — набором данных, ассоциированных со службой, что позволяет различать экземпляры служб в распределенной Грид-среде.

Посредством удаленного обращения к активностям (activities) сервиса потребитель получает определенный вид обслуживания, в том числе информационного обслуживания. Элементарными программными блоками являются базовые службы, которые служат фундаментом для конструирования высокоуровневых служб. Такой подход к описанию служб и протоколов взаимодействия между ними обеспечивает высокую степень виртуализации такой абстракции как Грид-служба и обеспечивает независимость от формы реализации служб, то есть интероперабельность к среде исполнения.

OGSA позволяет создавать и управлять временными экземплярами служб, что, в свою очередь, позволяет разработчикам конструировать службы сколь угодно высокого уровня, причем платформонезависимые. На усмотрение разработчика остаются вопросы выполнения обслуживания, подготовки программного кода и реализации алгоритмов, использования языков программирования. При этом правила взаимодействия, так же как и семантика, не зависят от исполнительной среды и Web-инфраструктуры, над которой фиксируются описания состояний экземпляров служб.

И, наконец, может быть самое главное достоинство Грид-подхода, ориентированного на OGSA — стремление к максимальной стандартизации и фиксации протоколов различного уровня. И, что важно, благодаря таким сообществам, как Global Grid Forum (GGF) Грид-компьютинг располагает действенным механизмом для уточнения существующих стандартов и создания новых.

С практической же стороны, очень важным является и наличие ставшего де-факто стандартом открытого программного обеспечения Globus Toolkit. (GT) (http://globus.org/toolkit/docs/4.0/). Компоненты этого программного обеспечения среднего уровня (middleware) являются Грид-службами, разработанными в соответствии с OGSA и обеспечивающими базовую функциональность.

Пространства данных — новые вызовы
и новые информационные службы

Важно заметить, что Грид-среда ВО заведомо более сложна, чем например Р2Р системы, не имеющие компонента централизованного управления. Именно поэтому в middleware Грид-систем такое значение уделяется безопасности и средствам управления ресурсами, а также планированию рабочей нагрузки.

А как работать с пространствами данных в ВО? Для поддержки ПД в [1] авторы предлагают создавать платформы поддержки пространств данных (Data Space Support Platform далее DSSP). Цель поддержки ПД состоит в обеспечении базового набора функций над всеми источниками данных и организации необходимого уровня связанности данных. DSSP, в отличие от СУБД, разворачивает набор сервисов поверх существующих систем управления данными, соблюдая при этом их потребности в автономии. На сегодняшний день реально работающих DSSP ещё нет, однако развитость современных Грид-платформ позволяет реализовать прототип DSSP уже имеющимся базовым набором сервисов. Речь идёт, прежде всего, о OGSA-DAI (http://www.ogsadai.org/) и инфраструктурных сервисах Грид-сегментов [5].

Однако, использование источников данных разной степени связанности (ПД) не перекрывает всех актуальных потребностей участников ВО. В современном мире как научном, так и социо-политическом, время актуализации информации постоянно уменьшается, особенно, если речь заходит о работе с потоковыми данными. А в современных информационных системах RSS feed’ы, media потоки, сенсорные сети являются полноправными источниками данных.

Временные издержки на структуризацию данных, их складирование в СУБД могут быть слишком велики. Время оказывается наиболее критичным параметром в информационных системах. Безусловно, хранение информации также должно присутствовать, но получать ее необходимо стремиться on-demand, а обрабатывать on-fly. Потребность в интеграции данных “нового” потокового типа обусловлена тем, что обработка этих данных on-fly диктуется их высокой степенью актуализации. И дает возможность генерации нового знания, которое продуцируется анализом динамики этих данных.

Набор базовых activities OGSA-DAI может только ограниченно работать с потоковыми данными: принимать и доставлять поток. Но этот набор можно расширять, чтобы службы поиска и запрашивания стали применимы в реальном времени к потоковым данным в DSSP построенной на базе GT4. Таким образом, можно не только создавать прототип DSSP, но и вести в рамках этой платформы постоянную распределённую работу с данными в целях информационной поддержки ВО, создавать новые информационные услуги.

Пример информационных сервисов (услуг)
в Science2.0

Виртуальная организация “Вакцины нового поколения” является крупнейшей в рамках RGRID. Именно для информационного обеспечения этой ВО разрабатываются большинство Web- и Грид-сервисов RGRID [5]. Хотя входящие в ВО-Вакцины медико-биологические учреждения являются в основном научно-исследовательскими институтами, а не клиниками, в рамках этой ВО разрабатываются не только собственно лекарственные средства, но и методы и системы проведения клинических испытаний и их оценки, а также стратегия и тактика клинического применения. Совокупность учреждений ВО представляет собой реальное медицинское сообщество, на примере которого можно отрабатывать технологии е-Медицины и е-Фармакологии в Грид-среде. Имеется большое разнообразие накопленных внутренних информационных ресурсов, используются также и внешние ресурсы (Медлайн, SWISS-PROT и др.).

Вспомогательные Грид-сервисы репозитория метаописаний и онтологий [5] используются для организации информационного пространства — создания в нем специализированных информационных структур промежуточного уровня. Графическое представление предметно-ориентированных онтологий является одним из видов интерфейса для эксперта, пользующегося ресурсами RGRID.

В этой ВО крайне востребованной является услуга сбора и мониторинга данных определённой понятийной направленности. Эта услуга задаётся семантической схемой — метамоделью (см. рис. 1), опирающейся на базовую онтологию некоторой отрасли знаний. В приведённом примере используется элемент базовой медицинской онтологии, однако заметим, что могут использоваться и более привычные мета-описания, например тезаурусы, представленные в OWL форме, как это реализуется, например, в проекте “Библиогрид” [6].

<Drug Name>
<Adverse Event>
             <Risk Factor >
                  <Risk Probability >
                           <Patient Data>
                                  …
                           </Patient Data >
                </Risk Probability >
             </Risk Factor >
</Adverse Event>
<URI > http://www.... </URI >

 

Рис.1

Приведённая на рис.1 метамодель предусматривает задание наименования препарата (DrugName), конкретного побочного эффекта (AdverseEvent), фактора риска (RiskFactor) и вероятности осложнения (Risk Probability). Базовый набор данных для такой модели содержится в описании препарата в Регистре лекарственных средств. Например, для побочных эффектов при применении варфарина описаны следующие основные побочные эффекты: кровотечение (bleeding), дисфункция печени (liver disfunction), диарея (diarea), некроз кожи (skin necrosis). Основные факторы риска, как правило, также известны. Например, для варфарина это возраст, артериальная гипертензия, дисфункция почек или печени.

Рис.2

Поскольку целью сбора, интеграции и представления информации пользователю является персонализация знаний о клиническом применении лекарственных препаратов, то найденный информационный объект должен включать данные о параметрах пациента или выборки пациентов, для которых получены эти данные. Часть этих и других дополнительных данных в целях упрощения изложения не приводятся. На рис. 2 показан пример информационного объекта, включающего параметрические данные, полученные в результате анализа одной из статей, посвященных опыту клинического применения варфарина при антикоагуляционной терапии и возникших при этом побочных эффектах.

Основной особенностью поисковой части сервиса следует считать необходимость постоянной актуализации и пополнения той информации, которая соответствует метамодели (см. рис. 1). В этом смысле сервис исполняет роль агента, следящего за возможными источниками в ПД ВО, Интернете и в доступных корпоративных информационных системах. Информационные объекты, выделенные сервисами лексического анализа из данных, найденных поисковыми сервисами в информационном пространстве в соответствии с заданной метамоделью, сохраняются в репозитории и могут в любой момент быть доступны участнику ВО.

Заметим, что если бы в исходной модели мы не указали бы тега “вероятность риска”, то количество собранных информационных объектов было бы много шире. Там присутствовали бы описания, типа приведённых на рис.3, в которых присутствуют выдержки их информационных источников.

Рис.3

Таким образом, вы, не приобретая никакого программного обеспечения, не используя для поиска, лексического анализа и отбора информации свой персональный компьютер будете иметь постоянный информационный поток, соответствующий заданной модели. Вместе с результирующими данными к вам придут и настроечные скрипты, позволяющие использовать либо браузер, либо экранный редактор в качестве средства визуализации. Пример визуализации при помощи браузера см. рис.4.

Рис.4

Вы можете организовать несколько потоков. Информацию о новинках в потоках вы можете получать, например, в специальных окнах своего браузера, которые часто используются под рекламу.

Несложно сделать новые услуги, старые приложения доступными как сервис, гораздо сложнее договориться о стандартах взаимодействия таких сервисов, преодолеть психологические барьеры. Дело доходит до того, что для сервис-провайдеров стало даже технологически выгодным маскировать новые решения под старые. Кроме того, нельзя игнорировать и элемент ответственности сервис-провайдеров перед потребителем информации. Впрочем, тут уже существует устоявшаяся практика заключения Соглашений об уровне обслуживания (SLA), что, конечно, не исключает необходимости наличия надёжных каналов связи.

Описанный подход в полной мере соответствует концепции “услуги по заказу” (On demand). При работе с такими услугами важно не забывать, что этот подход, позволяющий платить за ресурс по мере необходимости, предусматривает и необходимость дезактивации таких сервисов. IBM, активно развивающая такой подход, предлагает сейчас два варианта услуги: upgrade on demand, когда можно наращивать производительность по мере необходимости, и capacity On/Off on demand — включение/выключение требуемых ресурсов.

Заключение

Известно, что жизненно важным фактором научно-исследовательского процесса является механизм распространения знаний — чем более эффективно вы можете обеспечить разделяемый доступ не только к большим объёмам информации, но также и к ресурсам, которые используются для создания этой информации, тем более высокий уровень качества исследований и сотрудничества вы достигнете.

В грядущей Science2.0 различные источники данных совместно с приложениями в форме высокоуровневых сервисов, опирающиеся на более мелкие разноуровневые сервисы программного обеспечения среднего уровня, будут предоставляться как новые услуги, и при этом очень широко. Платформы поддержки пространств данных, реализованные на базе Грид-сегментов, уже сегодня позволяют создавать такие услуги и могут являться хорошим полигоном для дальнейших исследований.

Литература

  1. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International Journal of High Performance Computing Applications, 15 (3). 200-222. 2001.
  2. Foster I. Service-oriented Science // Science, 2005, v.308, #5723:814-817
  3. M. Franklin, A. Halevy and D. Maier: >From Databases to Dataspaces: A New Abstraction for Information Management // ACM SIGMOD Record 34, No. 4 (December 2005), pp.27-33.
  4. Foster I., Kesselman C., Nick J., Tuecke S. The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration Global Grid Forum, June 22, 2002
  5. Zhuchkov A. et al. Advancing of Russian ChemBioGrid by bringing Data Management tools into collaborative environment. Challenges and Opportunities of HealthGrids. V. Hernandes et al. (Eds). IOS Press, 2006, pp. 179-186.
  6. Жучков А.В, Маркарова Т.С., Твердохлебов Н.В., Арнаутов С.А. Библиогрид — электронные библиотеки как средство управления информацией в грид-среде // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Труды Восьмой Всероссийской научной конференции RCDL 2006 Суздаль 17-19.10.2006, — Ярославль: Ярославский государственный университет им. П. Г. Демидова, 2006, с 231-237.
!32

ИНТЕГРАЦИЯ НАУЧНОЙ ИНФОРМАЦИИ В ЕНИП

Сысоев Т.М., Дьяконов И.А.
(МСЦ РАН) (ВЦ РАН)

Единое научное информационное пространство

Единое научное информационное пространство представляет собой проект, направленный на объединение научной информации, опубликованной институтами и подразделениями РАН. Цель проекта — предоставить пользователям возможность доступа к объединённому, цельному представлению данных, расположенных в различных информационных системах организаций РАН, как правило, доступных в сети Интернет. Следует подчеркнуть, что объединение предполагается виртуальное, то есть не предполагает создания некоторого единого хранилища для данных — при весьма больших объемах информации такой подход был бы неэффективен как в плане требуемых вычислительных ресурсов, так и с точки зрения поддержки информации в актуальном состоянии. Вместо этого, в рамках инициативы ЕНИП предлагается набор стандартов для описания информационных ресурсов и набор протоколов, с помощью которых осуществляется взаимодействие между участниками ЕНИП. Это позволяет создать “надстройку” над уже сложившейся инфраструктурой, которая позволит, прежде всего, выполнять поиск научной информации унифицированным образом.

В настоящее время практически каждая организация РАН представлена в сети Интернет собственным веб-сайтом, на которых, в большинстве случаев, опубликована контактная информация, данные о сотрудниках и результатах их научной деятельности, структура и состав подразделений. Принятый в Интернет способ представления данной информации с помощью языка разметки HTML не позволяет поисковым машинам “понимать”, о чём идёт речь, для них доступен только текст. В результате качество поиска и его возможности оставляют желать лучшего. Например, мы не можем ограничить поиск только публикациями, или получить список персон, получивших учёную степень по какой-либо специальности в указанный период времени. Данная проблема характерна для всей сети Интернет в целом, и для её решения была создана инициатива “Semantic Web” [1], которая, в частности, предлагает стандарты для описания информационных ресурсов, пригодные для автоматической компьютерной обработки. Вместе с обычной текстовой информацией, предназначенной для посетителей веб-сайтов, его редакторы могут опубликовать описание в специальном формате, в результате чего поисковые системы получат информацию о структуре и связях представленных на сайте ресурсов.

На ЕНИП можно смотреть как на реализацию этого подхода в масштабах РАН. Поскольку Semantic Web описывает лишь технологии, остаётся свобода выбора в том, как их применять. Поэтому для ЕНИП предлагается набор стандартов описания научных информационных ресурсов и ряд протоколов, с помощью которых происходит взаимодействие между серверами.

Для описания ресурсов применяется модель данных RDF, предложенная в Semantic Web. Ресурсы описываются в соответствии с разработанными схемами данных, которые определяют такие понятия, как классы ресурсов, их свойства и связи. Там, где возможно, предлагаемые схемы данных используют популярные международные форматы, в частности, Dublin Core [2], Prism [3], vCard [4]. Не требуется, чтобы информационный ресурс был описан полностью, но, в то же время, описание должно быть достаточно удобным для пользователей системы, то есть в нём должны присутствовать свойства, по которым пользователь сможет эту информацию найти. Например, пользователь может выполнить поиск интересующей его персоны по фамилии и научной степени, перейти на сайт ресурса, на котором эта персона представлена, и получить о ней достаточно подробную информацию, в том числе, не представленную в исходном описании.

Протоколы взаимодействия являются достаточно простыми в использовании и следуют архитектуре веб-сервисов, наиболее хорошо зарекомендовавшей себя для работы в Интернет. Они основаны на идеях, предложенных в таких стандартах, как CIP и SDLIP, и представляют собой упрощение и адаптацию этих протоколов к стандартам WSA.

Структура ЕНИП/P>

Рис. 1. Типы узлов ЕНИП

На рисунке 1 представлены типы узлов ЕНИП и способы их взаимодействия на текущий момент. Можно выделить следующих участников:

В настоящее время большинство узлов ЕНИП построено на информационной системе “Научный институт РАН” [6] — типовом решении, позволяющем публиковать научную информацию какой-либо организации, в последнюю версию которого встроена поддержка протоколов взаимодействия ЕНИП. В частности, на этом решении работают серверы Пермского научного центра, Института механики сплошных сред, Санкт-Петербургского научного центра. В то же время подключены и информационные системы, построенные на других технологиях, например, данные Библиотеки по естественным наукам РАН и Научно-образовательная социальная сеть “Соционет”.

По мере развития системы будут добавляться новые серверы верхнего уровня, которые обеспечивают маршрутизацию запросов, например, по географическому принципу. Также в ближайшее время планируется подключение службы хостинга, которая позволит публиковать данные организациям, не имеющим своей информационной системы.

Рис. 2. Развитие ЕНИП

Интеграция существующих информационных систем

Архитектура ЕНИП позволяет подключать существующие информационные системы с помощью программных компонент — адаптеров. Допустимы различные способы интеграции, которые различаются по сложности их реализации.

Самым простым способом интеграции является интеграция с помощью экспорта данных в информационную систему, которая может участвовать в процессах распределённого поиска и обмена. Такой системой может быть как существующий узел ЕНИП, так и, например, новый узел, работающий на программном обеспечении “Научный институт РАН”. На практике это означает, что к существующей информационной системе создается “надстройка”, в задачи которой входит преобразование данных к стандартному формату, используемому в ЕНИП. Для реализации такого способа интеграции, необходимо выполнить следующие шаги:

Первый шаг — отображение схемы данных на OWL/RDF-модель необходимо выполнять с учётом того, что к настоящему моменту разработаны рекомендуемые схемы для метаинформации [5], в том числе так называемая “базовая” схема, которая поддерживается всеми участниками ЕНИП. Таким образом, отображение должно производиться так, чтобы конечный результат соответствовал базовой схеме. Базовая схема позволяет описывать информацию о сотрудниках организации, результатах их научной деятельности, структуре подразделений. Соответственно, при интеграции с помощью экспорта информация для участников ЕНИП будет доступна в объёме, соответствующем базовой схеме. При необходимости сделать доступными более специализированные, тематические данные, данный метод интеграции не подходит, и вместо него следует реализовать поддержку протокола распределённого поиска.

На этом шаге также следует выбрать схему именования информационных ресурсов. В ЕНИП каждому информационному ресурсу сопоставляется уникальное в рамках распределённой среды имя. Уникальность имени обеспечивается соглашениями по его структуре: первая часть содержит идентификатор узла ЕНИП, вторая — идентификатор информационного ресурса в рамках данного узла. В качестве идентификатора узла ЕНИП допустимо использовать DNS имя, по которому доступна информационная система. Идентификатор ресурса в рамках узла получается достаточно просто, например, в случае реляционной СУБД можно использовать строчку, состоящую из имени сущности и первичного ключа.

Далее следует определить, какие свойства из базовой схемы метаданных присутствуют в информационной системе. Свойства типа строк, дат и чисел форматируются в соответствии со стандартом XML Schema– Data Types. Отдельного внимания потребуют свойства, значения которых являются элементами словарей или рубрикаторов. В этом случае необходимо будет построить соответствие между применяемой в информационной системе классификацией (например, научных степеней), и предложенными в схемах метаданных словарями.

После выполнения данных шагов реализация программных компонентов, обеспечивающих экспорт данных, как правило, сложности не представляет. Для реляционной СУБД достаточно получить необходимую информацию с помощью SQL запроса, и оформить конечный результат в RDF/XML виде. Если для системы предусмотрен XML-формат экспорта (например, RSS), то может быть более просто, по сравнению с непосредственной работой с базой данных, составить для XML данных XSLT-преобразование, которое переведёт данные в нужный формат. Например, такой подход применяется при загрузке в ЕНИП данных из Научно-образовательной социальной сети “Соционет”.

В реализуемом компоненте необходимо предусмотреть возможность инкрементальной выгрузки, т.е. режим, в котором выгружаются только новые и изменённые с момента предыдущей загрузки данные. Реализация зависит от конкретной информационной системы. Обычно для этого потребуется таблица, в которой будут сохраняться идентификаторы выгруженных ресурсов и время их модификации.

Для экспорта данных в узел ЕНИП потребуется следующая информация:

Эту информацию можно получить у администратора соответствующего узла. Для узлов, построенных на информационной системе “Научный институт РАН”, адрес сервиса обмена имеет стандартный URL вида http://(имя узла)/services/Exchange. Загрузка данных осуществляется с помощью SOAP вызова. Сообщение SOAP представляет собой стандартную “обертку” над экспортированными RDF/XML данными, поэтому формируется достаточно просто. Ответ от сервиса обмена представляет собой сообщение со списком идентификаторов загруженных ресурсов, а также со списком обнаруженных во входных данных ошибок.

При наличии достаточных вычислительных ресурсов можно поднять собственный экземпляр информационной системы “Научный институт РАН”, предназначенный для выгрузки данных — в таком режиме она используется как дополнительное RDF-хранилище, обеспечивающее в необходимой степени поддержку протокола поиска.

Интеграция с помощью поддержки протокола поиска требует несколько больших усилий, но в конечном итоге является более эффективной, поскольку отсутствует дополнительная прослойка между информационной системой и ЕНИП, и пользователям предоставляется актуальная на данный момент информация. При таком способе интеграции ссылки о результатах поиска ЕНИП будут вести непосредственно на страницы интегрируемой информационной системы. Кроме того, поиск может выполняться по дополнительным атрибутам, отсутствующим в базовой схеме.

В общем случае для поддержки интеграции с помощью протокола поиска требуется выполнить следующее:

Реализация протокола поиска может быть непростой задачей, поскольку, помимо атрибутного поиска, в выражениях допускается также полнотекстовый поиск. Как следствие, ресурсы должны быть доступны по полнотекстовому поиску всех их атрибутов. Это не всегда выполнимо, поскольку в реальных информационных системах часть атрибутов может быть не предназначена для поиска, не везде реализован полнотекстовый поиск, а если и реализован, то индекс может строиться не по всем атрибутам или без выделения атрибутов. Тем не менее, сам протокол является достаточно простым, и если необходимый для операции поиска функционал поддерживается, то его реализация сложности не представляет.

Благодаря открытости архитектуры и протоколов, можно решить и обратную задачу: использование сервисов ЕНИП в существующих информационных системах. Основным вариантом использования в таких случаях является функция поиска. Описанным выше протоколом поиска можно воспользоваться для того, чтобы искать данные, в том числе одновременно в ряде узлов.

Заключение

Единое научное информационное пространство представляет собой важную и актуальную инициативу, направленную на повышение открытости и доступности научной информации РАН, что, в конечном счете, приведет к более тесному сотрудничеству между научными коллективами, повысит эффективность их работы. В то же время, развитие этого проекта невозможно без активного участия и поддержки научными организациями, которая не в последнюю очередь зависит от удобства и простоты процесса интеграции, высокоуровневое описание которого приведено в данной статье.

Литература

  1. W3C Semantic Web Activity, http://www.w3.org/2001/sw/.
  2. Dublin Core Metadata Initiative (DCMI), http://dublincore.org/.
  3. Publishing Requirements for Industry Standard Metadata, http://www.prismstandard.org.
  4. An Ontology for vCards, http://www.w3.org/2006/vcard/ns.
  5. Бездушный А.Н., Кулагин М.В., Серебряков В.А., Бездушный А.А., Нестеренко А.К., Сысоев Т.М. Предложения по наборам метаданных для научных информационных ресурсов // "Вычислительные Технологии", Том 10, N 7, г. Новосибирск, 2005, С. 29-48.
  6. Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А., Сысоев Т.М. “Возможности технологий ИСИР в поддержке Единого Научного Информационного Пространства РАН”// Сборник докладов Шестой Всероссийской конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" RCDL’2004, с.254-262, Пущино, 2004.
!33

ОРГАНИЗАЦИЯ КОРПОРАТИВНОЙ БИБЛИОТЕЧНОЙ СИСТЕМЫ ФИЛИАЛОВ БЕН НА ОСНОВЕ ЕНИП РАН

Якшин М.М.
(Библиотека по естественным наукам РАН)

С 1997 года ВЦ РАН ведутся работы по созданию Единого Научного Информационного Пространства (ЕНИП) РАН (ранее — Интегрированной Системы Информационных Ресурсов (ИСИР) РАН). Основная цель разработки ЕНИП РАН — объединение информационных ресурсов различного типа, имеющихся в учреждениях РАН и предоставление к ним унифицированного доступа. В основе концепции построения ЕНИП РАН лежит современная технология открытых систем, предполагающая использование единой метаинформации, описывающей ресурсы различного типа.

ЕНИП РАН поддерживает значительное число ресурсов, связанных с публикациями научных результатов, с которыми традиционно оперируют библиотеки разного уровня, в том числе ЦБС БЕН РАН. В состав ЕНИП РАН, в качестве одной из основных компонент, входит библиотечная компонента, на основе которой можно реализовать библиотечную систему филиалов БЕН.

Описываемая система является корпоративной библиотечной системой, обслуживающей основные аспекты работы библиотеки с читателями. Корпоративную сеть можно рассматривать как продолжение идеи централизованной иерархической ассоциации библиотек (где создается некое единое хранилище, в которое интегрируется вся информация о фондах входящих в нее библиотек). Основная идея корпоративной сети — в интеграции всех существующих механизмов объединения библиотек в единое для читателя информационное пространство, в котором можно пройти весь путь от поиска литературы до окончания работы с ней (возвращения экземпляра в библиотеку) в рамках одной системы, при этом взаимодействуя с фондами всех библиотек объединения.

Существует большое количество разнообразных сервисов, которые в той или иной степени реализуют элементы корпоративной библиотечной системы. К таким сервисам можно отнести:

Порталы распределенного поиска по протоколу Z39.50 — проводят распределенный поиск в каталогах библиотек объединения, предоставляющих программный интерфейс Z39.50. В этом случае, читатель, нашедший книгу, может знать, из какой библиотеки пришла эта запись, но для заказа книги придется обратиться в библиотеку напрямую, зарегистрироваться там лично и т.п. Кроме того, такие порталы имеют целый ряд объективных проблем (доступность, надежность и др.), характерных именно для распределенного варианта сервиса. Примером такого портала можно считать систему Сигла (http://www.sigla.ru/).

Основное отличие настоящей компоненты ЕНИП "Библиотечный отдел" от существующих систем — единая среда, в которой пользователю (читателю) предоставляется возможность, не обращаясь к конкретной одной библиотеке напрямую:

Система не является традиционной библиотечной системой (БС) и не конкурирует с многочисленными существующими системами. Взаимодействие происходит через использование массивов данных, накопленных в БС (через механизмы загрузки или распределенного поиска).

Организация распределения литературы в библиотечной сети БЕН РАН

В библиотечной сети БЕН РАН литература распределяется централизованно. Существует "центр обработки" (на данный момент совпадающий с центральным зданием БЕН в Москве на ул. Знаменка, 11/11), который анализирует ситуацию по всей сети БЕН, обслуживающей многие филиалы в центральном регионе РФ. Центр занимается анализом потребностей библиотек и научных институтов, собирает статистику и принимает решение о заказе той или иной литературы. Вся пришедшая литература (за исключением отечественных журналов, выписываемых на адреса библиотек НИИ РАН) проходит (как физически, так и логически) обработку в центре: по всем позициям заказанного списка специалисты-библиографы составляют библиографические описания в соответствии с ГОСТ 7.1-2003, индексируют издания по УДК.

В дальнейшем поступившие книги (единицы хранения) распределяются по институтам, причем распределение в виде матрицы соответствия книга-институт-количество известно уже на этом этапе. При поступлении книг в библиотеку назначения (это может быть как какой-то удаленный филиал, так, в частном случае, Центральная библиотека — ЦБ, расположенная в центральном здании БЕН в Москве), каждая единица хранения проходит дополнительную обработку, в результате которой у нее появляется шифр хранения и другие данные, характеризующие конкретный печатный экземпляр. В случае если публикации — журналы, дополнительных сведений о единице хранения обычно не бывает, т.к. библиотеки обычно используют алфавитную расстановку журналов. Единственным фондом ЦБС БЕН РАН, который использует расстановку журналов по шифрам на данный момент является фонд ЦБ.

Полностью централизованное поступление литературы является идеальной моделью, на практике существует в некоторой незначительной степени еще и децентрализованное комплектование фондов библиотек филиалов литературой, поступающей в дар непосредственно в институты или закупаемой на внебюджетные средства института. Сведения об этой литературе передаются в ЦБ для включения в сводные каталоги.

Информационные потоки

Исходя из приведенной схемы поступления литературы, стоит отметить наличие 4 уровней порционного получения информации о книгах и журналах:

(1) "Публикации" — на верхнем уровне существует гарантированное централизованное создание корректных библиографических описаний каждой книги. Это полностью статическое поле — можно в первом приближении считать, что библиографические описания на существующие книги не изменяются, и эти сведения могут быть подвержены единовременной загрузке и длительному хранению при наличии центра хранения.

(2) "Единицы хранения с точки зрения закупок / распределения" — уровень, на котором известна информация о том, какая публикация уровня (1) связана с какой библиотекой и сколько экземпляров нужно будет учитывать в БД, но еще не известна инвентарная информация, которая будет присвоена позже. Эта информация также статична — однажды утвержденные планы распределения литературы не изменяются.

(3) "Единицы хранения с точки зрения библиотеки" — уровень, когда по поступлении литературы в библиотеку назначения становятся известны ее инвентарные данные, в том числе шифр хранения и прочие данные, необходимые для заказа литературы в этой библиотеке. Эту информацию также можно либо считать условно-статичной — измениться она может только при утере/списании конкретной книги, что можно отразить в статусе (4), либо не передавать в центральное хранилище вообще (т.к. это внутренняя информация библиотеки, нужная только на этапе заказа).

(4) "Статус единицы хранения" — когда книга обработана и поступила в библиотеку, каждая единица хранения приобретает некий статус — наиболее динамичный параметр, которые нет смысла передавать в централизованное хранилище.

Стоит обратить внимание на отдельный вопрос передачи информации между уровнями (1)-(2) и (3)-(4), т.е. между центром обработки и филиалами. На уровне (1) уже создаются записи о публикациях с некими идентификаторами, а на уровне (3) создается запись о единице хранения, в которой должна присутствовать ссылка на такой идентификатор. Возможны следующие варианты действий:

Инсталляции

Можно выделить 3 уровня инсталляций ЕНИП с точки зрения библиотечной компоненты:

1. Низкий уровень — индивидуальные инсталляции ЕНИП в библиотеках / научных институтах, комплектуемых БЕН РАН. Эти инсталляции являются источниками информации уровня (3), поставляя ее в центральную инсталляцию библиотечной компоненты 2.

2. Средний уровень — инсталляция ЕНИП в центре обработки / центральном книгохранилище БЕН РАН — enip.benran.ru. Принимает статические данные от библиотек (уровень (3)), и, в свою очередь, передает на высокий уровень данные уровня (1). Является точкой входа и взаимодействия со всеми библиотеками для пользователя, который не просто интересуется библиографическими сведениями, а хочет произвести действие с определенной единицей хранения (заказать, скопировать, получить полный текст и т.п.)

3. Высокий уровень — портал enip.ras.ru, являющийся точкой входа для пользователя, который начинает работу с поиска публикации; имеет агрегированную базу публикаций со всех других порталов и возможность распределенного поиска.

Функциональные требования

  1. Для читателя:
  2. Читатель, заходящий на средний уровень (enip.benran.ru) должен иметь возможность с помощью библиотечной компоненты выполнять следующие действия (используя "средний уровень" как точку входа и, возможно, в дальнейшем передвигаясь по уровням):

    По построению системы, возможно 2 варианта: использование инсталляции ЕНИП в филиале в качестве основной системы работы с читателями и в качестве ведомой системы (когда основной каталог формируется и ведется в другой системе, например, уже существующей в библиотеке).

  3. Для библиотекаря

Для библиотекаря (ЕНИП — основная система)

Для библиотекаря (ЕНИП — ведомая система)

Литература

  1. Лаврик О. Л. Академическая библиотека в современной информационной среде. — Новосибирск: ГПНТБ СО РАН, 2003. — 250 с.
  2. П. М. Курив, Д., Котеров, Н. Е. Калёнов. Архитектура и функциональность Библиотечной Подсистемы ИСИР РАН. // Электронные библиотеки: электронный журнал (http://www.elibrary.ru), 2004. — том 7. — выпуск 1. — С. 1-15
  3. С. А. Власова, В. А., Серебряков, П. М. Курив, Н. Е. Калёнов. Библиотечная составляющая ИСИР РАН // Новые технологии в информационном обеспечении науки: Сб. статей под ред. Н.Е.Каленова. — М.: Биоинформсервис, 2001. — С. 24-32
  4. Калёнов Н.Е., Власова С.А. Б и блиотечная составляющая ИСИР РАН // Новые технологии в информационном обеспечении науки: Сб. статей под ред. Н.Е.Каленоваю — М.: Биоинформсервис, 2001. — С. 24-32
  5. С. А. Власова, В. А. Серебряков, А. Н. Бездушный, А. М. Меденников, Н. Е. Каленов. Подход к интеграции информационных коллекций В ИСИР РАН. // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. 2-я Всероссийская научная конференция. Сб. докладов. — М., 2000. — С. 129-135
  6. Бездушный А.Н., Меденников А.М., Серебряков В.А., Власова С.А., Калёнов Н.Е. Подход к интеграции информационных коллекций В ИСИР РАН. // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. 2-я Всероссийская научная конференция. Сб. докладов. — М., 2000. — С. 129-135
  7. Бездушный А.Н., Кулагин М.В., Жижченко А.Б., Серебряков В.А., Каленов Н.Е., Бездушный А.А. Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН. // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. VI Всеросс. науч. конф. Труды. — М., 2004. — С. 277-284
!34

ЗАДАЧА РЕАЛИЗАЦИИ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ “НАУЧНОЕ НАСЛЕДИЕ РОССИИ” КАК РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ.

Нестеренко А.К., Сысоев Т.М., Погорелко К.П.
(МСЦ РАН)

Аннотация

В статье описывается распределенная архитектура электронной библиотеки “Научное наследие России”. Рассматриваются вопросы подготовки, размещения и хранения электронных версий книг. Описывается реализация центрального WEB-портала электронной библиотеки, как единой точки доступа к ресурсам электронной библиотеки, указывается его место в рамках распределенной системы. В конце статьи рассматривается задача интеграции ресурсов электронной библиотеки в Единое Научное Информационное Пространство РАН.

Введение

Электронная библиотека “Научное наследие России” разрабатывается в рамках одноименной программы Президиума РАН с целью обеспечения сохранности и предоставления публичного доступа к научным трудам известных российских и зарубежных ученых и исследователей, работавших на территории России. Также некоторые из подсистем электронной библиотеки (системы хранения и представления электронных изданий конечным пользователям) создаются в рамках программы Президиума РАН “Информатизация”. Общая координация и управление проектом осуществляется Межведомственным суперкомпьютерным центром (МСЦ) РАН. Задачами подготовки электронных изданий и сопровождающей информации для размещения в хранилище данных электронной библиотеки занимаются ведущие библиотеки РАН, среди которых БАН, БЕН (Центральная библиотека и ее отделения), ИНИОН.

Второй важной задачей является интеграция существующих библиотечных ресурсов в Единое Научное Информационное Пространство (ЕНИП) РАН и обеспечение возможности централизованного доступа к ресурсам существующих хранилищ электронных изданий и метаданных об ученых и их научных трудах. Данная задача решается путем определения единой инфраструктуры распределенной системы, унификации форматов данных и протоколов взаимодействия компонентов системы, разработки единых регламентов подготовки и сопровождения электронных изданий. Рассмотрим более подробно общую архитектуру электронной библиотеки.

Общая архитектура электронной библиотеки

Электронная библиотека “Научное Наследие России” представляет собой техническое решение и методологию для обеспечения эффективного процесса предоставления электронных изданий трудов ученых в сети Интернет. Система изначально ориентирована на распределенную архитектуру, в которой источники данных (хранилища электронных книг и метаданных) могут быть распределены территориально.

На следующей диаграмме приведена общая архитектура распределенной системы электронной библиотеки и схема ее интеграции в ЕНИП РАН:

Рис. 1. Архитектура Электронной Библиотеки “Научное наследие России”

Основные архитектурные составляющие системы представлены:

Серверы хранения электронных изданий предназначены для хранения оцифрованных текстов бумажных изданий и дополнительных метаданных об их структуре (оглавления, номера страниц и т.д.). Они обеспечивают хранение электронных версий книг и предоставляют авторизованный доступ к ним внешним системам и пользователям. Они также обеспечивают надежное хранение размещаемых изданий (за счет выполнения резервного копирования данных) и предоставляют средства автоматизации размещения на серверах электронных версий книг.

Для сопровождения размещаемых в библиотеке электронных изданий необходимыми метаданными (информация об авторах, библиографические данные и т.д.) были разработаны унифицированные форматы метаданных об ученых и их научных трудах. Для хранения и сопровождения этих метаданных в распределенной инфраструктуре электронной библиотеки служат сервера метаданных, которые обеспечивают хранение и сопровождение метаданных об ученых и их трудах в унифицированном формате, а также обеспечивают эффективный поиск и предоставление хранимых метаданных внешним системам и пользователям.

Центральный диспетчерский сервер поддерживается с целью исключения дублирования работ при оцифровке изданий и контроля за состоянием и сроками их обработки. Он обеспечивает ввод и редактирование данных об изданиях, находящихся в обработке, предоставляет статистические данные об изданиях, вводимых в электронную библиотеку. В его задачу также входит предоставление по запросу справок об этапах обработки конкретного издания.

Центральный Web-портал электронной библиотеки “Научное Наследие России” осуществляет консолидацию данных, полученных с серверов метаданных, в рамках централизованного репозитория, обеспечивая, таким образом, централизованный доступ к ним пользователей. Взаимодействуя с серверами хранения электронных изданий, он является единой точкой доступа к электронным версиям научных трудов.

Центральный портал поддерживает взаимодействие с центральным узлом ЕНИП РАН[4,6], обеспечивая передачу хранимых метаданных в центральный узел и участвуя в процессе распределенного поиска по ЕНИП.

В описанной распределенной архитектуре задачи подготовки метаданных к выгрузке их в репозиторий центрального Web-портала, автоматизированного контроля подготовки и размещения электронных изданий в хранилищах электронных книг (функции серверов метаданных и центрального диспетчерского сервера) решаются за счет использования специализированного программного обеспечения SCIRUS[1,2] (http://scirus.benran.ru/scirus), созданного разработчиками БЕН РАН.

Задача непосредственного размещения электронных изданий на серверах хранения, включая программное обеспечение самих серверов, а также автоматизация этапов подготовки описателей размещаемых электронных книг (описание оглавлений, дополнительные поисковые индексы) решаются сотрудниками МСЦ РАН в рамках программы Президиума РАН “Информатизация”. Вторая задача, решаемая в рамках МСЦ РАН, это разработка центрального Web-портала, обеспечивающего централизованный доступ к ресурсам библиотеки и интеграцию ее в ЕНИП РАН. Рассмотрим более подробно решение выделенных задач.

Подготовка, размещение и хранение электронных изданий

Хранилище электронных книг позволяет размещать оцифрованные копии (полные тексты) научных трудов, которые могут быть представлены:

Помимо непосредственного отсканированного текста каждая оцифрованная книга сопровождается дополнительным набором метаданных в виде XML-файла [11], задающего структуру (оглавление книги). Данный файл (описатель электронной копии) может включать ключевые слова по разделам и страницам издания для поддержки поискового образа документа. Структура описателя электронной книги:

Одним из наиболее важных процессов, автоматизируемых в рамках электронной библиотеки, является процесс подготовки электронных изданий к размещению на серверах хранения, который имеет следующий набор этапов [7]:

Задачи подготовки метаданных и контроля подготовки электронных изданий, как было сказано выше, решаются центральным диспетчерским сервером и серверами метаданных. Для автоматизации этапов процесса, на которых производится первичная обработка (очистка от дефектов сканирования) страниц электронных изданий, а также подготовки оглавлений электронных книг (этапы 4-7) используется программное обеспечение, разработанное в библиотеке Математического института РАН [3], являющейся отделом БЕН РАН. Данное программное обеспечение позволяет:

Само хранилище электронных книг представлено файловым сервером, обеспечивающим надежное хранение страниц электронных изданий в структуре каталогов, а также обеспечивающим периодическое резервное копирование данных. Одной из важных задач, решаемых сервером хранения электронных книг, является обеспечение безопасного и авторизованного доступа к нему внешних систем и пользователей с использованием протокола HTTP [12].

Поскольку на текущий момент сервер хранения электронных изданий работает в демонстрационном режим, то к нему обеспечен публичный доступ и реализованы базовые механизмы управления пользователями и их правами. В дальнейшем планируется развитие программного обеспечения сервера в сторону повышения безопасности доступа к хранимым электронным изданиям.

Центральный Web-портал электронной библиотеки

Централизованный доступ пользователей к ресурсам электронной библиотеки осуществляется посредством пользовательских интерфейсов центрального Web-портала электронной библиотеки “Научное наследие России”, демонстрационная версия которого доступна по адресу http://nasledie.enip.ras.ru.

Центральный Web-портал допускает работу в пользовательском (открытом) и административном режимах. Пользовательские интерфейсы портала обеспечивают следующий набор функций:

В административном режиме центральный Web-портал позволяет выполнять:

Одной из наиболее важных задач, решаемых центральным Web-порталом, является централизованный доступ как к электронным версиям научных трудов, так и к сопровождающим их метаданным.

Для централизованного хранения метаданных Web-портал поддерживает стандартный для систем, интегрированных в ЕНИП РАН, формат загрузки и выгрузки данных на базе стандарта RDF/XML [13]. Консолидация метаданных об ученых и их научных трудах в рамках центрального Web-портала осуществляется посредством выгрузки подготовленных к размещению данных с серверов метаданных в формате RDF/XML с последующей их загрузкой в репозиторий портала.

Доступ к электронным версиям книг осуществляется посредством взаимодействия с хранилищами электронных изданий по протоколу HTTP. При этом очень важной задачей является предоставление пользователям удобного интерфейса навигации по страницам и разделам электронной книги. В части работы с оцифрованными изданиями центральный Web-портал позволяет осуществлять:

Интеграция электронной библиотеки в ЕНИП РАН

Задача Единого Научного Информационного Пространства РАН заключается в формировании распределенной среды, включающей в себя информационные системы различных институтов РАН и позволяющей обеспечить интегрированный взгляд на хранимые в них информационные ресурсы. Возможность получения такого обобщенного взгляда во многом обусловлена решением задачи формирования единого набора метаданных, описывающих как базовые предметные области научной деятельности людей, так и допускающих расширение в сторону конкретной специализации научной деятельности [4].

Помимо представления унифицированного обменного формата данных, в рамках инициативы ЕНИП Вычислительным центром (ВЦ) РАН в рамках проектов при поддержке РФФИ 2004-2006 года было создано программное обеспечение, позволяющее разрабатывать информационные порталы научных институтов РАН и обеспечивать их взаимодействие в рамках унифицированных протоколов обмена данными ЕНИП [5,6]. На текущий момент существует 15 действующих узлов ЕНИП РАН, расположенных в ведущих российских научных организациях и институтах, и один центральный узел ЕНИП. Центральный узел ЕНИП, с одной стороны, обеспечивает сбор и централизованное хранение данных с других узлов ЕНИП для организации эффективного поиска, с другой стороны, являясь единой точкой доступа в ЕНИП, он позволяет осуществлять распределенный поиск ресурсов по актуальным данным репозиториев входящих в ЕНИП информационных систем.

Центральный Web-портал электронной библиотеки “Научное наследие России” реализован с использованием описанных выше технологий и включен в качестве узла в ЕНИП РАН. Тем самым обеспечена возможность предоставления доступа к данным электронной библиотеки широкого круга пользователей и информационных систем в рамках унифицированных обменных форматов ЕНИП, что значительно расширяет состав целевой аудитории системы.

Заключение

В рамках работ над проектом 2006 года прототип Web-портала электронной библиотеки “Научное Наследие России” введен в эксплуатацию в открытом доступе, произведены базовая загрузка данных и размещение нескольких отсканированных книг. Особое внимание было уделено решению организационных вопросов подготовки и сопровождения материалов электронной библиотеки.

К ближайшим перспективам развития подсистем хранения и предоставления централизованного доступа к ресурсам электронной библиотеки в рамках работ 2007 года можно отнести:

Литература

  1. Сенько А.М. Информационная система SciRus: принципы построения и перспективы развития // Научный серис в сети ИНТЕРНЕТ: технологии параллельного программирования. Всероссийская науч. конф. Новороссийск, сент. 18-23, 2006. — М, 2006. — С. 58-59.
  2. Якшин М.М. WEB-интерфейс системы "Наука России" // Современные технологии в информационном обеспечении науки: Сб. науч. тр. под ред. Н.Е.Каленова. — М., 2003. — С. 47-52.
  3. Вопросы создания полнотекстовой базы данных в библиотеке Математического института им. В.А.Стеклова РАН // Современные технологии в информационном обеспечении науки: Сб. науч. тр. под ред. Н.Е.Каленова. — М., 2005. — С. 270-274.
  4. Бездушный А.А., Бездушный А.Н., Серебряков В.А., Филиппов В.И. Интеграция метаданных Единого Научного Информационного Пространства РАН // Монография. /ВЦ РАН — М., 2005. — С. 238.
  5. Bezdushny A.A., Bezdushny A.N., Nesterenko A.K., Serebriakov V.A., Sysoev T.M. Integrated System of Information Resources of the Russian Academy of Sciences // The 8th World Multi-Conference on Systemics, Cybernetics and Informatics SCI 2004, Orlando, Florida. — 2004. — P. 462-467.
  6. Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А., Сысоев Т.М. Возможности технологий ИСИР в поддержке Единого Научного Информационного Пространства РАН // Электронные библиотеки: перспективные методы и технологии, элек-тронные коллекции: Труды VI всероссийской научной конференции. /Институт математических проблем биологии РАН. — М., 2004. — C.254-262.
  7. Нестеренко А.К., Данилина А.А., Сысоев Т.М., Бездушный А.Н., Серебряков В.А. Автоматизация процессов интеграции распределенных информационных ресурсов // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды VIII всероссийской научной конференции. /Ярославский государственный университет им. П.Г. Демидова. — Суздаль, 2006. — С. 279-290.
  8. Tagged Image File Format (TIFF) // http: //partners.adobe.com/asn/developer/PDFS/TN/TIFF6.pdf
  9. DjVu digital document format // http://djvu.org/
  10. Portable Document Format (PDF) // http://www.adobe.com/
  11. Extensible Markup Language (XML) // http://www.w3.org/XML/
  12. RFC2616 — HTTP/1.1 Specification // http://www.w3.org/Protocols/rfc2616/rfc2616.html
  13. RDF/XML Syntax Specification // http://www.w3.org/TR/
!35

УПРАВЛЕНИЕ ЭЛЕКТРОННЫМИ ВЕРСИЯМИ ТЕЗАУРУСОВ

Онищук А.А.
(МГУ)

В настоящее время наиболее общим средством описания структуры информации является классификация информационных объектов с помощью таксономий. В частности, таксономия всегда лежит в основе любой онтологии. Однако часто в информационной системе необходимо использовать таксономии, реализованные как хранимые данные, а не как часть онтологии. Например, при тематической классификации ресурсов в научных информационных системах, когда размеры таксономий достигают десятков тысяч понятий, а сам состав понятий может меняться со временем.

Наиболее общей формой таксономии является тезаурус. Для описания какой-либо предметной области всегда используется определенный набор терминов, каждый из которых обозначает или описывает какое-либо понятие или концепцию из данной предметной области. Тезаурус — совокупность терминов, описывающих данную предметную область, с указанием семантических отношений (связей) между ними. Заметим, что кроме классификации других ресурсов, тезаурус может быть создан и использоваться как самостоятельная база знаний, показывая место тех или иных понятий в предметной области (см., например, [2]). В данной работе рассматривается организация терминов определенной предметной области в тезаурусы этих предметных областей для более удобного и полного восприятия пользователями их структуры, а также для последующего индексирования терминами тезаурусов информационных ресурсов.

В работе анализируются существующие стандарты на представление тезаурусов [4, 5]. Эти стандарты представляют тезаурус в виде набора объектов нескольких типов, между которыми может быть несколько типов связей. На основе проведенного анализа, делается выбор стандарта для реализации системы управления тезаурусами.

Для удовлетворения потребностей пользователей при работе с источниками информации, собранной в форме тезаурусов, необходимо создание автономной системы поддержки, поиска, просмотра и редактирования электронных версий тезаурусов, представленных в удобной для этого форме. Создаваемая система должна включать в себя различные компоненты администрирования, поиска, навигации и просмотра создаваемых тезаурусов. Благодаря однотипной структуре тезаурусов, классификаторов и плоских словарей, проектируемое программное средство должно уметь работать с любой из перечисленных структур терминов.

Исходя из сложившейся ситуации в области хранения и использования информационных ресурсов наиболее перспективным на сегодняшний день, с точки зрения построения распределенных приложений в сети, является подход Semantic Web [3] и используемые им технологии. Целью работы явилось создание современной, удовлетворяющей требованиям стандартов построения тезаурусов и технологий Semantic Web cистемы.

Для реализации системы была разработана соответствующая стандартам и требованиям Semantic Web модель данных, включающая в себя классы для реализации плоских словарей, классификаторов и тезаурусов. Классификаторы и плоские словари, очевидно, являются всего лишь частным случаем тезаурусов в том виде, в котором они представлены в стандартах ГОСТ 7.25-2001, ISO 2788-1986, Z39.19-1993.

Реализация рассматриваемой в работе системы разработана в рамках платформы ИСИР [1]. Для приобретения богатой функциональности полноценного веб-приложения ИСИР, мы расширили его объектную схему данных классами своей модели.

Итак, были выделены следующие классы для построения системы:

Так как одной из целей нашей работы была возможность создания тезауруса (пусть и с заранее определенной функциональностью) через пользовательский интерфейс, мы должны предусмотреть это в нашей модели. Все классы словарей, классификаторов и тезаурусов являются наследниками вышеописанных классов. Для создания какой-либо таксономии в нашей системе необходимо наличие соответствующего класса схемы данных. Для их создания через пользовательский интерфейс были реализованы классы “шаблоны”: UniversalThesaurusConcept, UniversalThesaurusTerm, UniversalClassifierConcept, UniversalVocabularyTerm.

Итак, наша реализация тезауруса в информационной системе ИСИР обладает следующими функциональными возможностями и особенностями:

  1. Позволяет осуществлять просмотр (навигацию) по тезаурусу, а также атрибутивный поиск терминов по тезаурусу. То есть обеспечивается эффективное выполнение необходимых для этого запросов, а именно:
  1. Позволяет осуществлять администрирование тезауруса, а именно, предоставляет следующие функции администрирования:

Является расширяемой. То есть допускает детализацию, при необходимости, некоторых связей, а также добавление новых типов связей через интерфейс редактирования плоского словаря этих связей.

Интерфейс просмотра тезаурусов реализован в виде навигации по остовому дереву дескрипторов конкретного тезауруса. Это один из наиболее удобных пользователю способов отображения полииерархической структуры. Вместе с тем, такой способ автоматически позволяет осуществлять полную навигацию по дереву классификатора и по совокупности терминов плоского словаря.

Литература

  1. А.Н. Бездушный, А.Б. Жижченко, М.В. Кулагин, В.А. Серебряков Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек // Программирование 26. — № 4. — 2000. — С. 177-185.
  2. А.А. Муромский, Н.П. Тучкова О тезаурусе для предметной области "Обыкновенные дифференциальные уравнения". — ВЦ РАН. — 2004. — ISBN 5-201-09851-0.
  3. Semantic Web project [HTML] (http://www.w3.org/2001/sw/).
  4. ISO2788: Guidelines for establishment and development of monolingual thesauri, 2nd ed., Geneva: ISO1986. [HTML] (http://www.collectionscanada.ca/iso/tc46sc9/standard/2788e.htm).
  5. Описание и использование тезаурусов в информационных системах, подходы и реализация, М.Х. Нгуен, А.С. Аджиев [HTML] (http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2004/part1/NA).
!36

РАСПРЕДЕЛЕННАЯ ИСТОРИКО-ГЕОГРАФИЧЕСКАЯ СИСТЕМА С ПРИМЕНЕНИЕМ ТЕХНОЛОГИИ SW

И.А. Дьяконов, T.М. Сысоев
(ВЦ РАН)

Распределенность — одна из важнейших черт современных информационных систем. Совершенно очевидно, что информационные ресурсы даже одной узкоспециализированной предметной области не могут быть размещены в пределах одного вычислительного устройства. Поэтому необходимы методы и инструменты интеграции информации, которая распределена среди множества таких устройств. Также стоит отметить, что с увеличением объема информации все труднее и труднее становится ее обрабатывать и организовывать поиск нужной. На текущий момент, в основном, применяются методы поиска, основанные на поиске словоформ (с использованием морфологии, как в поисковых машинах). Очевидно, что такой подход более или менее применим для поиска текстовой информации человеком, но он неприемлем для машинной обработки. Для возможности машинной обработки и построения сложных, адекватных запросов необходимо знать понятия и связи между понятиями предметной области, то есть сама предметная область с достаточной детализацией должна быть формально описана. Подход Semantic Web (SW) решает, в том числе, и проблему формального описания предметной области (понятий, связей) в виде, пригодном для машинной обработки.

Semantic Web (SW) — это концепция эволюции World Wide Web (WWW) в Сеть, в которой каждый ресурс на естественном языке был бы снабжен описанием, понятным компьютеру. Таким образом, особое место в Semantic Web уделяется семантике данных. Изначально WWW не был рассчитан на машинную семантическую обработку, только люди могут понять семантику того или иного документа, но не машина. Подход Semantic Web позволяет формально описывать семантику данных для машины, чтобы данные, представленные в документе, были не только набором символов, но также и несли смысл, что позволит осуществлять вполне “разумный” поиск данных, логический вывод, и автоматизировать эти процессы. Также применение технологии SW позволяет осуществить интеграцию распределенных информационных ресурсов, описать формат обмена данными.

При взаимодействии со специалистами в области истории было решено апробировать подход SW для исторической предметной области, так как в силу сложности организации самой предметной области, этот подход, кажется, как нельзя лучше подходит для решения задач, возникающих у историков. С другой стороны, история тесно связана с географическими местами и, соответственно, зачастую ценность представляет сама визуализация тех или иных исторических данных. Специалисты, работающие в этой сфере, интересуются фактами и связывающими их закономерностями. Накоплен огромный исторический материал, который необходимо не только хранить, но и, что более важно, уметь обрабатывать и, по возможности, получать новые факты. Визуальное представление данных дает один из мощнейших подходов к пониманию и осмыслению информации. Таким образом, возникает естественное желание совместить следующие подходы: накопление, систематизацию и хранение исторических данных с географическим, наглядным их представлением. Географическое представление исторических данных является само по себе ценной и важной задачей.

Работа рассматривает применение технологии Semantic Web для создания распределенной историко-географической информационной системы, позволяющей работать с историческими сущностями и визуализировать историко-географические данные.

Сначала выполняется описание исторической предметной области при помощи OWL-онтологии. Онтология формально предоставляет описание сущностей (таких как персона, событие, место и т.д.) и указывает связи и свойства связей между этими сущностями. В итоге это поможет систематизировать информацию, определить (описать) ее семантику, отвечать на более сложные запросы пользователей более “разумными” ответами, чем при контекстуальном поиске. К тому же будет определен формат обмена уже семантически нагруженными данными в распределенной среде — в среде с разными источниками данных. После этого разрабатывается ГИС-компонента для визуального отображения тех или иных исторических данных на картах. Необходимость ГИС-компоненты обусловлена тем, что возникают задачи визуализации динамических изменений каких-либо значений (например, население городов) с течением времени.

Что касается геопространственных данных, то их, по ряду объективных причин, так же нельзя просто аккумулировать в одном месте. Поэтому изначально рассматривается ситуация с распределенными геопространственными данными (впрочем, как и распределенными историческими данными). Для получения сторонних геопространственных данных используется технология веб-сервисов. Так, например, не обладая информацией о границах государств, эту информацию можно получить, а затем использовать, благодаря существующим источникам данных, которые предоставляют ее посредством веб-сервисов. При этом можно автоматически делать выводы, например, о принадлежности городов тем или иным странам, первоначально не обладая такой информацией, что показывает связь между геопространственными и историческими данными.

Отличительной особенностью исторической информации является присутствие временного фактора. Время не может рассматриваться просто как свойство того или иного объекта в силу того, что само по себе может определять “продолжительность жизни” этого свойства.

На текущий момент подготовлена актуальная онтология исторической области, разрабатывается подсистема взаимодействия ГИС-компоненты с другими источниками геопространственной информации посредством веб-сервисов, а также вопрос интеграции существующих геопространственных данных с историческими данными. Идет работа над созданием визуального редактора запросов, который позволит конструировать в графической форме запросы к системе, основываясь на онтологической информации и геопространственных данных. Именно использование технологии SW и описание онтологии предметной области позволило вообще говорить о таком редакторе запросов, который, безусловно, удобнее, более гибок и понятнее стандартных методов описания запросов.

Литература:

  1. Semantic Web Activity. [http://www.w3.org/2001/sw]
  2. А. А. Бездушный, А.Н. Бездушный, А.К. Нестеренко, В.А. Серебряков, Т.М. Сысоев. Архитектура RDFS-системы. Практика использования открытых стандартов и технологий Semantic Web в системе ИСИР// Пятая Всероссийская научная конференция: "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" – RCDL’2003. - Санкт-Петербург - 2003.
  3. GeoServer. [http://www.geoserver.org]
  4. OpenHistory Project. [http://www.openhistory.net]
  5. RDF/XML Syntax Specification (Revised), W3C Recommendation, February 10, 2004, Dave Beckett, ed. [http://www.w3.org/TR/rdf-syntax-grammar/]
  6. What the Semantic Web can represent, 1998, Tim Berners-Lee. [http://www.w3.org/DesignIssues/RDFnot.html]
  7. OWL Web Ontology Language (Overview), W3C Recommendation, February 10, 2004, Deborah L. McGuinness, Frank van Harmelen, ed. [http://www.w3.org/TR/owl-features/]
  8. Visual Contextualisation of Digital Content. [http://www.vicodi.org/]
!37

О ПРОБЛЕМАХ АВТОМАТИЗАЦИИ ДЕЯТЕЛЬНОСТИ ДИССЕРТАЦИОННЫХ СОВЕТОВ

Теймуразов К.Б., Бездушный А.Н.
(ВЦ РАН)

В настоящей статье рассматриваются вопросы разработки информационной системы по автоматизации процессов, связанных с подготовкой диссертации, в частности с ее прохождением через диссертационный совет, и создание на ее базе единой системы “рабочих мест” соискателя, секретаря диссертационного совета, членов диссертационного совета, а также сопутствующих сервисов, например, библиотеки диссертаций.

Процесс защиты диссертации подчиняется положению о порядке присуждения ученых степеней [2], а деятельность диссертационного совета регламентируется положением о совете по защите докторских и кандидатских диссертаций [3]. Анализ этих документов показывает, что процесс прохождения диссертации через совет требует от лиц, участвующих в процессе (соискатель, ученый секретарь совета и другие), выполнить значительное количество различных операций по созданию типовых (“шаблонных”) документов.

Основной целью системы является создание “рабочего места” секретаря диссертационного совета, позволяющего контролировать ход подготовки и защиты диссертаций, проходящих через совет, а также автоматизирующего типовые операции.

Для достижения этой цели, в первую очередь, мы стараемся решить следующие задачи:

В основу архитектуры системы положен репозиторий данных, включающий в себя каталогизируемые материалы, шаблоны документов, данные о диссертационном совете и его членах, данные о соискателях, их диссертациях, а также ходе подготовки и рассмотрения диссертаций. Основной единицей хранения данных в репозитории является ресурс. В системе выделяется три основных типа ресурсов, которые специализируются на решении рассматриваемой задачи:

Для работы с ресурсами спроектированы следующие блоки: блок регистрации ресурсов; блок индексации и поиска информации; блок управления и контроля, ответственный за управление пользователями и правами на доступ к ресурсам; блок управления рабочими процессами.

При проектировании системы было принято во внимание существование электронной библиотеки диссертаций [1, 4], развитием которой, по своей сути, является разрабатываемая система. Электронная библиотека диссертаций разработана с целью формирования электронного банка диссертаций, а, следовательно, она содержит часть функциональности, необходимой для работы разрабатываемой системы.

Таким образом, реализация системы основана на расширении электронной библиотеки диссертаций с сохранением функциональности последней, и, следовательно, разрабатываемая система наследует возможность ведения каталога авторефератов и диссертаций и поиска по нему. При этом расширению подвергается само понятие “диссертация”. Если в электронной библиотеке диссертаций понятие диссертации включает в себя, в основном, набор атрибутов необходимых для ее поиска пользователями (автор, название, тема, ключевые слова), то в разрабатываемой системе термин “диссертация” уже отождествляется с процессом, результатом которого является подготовка и защита диссертации, за счет чего приобретаются дополнительные свойства, характерные этим процессам (сдача кандидатских экзаменов, отзыв, заключение и т. д.).

Система реализована в виде прототипа, который имеет следующую функциональность: каталог материалов, включающий в себя нормативные документы, информационные материалы совета (состав, календарь и тематика заседаний), сведения об авторефератах и диссертациях, включая их полные тексты, а также средства для поиска и редактирования материалов; блок управления рабочими процессами. Система обеспечивает разграничение прав доступа к информационным ресурсам и сервисам на основе ролей пользователей. Выделены три основные роли в системе: соискатель, секретарь диссертационного совета, член диссертационного совета.

Любой пользователь системы имеет доступ ко всей открытой информации, касающейся деятельности диссертационного совета. Соискатель также может инициировать рабочий процесс “защита диссертации”, после чего получает возможность отмечать вехи на пути к защите, и имеет возможность получить, на основе введенных им данных, ряд документов, необходимых при защите. Секретарь диссертационного совета дополнительно может отслеживать ситуацию по всем рабочим процессам “защита диссертации”, получать сводную статистику, на основе имеющихся данных получать документы, необходимые для работы совета, формировать календарь заседаний совета, рассылать уведомления соискателям и членам совета.

В настоящий момент закончено создание прототипа системы, который находится в опытной эксплуатации. Ведутся работы по установлению необходимых доработок системы, с целью ее дальнейшего внедрения в эксплуатацию.

Литература

  1. О. А. Лавренова, Н. Н. Литвинова Электронная библиотека диссертаций в РГБ // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. Междунар. конф. “Крым 2002” — Т. 1. — М.: Изд-во ГПНТБ, 2002. — С. 235-239.
  2. Положение о порядке присуждения ученых степеней. Утверждено постановлением Правительства Российской Федерации от 30.01.2002 № 74. Собрание законодательства Российской Федерации, 2002, N 6, ст. 580; 2003, N 33, ст. 3278; 2006, N 18, ст. 1997.
  3. Положение о совете по защите докторских и кандидатских диссертаций. Утверждено приказом Минобрнауки России от 09.01.2007 № 2.
  4. К. Б. Теймуразов Электронная библиотека диссертаций // Современные проблемы фундаментальных и прикладных наук. Часть VII. Управление и прикладная математика / Труды XLIX научной конференции. /Моск. физ. — техн. ин-т. — М. — Долгопрудный, 2007.
!38

БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ РЕСУРСЫ НА САЙТАХ НИИ РАН

Л.И.  Госина
(Библиотека Математического института им. В.А. Стеклова РАН – отдел БЕН РАН)

В обзорном докладе рассматриваются вопросы создания и организации общедоступных электронных полнотекстовых и библиографических БД, создаваемых в НИИ РАН.

Данная работа отражает современное состояние академических электронных ресурсов. Она является логическим продолжением темы "История Российской академии наук в документах", которая завершится в 2008 г. созданием общедоступной полнотекстовой базы данных (поддержана грантом РГНФ 07-01-12101в).

Основной целью просмотра сайтов было выявление круга ресурсов и участников, которых можно привлечь к созданию отраслевой информационной системы по математике. Специалисты, работающие в нашей библиотеке, считают своей первоочередной задачей создание отраслевой библиотечно-информационной системы для математиков РАН. Мы полагаем, что очевидна необходимость дополнить существующую академическую систему библиотечных ресурсов, универсальную или многоотраслевую по своей тематике, отраслевыми общедоступными библиографическими и полнотекстовыми ресурсами – в соответствии с тематикой Отделений РАН. Поэтому целями 2-го уровня в работе по изучению сайтов НИИ РАН были:

На этом этапе рассматривались сайты трех отраслевых отделений РАН: Отделения математических наук (19 НИИ), Отделения физических наук (31 НИИ) и Отделения энергетики, машиностроения, механики и процессов управления (23 НИИ без учреждений, находящихся под научно-методическим руководством отделения). Изучались:

Перейдем к обзору сайтов. Несмотря на разработку системы ИСИР, в настоящее время есть круг академических институтов, не представляющих информацию о себе в Интернете. Так, из просмотренных нами 73 институтов:

Таким образом, аналогично академическим библиотекам, институты РАН можно разделить на “создателей” информационных ресурсов (их пока меньше) и “пользователей”, не предлагающих собственной продукции. По моим подсчетам из 73 учреждений “пользователей” более 40, т.к. ряд НИИ лишь обозначает свое присутствие в информационном пространстве, вывесив список статей или отчетов за 2-3 года и не обновляя их уже более трех лет. Причем, от местоположения НИИ не зависит его информационная активность - и среди территориально удаленных, и московских, и петербургских институтов представлены все три группы.

Первые выборочные просмотры сайтов НИИ математического и физического отделений осуществлялись в 2005 г. и за 1,5 года у ряда институтов заметно возросла активность в создании собственных электронных БД в Интернете. Но эти работы ведутся в инициативном порядке, а следовательно - неравномерно, с недостаточной координацией и значительными пробелами в информации. Очень заметно, что нет общих подходов к решению важнейшего вопроса о границах общедоступного информационного обеспечения, поэтому равнозначные БД (например, “Трудов” НИИ) представлены на всех уровнях раскрытия текста: в виде оглавлений, рефератов, полных текстов. Даже издания одного института раскрываются по-разному: например, журнал ФИАН “ЭЛЛФИ” показывает полные тексты публикаций, а журнал “Краткие сообщения по физике” дает оглавления и аннотации (он переводится на английский язык издательством Allerton Press).

Пока еще не сложилось и четкое представление о разделении “зон информационной ответственности” между библиотеками, институтами и издательскими подразделениями РАН. Поэтому ряд институтских сайтов ссылается на свои библиотеки - например, С.-Петербургское отделение Математического института им. В.А. Стеклова (ПОМИ, (www.pdmi.ras.ru), показывая широкий круг ресурсов, в том числе - полнотекстовых. Другие дают ссылки на ресурсы НЭБ РФФИ и зарубежных консорциумов, называя их “библиотекой” – например, Институт радиотехники и радиоэлектроники им. В.А. Котельникова РАН ( www.cplire.ru), и при этом не приводят сведений о ресурсах библиотеки института. Третьи вообще не показывают этот уровень, предлагая лишь списки публикаций научных сотрудников, как, например, Институт математического моделирования РАН ( www.imamod.ru), причем, списки явно выполнены без участия библиотекарей. В данном случае ресурс плохо оформлен, но представляет информационную ценность, поскольку есть переход к полным текстам.

Ряд сайтов включает БД публикаций, поиск которых возможен лишь при точном знании части выходных данных или реквизитов хранения документа. Пример такого подхода есть на сайте Президиума РАН (http:www.ras.ru). Там представлен ряд личных архивов выдающихся ученых, без какой-либо описи, списка или иного перечня материалов, позволяющего ознакомиться с содержанием коллекции. Возможен только поиск конкретного документа, если специалисту известны его реквизиты. Такое решение существенно снижает поисковые и информационные возможности электронного архива, сужает сферу его применения в образовательных целях. Очевидно, что при работе над проектом с библиотекарями не консультировались – любой специалист указал бы на этот существенный недостаток еще на начальной стадии, хотя можно устранить его и сейчас. Эта ошибка – ориентированность поиска лишь на пользователей, знающих параметры публикации – повторяется на сайте ФИАНа, Института прикладной математики и др.

Очень разное отношение к показу собственной издательской продукции НИИ (как к монографическим, так и к сериальным изданиям): одни издатели дают свободный доступ даже к текстам последних публикаций, оперативно вывешивают информацию, в том числе, в рекламных целях – например, к таким издателям относится Математический Институт им. В.А. Стеклова РАН (www.mi.ras.ru); другие, например ВЦ РАН им. А.А. Дородницына (www.ccas.ru), даже не выделили на сайте это направление, хотя у них есть мощный издательский центр с многолетними традициями и большим объемом продукции. Их публикации очень выборочно представлены на сайтах отделов как труды конкретных сотрудников.

Рассмотрим круг представляемых информационных материалов, в первую очередь – отечественных, на сайтах НИИ РАН.

В отделении математики создан отраслевой портал Math-Net.RU, предназначенный для предоставления библиографической и полнотекстовой информации ученым РАН (размещен на сайтах Президиума и Математического института им. В.А. Стеклова). В настоящее время он нацелен на раскрытие содержания отечественных журналов, но также включает ресурсы головной библиотеки отделения (библиотека Математического института им. В.А. Стеклова), что дает дополнительные возможности поиска информации.

Математический институт им. В.А. Стеклова РАН, в котором действует научно-образовательный центр (НОЦ) по математике и математической физике. На сайте института (http:www.mi.ras.ru) представлены:

Полнотекстовые ресурсы:

С.-Петербургское отделение Математического института им. В.А. Стеклова (ПОМИ) на своем сайте (www.pdmi.ras.ru) представляет еще более широкий набор электронных ресурсов:

Институт вычислительной математики РАН (http:www.inm.ras.ru) имеет общую библиотеку с Математическим институтом им. В.А. Стеклова. На своем сайте институт представил электронную библиотеку публикаций своих сотрудников, организованную двумя способами (есть кнопки “публикации” и “библиотека”). По кнопке “публикации” возможен авторский поиск на библиографическом и реферативном уровнях, а во втором – поиск конкретной работы по списку оцифрованных публикаций с получением полного текста различного качества. В библиотеку включены книги, статьи в отечественных и зарубежных журналах, научные отчеты, препринты и другие материалы.

Институт прикладной математики им. М.В. Келдыша РАН (ИПМ им. М.В. Келдыша) (Москва) активно работает над созданием электронных ресурсов. Еще 1,5 года назад на сайте (http:www.keldysh.ru) была представлена только библиотека препринтов: библиографическое описание публикаций и аннотации, в т.ч. на английском языке. В настоящее время библиотека включает каталог публикаций сотрудников института, препринты, статьи, технические отчеты, авторефераты, монографии, сборники, отчеты по проекту, в том числе 620 полных текстов работ (по состоянию на июнь 2007 г., и их количество постоянно увеличивается). Но поиск по каталогу не очень удобен для внешних пользователей. Также с сайта есть вход:

Институт математики им. С.Л. Соболева СО РАН (http:www.math.nsc.ru) открыл со своего сайта доступ к:

Как видно из обзора, полнотекстовые отечественные электронные журналы, монографии, статьи, научные отчеты и другие ресурсы представлены на сайтах НИИ достаточно широко, но хронологический охват, актуальность, а особенно доступность и сервис для внешних пользователей существенно различаются. Поэтому нужно показать, как по-разному институты решают вопросы доступа к информационным ресурсам:

Институт кристаллографии им. А.В. Шубникова РАН (ns.crys.ras.ru) помимо ресурсов библиотеки показывает свою издательскую продукцию, причем странным образом: показаны обложки книг, но нет библиографического описания, аннотаций, оглавлений, не говоря уже о текстах. Сведений об изданиях явно недостаточно для научной ссылки или оперативного поиска и приобретения. Цель создания такого ресурса не вполне ясна, правда, можно сосчитать изданные институтом монографии за несколько лет. А ресурсы библиотеки представлены очень хорошо, и в них есть раздел, который обязательно должен быть представлен на сайтах центральных библиотек. Это раздел с профессиональной информацией, причем есть тематические полнотекстовые подборки.

На сайте Института астрономии РАН (http:www.inasan.rssi.ru) представлены профессиональные справочники и энциклопедии, а также внешняя электронная библиотека Физтеха, предназначенная для выпускников этого вуза. В ней представлены отечественные полнотекстовые ресурсы, но свободного доступа к ним нет. От библиотеки есть ссылки к целому ряду других отечественных хорошо наполненных ресурсов, в т.ч. справочных, а также к поисковым системам. Есть ресурсы, редакторы которых называют свое имя – в данном случае это известный автор математических справочников, полные тексты которых есть в системе. Удобно, что пользователь может сам предложить новые ссылки и неизвестные ресурсы, которые считает полезными.

ФГУП “ГНЦ РФ Институт теоретической и экспериментальной физики” (http:www.itep.ru) не показывает библиотечных ресурсов, но дает ссылки на Интернет-ресурсы. Среди них есть та же библиотека Физтеха и уже перечисленные ссылки, но также создан он-лайновый сервис для разнообразной работы с текстом (переписка, переводы, орфографические и толковые словари и т.д.), представлен объемный он-лайновый справочник по математике, организованный по рубрикам. Среди ссылок есть тематический портал по математике для специалистов разного уровня – от школьной математики до фундаментальной

Нужно напомнить о таком важном источнике информации, как персональные страницы ученых на сайтах институтов. Пока их относительно немного: на сайте Математического института им. В.А. Стеклова личные страницы есть 20% ученых, но лишь 1/3 содержат информацию. Приведу 2 характерных примера организации персональных страниц:

У доктора физико-математических наук И.Я. Арефьевой (физика по специальности) это личный сайт с несколькими страницами, на которых есть биографические сведения, информация об учениках, библиография работ с аннотациями и сведениями о ссылках и отсылки к полным текстам в зарубежных архивах и БД (например, к статьям в Лос-Аламосском архиве). Таким образом, персональная страница дополняет библиотечную информацию новыми, особенно зарубежными публикациями, в том числе - полнотекстовыми, отсутствующими в библиотеке.

У академика РАН, президента Московского Математического общества, лауреата медали Филдса и самого цитируемого ученого России В.И. Арнольда на персональной странице лишь библиографический уровень доступа к информации. Он привел биографические сведения о себе, о своих научных достижениях и минимальный список наиболее важных, с его точки зрения, публикаций (всего их существенно более 300).

Как показал обзор, типо-видовой состав академических ресурсов очень разнообразен: отечественные публикации включают монографии, сборники, труды конференций, научные отчеты, справочные издания и учебную литературу, авторефераты диссертаций, препринты, брошюры, статьи из сборников и сериальных изданий. Электронные издания представлены журналами и ежегодниками, сериальными изданиями и разнообразными библиотеками.

Сайты НИИ РАН содержат информацию для комплектаторов и библиографов, позволяя находить новую отечественную литературу для фонда, в том числе – электронные полнотекстовые издания, а также сверять каталоги библиотек на наличие лакун.

Заметное количество отечественных информационных ресурсов в Интернете, уже организованных по тематике, а иногда - по видам научной деятельности и уровню знаний, дают возможность библиотекам на новом уровне создавать систему информационного обеспечения науки и содействовать образовательной работе НИИ РАН.

Но значительный объем и разнообразие решений, а также постоянный количественный рост профильных ресурсов требуют решать этот вопрос не на уровне специальных библиотек, у которых нет кадров и возможностей для постоянного мониторинга, а в рамках центральных библиотек РАН. Аналогично прежним библиографическим отделам, нужно создавать группы электронной библиографии, которые будут заниматься мониторингом отечественных ресурсов по отраслям знания. Они помогут библиотекам сети в информационной работе и расширят отраслевые порталы на сайтах центральных библиотек, создав отраслевые указатели отечественных ресурсов. Ученые смогут найти эту информацию как на сайтах центральных библиотек, например, БЕН РАН, так и библиотек отделений и научных центров РАН.

!39