!1!

Формирование и использование
электронных ресурсов в системе
БЕН РАН

Н.Е. Калёнов
(БЕН РАН)

Библиотека по естественным наукам (БЕН) РАН, одной из первых библиотек в бывшем Советском Союзе, начала работу с электронными ресурсами, когда в конце 70-х годов БЕН РАН была включена в число разработчиков программы по созданию "Государственной автоматизированной системы научно-технической информации". В 1978 году в Библиотеке была установлена ЭВМ ЕС-1022 и, начиная с 1979 года, БЕН приступила к информационному обслуживанию сотрудников институтов РАН, библиотеки которых входят в её централизованную систему, в режиме ИРИ по базам данных (БД) на магнитных лентах, получаемых из ВИНИТИ.

К середине 80-х годов БЕН РАН получала из ВИНИТИ на магнитных лентах более миллиона записей (рефератов публикаций по всем разделам естественных наук) в год и обслуживала около 40 институтов РАН. Система ИРИ имела второй контур - пользователь, ознакомившись с рефератом, имел возможность в автоматизированном режиме заказать копию заинтересовавшей его статьи; заказ выполнялся БЕН РАН в течение недели после поступления. Предварительно он формировался и распечатывался на ЭВМ в соответствии с принятыми правилами. Кроме того, система ИРИ предусматривала обязательный возврат данных обратной связи, которые обрабатывались и анализировались в автоматизированном режиме. Результаты анализа использовались для корректировки запросов абонентов, а также для оптимизации подписки на журналы для БЕН и библиотек её сети. Таким образом, БЕН РАН выполняла функции распределительного (обслуживающего) информационно-библиотечного центра для ученых РАН в области естественных наук. Эти функции Библиотека продолжает выполнять и сейчас, но уже на качественно другом уровне.

В 1986 году БЕН РАН, первой библиотекой в стране, начала работу с базой данных Science Citation Index (SCI) на CD-ROM, а затем с базой данных Current Contents, которая в настоящее время поступает в Библиотеку через Интернет по протоколу FTP; информация в этой БД существенно опережает поступления отраженных в ней журналов. В настоящее время Библиотека имеет один из наиболее полных в стране комплектов SCI (с 1996 года по текущий момент) и еще около 50-ти наименований БД на CD-ROM, которые она предоставляет пользователям в специально оборудованном классе. Несколько десятков НИИ РАН обслуживаются в режиме ИРИ по БД Current Contents.

Развитие вычислительной техники позволило существенно усовершенствовать автоматизированную систему БЕН (АС НАУКА). В настоящее время вся информация, поступающая в централизованную библиотечную систему (ЦБС) БЕН, проходит автоматизированную обработку и отражается в электронных каталогах. Программные средства, обеспечивающие автоматизацию библиотечной технологии и поддержку электронных каталогов, разработаны специалистами БЕН и внедрены не только в Центральной библиотеке, но и во многих её отделениях в институтах РАН.

Появление сети Интернет открыло новые возможности для библиотек как центров информационного обеспечения науки. С 1996 года БЕН РАН участвует в проектах, связанных с работой в сети Интернет, поддерживаемых Российским фондом фундаментальных исследований, Российским гуманитарным научным фондом и фондом Дж. Сороса. Подключение БЕН РАН к Интернет обеспечило возможность создания в Библиотеке сервера (http://ben.irex.ru), что позволило использовать Интернет как для совершенствования внутренней библиотечной технологии, так и для предоставления удаленным пользователям доступа к ресурсам Библиотеки. В этой связи Интернет позволяет существенно повысить уровень информационного обеспечения ученых и специалистов, особенно работающих на периферии и не имеющих возможностей посещать центральные научные библиотеки.

Одной из основных задач БЕН РАН является максимальное раскрытие фондов её ЦБС для пользователей, поэтому значительное внимание в Библиотеке уделяется формированию системы электронных каталогов. В настоящее время каталоги ЦБС БЕН РАН доступны для читателей внутри БЕН и пользователей Интернет. При разработке и развитии новых информационных технологий БЕН РАН поддерживает постоянную "обратную связь" с пользователями - сотрудниками НИИ РАН, стремясь в максимальной степени следовать их пожеланиям в направлении повышения уровня сервиса. Исходя из таких пожеланий, БЕН поддерживает, как в локальной сети, так и в Интернет, два вида каталогов - журнальный и книжный. Такой подход вызван принципиальным отличием работы сотрудников РАН с информацией об этих видах изданий - в большинстве случаев пользователь постоянно следит за определенными журналами, и ему необходимы средства для максимально быстрого получения информации именно об этих журналах; при работе же с каталогом книг пользователь зачастую знает их названия приблизительно, или вообще ищет издания по тематике и отдельным словам.

Сводный электронный каталог журналов, поступающих в сеть БЕН РАН, доступный в локальной вычислительной сети ведется с 1990-го года. Он содержит, наряду с библиографическими сведениями о журналах, информацию о том, в какие библиотеки какие выпуски журналов поступили.

Каталог журналов, доступный через Интернет, отражает все поступившие в ЦБС журналы, начиная с 1993-го года издания. Пользователь Интернет с помощью стандартных средств ("броузеров" типа Internet Explorer или Netscape Communicator) может просматривать каталог в алфавитном либо тематическом режимах. В алфавитном режиме просмотр ведётся по трем уровням (алфавит - латиница и кириллица, алфавитный список журналов на каждую букву, описание журнала). В тематическом режиме просмотр ведется по специальному предметному рубрикатору журналов БЕН. Просмотр возможен по четырем уровням (рубрики, подрубрики, список журналов на каждую подрубрику в алфавитном порядке, описание журнала). Описание журнала, наряду с основными библиографическими сведениями (название журнала, страна издания, ISSN, есть шифр хранения БЕН РАН), содержит информацию о поступивших томах и номерах журнала по годам издания.

В настоящее время многие издательства отражают на своих сайтах оглавления выпускаемых ими журналов и предоставляют доступ через Интернет к полным текстам статей. Необходимо отметить, что если оглавления журналов предоставляются, в большинстве случаев, бесплатно любому пользователю Интернет, то доступ к электронным версиям полных текстов имеют, в основном, библиотеки, выписывающие данный журнал в печатном виде. В последнее время в мире развивается практика объединения библиотек в консорциумы. Консорциум заключает соглашения с издательствами, в соответствии с которыми он выписывает определенное количество наименований журналов в печатном виде, а издательство предоставляет каждой входящей в консорциум библиотеке доступ ко всему массиву выписанных журналов. Это расширяет возможности доступа к журналам и обеспечивает экономию средств библиотек.

БЕН РАН является членом нескольких консорциумов и имеет доступ к электронным версиям журналов ведущих научных издательств мира. Стремясь повысить уровень сервиса для своих пользователей, БЕН поставила задачу формирования электронного журнального комплекса, включающего каталог журналов, поступивших в ЦБС БЕН, ссылки на оглавления журналов, которые, в свою очередь, содержат ссылки на их электронные версии. Этот проект реализуется при поддержке РФФИ. В настоящее время к каталогу БЕН РАН подключены оглавления и полные тексты порядка 1000 наименований зарубежных журналов. Актуальность этих ссылок постоянно контролируется сотрудниками БЕН. Для исправления и выявления ошибок на страницах журнального каталога организована обратная связь с пользователями.

Сводный электронный каталог книг и продолжающихся изданий (серии, труды различных организаций и обществ, материалы конференций) ЦБС БЕН РАН существует в локальном варианте с 1994-го года. Для обеспечения доступа к нему через Интернет разработан специальный программный комплекс, позволяющий работать пользователям с каталогом через стандартные "Интернет-броузеры". Он позволяет проводить в каталоге развитый поиск и получать необходимую информацию на экране компьютера в формате стандартных библиографических описаний. Если данное издание находится в фонде Центральной библиотеки, то указывается его шифр (шифры) хранения.

Пользователь Интернет, впервые работающий с электронным каталогом, может ознакомиться с подробным его описанием, перейдя по гиперссылке "HELP". Кроме того, на первой странице каталога имеется краткая инструкция по формированию запросов.

В 2000 г. в БЕН РАН установлен сервер Z 39.50 (разработка специалистов ОИГГиМ СО РАН) и шлюз, позволяющий обеспечивать работу с ним через стандартные Интернет-броузеры. Это позволило предоставить пользователям возможность одновременного поиска информации в каталогах различных библиотек, где установлены подобные сервера.

Зарегистрированные пользователи (в первую очередь, коллективные абоненты - партнеры БЕН по системе межбиблиотечного абонемента - МБА) могут заказать нужные им материалы или их копии из фондов ЦБС БЕН через Интернет. Система заказа литературы предоставляет пользователю три режима работы: формирование заказа из каталога журналов, из каталога книг и без использования каталогов.

Режим заказа без использования каталогов необходим в том случае, если требуемое издание не содержится в электронных каталогах, так как поступило в фонды БЕН до начала их ведения.

Учитывая пожелания пользователей - сотрудников НИИ РАН, в БЕН реализована система информирования через Интернет о новых поступлениях книг и журналов - на сервер БЕН еженедельно загружаются указатели поступлений книг в виде двух серий - "Поступления в Центральную библиотеку" и "Поступления в библиотеки институтов РАН" и указатели поступлений журналов в виде двух массивов - "Журналы отечественные, стран СНГ и Балтии" и "Журналы других стран".

Развивая направление, связанное с информационным обеспечением научных исследований, БЕН РАН поддерживает на своем сайте специальный раздел "Естественные науки в Интернет", который, в свою очередь, имеет два подраздела - "Стартовые точки" и "Научная периодика в Интернет". Первый из них содержит сведения об организациях (со ссылками на их сервера), поддерживающих информацию о сайтах по основным разделам естественных и точных наук (математика, физика, химия, биология, науки о Земле), а также по экологии.

Раздел "Научная периодика в Интернет" содержит краткие сведения о серверах (с гиперссылками), поддерживающих сводную информацию о журналах (например, на сайт The Internet Directory of Publications, содержащий информацию о 150 000 журналов, газет и других периодических изданий), на электронные библиотеки, отдельные электронные журналы по естественным наукам.

Информация в разделе "Естественные науки в Интернет" постоянно актуализируется сотрудниками БЕН.

В течение последних лет БЕН РАН работает над проектом "Наука России", поддерживаемым Российским фондом фундаментальных исследований, целью которого является разработка типовых программных средств для создания сводной базы данных по публикациям сотрудников РАН, основой которой являются картотеки трудов сотрудников, ведущиеся в традиционном виде в библиотеках институтов РАН. Разработанный в рамках проекта локальный комплекс установлен во многих библиотеках НИИ РАН, которые ведут на его основе БД трудов своих сотрудников. Центральный комплекс системы обеспечивает слияние БД и возможности поиска информации через Интернет.

В настоящее время на сервере БЕН представлены две базы данных - "Труды сотрудников БЕН РАН" и "Труды сотрудников ИОХ РАН". Причем к первой из них подключены файлы изображений и полных текстов публикаций.

Перспективы развития электронных ресурсов БЕН РАН связаны с организацией системы электронной доставки документов, формированием полнотекстовой электронной библиотеки, содержащей наиболее важную для пользователей информацию; развитием системы общедоступных библиографических баз данных. Кроме того, специалисты БЕН РАН принимают участие в разработке библиотечной составляющей Интегрированной системы информационных ресурсов РАН, предполагающей предоставление пользователям разносторонней библиографической и полнотекстовой информации.

!2!

Информационная поддержка научных
исследований электронными ресурсами
ВИНИТИ

В.А. Цветкова
(ВИНИТИ)

Работа выполнена в рамках проекта РФФИ № 01-07-90103

ВИНИТИ - крупнейший информационный центр России, основан в 1952 г. с целью улучшения информационного обеспечения ученых и специалистов. За пятьдесят лет своего существования ВИНИТИ не изменил своей задаче, несмотря ни на какие сложности, имевшие место в экономике страны в последние 10 лет. Ежегодно ВИНИТИ обрабатывает более одного миллиона документов, поступающих из 100 стран мира на 60 языках.

Этот поток лежит в основе подготовки баз данных ВИНИТИ, Реферативного журнала, который издается в печатной и электронной формах, ряда других информационных продуктов.

Безусловно, на информационные продукты и услуги (ИпиУ) ВИНИТИ оказали непосредственное влияние современные информационные технологии, развитие телекоммуникаций, возможности, реализуемые благодаря Интернет. В последнее десятилетие наряду с традиционными печатными изданиями, в первую очередь Реферативным журналом, ВИНИТИ активно предлагает на информационном рынке новые электронные информационные продукты, а именно:

Банк данных ВИНИТИ с ретроспективой более 20 лет доступен для проведения поиска в on-line режиме через сеть Интернет. Базы данных ВИНИТИ предлагает на любых носителях, в том числе и с использованием электронной доставки.

С 1995 г. ВИНИТИ стал предлагать своим подписчикам Реферативный журнал в электронной форме для пополнения фондов разного рода библиотек, то есть для формирования "ЭЛЕКТРОННЫХ" библиотек.

Создавая электронную форму Реферативного журнала ВИНИТИ, разработчики не стремились внести какие-либо кардинальные изменения в содержание и привычную форму представления материала. Скорее наоборот, учитывая инертность потребителя, сохранили привычную форму представления материала, но предоставили подписчикам новые возможности по поиску, просмотру, созданию кумулятивных (сборных) изданий, обусловленные возможностями новых информационных технологий.

Сегодня ЭлРЖ - аналог печатного издания по наполнению и порядку расположения разделов и данных, снабжен общепринятыми для информационных изданий механизмами поиска документов и доступа к ним. Такая форма представления информации очень удобна для традиционных пользователей ВИНИТИ: научных институтов, крупных библиотек, привыкших к печатным вариантам РЖ.

Достоинства ЭлРЖ состоят в том, что:

Работа с электронным РЖ позволила во многом отработать элементы, присущие электронной торговле: заказ поступает по электронной почте, сам продукт отправляется по электронной почте - нет только системы электронных платежей - в этом беда нашей российской системы расчетов.

В результате анализа спроса на РЖ ВИНИТИ в электронной форме по различным тематическим направлениям за период с 1995 по 2000 год можно отметить, что спрос на электронные РЖ распределяется следующим образом: Биология - 25%; Химия - 15%; Автоматика и радиоэлектроника - 12%; Физика - 8%; Экономика промышленности - 8%; Электротехника и энергетика - 8%; Машиностроение - 5%; Механика - 4%; Транспорт - 4%; Геология и горное дело - 4%; География и геофизика - 3%; Металлургия - 3%; Астрономия - 1%.

Среди потребителей ЭРЖ можно выделить следующие категории:

Наблюдения за динамикой заказов на ЭлРЖ показывают, что к середине 2001 г. установился довольно устойчивый круг потребителей, имеющих динамику к расширению. Такую же динамику, но менее активную, имеет круг приверженцев баз данных и поиска в on-line режиме. Таким образом, на информационном рынке группа потребителей, тяготеющая к электронным формам информационных продуктов и услуг, становится все более многочисленной. Наблюдается ситуация, при которой рост/падение реализации проходит как бы синхронно у печатной и электронной версии. Это позволяет сделать вывод, что потребители этих двух форм все-таки разные. На настоящем этапе эти формы не конкурируют между собой, а скорее взаимно дополняют друг друга.

К настоящему времени объемы предоставления электронных версий изданий составляют 12-15% от печатных. Следует отметить, что опыт ВИНИТИ отражает общемировую тенденцию, которая показывает, что на настоящем этапе рынок электронных продуктов и услуг в сфере научной и технической информации составляет 12-15% от печатного. Видимо сказывается присущая этой сфере рынка приверженность к традиционным формам представления информации, а так же то, что носителя, аналогичного бумаге по удобству и комфортности для человеческого восприятия, пока нет.

Электронные продукты связаны с новым поколением потребителей, сформировавшимся в условиях информатизации общества, доступности компьютеров, получившим "вкус" работы в Интернет.

Одним из доминирующих факторов становится оперативность доставки информации, будь то результаты поиска в базах данных, электронные журналы или копии первоисточников. Именно этот параметр стал катализатором в развитии специального направления в деятельности информационно-библиотечных служб, которое получило название электронная доставка документов (ЭДД). Эта направление начало развиваться в рамках работ библиотек и информационных центров по обслуживанию копиями первоисточников. Появление новых информационных технологий, основанных на использовании средств оцифровки текстов и их последующей передачи средствами телекоммуникаций вывело эти работы в число первоочередных направлений, на котором сосредоточено внимание мировых информационно-библиотечных служб. Такие службы создаются как библиотеками, так и коммерческими службами. Наиболее известны службы электронной доставки документов UMI (США), EBSCO (США), BLDSR (Великобритания). Большой опыт накоплен в ИНИОН, ГПНТБ СО РАН, РГБ.

Для ВИНИТИ развитие этого направления имеет особое значение, так как копии первоисточников являются той целью, к которой стремятся потребителя, проведя поиск в базах данных или читая Реферативный журнал.

В 2001 г. ВИНИТИ в тесном сотрудничестве с ведущими библиотеками и информационными центрами (РГБ, ИНИОН, БЕН РАН, ГПНТБ СО РАН) начал при поддержке Российского фонда фундаментальных исследований (РФФИ) реализацию проекта "Разработка распределенной системы электронной доставки документов из фондов информационных центров и библиотек России".

Проект имеет целью повышение оперативности и полноты информационного обеспечения ученых и специалистов на основе распределенной системы электронной доставки документов из фондов библиотек и информационных центров. Посредством Интернет-технологий пользователям должна быть предоставлена возможность прямого доступа к информационным ресурсам, передачи заказов и получения копий интересующих документов в электронном виде независимо от места их нахождения.

В ходе работы над проектом предстоит решить ряд проблем, связанных с разработкой самой автоматизированной распределенной корпоративной системы, согласованием формата заказов, методики распределения и исполнения заказов участниками системы и пр. Кроме того, участники системы уже на начальном этапе столкнулись с рядом проблем, без решения которых работа системы такого рода не может стать в полной мере легитимной. В числе их можно указать:

В рамках названного проекта делается попытка решить не только технико-технологические проблемы создания распределенной (корпоративной) системы электронной доставки документов, но и проработать вопросы взаимодействия участников системы, включая взаиморасчеты и оптимизацию размещения заказов, а также обосновать правовые аспекты деятельности системы. Это позволит существенно повысить оперативность и уровень информационного обеспечения научных исследований.

!3!

Вопросы каталогизации сетевых
информационных ресурсов

Ю.Е. Поляк
(Центральный экономико-математический институт РАН)
polak@cemi.rssi.ru

Первые хорошие онлайновые каталоги (классификаторы) Интернет-ресурсов появились в середине 90-х годов, когда, собственно, и возникла необходимость ориентироваться в уже значительном объеме накопленной информации. Как известно, начало разработки Yahoo! (Yet Another Hierarchical Officious Oracle) относится к 1994 г., когда стенфордские аспиранты Д. Фило и Д. Янг поняли, что их не устраивает ни один из имевшихся к тому времени каталогов (сейчас, летом 2001-го, оба они замыкают форбсовский список миллиардеров - http://www.forbes.com/2001/06/21/billionairesindex.html). По тем же причинам в 1995 г. в ЦЭМИ РАН мы начали работу над каталогом русскоязычных ресурсов, который позже получил известность под названиями "Ау!" и @Rus [1,2]. В хронологический обзор Е. Горного [3] из каталогов попал он один - очевидно, потому, что более ранние проекты (достаточно полные подборки адресов в Ижевске, Геленджике, Москве и нескольких американских университетах) не получили дальнейшего развития. С тех пор появились сотни каталогов - и универсальных, и специализированных, и многие из них имеют отчетливые следы влияния "Ау!".

Как известно [2,4,8], для поиска информации в больших массивах данных используются два основных метода. Один из них - поиск на основе каталога ресурсов. Он является более эффективным, если пользователь хорошо представляет себе предметную область интересующих его материалов - тогда, выбрав определённый раздел, он получит ресурсы только по необходимой тематике. При заполнении такого каталога вручную специалисты описывают ресурсы и распределяют их по рубрикам, что требует больших трудозатрат и не всегда обеспечивает необходимую полноту и актуальность данных. Метод контекстно-атрибутного поиска позволяет отыскать необходимый документ по словам или атрибутам, характеризующим интересующую тему. При этом результат поиска сильно зависит как от правильности выбора ключевых слов, так и от качества работы поисковой машины. Результат поиска, как правило, содержит много ссылок на ресурсы, не относящиеся к нужной тематике.

Можно встретить немало текстов, где делаются попытки раз и навсегда решить вопрос, что лучше - каталоги или поисковые машины (search engines). При этом отмечается, что поисковые машины индексируют миллионы документов, а скорость актуализации их баз данных намного превосходит возможности живых редакторов. Но такая масса данных вряд ли полезна пользователю, особенно если нужные сведения находятся на какой-нибудь 35-й странице. С другой стороны, именно скрупулезная (пусть и более медленная) ручная проверка ссылок, выполняемая специалистами, уменьшает количество "информационного мусора" в каталогах и позволяет точнее отвечать на запросы пользователя. Но и там не всегда легко найти нужную информацию - ведь любая, даже самая совершенная система классификации в значительной степени произвольна, и логика создания базы данных далеко не всегда совпадает с логикой поиска. Еще одна проблема любой классификации состоит в том, что чем она подробнее (то есть чем лучше она отражает многообразие классифицируемого материала), тем труднее в ней разобраться потребителю. С увеличением числа рубрик в каталоге возрастает и число пограничных ситуаций, когда ресурс с полным основанием можно отнести к двум-трём (а то и больше) рубрикам. Если же рубрик слишком мало, списки из сотен аннотаций по одной теме становятся труднообозримыми. Именно структура рубрикатора во многом определяет качество каталога.

Следует также иметь в виду, что для каталогов сетевых ресурсов вряд ли подойдет стандартная библиотечная классификация с детально проработанными названиями разделов. Ряд из них, например, "Объемное деформирование. Прокатка, прессование, выдавливание, волочение и другие виды обработки давлением" (УДК 621.77) или "Детали машин. Механизмы. Передачи (механические). Подъёмно-транспортное оборудование. Крепежные средства. Смазка" (УДК 621.8) рискуют остаться пустыми. В то же время ни в одном УДК или ББК вы не найдете понятия "сервис-провайдер", "интернет-магазин" или "веб-дизайн", но именно этим заголовкам соответствуют тысячи записей. Немногим может помочь и международная классификация видов деятельности (International Standard Industrial Classification of all Economic Activities - ISIC, (http:// www.ilo.org /public/ english/bureau/stat /class/isic.htm), где позиции одного и того же иерархического уровня несопоставимы по информационному наполнению - например, 16 (производство табачных изделий), 55 (отели и рестораны), 64 (связь и телекоммуникации), 80 (образование), 85 (здравоохранение и социальные услуги).

Еще одно замечание по поводу средств поиска и пользовательских предпочтений. Лет 15-20 назад, на заре массовой компьютеризации, обсуждались различные способы организации диалога с компьютером. Традиционный вариант, основанный на использовании клавиатуры ("think and type"), постепенно вытеснялся более дружественным для массового пользователя интерфейсом с применением мыши ("see and point"). Применительно к навигации в Интернете запрос поискового контекста соответствует работе с клавиатурой, а мышь удобна для перемещения по иерархии и ссылкам каталога - в соответствии со вкусами и привычками пользователей.

Для решения указанных выше проблем часто применяют комбинированную технику поиска. Наблюдается своеобразная конвергенция каталогов и поисковых систем, когда они приобретают лучшие черты друг друга [5]. Ограничение области поиска определенной тематической категорией экономит время поиска и в то же время повышает релевантность его результатов. Тщательный ручной мониторинг встроенного каталога в сочетании с быстрым автоматическим обходом сайтов, выполняемым поисковыми роботами, обеспечивает высокую степень соответствия запроса и результата.

Подобные примеры можно без труда найти и в отечественном сегменте Интернета и за рубежом. С 1997 года поиск в каталоге "Ау!" можно было выполнять с помощью встроенной поисковой системы "Апорт!", а сейчас этот каталог интегрирован в поисковую систему. Популярность поисковой системы Rambler во многом определяется системой рейтингов Rambler Top100, фактически представляющей собой каталог ресурсов. Упоминавшийся каталог Yahoo! тоже обзавелся системой поиска, при этом последовательно приобретались лицензии таких известных поисковых систем как AltaVista, позже HotBot и Google - лучших на текущий период. В свою очередь, Hotbot и AltaVista года два назад включили в состав услуг поиск по Yahoo-подобным каталогам (directories).

Ярким примером такого рода может служить и новый каталог компании Яndex - разработчика одноименной поисковой системы, лидирующей на отечественном рынке. Этот проект также направлен на повышение релевантности при поиске Интернет-ресурсов. Работа над каталогом началась в конце 1999 года. Наш коллектив совместно со специалистами Яndex разработал концепцию каталога и принципы классификации, выполнил первоначальное наполнение базы данных и обучение редакторов. В основу был положен ряд совершенно новых решений. Одно из основных - применение своеобразной многомерной рубрикации. В каталоге Яndex поиск можно вести не только по теме, но и по другим признакам - географическому региону, источнику и адресату информации, сектору экономики. Во многих ситуациях важно отличать официальные данные от публикаций прессы, частных суждений. Точно так же различны материалы, предназначенные коллегам и единомышленникам, либо инвесторам и спонсорам, либо произвольной аудитории (как товары в продовольственном магазине). Новый каталог позволяет уточнять поиск в соответствии с этими и многими другими критериями. Такой принцип построения каталога (он называется фасетным) применен в Интернете впервые.

Тематическое дерево каталога сделано максимально простым. На верхнем уровне в нем всего 12 тематических рубрик, а число уровней в глубину не превышает четырех. На любом уровне можно сузить список сайтов по любому из признаков. Например, в каталоге Яndex легко найти все благотворительные (некоммерческие) организации, работающие с детьми в Нижнем Новгороде (используются признаки: тема + регион + сектор экономики), юридические услуги для организаций (используются признаки: тема + адресат) или чаты, посвященные современной музыке (используются признаки: тема + источник информации). Сайты в каталоге отсортированы по индексу цитирования - числу упоминаний данного сайта в Интернете.

Новый каталог естественно интегрирован с поиском Яndex. Каталог и поиск рассматриваются как равноправные и дополнительные вещи. Если вспомнить аналогию с мышью и клавиатурой применительно к поиску и каталогу, то здесь пользователю предоставлены обе возможности навигации и удобный переход от одной к другой.

Еще одна особенность каталога: для лучшей организации обработки запроса пользователю уже на титульной странице предлагается выбрать вид деятельности из наиболее популярных вариантов - "купить", "почитать", "поиграть", "пообщаться", "скачать". Ссылки ведут соответственно к электронным магазинам, библиотекам, чатам и т.д. К началу лета 2001 г. в каталог Яndex помещено более 40000 российских интернет-ресурсов, что соответствует примерно 300 тысячам единиц описания в обычном каталоге.

Известны и другие примеры, когда поисковая система может выполнять кластеризацию результатов поиска. Так, Northern Light в ответ на конкретный запрос о неанглоязычных пользователях сети предложила свыше 8 тысяч ссылок, динамически объединенных в 12 категорий, среди которых были, в частности, "психология обучения", "латиноамериканский рынок" и "управление музеями". В данном случае наиболее подходящий по смыслу раздел "очерки о Сети" содержал 12 ссылок. Разумеется, подобные решения, дающие возможность ограничить поиск нужными категориями, предоставляют пользователям дополнительные удобства.

Между тем продолжают появляться новые решения и в жанре "традиционных" каталогов. В первой фразе этого текста говорится о "хорошем" каталоге. Это понятие довольно субъективно, у многих есть собственное представление о том, что это такое. Как считают авторы нового, динамично развивающегося каталога "Вирталог" (http://www.virtalog.ru), хороший каталог должен быть

Такой каталог, по замыслу авторов, представляет собой сервис приложений, обеспечивающий персонализацию настроек и контента. Естественно, подобный проект требует значительных затрат и предъявляет высокие требования к профессионализму разработчиков.

В заключение - несколько слов о печатных изданиях каталогов отечественных Интернет-ресурсов. Ряд из них подготовлен тем же коллективом лаборатории сетевых информационных ресурсов ЦЭМИ, который разработал базу данных каталога "Ау!"/@Rus. Среди них - первый в стране справочник [6], а также два выпуска Russian Internet Directory [7], которые содержат соответственно 7 500 и 12 500 ссылок и до сих пор остаются наиболее полными печатными каталогами Рунета. Материалы из нашей базы вошли в "Желтые страницы Интернет" - фундаментальную серию издательства "Питер" (см. [8] и последующие выпуски). Последний проект лаборатории - серия "Навигатор российского Интернета" [9], выходящая в качестве приложения к журналуа "Информационные ресурсы России". Каждая книга "Навигатора" объемом 6-8 печатных листов содержит порядка тысячи аннотированных ссылок и по содержанию приблизительно соответствует одной из глав универсальных "Желтых страниц". В 1999-2001 годах опубликованы выпуски "Информация об информации", "Образование", "Медицина и здоровье", "Наука и техника", "Средства массовой информации", "Некоммерческие организации" и другие (о некоторых из них см. [10]). К сожалению, из-за небольшого тиража эти книги почти неизвестны потенциальным читателям (подпиской занимается ответственный секретарь журнала "Информационные ресурсы России" В.К. Шарова, shr@rosinf.ru, телефон в Москве 456 7065).

Литература

  1. В.В. Куликов, Ю.Е. Поляк. Каталог русскоязычных ресурсов Интернет "Ау!" // Тезисы докладов Всероссийской научно-методической конференции "Телематика'98" (http://risbank.spb.ru/risbank2/tm98/152.htm).
  2. О.В. Парахина. Системы поиска информации в российском Интернете// Тезисы докладов Всероссийской научно-методической конференции "Телематика'99" (http://risbank.spb.ru/tm2000/info/tm_paper_present_99.php?Proj_ID=4010&Paper_ID=93).
  3. Материалы к истории русского Интернета // Российский Интернет: накануне больших перемен. - М.: IREX, 2000 (http://interpub.irex.ru/chrono.html).
  4. Yuri Polak. Internet in Russia, Russia in Internet // Online Information'98. 22nd International Online Information Meeting Proceedings. - London, 1998
  5. Yuri Polak. Information search in Russian Internet on the eve of 2000 // Internet: Technologies and Services, 1st International Conference and Exhibition - IEEE, October 1999
  6. Информационные ресурсы Интернет (энциклопедия "Технологии электронных коммуникаций" том 68). - М.; "Эко-Трендз", 1996
  7. Russian Internet Directory. - М.: МЦНТИ, 1997; 2-е издание - 1998
  8. Ю.Е. Поляк, А.В. Сигалов. Желтые страницы Internet'98. Русские ресурсы. - СПб: Питер, 1998
  9. Навигатор российского Интернета. - М.:МГЦНТИ, 1999-2001
  10. А.Н. Дыбенко. И новичкам, и специалистам // PC Week (Russian Edition) #13, 2000 (http://interpub.irex.ru/chrono.html).
!4!

Библиотечная составляющая ИСИР РАН

С.А. Власова, Н.Е. Калёнов
(БЕН РАН)
П.М. Курив
(ЦНТК РАН)
В.А. Серебряков
(ВЦ РАН)

В 1997 году руководством РАН было принято решение о развертывании работ по созданию Интегрированной Системы Информационных Ресурсов (ИСИР) РАН [1].

Основной целью разработки ИСИР РАН является объединение информационных ресурсов различного типа, имеющихся в учреждениях РАН, в единую систему, обеспечивающую их поддержку и предоставление пользователям Интернет. В основе концепции построения ИСИР РАН лежит современная технология открытых систем, предполагающая использование единой метаинформации, описывающей ресурсы различного типа.

Среди ресурсов, поддержку которых должна обеспечивать ИСИР РАН, значительная доля приходится на информацию, в той или иной мере связанную с публикациями научных результатов, с которой традиционно оперируют библиотеки разного уровня, входящие в состав институтов, отделений или непосредственно подчиняющиеся Президиуму РАН.

В связи с этим в состав ИСИР РАН, в качестве одной из основных компонент, была введена библиотечная составляющая (БС).

Информационные ресурсы, генерируемые и поддерживаемые в рамках БС ИСИР РАН, включают:

В процессе функционирования ИСИР РАН библиотечная составляющая должна выполнять следующие функции:

Для реализации перечисленных функций в процессе разработки ИСИР РАН решаются следующие задачи:

Включение библиотечных ресурсов в ИСИР РАН связано с определенной сложностью, обусловленной тем, что многие библиотеки (как центральные, так и институтские) уже длительное время работают в автоматизированном режиме и накопили значительные массивы электронной информации. Сюда относятся каталоги фондов, библиографические и реферативные базы данных, полнотекстовые электронные документы. При этом библиотеки используют различные программные средства и форматы представления данных, что существенно затрудняет интеграцию их информационных ресурсов в ИСИР.

С другой стороны, академические библиотеки накопили значительный опыт в разработке и поддержке автоматизированных систем и предоставлении электронной информации пользователям, в связи с чем они могут внести существенный вклад в создание ИСИР РАН. Исходя из этого, в 2000 г. к разработке Библиотечной составляющей ИСИР были привлечены специалисты отдела системных исследований и автоматизированной технологии БЕН РАН. В течение 2000г. были решены два комплекса задач. Первый связан с разработкой системы метаданных для описания библиографических ресурсов, второй - с разработкой алгоритмов и программ, обеспечивающих загрузку в ИСИР РАН данных из системы "Наука России" [2].

В качестве основы метаданных была выбрана схема DUBLIN CORE METADATA и язык XML в стандарте RDF [3]. Базовый набор элементов DUBLIN CORE был расширен за счет введения специальных квалификаторов, обеспечивающих идентификацию библиографических ресурсов. Поскольку ИСИР РАН ориентирована на работу с пользователями и не является технологической библиотечной системой, разработчиками была принята концепция, согласно которой профессиональную библиографическую обработку изданий библиотеки РАН осуществляют на базе существующих у них программных средств (при этом может использоваться детальное представление всех элементов библиографического описания, предусмотренное библиотечными форматами семейства MARC). Вся введенная в библиотеках информация загружается в ИСИР, однако при поиске ИСИР оперирует лишь ограниченным набором элементов данных - персоналии, имеющие отношение к публикации (авторы, редакторы и т.п.), авторские коллективы, даты публикации, стандартные номера ISBN и ISSN. Кроме поиска по этим элементам данных предусмотрен поиск по всем словам, (за исключением настраиваемого словаря "стоп-слов"), входящим в библиографическое описание документа в стандарте ГОСТ 7.1-84.

Система "Наука России", информацию из которой было решено загружать на первом этапе создания БС ИСИР РАН, разрабатывается специалистами БЕН РАН по гранту РФФИ (проект 99-07-90053) как типовая система, устанавливаемая в библиотеках НИИ РАН, обеспечивающая децентрализованную подготовку баз данных трудов сотрудников академических институтов. В настоящее время система установлена в библиотеках многих институтов, где накоплены, в общей сложности, десятки тысяч описаний публикаций. База данных системы включает 4 взаимосвязанные подбазы - персоналий (сведения о сотрудниках РАН - авторах публикаций), организаций (наименования, адреса академических учреждений, в которых работают сотрудники, включенные в подбазу персоналий), публикаций (описания публикаций на аналитическом уровне), источников (описания изданий на монографическом уровне и сводном уровнях).

В 2000 г. была разработана версия программного комплекса, обеспечивающего конвертирование информации из баз данных "Наука России" в согласованный формат "DC/XML/RDF". Подробная информация о ней приведена в [3]. Тестовый массив, полученный на основе обработки реальной базы данных, был загружен в ИСИР, однако возникла проблема эксплуатации системы в технологическом режиме, связанная с актуализацией информации. Ввод данных сотрудниками библиотек НИИ РАН в систему "Наука России" идет постоянно, загрузка данных в ИСИР РАН осуществляется периодически в пакетном режиме. Для полной идентификации ресурсов, загружаемых в ИСИР РАН, и исключения повторного ввода уже существующей актуальной информации возникла необходимость уточнения набора элементов данных.

Для ресурса "Публикации" добавлен идентификатор, вычисляемый на основе атрибутов данного ресурса по специальному алгоритму, разработанному в рамках системы "Наука России" (квалификатор значения поля Identifier - dcs.Hash).

Для всех типов ресурсов добавлено свойство modified - дата последней модификации ресурса. Дата в записях ресурсов имеет вид ГГГГ-ММ-ДД. В связи с тем, что записи баз данных "Наука России" не содержали даты модификации, была разработана специальная программа первоначального добавления дат во все записи уже существующих ресурсов. Обеспечение текущего ввода дат осуществляется путем специальной настройки программы ввода данных системы "Наука России".

При конвертировании данных системы "Наука России" в ИСИР РАН все записи ресурсов получают идентификационный номер, состоящий из трехсимвольного имени ресурса ("org", "per", "pub"), точки, двухсимвольного кода библиотеки, принятого в ЦБС БЕН РАН, и номера записи в соответствующей исходной подбазе данных.

Изложенные выше изменения были внесены в программу конвертирования данных системы "Наука России" в ИСИР РАН. Ниже приводится пример, содержащий две выгруженные публикации (статья из сборника и статья из журнала) с четырьмя различными персоналиями - авторами этих публикаций, и одной организацией, в которой они работают: (1) Калёнов Н.Е., Васильев А.В., Власова С.А., Глушановский А.В. Автоматизированная информационная система "Наука России". // Информационно-библиотечное обеспечение науки: Проблемы интеграции информационных ресурсов, 1995. - С.112-115 и (2) Власова С.А. Автоматизированная система обслуживания читателей научной библиотеки // НТИ. Сер. 1., 1993. - N. 2. - С.16-19.

Информация подготовлена БЕН РАН, код которой - hh.

В результате работы программы конвертирования формируется следующий текстовый файл:

<?xml version="1.0" encoding="ISO-8859-1"?>

<rdf:RDF xml:lang="ru"

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.0/"

xmlns:isir="x-isir.ras.ru:">

<!-- организации -->

<isir:organization rdf:about="x-ben.irex.ru:org.hhO305">

<isir:modified>2000-11-29</isir:modified>

<isir:orgname>Библиотека по естественным наукам РАН</isir:orgname>

<isir:orgabbr>БЕН</isir:orgabbr>

<isir:address zipcode="119890" city="Москва" rdf:value="ул. Знаменка, 11"/></isir:organization>

<!-- персоналии -->

<isir:person rdf:about="x-ben.irex.ru:per.hhP23">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Калёнов Н.Е.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/>

</isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP100">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Васильев А.В.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP498">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Власова С.А.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP504">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Глушановский А.В.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<!-- публикации -->

<isir:publication rdf:about="x-ben.irex.ru:pub.hhS317">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.s"/>

<isir:modified>2000-11-29</isir:modified>

<dc:Title> Информационно-библиотечное обеспечение науки: Проблемы интеграции информационных ресурсов</dc:Title></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhA317"><dc:Title> Автоматизированная информационная система "Наука России"</dc:Title>

<dc:Identifier rdf:parseType="Resource"><isir:vq

rdf:resource="x-ben.irex.ru:dcs.Hash"/><rdf:value>ИБОН=1995112</rdf:value></dc:Identifier>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP23"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP100"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP498"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP504"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.PartOf"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhS317"/></dc:Relation>

<isir:modified>2000-11-29</isir:modified>

<dc:Date>1995</dc:Date><dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Pages"/>

<rdf:value>112-115</rdf:value></dc:Description>

<dc:Language>ru</dc:Language></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhS348">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.s"/>

<isir:modified>2000-11-29</isir:modified>

<dc:Title> НТИ. Сер. 1.</dc:Title></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhM34819932">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.m"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.Serial"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhS348"/></dc:Relation>

<dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Issue"/>

<rdf:value>(2)</rdf:value></dc:Description><dc:Date>1993</dc:Date></isir:publication><isir:publication rdf:about="x-ben.irex.ru:pub.hhA348">

<dc:Title>Автоматизированная система обслуживания читателей научной библиотеки.</dc:Title><dc:Identifier rdf:parseType="Resource">

<isir:vq rdf:resource="x-ben.irex.ru:dcs.Hash"/>

<rdf:value>НТИС11993216</rdf:value></dc:Identifier>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP498"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.PartOf"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhM34819932"/></dc:Relation>

<isir:modified>2000-11-29</isir:modified>

<dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Pages"/>

<rdf:value>16-19</rdf:value></dc:Description>

<dc:Language>ru</dc:Language>

</isir:publication>

</rdf:RDF>

Таким образом, в настоящее время реализована возможность технологической загрузки данных, формируемых с помощью программного обеспечения системы "Наука России" в библиотеках НИИ РАН, не только на автономный WEB-сервер (см. http://195.178.196.201/N_r1.htm), но и в интегрированную систему информационных ресурсов РАН.

В заключение необходимо отметить, что БС ИСИР РАН будет играть важную роль в информационном обеспечении пользователей тогда и только тогда, когда её будет поддерживать специальная организационная структура, причем речь идет не о технической поддержке (что очевидно), а об информационной - необходимо постоянно контролировать актуальность и качество информации, циркулирующей в системе. Ввод и редактирование информации "на добровольных началах" сотрудниками РАН приведет к тому, что очень скоро система, с одной стороны, будет "замусорена" некорректными данными, а, с другой стороны, в ней будет отсутствовать важная информация.

С нашей точки зрения, организационная структура БС ИСИР РАН, обеспечивающая поддержку и сохранность информационных ресурсов, должна опираться на сложившуюся и успешно работающую в РАН систему научных библиотек. Последняя состоит из совокупности централизованных библиотечных сетей (ЦБС), каждая из которых возглавляется Центральной библиотекой (ЦБ) и объединяет библиотеки НИУ РАН по территориальному (СО РАН, Санкт-петербургский НЦ, УрО РАН и др.) или тематическому (БЕН РАН, ИНИОН) признакам.

Научная библиотека имеется в каждом НИИ РАН. Хотя взаимоотношения библиотек с институтами и ЦБ различны (какие-то библиотеки являются подразделениями ЦБ, какие-то - подразделениями институтов), все они в той или иной мере связаны с соответствующими ЦБ и институтами; многие сотрудники библиотек за последние годы накопили большой опыт работы с электронными информационными ресурсами.

Представляется целесообразным, чтобы в штат библиотеки каждого НИУ РАН был введен один сотрудник (с финансированием, позволяющим принять на работу достаточно квалифицированного специалиста - библиографа, имеющего опыт работы с компьютером на уровне пользователя) - локальный администратор БС ИСИР РАН, задачами которого должны являться формирование и актуализация информации, относящейся к данному НИИ. Этот сотрудник должен работать в тесном контакте с ученым секретарем и специальным сотрудником НИИ, отвечающим за поддержку узла ИСИР в данном институте. Соответственно, в каждой библиотеке должен иметься хотя бы один современный компьютер, обеспечивающий ввод данных в БС ИСИР (необходимо заметить, что во многих библиотеках компьютеры установлены, но подавляющее их число было передано библиотекам институтами "за ненадобностью" и они являются морально и физически устаревшими).

Для координации и методического руководства деятельностью локальных администраторов в каждой ЦБ создается "узел БС ИСИР" - небольшая группа специалистов - (от 2-х до 8-ми человек, в зависимости от количества "обслуживаемых точек"), в задачи которой входит установка и настройка программного обеспечения в библиотеках НИУ, разработка инструктивно - методических материалов, консультирование локальных администраторов, участие в развитии БС ИСИР РАН.

В бюджете РАН должны быть предусмотрены специальные средства на поддержку БС ИСИР РАН, которые должны расходоваться на заработную плату администраторов и поддержку технической базы.

Литература

  1. А.Н. Бездушный, А.Б. Жижченко, М.В. Кулагин, В.А. Серебряков. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек // Программирование, 2000, № 4. - C. 3-14
  2. Васильев А.В., Власова С.А., Глушановский А.В., Калёнов Н.Е. Система "Наука РОССИИ" и её использование в информационно-библиотечной технологии // Информационное обеспечение науки: новые технологии. Сб. науч. тр. - М. 1997. - С.86 - 88
  3. Бездушный А.Н., Власова С.А., Калёнов Н.Е. Меденников А.М., Серебряков В.А., Подход к интеграции информационных коллекций В ИСИР РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. 2-я Всероссийская научная конференция. Сб. докладов. (Сентябрь, 26-28, 2000. - Протвино). - М., 2000. - С. 129-135
!5!

Новое направление в информационном обеспечении сельхознауки.

М.А. Аветисов, Е.В. Крамчанинов
(Центральная научная сельскохозяйственная библиотека - ЦНСХБ)
В.И. Стеллецкий
(Всероссийский научно-исследовательский институт информации и технико-экономических исследований агропромышленного комплекса - ВНИИТЭИагропром)

Центральная научная сельскохозяйственная библиотека является крупнейшей библиотекой в области сельскохозяйственной науки в России. Во времена ГСНТИ библиотека вместе с ВНИИТЭИагропром возглавляла сеть информационных органов научно-технической информации по сельскохозяйственной науке. Сеть благополучно прекратила свое существование. Тем временем появилась новая сеть - сеть Интернет. К сожалению, освоение этого нового явления научными учреждениями аграрного сектора, библиотеками и органами НТИ очень и очень далеко от желаемого. Но достаточно очевидно, что развитие Интернет приведет в скором времени в нашей области знаний к активному использованию ресурсов Интернет.

Поскольку сеть органов НТИ в сельском хозяйстве имеет весьма низкую активность, то в целях поддержки науки ЦНСХБ позволила себе взять некоторую часть работ, выполняемых ранее органами НТИ.

Первый шаг в направлении создания для пользователей нового информационного библиотечного поля был сделан в 1999 году выпуском реферативного журнала "Ветеринария". С тех пор библиотека подготовила еще ряд журналов. В настоящее время выходят журналы "Ветеринария", "Экологическая безопасность в АПК", "Пищевая и перерабатывающая промышленность", "Экономика сельского хозяйства", "Инженерно-техническое обеспечение АПК". Планируется в конце года выпуск кумулятивного журнала "Ветеринария" за 2001 год на английском языке. Автоматизированная система подготовки РЖ обеспечивает появление рефератов в базе данных ЦНСХБ (Электронный каталог статей) раньше, чем выходит печатное издание. Одновременно с печатным изданием готовится и электронное издание на машиночитаемых носителях.

Исходя из важности пропаганды достижений отечественной сельскохозяйственной науки, ЦНСХБ взяла на себя роль депозитария отчетов по научным работам НИО Россельхозакадемии. Полные тексты отчетов (абсолютное большинство из которых, к сожалению, поступает в печатном виде) предоставляются пользователю Интернет и читателям библиотеки. Поиск осуществляется по полным текстам.

Библиотека начала выпуск электронного журнала по сельскохозяйственной тематике в помощь сельхозпроизводителю "Фермер", который также доступен пользователям Интернета.

Развитие информационных технологий и приобретенный опыт работы ЦНСХБ позволил сделать второй шаг - начать создание сельскохозяйственной электронной библиотеки знаний (СЭБиЗ). Библиотека создается при поддержке РФФИ. В значительной степени создание библиотеки сопряжено с возникновением и развитием информационно-консультационной службой по сельскому хозяйству, поддержанной министерством сельского хозяйства.

"Репертуар" электронной библиотеки включает на первом этапе кроме электронных каталогов и реферативной информации, как упоминалось выше, следующие разделы:

Каждый такой раздел, в дальнейшем именуемый информационными ресурсами (ИР) СЭБиЗ имеет, вообще говоря, свою структуру данных. Документы содержат текстовый материал, иллюстративные материалы (графику, фотографии), а в ряде случаев и фрагменты аудио и видеоматериалов. Документы могут содержат также и ссылки на соответствующие страницы в сети Интернет.

Данные, загружаемые в библиотеку знаний слабодинамичны. Будучи единожды введенными они практически не изменяются. Эта особенность данных позволила нам рассмотреть следующую схему предоставления данных пользователям.

Исходные данные вводятся, корректируются и обогащаются, например, при аналитико-синтетической обработке информации, в одну среду, например ISIS или SQL, а для предоставления их в доступ пользователям они перегружаются в другую среду, связную структуру HTML-страниц - базу данных информационно-поисковой системы.

Естественно, при таком подходе необходимо отдавать себе отчет, что к ИПС должны предъявляться достаточно жесткие требования, а именно:

В полной мере удовлетворяет этим требованиям ИПС "Артефакт", первая версия которой использована в ЦНСХБ для предоставления доступа к электронным каталогам. Система разработана специалистами информационного агентства "Интегрум-Техно". Как основа при создании СЭБиЗ используется следующая версия системы, которая позволяет работать с данными в HTML-формате.

ИПС "Артефакт" учитывает морфологию русского языка (а также английского, в версии ЦНСХБ, и ряда других европейских языков в полной версии), соотношение слов в предложении, обеспечивает возможность поиска в поименованных данных, обработку дат.

Синтаксический анализатор запроса (разработка ЦНСХБ) позволяет обеспечить для различных категорий пользователей различные режимы работы с системой от формирования запроса в свободной лексике (строгое или нестрогое словосочетание) до поиска с расширением запроса по тезаурусу, подключение перевода, использование лексики и кодов различных классификаторов и т.п.

Возможности, представляемые языком HTML, позволяют подключать модули для вызова динамически меняющихся данных из основных баз данных, в которые вводятся ИР.

Значительная часть материалов образуется в результате сканирования и распознавания печатной продукции. Поскольку поиск в СЭБиЗ обеспечивается по всему текстовому пространству электронной библиотеки, то существенным для отображения найденного документа является разумное его структурирование на фрагменты, выделение среди текста необходимых элементов типа фамилий авторов, аннотаций, оглавлений и т.п. Словари и справочники, загружаемые в электронную библиотеку, если они создаются на основе печатной продукции, требуют решения дополнительных проблем. Это разбиение на отдельные статьи, выделение заголовков статей, автоматическое распознавание ссылок на другие статьи. При вводе дореволюционных словарей возникают еще проблемы связанные с изменением грамматики и правописания русского языка. В настоящее время разметка текста ведется отдельно для каждого вида сканируемого материала, с целью максимального упрощения обработки при распознавании и разметке текстового материала. Преобразование каждого типа размеченного материала обеспечивается специализированными программными модулями. В дальнейшем предполагается перейти на разметку средствами языка XML.

Создание электронной библиотеки знаний в основном ориентировано на русскоязычного пользователя. Однако ЦНСХБ ведет значительную работу по интеграции справочных информационных ресурсов со странами Центральной и восточной Европы. Мы участвуем в проекте, проводимом Региональным отделением FAO SEUR(Food and Agricultural Organization Subregional Office for Central and Eastern Europe) по обмену информацией в области сельского хозяйства среди стран региона.

Для реализации данного проекта было организован рабочий семинар среди специалистов информационных технологий, которые работают преимущественно в библиотеках или сельскохозяйственных информационных центрах, который проходил в городе Нитра, Словакия. При поддержке международных организаций IAALD, NitraNet и FAO SEUR, был начат проект "AgroWeb CEE".

Проект предлагает помощь всем желающим в получении информации по всем вопросам сельского хозяйства. Это сведения о министерствах, библиотеках, информационных центрах, информация, касающаяся сельскохозяйственного образования и научно-исследовательских организаций в сфере агропромышленного сектора.

На последних рабочих совещаниях (Годолло, Венгрия, 1998 г.; Рим, Италия, 2000 г.) был выработан единый пользовательский интерфейс, единая структура представления данных.

В заключение следует отметить, что изложенные положения частично уже реализованы на сайте ЦНСХБ: www.cnshb.ru - раздел поиска в информационных ресурсах, www.cnshb.ru/akdil - энциклопедии, словари, организации и т.п., www.cnshb.ru/ aw/russian/ - AgroWeb Russian Federation.

!6!

Формирование информационного
наполнения электронной библиотеки
знаний

М.А. Аветисов, Е.В. Крамчанинов
(Центральная научная сельскохозяйственная библиотека - ЦНСХБ)
В.И. Стеллецкий
(Всероссийский научно-исследовательский институт информации и технико-экономических исследований агропромышленного комплекса - ВНИИТЭИагропром)

Информация, являющаяся объектом поиска в электронной библиотеке знаний оказывается весьма разнородной. Это и традиционные для библиотек электронные каталоги, содержащие библиографические описания данных, а в ряде случаев и достаточно объемные рефераты, это и полные тексты слабоструктурированных документов, это словари, справочники, данные об организациях, персоналиях и т.п. Документы могут содержать иллюстративные материалы - графику, фотографии, а в ряде случаев и фрагменты аудио и видеоматериалов. Документы могут содержать ссылки на соответствующие страницы в сети Интернет.

К сожалению, нет единообразного механизма формирования информационных ресурсов электронных библиотек. В настоящее время для традиционных библиотек наиболее продвинутой следует считать процедуру формирования электронных каталогов. Здесь отработаны форматы, имеется необходимое программное обеспечения для ввода, поддержки поиска и отображения соответствующих записей. Что касается других материалов, представляемых в электронных библиотеках, то здесь приходится решать целую серию задач, для обеспечения достаточно производительного и безошибочного ввода и преобразования данных к тем форматам, которые позволяют обеспечивать эффективный поиск и отображения информации.

Кроме вопроса оцифровки материала и распознавания в нем текста возникают вопросы разбиения текста на части, именования этих частей, организации ссылок между частями, формирование оглавления или указателя частей документа, разметка документа - выделение отдельных информационных единиц (полей), преобразование выделенных полей к форме пригодной для поиска и отображения.

Рассмотрим некоторые решения задачи формирования материалов для сельскохозяйственной электронной библиотеки знаний (СЭБиЗ). Структура библиотеки и данных, а также возможности, которые предоставляются пользователю, определяются выбором ИПС "Артефакт" в качестве основного инструмента поиска информации.

Электронная библиотека представляет собой совокупность информационных ресурсов с различной организацией данных. Ввод библиографических описаний, рефератов и дополнительных данных аналитико-синтетической обработки документов оставлены вне рамок настоящего доклада.

Рассмотрим процедуру ввода полнотекстовых материалов, в частности, получаемых в результате сканирования печатной продукции. Поскольку поиск в СЭБИЗ обеспечивается по всему текстовому пространству электронной библиотеки, то существенным для отображения найденного документа является разумное его структурирование на фрагменты, выделение среди текста необходимых элементов типа фамилий авторов, аннотаций, оглавлений и т.п. Отдельной задачей представляется и организация поиска и отображения документов старых книг (книг с дореформенной 1918 г орфографией). Следует учитывать, что поисковые системы даже использующие (тем более использующие) морфологический разбор текста, как правило, не работают со старыми языковыми формами, что, в частности, относится и к ИПС "Артефакт". Предлагаемые методы позволяют обеспечить поиск с учетом современных правил написания слов и алфавита, а также отображения, при необходимости, соответствующих страниц первоисточников в исходном виде.

Словари и справочники, загружаемые в электронную библиотеку, если они создаются на основе печатной продукции, требуют решения дополнительных проблем. Это разбиение на отдельные статьи, выделение заголовков статей, автоматическое распознавание ссылок на другие статьи. При вводе дореволюционных словарей возникают еще проблемы связанные с изменением грамматики и правописания русского языка. При предоставлении словаря в электронном виде представляется желательным как возможность поиска по заголовкам статей словаря, так и по полному их тексту. Естественно, должны показываться приложенные к статье иллюстрации и осуществляться ссылки на другие статьи этого же словаря.

Для обеспечения такого, в том числе полнотекстового, поиска необходимо загрузить в поисковую систему (базу данных) образ словаря, разделенный на отдельные статьи. При этом заголовок статьи должен быть выделен в отдельное поле для обеспечения поиска только по заголовкам. Другим решением может быть создание отдельной базы заголовков со ссылками на полные тексты статей словаря.

Современные системы распознавания такие, как, например FineReader, позволяют передавать результат распознавания в WinWord, где этот результат вместе с иллюстрациями напоминает обрабатываемые страницы первоисточника. В WinWord'е возможно выполнять необходимую корректировку текста и преобразование его в формат HTML. При этом сохраняется необходимая разметка документа (разделение на абзацы, жирность, курсив, таблицы, рисунки, как ссылки отдельные образы, конечно).

В то же время формат HTML является одним из входных форматов ИПС "Артефакт", позволяющей проводить поиск в полнотекстовой базе данных из Интернет (с использованием морфологического разбора запроса и объекта поиска). Однако, чтобы в результате поиска каждая статья словаря показывалась отдельно, при загрузке в базу "Артефакт" каждая статья должна быть оформлена в виде отдельного файла, а для возможности поиска только по заголовкам, заголовок статьи должен быть представлен как поле базы, и, следовательно, снабжен префиксом с идентификатором этого поля.

При вводе дореволюционных словарей каждая статья подвергается двойной обработке:

Значительное количество справочного материала в библиотеках размещается на каталожных карточках. В частности, в ЦНСХБ это и картотеки латинских наименований вредителей сельского хозяйства, и картотеки наименований растений, гербицидов и инсектицидов и т.п.

Формирование картотеки происходит в несколько этапов: сейчас - это просто HTML файлы, разделенные по буквам. Представляющие простые таблицы соответствий оного термина - другому. В дальнейшем эти таблицы подразумевается превратить в базы данных с поисковым механизмом. При вводе в поисковую строку соответствующего значения, мы получаем эквивалентное этому слову перевод или необходимые данные. В дальнейшем при создании баз данных картотек, подразумевается подключение к сведениям картотек, информации, взятой из других источников, но которая относится к данной теме.

При формировании информационных ресурсов типа справочников персоналий и организаций приходится решать вопросы форматов представления этих данных, а также организации взаимосвязи между этими ресурсами. В настоящее время эти сведения находятся в виде HTML-файлов, над которыми включен аппарат полнотекстового поиска "Артефакт". Для более полного соответствия этих данных возможным поисковым предписаниям, предполагается выделение из этих полных текстов отдельных полей (таких как название, директор и т.п.), а также всю информацию относящуюся к данным темам, проиндексировать. После приписывания ключевых слов, появится возможность полнее отобразить необходимые рубрики при поиске.

Аналитико-синтетическая обработка документов в библиотеке призвана обогатить документы соответствующими языковыми средствами. Для достижения правильных результатов при поиске пользователь должен быть обеспечен справочными материалами, используемыми при классификации документов. В СЭБиЗ представлены рубрикатор ГРНТИ по сельскому хозяйству и тезаурус по сельскому хозяйству.

Предполагается использование тезауруса и рубрикатора ГРНТИ при поиске по материалам электронной библиотеки. При этом необходимым условием является дополнительная систематизационная обработка всех (желательно) материалов, во время которой каждому элементу библиотеки, например, странице HTML, припишутся соответствующие рубрики и термины отраслевого (сельскохозяйственного) тезауруса. Эти приписанные элементы образуют дополнительные поисковые поля. При работе с рубрикатором возможно также ограничивать поиск тематической рубрикой, т.е. найдутся только те документы, рубрика которых соответствует выбранной.

!7!

Корпоративная система электронной
доставки документов

С.А. Власова, Н.Е. Калёнов, А.М. Сенько
(БЕН РАН)

Развитие средств вычислительной техники, позволяющее достаточно легко создавать и хранить электронные образы печатных документов, и сетевых технологий, обеспечивающих быструю доставку электронного документа в любую точку земного шара, обусловили появление и бурное развитие в библиотечном мире служб электронной доставки документов (ЭДД). Несмотря на слабую правовую базу, регламентирующую процессы формирования и предоставления электронных копий опубликованных документов, это направление библиотечного обслуживания является в настоящее время наиболее перспективным.

Традиционная система межбиблиотечного абонемента (МБА), предусматривающая отправку из одной библиотеки в другую оригиналов изданий или ксерокопий их фрагментов, уже не может функционировать достаточно четко и оперативно из-за высоких почтовых тарифов и непредсказуемости сроков доставки документов отечественной почтой, и не удовлетворяет современным требованиям, предъявляемым к системам информационного обслуживания пользователей.

Осознавая важность развития служб электронной доставки, с одной стороны, и проблемы, возникающие при их организации и эксплуатации, с другой стороны, ряд ведущих научных библиотек и информационных центров страны решили координировать свои действия в области ЭДД и учредили в 2000-м году Ассоциацию служб электронной доставки документов в виде некоммерческого партнерства (НП), получившего название АСЭД.

Учредителями АСЭД являются Библиотека Академии наук (Санкт-Петербург), Библиотека по естественным наукам РАН (Москва), Всероссийский институт научной и технической информации (Москва), Государственная публичная историческая библиотека (Москва), Государственная публичная научно - техническая библиотека СО РАН (Новосибирск), Институт научной информации по общественным наукам (Москва), Российская государственная библиотека (Москва), Росинформресурс (Москва), Федеральный институт промышленной собственности (Москва), Центральная научная сельскохозяйственная библиотека (Москва).

Целью создания АСЭД является поддержка и развитие электронной доставки документов, интеграции информационных ресурсов и повышение эффективности их использования для наиболее полного удовлетворения растущих информационных потребностей мирового сообщества.

К основным направлениям деятельности НП АСЭД относятся:

На сайте АСЭД (http://www/edd.ru/edisa), наряду с полной информацией об Ассоциации (уставом, правилами приема в члены, протоколами собраний и т.п.), представлены сведения о конференциях и семинарах, связанных с направлениями деятельности АСЭД, "Форум", в рамках которого обсуждаются вопросы, связанные с электронной доставкой документов, а также публикации, относящиеся к этому направлению, в частности, полные тексты двух монографий В.А. Глухова и О.Л. Лаврик.

В 2001-м году коллектив специалистов, входящих в организации - учредители АСЭД, получил грант РФФИ на создание корпоративной системы электронной доставки документов. Было разработано техническое задание на создание первой очереди системы и начата её разработка.

Первая очередь системы является "закрытой" и ориентирована на работу с участниками АСЭД; войти в нее могут только представители организаций, зарегистрированных администратором и получивших свои пароли доступа. Целью системы является взаимная помощь в выполнении заказов, поступивших в организации - участницы от внешних абонентов. Система работает по протоколу HTTP, доступ к ней осуществляется через стандартные Интернет - броузеры. В системе реализован принцип "биржи" заказов: организация-заказчик предлагает через систему партнерам выполнить свой заказ, партнеры, в свою очередь, предлагают условия выполнения заказа, заказчик выбирает наиболее подходящего для него исполнителя, подтверждает заказ и получает через систему уведомление о его выполнении.

Пилотная версия первой очереди системы, проходящая в настоящее время опытную эксплуатацию, работает под управлением WINDOWS NT, построена на основе MICROSOFT SQL SERVER и обеспечивает выполнение следующих функций:

В процессе опытной эксплуатации пилотной версии системы оценивается правильность выбора тех или иных принципиальных решений, уточняются положения Технического задания первой очереди, одновременно прорабатываются основные направления развития системы и требования к её второй очереди.

!8!

Новые проблемно-ориентированные
выпуски БД ВИНИТИ по проблемам
охраны окружающей среды и экологии

В.М. Ефременкова, М.М. Мельникова, И.И. Потапов, Н.Ф. Чумакова
(ВИНИТИ)

Наряду с традиционно генерируемой с 1981 по 1998 гг. БД "Охрана окружающей среды и воспроизведение природных ресурсов" с ретрофондом 191.6 тыс. документов ВИНИТИ начало с 1999 г. выпускать пять проблемно-ориентированных выпусков БД по проблемам охраны окружающей среды и экологии. Эта система БД отражает около 33 тыс. документов в год. Тематически она охватывает проблемы экологии и охраны окружающей среды - это выпуски "Экология человека", объемом 6.7 тыс. док. в год; "Охрана и улучшение городской среды" - 4.9 тыс. док. в год; "Системы и методы контроля качества окружающей среды" - 4.1 тыс. док. в год; "Технологические аспекты охраны окружающей среды" - 7.8 тыс. док. в год и "Охрана природы и воспроизведение природных ресурсов" - 9.3 тыс. док. в год.

Предлагаемые выпуски БД отражают наиболее актуальные проблемы техногенной деятельности человека от экологических аспектов градостроительства до влияния городской среды на жизнедеятельность человека, растительного и животного мира; от систем, приборов и методов контроля качества воздуха, воды и почвы до способов очистки, переработки и утилизации газообразных, жидких и твердых отходов; малоотходной и безотходной технологиям в промышленности, на транспорте и в сельском хозяйстве.

Основной поток первоисточников состоит из статей из периодических и продолжающихся изданий (около 800 - изданий России и 2000 иностранных изданий), составляющих от 90.3% в БД "Экология человека" до 65.9% в БД "Технологические аспекты охраны окружающей среды". Тематика последней БД предполагает наличие достаточно большого потока патентов - около 25%, в то время как в остальных БД поток патентной литературы составляет от 1 до 8%. Статьи из сборников трудов составляют от 6.6% до 18.6%; книги - 0.3-2.5%; депонированные рукописи - около 1.5%. Анализ статистического распределения потока документов по странам и языкам их опубликования показал, что наибольший поток русскоязычных документов и документов России - около 42.5% отмечается в БД "Охрана и улучшение городской среды"; англоязычных - около 65.3% имеет место в БД "Технологические аспекты охраны окружающей среды" (из них публикации США составляют 30.8%, Великобритании - 6.7%).

В условиях недостаточного финансирования закупки иностранной литературы приобретает особое значение как изучение динамических характеристик системы БД ВИНИТИ по охране окружающей среды, так и тематический анализ зарубежных каталогов и близких по тематике БД или их фрагментов. Интересные данные могут быть получены при работе с международным библиографическим каталогом Ulrich's International Periodicals Directory. В настоящее время в этом каталоге содержится по проблемам охраны окружающей среды 3232 регулярных издания и 1501 нерегулярное. Научные журналы составляют 23.6%, правительственные отчеты - 9.5%, монографии - 6.4%. On-line доступ может быть предоставлен информационными службами к 10.8% выходящих в настоящее время изданиям. Следует отметить, что небольшая часть из них находится на электронных носителях: компакт дисках, видеокассетах, микрофишах и дискетах. Основными информационными службами, включающими около 9% журналов по охране окружающей среды являются такие всемирно известные службы как Chemical Abstracts Services (CAS), BIOSIS, Environment Science and Pollution Managment, Current Contents; в Scientific Citation Index, INIST Atomindex, Ecological Abstracts содержится по рассматриваемой тематике около 4% изданий. Наибольшее количество приходится на издания США - 38.6%, журналы Великобритании составляют 13.7%, Японии - 3.4%, России - 0.9% (47 журналов). В БД ВИНИТИ значительно меньше журналов США и Великобритании, практически одинаковое количество изданий Китая и Японии и значительно больше периодических и продолжающихся изданий России. Изучение и сравнение перечней журналов нескольких информационных центров позволит устанавливать приоритеты при формировании подписки и выборе электронных ресурсов при поиске необходимых для рассматриваемой тематики изданий.

!9!

Технологическая классификация
библиотек (постановка вопроса)

А.М. Стахевич
(НТБ МАДИ (ТУ))

Классификация библиотек может быть осуществлена по различным признакам: назначению, ведомственной принадлежности, учредителю, составу фонда и читателей и др. Технология пронизывает деятельность любой библиотеки и отличает их друг от друга. Поэтому технологию также можно отнести к существенным классификационным признакам.

В зависимости от доминирующей в библиотеке технологии можно говорить о виде, к которому принадлежит та или иная библиотека. Эту зависимость можно представить следующим образом:

В основе предложенного нами технологического деления библиотек на виды лежит принцип поиска, отбора, обработки, хранения, передачи (обмена, выдачи) и списания (стирания, уничтожения) литературы (информации). Причем для последних двух видов библиотек характерна не только количественная, но и качественная (интеллектуальная) мощность предполагаемых к использованию технических средств (нейро- и геннокомпьютеров). Таким образом, тенденция к максимальному информационному и интеллектуальному насыщению минимальной среды очевидна.

За исключением бумажной, остальные виды библиотек встречаются крайне редко. Пока больше примеров, когда на базе какой-нибудь одной технологии или параллельно с ней получают развитие сразу несколько типов технологий. Подобная технологическая смешанность является существенной чертой современных библиотек мирового библиотечного сообщества. Поэтому можно говорить о формировании еще одного, на сегодня самого распространенного, вида библиотек - гибридной библиотеки. Правда, в отличие от Запада гибридные библиотеки России имеют следующую принципиальную особенность: давно освоенные, но устаревшие, малоэффективные технологии (бумажная, механизированная и частично автоматизированная) здесь "мирно сосуществуют" с еще только получающей развитие высокоэффективной цифровой технологией. В зарубежных гибридных библиотеках, напротив, идет активное вытеснение (замена) известных старых технологий новыми, в частности, цифровой.

В заключении отметим, что каждый новый вид библиотеки созвучен времени и является одним из проявлений приспособления (уравновешивания) библиотечным организмом влияний внешней среды. Поэтому можно говорить о великом разнообразии используемых в библиотеках технологий и соответственно видовой неисчерпаемости библиотек.

Литература

  1. Столяров Ю.Н. Родо-видовая и типологическая классификация библиотек // Библиотековедение. - 1996. - №3. - С.25-39; Акилина М.И. Классификация и типология библиотек. Вопросы методологии // Там же, С.40-54.
  2. Глушков В.М. Основы безбумажной информатики. - М.:Наука, 1982. - 552 с.; Глушков В.М. Кибернетика. Вопросы теории и практики. М.: Наука, 1986. - 488 с. - (Сер.: Наука. Мировоззрение. Жизнь).
  3. Бакленд М. Реконструкция (перестройка) библиотечного обслуживания / РГБ. Информкультура. - М., 1996. - 129 с. (Серия "Библиотечное дело: информационные материалы". Вып.1-2.).
  4. Тапскотт Д. Электронно-цифровое общество: плюсы и минусы эпохи сетевого Интернета. - М., 1999. - 432 с.; Гейтс Б. Бизнес со скоростью мысли. - М., 2000. - 480 с.
  5. Акеройд Д. Управление развитием электронных библиотек // Науч. и техн. б-ки. 2001. № 2. С.119-127; Шарон Т, Франк А. Электронные библиотеки в Интернете //Там же. С.127-133.
  6. Нейроинформатика / А.Н.Горбань, В.Л.Дудин-Барковский, А.Н.Кирдин и др. - Новосибирск: Наука. Сибирск. предпр. РАН, 1998. - 296 с.
  7. Нейроинформатика-99. Дискуссия о компьютерах. Науч. сес. МИФИ-99.Всерос.науч.-техн. конф. (20- 22 янв.1999 г.). - М.: МИФИ, 2000. - 224 с.
  8. Нейроинформатика-2000. Науч. сес. МИФИ-2000. 2-я Всерос.науч.-техн. конф.: Сб. науч. тр. В 2-х ч. - М.: МИФИ, 2000. - Ч.1 - 284 с.; Ч.2. - 236 с.
  9. Галушкин А.И. Теория нейронных сетей. Кн.1.: Учеб. пособие для вуз. - М., 2000. - 416 с.; Галушкин А.И. Нейрокомпьютер.Кн.3: Учеб. пособие для вуз. - М.,2000. - 528 с.; Сигери Омату и др. Нейроуправление и его приложения. Кн.2. - М., 2000. - 272 с. (Серия "Нейрокомпьютер и его применение").
  10. Молекулярные основы биологических процессов // Современное естествознание: Энциклопедия: В 10 т. Т.8. - М.,2000. 408 с.
  11. Стахевич А.М. Библиотековедение и естествознание: Перспективы взаимодействия наук (Концептуальный подход) // Материалы 8-й междунар. конф. "Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества" ("Крым-2001"). В 3 ч. - М., 2001. - Ч.1. С.57-59.
!10

Вопросы комплектования библиотечных
фондов электронными ресурсами

Е.И. Козлова
(БЕН РАН)

Обеспечение пользователей информационными ресурсами в значительной мере расширилось благодаря появлению и все более широкому использованию документов в электронном формате. Однако это не означает, что происходит замена печатных источников информации на электронные. Перед библиотечными работниками, в частности перед комплектаторами, стоит задача разработки метода формирования фонда, в котором будет сочетаться комплектование обоими видами документов. Для решения этой проблемы, в первую очередь, требуется выявить и исследовать наиболее значимые для пользователей критерии оценки информационных продуктов. С этой точки зрения следует рассмотреть преимущества и недостатки электронных документов по сравнению с традиционными, печатными ресурсами как с позиций пользовательских потребностей, так и с точки зрения формирования и сохранности фонда. Существующие в комплектовании методы оценки изданий основаны на таких показателях как спрос, экспертная оценка и стоимостная характеристика. Разработаны системы критериев с помощью которых определяется информационная ценность изданий. Как правило, такая оценка отражает содержание документа; оценка формальных свойств - полиграфическое оформление, удобство расположения материала и т.д. - могут опосредованно содержаться в этих характеристиках. Исследования в области комплектования библиотечных фондов электронными ресурсами предполагают следующие направления:

Использование электронных изданий пользователями различных организаций позволяет провести сравнительный анализ обращений к такой информации и выявить закономерности и особенности работы с этим ресурсом. Прежде всего следует рассмотреть, какой вид информации пользуется наибольшим спросом. Существует несколько видов электронных изданий, ориентированных на различные пользовательские потребности:

Высокую оценку пользователей получили библиографические БД со ссылками к полнотекстовым статьям. Например, российские специалисты активно работали с БД "MEDLINE" с последующим заказом статей в рамках проекта "Межмединформ", который осуществлялся через Немецкую медицинскую библиотеку, г.Кёльн при поддержке Немецкого исследовательского общества (DFG).

Обращение происходит к различным группам источников, но для того, чтобы принять решение о выборе типа источника информации требуется определить, какие из них представляют наибольший интерес для пользователей. К сожалению, статистические данные представляют лишь отдельные держатели электронных ресурсов, что затрудняет оценку информационных продуктов для организаций-пользователей. Те статистические данные, которые дают держатели электронных ресурсов, отличаются друг от друга по содержанию, что также осложняет разработку единого подхода к оценке информации. Поэтому следует заметить, что те исследования, которые базируются на изучении статистических данных, имеют ограниченный диапазон издающих организаций и требуют различных методик оценки в зависимости от представленных сведений. В настоящее время предложены и используются несколько способов оценки электронных ресурсов, основанных на количестве зарегистрированных доступов:

Детализированная (аналитическая) статистика - количество обращений к каждой группе ресурса (библиографические, аннотированные и полнотекстовые источники);

Общая статистика - суммарное количество обращений по названиям, по организациям.

Например, анализ данных, представленных издательством "Academic Press" (база данных электронных журналов "IDEAL"), показал, что пользователи электронных журналов условно делятся на 2 основные группы - осуществляющие библиографический поиск и поиск конкретных статей (Таблица 1).

Таблица 1.

Анализ обращений пользователей к различным видам электронных документов

Организация

Характер обращения

Оглавление

аннотация

Полнотекстовые статьи

Группа 1

Воронежский гос.ун-т

408

64

924

Ин-т общей и эксперим. биол.

361

20

919

Ин-т хим.физики

804

379

2064

МГУ

286

101

353

Самарский науч. центр

739

25

1422

Уральский гос. ун-т

94

47

115

Пущинский науч. центр

242

118

497

Группа 2

БЕН РАН

335

146

193

ВЦ РАН

142

33

98

Дальневост. гос. ун-т

675

229

367

Ин-т биологии (Уфа)

328

38

267

Ин-т биологии внутр. вод

353

295

270

Ин-т мат. Моделирования

138

48

129

Ин-т прикладной физики

390

91

323

Ин-т электрофизики

477

294

475

Объед.ин-т ядерн. исслед.

388

156

246

В группе 1 наибольшим спросом пользуются полнотекстовые статьи, второе место занимают оглавления журналов и лишь на третьем месте находятся аннотации. Объяснить такую закономерность можно тем, что обращаясь к определенному источнику (в данном примере издательство "Academic Press"), специалист хочет получить конкретный материал (статью), о которой он уже получил информацию, либо он является постоянным пользователем данных изданий, т.е. в этом случае мы сталкиваемся с определенным запросом. Для удовлетворения неопределенного запроса происходит, в первую очередь, обращение к библиографическим источникам (группа 2) или же требуется поиск по оглавлениям всех журналов одновременно. В этом случае эффективность поиска повышается при наличии единой поисковой системы для всех изданий, содержащихся в базе данных. Чтобы принять решение о выборе вида ресурса для пользователей конкретной организации требуется определить, какой тип запросов (определенных или неопределенных) преобладает. Включение в лицензионное соглашение условий предоставления статистических данных для каждой организации было бы эффективным средством оптимизации работы с электронными изданиями.

Принятие решения о выборе какого-либо ресурса связано также с необходимостью выбора наиболее эффективного способа его предоставления пользователям:

Исследования в этом направлении, прежде всего, ориентированы на изучение политики ценообразования и разработку методики наиболее эффективного распределения денежных средств при максимально возможном обеспечении пользовательских потребностей. Далее описаны основные способы ценообразования на электронные продукты:

Каждый из перечисленных способов имеет свои преимущества и недостатки, и эффективность выбора определяется не только текущей стоимостью ресурса, но и возможностями его текущего и ретроспективного использования.

Проблема текущего и ретроспективного использования электронных ресурсов связана непосредственно с вопросом сохранности фондов. Комплектование фондов документами на электронных носителях, в первую очередь, требует решения вопроса о том, какие ресурсы можно включать в состав фонда, и как следует определять те документы, которые не должны быть включены в его состав. С этой точки зрения целесообразно говорить о локальных и удаленных ресурсах, т.е. о тех документах, которые есть физически в библиотеке (на CD-ROM, имеются в локальной сети или установлены на сервере организации-пользователя) или размещены на сервере организации - держателя ресурсов.

В том случае, когда используются удаленные ресурсы, важное значение имеет содержание лицензионного соглашения, определяющее условия доступа к ресурсам после окончания срока действия договора (подписки). Непосредственное сравнение цен на приобретение печатных и электронных копий изданий не является основанием для принятия решения о выборе носителя документа, т.к. требуется решить вопрос о последующем доступе к электронным версиям изданий. Издающие организации и держатели электронных ресурсов предлагают условия использования своих продуктов, при которых доступ к ним возможен либо только в период действия лицензионного соглашения (в некоторых случаях после окончания договора предлагается приобретение комплекта документов на CD-ROM за умеренную плату), либо пользователям оставляют доступ к архивным файлам (такая практика пока не получила широкого распространения). В рамках консорциумов, как правило, предоставляется текущий доступ к изданиям, однако преимуществом такой формы является широкий круг изданий, не доступных в печатной форме. Поэтому следует принимать во внимание показатель периода полужизни изданий (период, в течение которого издания пользуются активным спросом). Учитывая такой подход к работе с электронными документами, требуется рассмотреть вопрос о пересмотре политики распределения бюджетных средств - на непосредственное приобретение документов для фонда и для оплаты доступа к электронным ресурсам (временного использования).

При оценке ценности электронных публикаций по данным обращения к ним следует также учитывать технические условия доступа к ресурсу. Различие между оценкой электронных и печатных документов заключается в особенности использования этих видов изданий, и для того чтобы создать комплексную методику комплектования фонда изданиями требуется выявить условия доступа к электронным форматам публикаций.

С этой позиции можно все ресурсы разделить на следующие группы:

  1. Удаленный доступ:

  1. Локальные
  2. На CD-ROM

Способ доступа влияет на количество и частоту зафиксированных обращений, т.к. это связано с проблемой связи с удаленными серверами. Поэтому при количественной сравнительной оценке статистических данных должны быть использованы корректирующие коэффициенты.

Таким образом, задача обеспечения пользователей электронными и печатными документами рассматривается не только с традиционной точки зрения формирования фонда - включения публикаций в его состав. Возможно создание методики оценки и отбора изданий как для временного использования, так и для отбора в фонд.

!11

Межбиблиотечная отраслевая
информационная система в области
математики

К.П. Погорелко
(Отдел БЕН РАН в Математическом институте им. В.А. Стеклова РАН)

Фонды удаленных библиотек всегда представляли интерес для ученых. Комплектование профильной литературой даже в узко специализированной библиотеке никогда не бывает полным. В современных условиях недостаточного финансирования комплектование даже основными "ядерными" журналами часто бывает фрагментарным и неполным. Много актуальной информации содержится и в так называемой "серой" литературе - трудах конференций и семинаров. Эта литература не попадает в централизованные системы распределения и преимущественно остается в регионах. Следовательно, она комплектуется не всеми профильными библиотеками. Фонды библиотек также пополняются за счет даров, которые часто бывают уникальными. Поэтому ученые заинтересованы в доступе к фондам всех отраслевых библиотек.

Отдельным вопросом можно считать то, какая библиотека для читателя является "удаленной". В информационном обслуживании качество является зачастую определяющим моментом. К понятию качества в информационном обслуживании можно отнести легкость, с которой можно найти требуемый документ, и время, за которое этот документ станет доступен читателю. Как правило, у читателя существует определенный временной порог, превышение которого приводит к тому, что он теряет нужду в требуемом документе и запрос становится не актуальным. Следовательно, сокращение времени доступа читателя к фондам библиотеки приводит к увеличению объема обслуживания, и, как следствие, к росту "нужности" конкретной библиотеки для ученых. С этой точки зрения для ученого, находящегося в командировке или работающего дома, даже библиотека того НИУ, в котором он работает, может оказаться "удаленной", не говоря уже о библиотеках, расположенных в других учреждениях и городах.

С развитием современных средств телекоммуникации у библиотек появились новые возможности в обслуживании удаленных читателей. Делая свои каталоги доступными для поиска, например, средствами Интернет, библиотека дает возможность ученому найти необходимый документ. Для доступа к документу, в дополнение к традиционному межбиблиотечному книгообмену для документов сравнительно небольшого объема как, например, журнальная статья, появилась возможность их пересылки в электронном виде. Часть материала в библиотеке уже доступна для пересылки. Это относится к документам, хранящимся в полнотекстовых базах данных, к которым библиотека по тем или иным соглашениям имеет доступ. Документы, хранящиеся в библиотеке в традиционном виде, могут быть отсканированы и, тем самым, может быть и не самым эффективным образом с точки зрения объема информации, но переведены в "электронный" вид.

Удобство поиска для читателя состоит в том, чтобы он мог из одного места провести поиск в каталогах интересующих его библиотек и оценить возможность и временные рамки получения интересующего его документа на своем рабочем столе. Межбиблиотечные каталоги в настоящее время присутствуют, в основном, в иерархическом виде согласно структуре библиотечных объединений - сводный каталог БЕН, сводный каталог БАН. В то же время информационные потребности ученых, работающих в конкретной области знаний, находятся, в основном, в рамках этой области. При поиске в политематическом сводном каталоге трудно обеспечить высокую точность. Тематический поиск и поиск в условиях неполной информации дают много "шума". Для читателя, работающего в области математики, больший интерес, при условии доступности фондов, представляет поиск в фондах библиотек математических институтов РАН и библиотеках математических факультетов университетов, чем библиотеках другого профиля, которые, в основном представлены в упоминавшихся сводных каталогах.

В соответствии с вышеизложенным, в настоящее время предпринимается попытка создания межбиблиотечной отраслевой информационной системы по математике. В настоящее время в проекте участвуют библиотеки МИАН (Математический институт им. В.А. Стеклова РАН) и ПОМИ (Петербургское отделение Математического института). Однако интерес был проявлен и со стороны библиотек математических факультетов Московского и Петербургского университетов. На первом этапе предполагается создание объединенного каталога фондов периодических и продолжающихся изданий и доступных электронных ресурсов библиотек - участниц проекта и создание сети электронной доставки.

Создание объединенного каталога можно проводить несколькими путями, каждый из которых имеет свои достоинства и недостатки. При условии существования соответствующих каталогов в библиотеках - участницах, одним из возможных решений является создание объединяющего каталога и периодическое копирование объединяемых каталогов в центральный. Достоинством данного метода является относительная простота как реализации программного обеспечения, так и организации функционирования всей системы в целом. К недостаткам такого подхода следует, прежде всего, отнести относительно большие задержки в актуализации сводного каталога. Изменения в локальной базе находят отражение в объединяющей базе с запозданием, определяемым периодичностью процедуры копирования. Такое запаздывание может привести к тому, что документ, отмеченный в сводном каталоге как доступный, на самом деле оказывается занятым и читатель вместо заказанной статьи получает отказ.

Наиболее перспективным путем объединения каталогов являлся бы путь, при котором объединенный каталог физически не создается. В этом случае система переадресовывает запрос от читателя к информационным системам - участницам, объединяет их ответы и представляет результат читателю. Однако для реализации объединения таким путем необходимо, как минимум, чтобы информационные системы участвующих библиотек находились на достаточно высоком уровне развития и были бы постоянно доступны через Интернет. В случае настоящего проекта данное условие не выполнено - каталог библиотеки ПОМИ реализован в среде MS-DOS, не имеет выхода в Интернет и техническое оснащение библиотеки - единственный компьютер на базе 486 процессора - не позволяет это сделать.

Кроме того, такое объединение требует достаточно высокого качества связи, т.к. в этом случае задержка ответа читателю складывается из задержки ответа центрального узла и максимальной задержки ответов от каталогов библиотек-участниц. При плохом качестве каналов, которое, к сожалению, имеет место, такая двойная задержка сделает работу невозможной. В случае настоящего проекта это условие также не выполнено.

Поскольку актуальность информации в данной системе представляется важным условием, предпринимается попытка организации центральной системы, доступной для администрирования через протоколы Интернет, которая может заменить библиотекам их локальные системы. Реализация системы предполагается на Microsoft SQL Server и Microsoft IIS, установленные на сервере библиотеки МИАН. Таким образом, создается база данных требуемой структуры, к которой организуется три уровня интерфейсов. Первый - это интерфейс гостя, при котором можно осуществлять поиск в представленных фондах всех библиотек или с ограничением на желаемые библиотеки. Вторым является интерфейс зарегистрированного читателя, при котором, после проверки пароля, дополнительно можно заказать нужную копию статьи в электронном виде и посмотреть личные сведения, которые система накапливает на данного читателя. Интерфейс администратора системы является третьим уровнем интерфейса. Лица, наделенные административными привилегиями, могут редактировать информацию, относящуюся к их библиотеке, добавлять новых читателей, блокировать-разблокировать их доступ к системе и получать статистику использования системы. Интерфейсы первых двух уровней реализуются в пределах HTML и доступны при использовании любого интернет-броузера. Однако скудные средства диалога HTML не позволяют эффективно реализовать некоторые функции, которые должен выполнять администратор. Поэтому, по-видимому, на компьютерах, с которых будет осуществляться администрирование, не удастся обойтись стандартными средствами доступа к Интернет и потребуется установка специального программного обеспечения, что накладывает дополнительные требования к этим компьютерам, с одной стороны, и затрудняет сопровождение системы для действительно удаленных библиотек, с другой стороны.

В системе, помимо стандартных функций электронного каталога, предусматриваются функции, помогающие в докомплектовании фонда и проведении книгообмена. Предусматривается возможность ввода журналов, предлагаемых библиотеками для обмена. Кроме того, администратор базы может получить список лакун в своей библиотеке. Если среди недостающих журналов будут такие, которые предложены кем-то для обмена, то на экране появятся соответствующие отметки.

Отдельным предметом обсуждения являются затраты на функционирование данной системы в целом. Администрация МИАН понимает важность качественного информационного обслуживания для обеспечения эффективного существования русской математической школы. Поэтому она производит как бы "оптовую" закупку услуг, предоставляемых библиотекой, оснащая её необходимым оборудованием и привлекая к работе квалифицированных специалистов, что снимает с библиотеки потребность торговать своими услугами "в розницу", а для ученых и аспирантов это дает качественный и бесплатный информационный сервис. Поэтому первоначально предполагается, что услуги такого межбиблиотечного объединения для читателей библиотек - сотрудников математических институтов будут бесплатными, а расходы библиотек будут компенсироваться администрациями институтов.

!12

Функции сайтов отраслевых
информационных и библиотечных
центров

Н.С. Солошенко
(Отдел БЕН РАН в Математическом институте им. В.А. Стеклова РАН)

Международным научным сообществом создана критическая масса распределенных отраслевых ресурсов, различных по объему, наполнению и значимости, требующих многопланового структурирования в соответствии с потребностями пользователей. В последнее время, кроме Интернет-каталогов отраслевых ресурсов, составленных в виде списков адресов соответствующих Web-страниц и выполняющих, в основном, роль навигаторов к указанным ресурсам, появляются интегрированные сетевые инструменты доступа к разнородным распределенным документопотокам, которые используются при включении ресурсов в информационно-поисковые системы (ИПС). Появление подобных международных отраслевых систем является возможностью для российских производителей представить свои электронные продукты в сетевой доступ и стать, таким образом, полноправными участниками обмена отраслевой информацией. Вхождение в хорошо структурированную информационную среду связано, прежде всего, с проблемой выявления своей "экологической ниши", созданием информационного продукта и распространением его в среде пользователей посредством системы услуг.

Проведенное в Великобритании исследование под названием "Супержурнал" показало, что потребители электронных изданий хотят получать виртуальный доступ на издательские серверы (gateway) или "покупку в одном магазине" (one stop shopping), объединение изданий по предметной области, а также интерфейс, связывающий библиографические базы данных с полнотекстовыми изданиями [1].

Не только за рубежом, но и в России все большее распространение получают "тематические порталы" - отраслевые сайты, представляющие сетевой доступ к различным информационным продуктам в определенной области как собственной генерации, так и внешним, и являющиеся, по сути теми инструментами структурирования ресурсов, в которых так нуждаются различные группы пользователей. Эти "суперсайты" отражают по возможности полно все взаимосвязи документных координат: классификационных систем, изданий, учреждений и персоналий авторов, научных обществ и форумов, а также библиотечных каталогов и разнообразных баз данных [2]. В системе отраслевой информации они выполняют следующие функции:

Чаще всего тематические порталы принадлежат крупным научным обществам (например, Американскому или Санкт-Петербургскому математическим обществам), или издательским комплексам, которые более или менее успешно решают задачу обеспечения отраслевого пользователя так называемым "subject gateway" - "предметным входом" в систему необходимых документопотоков. Тематические порталы информационных центров или издательских комплексов предоставляют доступ, прежде всего, к ресурсам собственной генерации, например, реферативным базам. На этих сайтах также представлены параллельные электронные журналы и монографии (в том числе и сериальные издания), сведения о конференциях, семинарах, школах, указатели персоналий и т.д.

Кроме того, крупнейшие отраслевые порталы поддерживают каталоги Интернет-ресурсов, распределенных по всей глобальной сети. Эти обширные информационные пособия предназначены, в основном, для квалифицированных пользователей, так как содержат, минимум информации о ресурсе: название и URL (Универсальный Локатор Ресурса).

Вообще следует отметить, что подобные тематические порталы рассчитаны на пользователей, обладающих хорошими навыками поиска в Интернет. Они выполняют задачу структурирования тематических ресурсов, а в последнее время и их интеграции через систему ссылок - от библиографического описания документа к полному электронному тексту. При этом, издательские и информационные центры начинают выполнять некоторые библиотечные функции. Но при этом не следует забывать, что доступ к рефератам и полным текстам документов через подобные порталы является, как правило, коммерческим.

В последнее время, как уже упоминалось, появляются интегрированные сетевые инструменты доступа к разнородным распределенным ресурсам, интеграция которых достигается через стандартизованные описания материала на языке метаданных (например, Dublin Core или RDF). Эти ИПС, часто называемые "subject gateway" - "отраслевой вход" - включают описание таких гетерогенных ресурсов как: онлайновые документы, специализированные базы данных, Web-сайты научных и учебных центров, издательств, обществ, исследовательских групп, списки адресов электронной почты и т. д., отобранные и проиндексированные предметными экспертами и информационными специалистами. Пользователи могут просматривать содержание по определенной теме или производить поиск по ключевым словам. В результате поиска пользователь получает единый тематический список ресурсов различных производителей - некое "виртуальное сетевое издание", которое помимо информационной выполняет ориентирующую и навигационно-поисковую функции, так как содержит аннотации ресурсов и их URL.

Европейским математическим обществом реализуется проект "Эйлер", целью которого является развитие системы поиска математической информации в Интернет по информационно-библиотечным ресурсам Германии, Франции, Италии и Швеции по принципу "покупки в одном магазине". Проект предусматривает интеграцию библиотечных ресурсов в рамках информационной инфраструктуры. Эта система представляет глобальный портал, объединяющий гетерогенные Web-ресурсы: библиотечные каталоги, библиографические базы, электронные журналы, издаваемые академическими учреждениями, архивы препринтов и "серой литературы", Интернет-каталоги по математике и пр. "Эйлер" интегрирует платные (электронную доставку документов, обслуживание в коммерческих БД - "MATH", доступ к полным текстам электронных журналов) и бесплатные (доступ к электронным библиотечным каталогам, препринтам и некоторым оригинальным электронным журналам) услуги. Единая методика описания разнообразных и разнородных документов обеспечивает совместимость. Проект рассчитан на обслуживание информацией в рамках консорциума партнеров, предоставляющих свои ресурсы [3].

В России пока распространены, в основном, библиотечные консорциумы по совместному использованию зарубежных электронных журналов, получаемых либо в дополнение к приобретению печатных версий членами консорциума, либо по отдельным соглашениям. Информационно-библиотечные центры получают право доступа к распределенным электронным фондам зарубежных первоисточников, и библиотечные сайты превращаются в средство доступа к многоуровневым ресурсам для зарегистрированных пользователей. Кроме того, основными сетевыми продуктами информационно-библиотечных центров являются Web-каталоги на собственные ресурсы и отраслевые, а также политематические базы данных. Связывание печатных и виртуальных ресурсов через систему ссылок от библиографического описания до полного текста документа создает, таким образом, распределенную гибридную библиотеку [4].

Так, например, в Библиотеке по естественным наукам РАН текущий каталог зарубежных периодических изданий фактически представляет собой политематический многоуровневый электронный ресурс. В этом комплексе, начиная с 1996 года, от названий журналов установлены ссылки на страницы их оглавлений на сайтах издательств и полнотекстовые версии этих журналов в случае, когда Библиотека имеет право доступа к ним (около 1 000 названий) [5]. При этом крупные библиотеки и информационные центры стремятся обеспечить доступ пользователям к разным уровням документной информации. Так, например, в ГПНТБ России действует служба по электронной доставке документов из фондов библиотеки. Заказ информации возможен по электронному каталогу и по базе авторефератов диссертаций. ВИНИТИ оказывает услуги по изготовлению и доставке электронных копий первоисточников из своих фондов, а также изданий, доступных в Интернет.

Web-страницы политематических библиотек, содержащих ссылки на отраслевые ресурсы, как правило, построены по принципу "стартовых точек", то есть включают страницы Интернет, поддерживающие каталоги основных зарубежных ресурсов, списки журналов и ссылки на сайты издательств, выполняя таким образом функцию структуризации ресурсов. При этом большинство отраслевых пользователей-ученых хотели бы, не обременяя себя трудоемким и продолжительным поиском в Интернет, сделать "покупку в одном магазине". Библиотеки НИУ РАН могут помочь ученым, используя собственные сайты как эффективный инструмент доступа к ресурсам и оказания различных информационных услуг. При этом, если основными задачами, которые политематические центры решают с помощью своих сайтов, являются структуризация ресурсов и их интеграция через систему ссылок, то дополнительной и важнейшей задачей сайта отраслевой научной библиотеки является индивидуализация доступа к ресурсам.

Библиотека НИУ РАН является элементом как минимум двух информационных систем. Как член библиотечного консорциума БЕН РАН, отраслевая библиотека имеет доступ к мировым распределенным электронным ресурсам, и в её задачи входит предметная структуризация этих ресурсов. Одним из решений этой задачи является создание многоуровневого электронного текущего комплекса с использованием собственного каталога зарубежных периодических изданий, как было описано ранее. Другим вариантом решения этой проблемы может стать размещение на отдельной странице библиотечного сайта списка всех отраслевых электронных изданий, доступ к которым возможен из библиотеки НИУ. При этом имеет смысл указать, имеются ли эти издания в фонде библиотеки НИУ и за какие годы, а также связать их со страницами их оглавлений на сайтах издательств и полнотекстовыми версиями этих журналов. Пользователь, работая со специально выделенными компьютерами в читальном зале библиотеки, имеет возможность сразу получить доступ к многоуровневым документам. Удаленный пользователь будет ограничен доступом к библиографическому описанию нужной статьи, реферат и полный текст которой он сможет заказать через обратную связь, предусмотренную на сайте (по электронной почте). Кроме того, большинство издательств оказывают всем пользователям бесплатные услуги по рассылке извещений о выходе в свет следующих выпусков интересующих журналов или статей из определенных изданий или по нужной тематике. Поэтому представляется крайне полезным указать ссылки на соответствующие службы рассылки оглавлений, предоставив читателю выбор: зарегистрироваться самостоятельно или поручить это библиотекарю.

С другой стороны, участие в отраслевой системе в качестве полноправного участника обмена информацией требует от отраслевой научной библиотеки создания собственного продукта и оказания услуг на его основе. В отсутствие централизованного финансирования проектов по созданию отраслевых ИПС головные библиотеки отделений РАН должны взять на себя задачи интеграции отечественных отраслевых ресурсов, и первой стадией такого объединения может явиться создание сводного каталога библиотек учреждений родственного профиля с единым сетевым интерфейсом. Наличие такого ресурса вкупе со службой электронной доставки информации позволит его производителям стать коллективным членом международных отраслевых консорциумов, в которых российские партнеры могут обеспечивать свое долевое участие различными услугами, например, электронной доставкой документов.

Создание сводного каталога отраслевых российских Интернет-ресурсов в формате, обусловленном одним из действующих или разрабатываемых международных "subject gateway", явилось бы еще одной ступенью интеграции отечественных отраслевых ресурсов. Это оказало бы неоценимую помощь как российским пользователям, так и зарубежным, особенно при условии двуязычной информации, и, возможно, помогло бы другим библиотекам найти свою нишу в производстве информационных продуктов.

Как правило, электронными информационными продуктами библиотеки НИУ РАН являются книжные и журнальные каталоги, глубина которых не превышает десяти лет, и списки новых поступлений. Раскрытие содержания ценной малотиражной научной продукции может стать для библиотеки института (как низовой информационно-библиотечной службы) уникальной "экологической нишей" в системе электронных услуг и следующим уровнем наполнения Интегральной системы Информационных Ресурсов (ИСИР) РАН [6]. Создание ретрофонда оглавлений популярных трудов, сборников, журналов возможно начать с тестовых массивов популярных изданий. Реклама услуг по копированию или электронной доставке документов на библиотечном сайте привлекут пользователей. Спрос на определенные издания поможет выявить наиболее востребованные информационные продукты. Следует учитывать опыт информационно-библиотечных центров, предлагающих услугу рассылки оглавлений по электронной почте. Создание списков рассылки информационных продуктов с рекламой услуг по доставке полных текстов позволит индивидуализировать услуги и, в конечном счете, повысить заинтересованность пользователей.

Литература.

  1. Анализ рынка электронных изданий /Гава О.Ю., Добрынина Е.В., Кампфенс И., Тимофеева О.В., Тимофеев В.Ф. //Информационное общество, информационные ресурсы и технологии телекоммуникации. Междунар. конф., 5, НТИ-2000: Сб. тр. М.: ВИНИТИ, 2000.- С.72-77.
  2. Борщев В.Б., Гиляревский Р.С. Научная коммуникация в век Интернета // НТИ. Сер.2 Информ. процессы и системы. - 1999, № 10. - С.2 - 6.
  3. Вегнер Б. Проект Эйлер - интегрированный доступ к библиотечным каталогам и математической информации в Интернете //Науч. и техн. б-ки. - 2001, № 2. - С.75 - 81.
  4. Глухов В.А. Проблемы обеспечения доступа к электронным ресурсам в библиотеках // Информационно-библиотечное обеспечение науки. Проблемы интеграции информационных ресурсов: Мат. конф. - М., 2000 - С. 90-96.
  5. Власова С.А., Каллистратова О.Д., Соловьева Т.Н. Электронные ресурсы БЕН РАН в Интернете // Информационное общество, информационные ресурсы и технологии телекоммуникации. Междунар. конф., 5, НТИ-2000: Сб. тр. М.: ВИНИТИ, 2000.- С.66-67.
  6. Бездушный Н., Кулагин М.В., Серебряков В.А. Интегрированная Система Информационных Ресурсов (ИСИР) РАН // Современные технологии в информационно-библиотечном обеспечении научных исследований: Материалы 8-го науч.-практ. семинара (Таруса 13-18 сентября 1999 г.) /РАН. БЕН. - М.,1999. - С. 10-15.
!13

Библиотечное обслуживание ученых
на рабочем месте: концепция развития
системы услуг в отраслевой библиотеке
РАН

Л.И. Госина
(Отдел БЕН РАН в Математическом институте им. В.А. Стеклова РАН)

В Российской академии наук информационное обслуживание ученых осуществляется, в основном, в централизованных библиотечных объединениях: центральные библиотеки формируют универсальные по тематике фонды документов, а библиотеки сети - отраслевые. В настоящее время центральные библиотеки как держатели основных фондов получают большую часть бюджетного финансирования, средств от общественных организаций и целевых программ. Однако основная часть адресного обслуживания специалистов и непосредственная поддержка научных исследований осуществляются кругом научных и научно-технических библиотек, в т. ч. отраслевыми библиотеками РАН. В 2000 г. в Академии наук 369 отраслевых библиотек обеспечивали информацией около 400 научно-исследовательских учреждений (НИУ), обслуживая более 100 тысяч читателей.

Главной типологической особенностью этих библиотек является их ориентация на обслуживание конкретного научного коллектива с четко определенными информационными потребностями, вытекающими из тематики исследовательских работ. Это влечет за собой формирование профильного фонда, особого справочно-поискового аппарата и гибкого библиотечного обслуживания. В научных библиотеках график работы абонемента, выставки новых поступлений и тематические экспозиции организованы удобно для тех, кто месяцами работает "в поле" (геологи, географы, палеонтологи и др. специальности, связанные с экспедициями) или посещает головной институт по системе "присутственных дней" 2-3 раза в неделю. Карточные каталоги и картотеки, системы классификаций имеют большое количество гибридных вариантов и разновидностей, приспособленных для раскрытия особенностей данной научной дисциплины и поиска пертинентной информации.

Автоматизация библиотечных процессов требует изменений не только в технологии, но и в содержательных аспектах библиотечной работы. Меняются позиция библиотеки и её активность во взаимоотношениях с читателями, пересматриваются требования к библиотечному сервису, индивидуальным формам информационного обеспечения и, как следствие, показателям качества библиотечной работы. Рассмотрим это положение на примере академической библиотеки НИУ, переходящей от традиционной технологии к автоматизации отдельных процессов, а затем к созданию автоматизированной библиотечно-информационной системы.

Научная библиотека с традиционной технологией помогает профессиональной деятельности ученых, которые проявляют инициативу в общении с библиотекой. "Диалог" может состояться только при условии обращения читателя, посещения им библиотеки, оформления заказа на литературу. Библиотека при активном поведении читателя отвечает на поступивший запрос, но научный сотрудник, не записавшийся в библиотеку (т.е. потенциальный читатель), её работой никак не охвачен. Библиотека оказывает услуги "внешним" читателям, пришедшим из других учреждений, но не может предложить информацию "своим" научным сотрудникам, по различным причинам не обратившимся в библиотеку.

Предполагается также, что чем выше качество работы библиотеки: "точнее" её комплектование и классификация, удобнее справочный аппарат, шире спектр услуг, выше профессионализм сотрудников, - тем чаще её будут посещать читатели. Поэтому статистические показатели всегда учитывали, в первую очередь, количественные параметры библиотечной работы: количество читателей, книговыдач, посещений, справок и др. Хотя высокое количество посещений может отражать некачественную работу библиотеки - например, неоднократные обращения за нужным изданием, которого в данный момент нет на месте.

Информация активнее используется, если она приближена к специалисту, поэтому расширение информационного аспекта библиотечной работы предполагает возможность обслуживания вне стен библиотеки. Отраслевые библиотеки НИУ появились в Академии наук на рубеже 19 в. для повышения сервиса обслуживания - узкопрофильные издания, постоянно необходимые для работы ученых, максимально приближались к рабочему месту. Посещение Библиотеки Академии наук требовало значительных затрат времени, а наличие профильного отраслевого фонда в НИУ экономило это время. Поэтому в отраслевой библиотеке обслуживание всегда было ориентировано на профессиональные потребности читателей, и три основных фактора - "полнота информации + оперативность её предоставления + индивидуальный подход" - в течение многих десятилетий неизменно определяли требования к библиотеке.

Информационное направление в работе библиотек стало усиленно развиваться, разделяясь на различные виды групповой и индивидуальной информации в период автоматизации в 70-80 гг. Это практически не изменило технологию широкого круга научных библиотек. Однако сочетание автоматизации в центральных библиотеках с вниманием к информационному обеспечению ученых в НИУ расширяло сферу библиотечного обслуживания и повышало активность библиотек в их взаимоотношениях с читателями. Например, БЕН РАН инициировала в своей сети развитие ИРИ на базе магнитных лент ВИНИТИ, переводя информацию для библиотек НИУ на бумагу. Различные модификации ИРИ, групповой и индивидуальной информации, бюллетени новых поступлений и другие формы обслуживания на этом этапе библиотечно-информационных технологий соединяли библиотеку непосредственно с рабочими местами ученых. Библиотекарь посещал отделы НИУ или, при небольшом штате библиотек, выделенные от отделов информаторы приносили оповещения о новых документах на рабочие места. Более широкий спектр услуг позволял точнее учесть информационные потребности исследовательских групп (лабораторий, отделов, секторов).

В этот период появились попытки оценить качество информационной работы библиотек, используя сложные количественные показатели. Они выражали различные соотношения, например: "запрос/оповещение"; "всего оповещений/в т.ч. новых" и т.п., - давая представление о полезности информационных услуг и активной позиции библиотеки. Но это относилось лишь к одному аспекту библиотечной работы.

Автоматизация библиотечной технологии в Академии наук проводилась, в основном, в центральных библиотеках и слишком сильно затянулась, т.к. и в настоящее время многие библиотеки НИУ к ней еще не приступали. Внедрение автоматизации изменяло технологию, но мало отражалось на системе библиотечных услуг, о чем можно судить по стабильности перечня показателей оценки работы библиотек. Например, после появления в библиотеках технических средств был введен учет ксерокопирования, но подход к взаимоотношениям "читатель - библиотека" и уровню сервиса в библиотечной деятельности оставался прежним. Его изменили сетевые технологии, которые уже используются в части отраслевых библиотек НИУ.

Появление сетевых технологий в библиотеках НИУ явилось новым этапом в развитии их деятельности и поставило эти библиотеки в неравные условия. Поскольку техническим оснащением и подключением библиотек к Интернет занимались институты РАН, далеко не всегда создавались автоматизированные системы. Нередко автоматизация осуществлялась как вставной фрагмент в привычную библиотечную деятельность: в читальный зал ставился компьютер с доступом к Интернет, иногда приобреталась база данных на CD-ROM. Эти услуги предназначены для посетителей читального зала, не имеющих компьютера или подключения к Интернет на рабочем месте. Такая форма обслуживания по-прежнему предполагает, что активность должны проявлять ученые, которые посещают библиотеку. Появление фрагментов автоматизированного обслуживания повлекло за собой расширение показателей работы библиотек, но опять количественных: учитываются количество обращений к базам данных и человеко-часы работы с базами данных или в Интернет.

Центральные библиотеки намного шире освоили эти возможности, т.к. имеют собственные автоматизированные библиотечно-информационные системы и создают электронные ресурсы. В то же время, с нашей точки зрения, отраслевые научные библиотеки сейчас имеют особенно интересные возможности для развития, которые отсутствуют у других видов библиотек. Сравним подход к обслуживанию читателей в библиотеке с традиционной технологией и возможности, предоставляемые автоматизированной библиотечной системой, включенной в локальную сеть НИУ РАН.

Задачи библиотек НИУ, сформулированные как "полнота информации + оперативность её предоставления + индивидуальный подход" сохраняются в полном объеме на протяжении почти двух столетий. Важно отметить, что библиотеки НИУ соответствуют этим требованиям, но, за исключением уже упоминавшихся выше бюллетеней новых поступлений и разновидностей ИРИ, информация не доставлялась на рабочее место. Приходя в библиотеку за книгой, ученый не всегда получал её сразу: нет в библиотеке, занято, задержали по МБА, в переплете, на выставке и т.п. Поэтому библиотечное обслуживание, даже приближенное к рабочему месту, все равно требовало затрат времени и читательской активности в добывании информации. Появление новых технических средств позволяет пересмотреть привычный подход к обслуживанию ученых и рассматривать повышенный уровень библиотечного сервиса в качестве нового стандарта.

В научных библиотеках читательская активность изначально заложена в концепцию обслуживания и организацию библиотечной деятельности, которая поощряет библиотекарей за высокую посещаемость библиотеки. Это можно проследить в системе показателей библиотечной работы, где учитывается всевозможная посещаемость (библиотеки, выставки новых поступлений, читальных залов и др.), хотя давно известно, что прямой связи с качеством работы библиотеки у этих показателей нет. По-настоящему обслуживать на рабочем месте и предоставить ученому услугу в удобное время и в нужной форме традиционная библиотека не могла. Качество её работы и уровень предлагаемого сервиса сложно было оценить, хотя в Академии наук делались попытки разработать некий стандарт в обслуживании, которому должны были соответствовать библиотеки НИУ. Например, в ЦБС БЕН РАН в 1986 г. было разработано методическое пособие "Виды информационно-библиографической работы, рекомендуемые библиотекам ЦБС БЕН АН СССР, в зависимости от штата", определявшее для различных по количеству читателей, объему фонда и штатной численности сотрудников библиотек НИУ унифицированные наборы форм информационного и библиографического обслуживания. По существу этот документ гарантировал читателям различных библиотек НИУ определенный стандартный уровень информационного обслуживания.

Библиотекари привыкли, что концепции автоматизированных информационных систем направлены на изменение технологии, а не на расширение библиотечного обслуживания, и по-прежнему ожидают активного поведения и поиска информации от читателей, хотя разработка автоматизированной библиотечно-информационной системы позволяет многое изменить в отношениях "библиотека - читатель". Следовательно, пора пересмотреть сложившуюся в отраслевых научных библиотеках систему услуг с учетом новых возможностей и специфических задач этого вида библиотек.

Наличие одного-двух компьютеров, соединенных с Интернет, в традиционной библиотеке дает некоторые дополнительные возможности получения информации, но качественно не меняет всю систему услуг. Иное дело, когда разрабатывается собственная автоматизированная библиотечно-информационная система и локальная сеть библиотеки является подсистемой сети НИУ. Такая ситуация означает, с одной стороны, что рабочие места ученых автоматизированы и ученый может, минуя "свою" библиотеку, получить значительный объем информации, в том числе и библиотечной. Например, ученые через Интернет находят нужные документы и шифры их хранения в каталогах других библиотек. С другой стороны, библиотекари занимаются организацией автоматизированной технологии и созданием баз данных, являясь носителями консервативного стереотипа мышления и не понимая, что обслуживание не обязательно должно осуществляться в стенах библиотеки. Библиотека может перенести по сети на рабочий стол ученого часть своих технологических процессов, связанных с обслуживанием, т.е. фактически стать частью его рабочего места. Тогда у библиотеки появляется возможность занять активную позицию в общении с ученым и предложить ему ряд услуг и информационное обеспечение. У пользователя отпадет необходимость посещения библиотеки для промежуточных операций, таких как заказ литературы, постановка на очередь, поиск в РЖ, заказ по МБА или заказ ксерокопий, знакомство с новыми поступлениями и др. Электронный адрес пользователя позволит перевести эти процессы в режим удаленного заказа или переписки. Предложение комплекса услуг через локальную сеть НИУ или Интернет, действительно приближает библиотеку к рабочему месту ученого. Библиотека сэкономит его время без ущерба для качества информационного обеспечения исследований и на практике осуществит индивидуальный подход, обслуживая на рабочем месте уже не группу специалистов, а конкретного ученого.

"Рабочее место ученого" не обязательно тождественно письменному столу в здании НИУ. Рабочий процесс может проходить в лаборатории или в вузе, где ученый преподает, в другом НИУ, где он участвует в работе научных семинаров или диссертационных советов, в библиотеке и, наконец, в домашних условиях. Причем, ученые всегда совмещали исследовательскую работу с педагогической и издательской, так как этого требует процесс научных коммуникаций, поддерживающий все виды научной деятельности и воспроизводство научных кадров. Поэтому и рабочее место исследователя "распределялось" в научных учреждениях, требуя для участия в различных процессах физического присутствия ученого. Сейчас с помощью новых технологий "распределенное рабочее место" ученого реорганизуется: часть процесса научных коммуникаций, редакторская работа и, частично, поиск информации выводятся на рабочий стол с персональным компьютером. Одной из важнейших подсистем этого автоматизированного распределенного рабочего места и будет отраслевая научная библиотека НИУ, услуги которой доступны через локальную сеть и Интернет.

Концепция предоставления ученым услуг на рабочем месте предполагает, что читатели будут посещать библиотеку НИУ лишь на конечном этапе технологической цепочки поиска пертинентной информации, чтобы просмотреть выставку новых поступлений или взять (вернуть) документ. Поэтому должен измениться и подход к оценке деятельности этого вида библиотек. Старая система показателей перестает действовать, т.к. не отражает реально проходящие в библиотеках процессы. Например, доступ по сети к базе данных исключает возможность анализа её использования, т.к. регистрируется факт запроса, но не известен результат работы с базой (найдена ли нужная информация, какое количество ссылок пользователь считает полезными и т.п.). Экономия времени ученого неизбежно сокращает количество посещений библиотеки, т.к. заказы по МБА, постановка в очередь на занятые издания и другие процедуры осуществляются по электронной почте. Копирование и электронная доставка небольших по объему статей или разделов документов способствует сохранности фонда, но опять сократит количество посещений, т.к. ученому не надо будет оформлять выдачу и возврат первоисточника. Поэтому вопрос оценки деятельности автоматизированных библиотек, ориентированных на сервис, пора ставить на повестку дня.

Привычная оценка деятельности библиотек по количеству посещений и читателей предполагает, что снижение этих показателей позволяет сокращать и библиотечный персонал. Процесс сокращения штатов в научных библиотеках уже вышел за разумные пределы - в библиотеках некому работать. Однако автоматизация библиотек не означает сокращение объема работ - изменяется характер труда. Кроме того, автоматизация библиотек требует обязательного создания электронных баз данных, которые должны охватывать и раскрывать, как минимум, ядро информационных ресурсов библиотеки. Это необходимо для нормального процесса обслуживания ученых. Поэтому в оценке деятельности библиотек должно учитываться и это направление работы, требующее квалифицированных кадров. Новые возможности информационного обеспечения и повышение библиотечного сервиса требует не количественной, а качественной оценки.

Нам представляется, что в библиотеках НИУ качественную сторону их работы, в том числе уровень сервиса, легче оценить, чем в универсальных публичных библиотеках. Поскольку академические библиотеки должны охватывать обслуживанием всех научных сотрудников, количество читателей должно соотноситься в процентах с исследовательским коллективом НИУ, для которого и организована библиотека. Стремиться нужно к 100% охвату специалистов, занятых исследовательской работой. Читатели из других организаций или из хозяйственных подразделений НИУ должны учитываться отдельно, т.к. не входят в основной контингент, для которого создавалась специальная библиотека. Обслуживание может подразделяться на "библиотечное" (т.е. производимое в помещениях библиотеки) и "удаленное" (в режиме удаленного доступа на рабочем месте). Для "удаленного" обслуживания нужно разработать стандартный перечень библиотечных услуг, предоставление которых библиотека гарантирует "своим" пользователям (например, получение электронного бюллетеня новых поступлений, заказ на издания из фонда, заказ по МБА, заказ на ксерокопирование, постановка в очередь на нужное издание).

Для оценки качества работы отраслевой академической библиотеки можно использовать следующие показатели:

В автоматизированной библиотеке "полнота обслуживания" будет означать наличие библиотечного обслуживания и непосредственно в стенах библиотеки, и на рабочем месте в режиме удаленного доступа. Для ученых возможен выбор удобных форм обслуживания, сочетание традиционных услуг и удаленного доступа. Может появиться группа пользователей, заинтересованная преимущественно в новых формах, что зависит от особенностей научной дисциплины и характера деятельности. Например, ученый может получать электронные бюллетени новых поступлений, просматривать библиотечные каталоги и картотеки для уточнения ссылок, пользоваться базами данных, доступными по локальной сети НИУ, но подолгу не посещать библиотеку и практически не пользоваться её фондом, если ему достаточно вторичной информации. Однако он должен учитываться в числе пользователей библиотеки, а полезность её информационных ресурсов для данного ученого может подтверждаться ежегодной перерегистрацией электронного адреса с подтверждением желания получать бюллетени новых поступлений и прочую информацию. Несомненно, что будет также и группа читателей, предпочитающих непосредственный контакт с книгами любому другому виду услуг. Важно, что предлагаемые библиотекой формы обслуживания позволят каждому ученому подобрать оптимальный для него режим библиотечно-информационного обеспечения.

Мы полагаем, что основной вектор развития отраслевых библиотек НИУ, это - адресная система услуг, в т.ч. - предоставляемых ученым непосредственно на рабочем месте, индивидуальный подход к пользователям. В работе отраслевых библиотек будет создаваться и накапливаться еще один важный положительный эффект. Поскольку автоматизация распределенных рабочих мест ученых требует организации обслуживания не только через сетевой, но также через удаленный доступ к информационным ресурсам, то библиотеки НИУ будут создавать базы данных, которые постепенно наполнят российскую часть Интернет отраслевой информацией.

Концепция предоставления библиотечных услуг на автоматизированном распределенном рабочем месте ученого или специалиста затрагивает широкий круг научных и научно-технических библиотек, работающих в различных отраслях науки и промышленности. Поэтому финансовая поддержка автоматизации отраслевых библиотек с достаточно представительными фондами позволит, с нашей точки зрения, быстрее создать совокупные отраслевые БД с глубокой ретроспективой раскрытия документов, а также повысить информационную обеспеченность ученых и специалистов.

Литература:

  1. Виды информационно-библиографической работы, рекомендуемые библиотекам ЦБС БЕН АН СССР, в.зависимости от штата /Сост. Т.М. Беляева, З.Г. Высоцкая, В.Б. Григорьева. - М., 1986. - 37с.
  2. Калёнов Н.Е. Проблемы развития системы информационно-библиотечного обеспечения научных исследований РАН// 275 лет на службе науке: библиотеки и институты информации в системе РАН: Сб. науч. тр./ РАН. Информ.- библ. совет.- М.,2000.- С.66-72.
  3. Смирнов С.Н. Углубление индивидуального подхода в информационно-библиотечном обеспечении ученых (на опыте библиотеки института кристаллографии РАН)// 275 лет на службе науке: библиотеки и институты информации в системе РАН: Сб. науч. тр./ РАН. Информ.- библ. совет.- М.,2000. - С.119-123.
!14

Использование Science Citation Index
в библиометрических исследованиях
науки

Н.А. Слащева, Т.Н. Харыбина, В.В. Васильчиков
Центральная библиотека Пущинского научного центра РАН (отдел БЕН РАН)

Представленный доклад посвящен использованию метода цитат-анализа в библиометрических исследований науки с применением базы данных Science Citation Index на CD-ROM.

Современное состояние в области информационно-библиографического обслуживания (ИБО) пользователей в России и во всем мире характеризуется бурным развитием компьютерных технологий, обилием информационных ресурсов и способов доступа к ним. Одно из ведущих мест среди информационных ресурсов в ИБО ученых прочно занимают базы данных на компакт-дисках, которых в области естественных наук в мире создано огромное количество, обеспечивающих высокую полноту и оперативность отражения материалов. Одна из них - база данных Science Citation Index (SCI) на CD-ROM представляет собой политематическую библиографическую, а с 1991г. - реферативную базу данных. По своим поисковым возможностям она является уникальной. Поиск информации в ней возможен: по терминам из заглавия, из поля ключевых слов, из реферата, по авторам, по цитированию (поиск работ, ссылающихся на данную работу или на любые работы определенного автора), по элементам контактного адреса, по аббревиатуре названия журнала, по полному названию журнала. Таким образом, эта база данных используется как для ретроспективного информирования пользователей по разовым и постоянно-действующим запросам, так и, благодаря отражению в SCI цитируемых публикаций, значительно расширяющих ее возможности, для наукометрических исследований при изучении информационных потребностей пользователей и оценки значения научных работ ученых в мировой информационной системе. Именно эта особенность базы данных SCI была использована в следующих наукометрических исследованиях.

В современных условиях функционирования библиотеки, учитывая постоянное ограничение в валюте на приобретение иностранной периодики, при одновременном удорожании самих изданий, возникает проблема по комплектованию фонда наиболее информативными иностранными журналами, которые в наибольшей степени отражали бы тематику исследований ученых. Одним из критериев отбора при градации иностранных журналов в соответствии с их информационной значимостью является цитат-анализ. В данном случае ранжирование журналов проводилось в двух направлениях.

Первое направление основано на анализе цитирования иностранных журналов в статьях ученых Пущинского научного центра РАН (ПНЦ). Для выполнения этого исследования вся пристатейная библиография из публикаций ученых Центра, статьи которых были отражены в SCI за 1991-1997 гг., были выведены в отдельный массив публикаций. Затем с помощью специальной программы БЕН было построено частотное распределение журналов по количеству на них ссылок учеными ПНЦ за семь лет. Для этих журналов вводится относительный показатель библиографии Kбi (отношение общего количества ссылок ei на данный журнал к суммарному значению ссылок на иностранные журналы учеными ПНЦ), т.е. Kбi=eiё S ei.

Второе направление с использованием цитат-анализа было проведено также с помощью специально разработанной программы в БЕН по определению количества цитирования научных работ заведующих лабораторий восьми НИИ Центра другими исследователями с 1991-1997 гг. По данным этого анализа был определен список иностранных журналов, в которых отражены статьи отечественных и зарубежных ученых, цитирующих публикации научных сотрудников ПНЦ. В результате чего, формируется массив журналов, в котором каждый из них характеризуется относительным значением цитирования Kцi, которое является отношением количества ссылок fi в данном журнале на работы специалистов ПНЦ к общему количеству ссылок на труды ученых ПНЦ. Таким образом, Kцi=fiё S fi.

Цитатный анализ выявляет также тенденции развития и состояния науки, изучая межличностные отношения - информационные связи между учеными. С его помощью можно проследить историю научных открытий и личной причастности разных исследователей к данным открытиям. В библиотеке с помощью специально разработанной программы, позволяющей вести поиск цитируемости автора вне зависимости от его порядкового номера в статье, проводятся исследования по цитируемости и числу опубликованных работ конкретных ученых, отдельных лабораторий и институтов ПНЦ. Это дает возможность оценить: общую продуктивность лаборатории, вклад отдельных научных сотрудников и заведующих лабораторий, значимость научных работ, выявить наиболее цитируемые статьи, определить язык публикации, которая обладает преимущественным цитированием, отражает ли цитируемость реально успешные исследования, отмеченные другими формами признания (государственные премии, получение гранта и т.д.).

В качестве модели, с помощью SCI была проведена работа по оценке развития небольшой лаборатории "Системной организации нейронов" в Институте Теоретической и Экспериментальной Биофизики РАН (ИТЭБ РАН), которой руководит доктор биологических наук, профессор О. С. Виноградова.

Для изучения цитируемости публикаций лаборатории был проведен полный их учет по картотеке трудов сотрудников Центра со дня ее основания, т.е. с 1965 года. Кроме этого был составлен полный список всех сотрудников лаборатории, в настоящий момент работающих в ней. Из этих данных составлялись сведения о цитируемости каждой отдельной работы по годам, т.е. определялась цитируемость как отдельных сотрудников, так и каждой отдельной работы.

На основании этих данных был определен тотальный индекс цитирования лаборатории, т. е. цитируемость всех работ по годам, а также проведен сравнительный анализ цитирования англо- и русскоязычных публикаций.

Кроме того, была изучена цитируемость отдельных работ по годам. Условно было принято, что наиболее цитируемыми будут считаться работы, на которые в течение года было не менее пяти ссылок. Таких работ оказалось семь.

Для определения группы журналов, отражающих тематику исследований лаборатории, были подсчитаны ссылки в каждом из них. Далее они были сгруппированы по количеству ссылок в них на публикации лаборатории. Для наглядности ссылки были разбиты по годам, и журналы расположены по числу ссылок в них в убывающем порядке. Наибольшее количество ссылок на работы встречаются в журналах: Neuroscience, Hippocampus, Journal of Neurophysiology, которые содержат актуальные работы, касающиеся предмета исследования лаборатории "Системной организации нейронов".

SCI можно использовать для изучения информационных потребностей ученых с целью выявления информационной значимости иностранных журналов. Наконец, хотелось бы еще раз подчеркнуть, что SCI является универсальным инструментом как для библиографического поиска, так и выяснения цитируемости (следовательно, важности) целых отраслей знания.

!15

Использование электронных ресурсов в
информационном обеспечении научных
исследований

Т.Н. Харыбина, Н.А. Слащева, И.Ю. Черкасова, С.В. Дронов
(Отдел БЕН РАН в ПНЦ)

Центральная библиотека Пущинского научного центра РАН (ЦБП) является отделом Библиотеки по естественным наукам РАН (БЕН) и входит в её централизованную библиотечную систему (ЦБС), возглавляя, в свою очередь, локальную ЦБС, состоящую из 8 библиотек институтов Пущинского научного центра РАН. Она всегда играла роль основного источника всех видов научной информации и была ориентирована на обеспечение пользователей как традиционной литературой, так и разносторонней информацией в области естественных наук с использованием новейших электронных технологий. И сегодня, несмотря на огромное количество проблем разного рода, библиотека продолжает развивать свою деятельность, направленную на информационную поддержку науки и образования, оставаясь центром информационно-библиотечного обслуживания ученых, студентов, аспирантов научных учреждений центра.

Применение новых электронных продуктов в информационно-библиотечной деятельности не только существенно ускоряет и повышает качественный уровень обслуживания пользователей, но и в целом преобразует и видоизменяет весь комплекс существующих технологий, обеспечивая не только своевременный и быстрый доступ пользователей к информации и первоисточникам, но и в целом, создает условия для реализации одного из главных принципов открытого общества - принципа всеобщей доступности информации.

В настоящее время в библиотеке реализована система информационно-библиографического обслуживания, которая предоставляет своим пользователям огромный спектр информационно-библиографических услуг: от поиска информации в базах данных, электронных каталогах на CD-ROM и через Internet до электронной доставки документов.

Электронные ресурсы предоставляемые Библиотекой своим пользователям, включают в себя как собственные ресурсы, созданные в БЕН РАН или ЦБП, так платные и бесплатные ресурсы, созданные другими организациями, доступ к которым приобретает и организует БЕН РАН или Научный центр.

Организационно, обслуживание пользователей ЦБП информацией в электронной форме осуществляется двумя путями: обеспечение прямого доступа читателей к библиографической, реферативной и полнотекстовой информации доступной в сети Интернет и организацией текущего и ретроспективного информирования по базам данных на CD-ROM.

Базы данных на CD-ROM занимают одно из ведущих мест среди информационных ресурсов в ИБО ученых Центра. Такой интерес к ним со стороны пользователей и информационно-библиографических служб закономерен, так как наглядно проявляются их преимущества перед печатными изданиями; прежде всего - это многоаспектный, комбинированный поиск, большой хронологический охват, высокая скорость получения информации, возможность предоставления результатов на бумаге и дискете, а также передача информации пользователю по электронной почте. В области естественных наук в мире создано огромное количество баз данных, обеспечивающих высокую полноту и оперативность отражения материалов. Поэтому очень важно в условиях жестких финансовых ограничений уметь оценить информационные и поисковые возможности баз данных и выявить наиболее ценные, отвечающие информационным потребностям ученых Центра. Результаты опроса и анкетирования пользователей Библиотеки показали, что для удовлетворения их информационных потребностей отдается предпочтение следующим зарубежным базам данных на CD-ROM - SCI, Medline, Current Contents, Chemical Abstracts, Biological Abstracts. Данные этого анализа представлены на рис.1.

Рис. 1

Для обеспечения пользователей ПНЦ текущей информацией Библиотека использует базы данных Current Contents, данные из которых значительно опережают появление первоисточников на выставке новых поступлений и служат надежным подспорьем в научно - исследовательской работе, предоставляя доступ к последним достижениям науки.

В отличие от Current Contents, обеспечивающей текущее информирование, следует отметить большой интерес со стороны ученых ПНЦ к базе данных SCI, которая дает исчерпывающую информацию о мировой научной литературе в области естественных, технических, медицинских и сельскохозяйственных наук. Потребность в использовании этой базы выразили ученые всех институтов Центра. Направленность запросов за 2 года такова:

Тематические 42%

Библиографические уточнения 21%

Библиометрические 37%

Проведенный анализ использования SCI учеными ПНЦ в течение двух лет показал:

а) благодаря широким поисковым возможностям и хорошему отбору документов эта база данных представляет интерес для всех специалистов ПНЦ (биологов, химиков, математиков, физиков);

б) эта база данных необходима ученым ПНЦ для ретроспективного информирования пользователей по разовым и постоянно-действующим запросам;

в) отражение в SCI цитируемых публикаций значительно расширяет возможности этой базы, которые могут быть использованы для наукометрических исследований при изучении ИП и анализа развития ПНЦ, а также оценки значения научных работ ученых ПНЦ в мировой информационной системе.

Цитатный анализ выявляет также тенденции развития и состояния науки, изучая межличностные отношения - информационные связи между учеными. С его помощью можно проследить историю научных открытий и личной причастности разных исследователей к данным открытиям.

В настоящее время эти исследования проводят многие информационные центры и библиотеки во всем мире, и спрос на такие сведения вырос и в нашей стране: как со стороны РАН, в частности отделения физико-химической биологии, так и со стороны различных отечественных и зарубежных фондов. Все чаще за такими данными обращаются ученые при подаче заявок на гранты, которые должны содержать краткое описание состояния вопроса.

Благодаря электронной версии SCI на CD-ROM, а также разработанной в БЕН РАН специальной программе, позволяющей вести поиск цитируемости автора вне зависимости от его порядкового номера в статье, в библиотеке регулярно проводятся исследования по цитируемости и числу опубликованных работ конкретных ученых, отдельных лабораторий и институтов ПНЦ. Это дает возможность оценить: общую продуктивность лаборатории, вклад отдельных научных сотрудников и заведующих лабораторий, значимость научных работ, выявить наиболее цитируемые статьи, определить язык публикации, которая обладает преимущественным цитированием, отражает ли цитируемость реально успешные исследования, отмеченные другими формами признания (государственные премии, получение гранта и т.д.).

База данных по биомедицине Medline на CD-ROM, созданная Национальной Медицинской библиотекой США, также представляет большой интерес для ученых ПНЦ. Medline содержит библиографическую информацию с рефератом с 1966 по 1998 гг. Глубокая ретроспектива документального массива и развитая поисковая система обеспечивают широкие возможности этой базы для удовлетворения информационных потребностей ученых ПНЦ в области биомедицины.

Исследования, проведенные по результатам тематического поиска в нескольких базах данных (SCI, Medline) за период с 1991 по 1997 года по одинаковым запросам в области ФХБ, свидетельствуют, что наиболее полная и релевантная информация была получена из SCI.

Используя поисковые возможности баз данных SCI и Medline можно сформировать массив публикаций восьми НИИ Центра, которые отражены в них с 1991 года по 1997 год (Рис. 2). Анализ распределения публикаций в этих базах данных показал, что с 1995 года происходит увеличение числа публикаций ученых ПНЦ, входящих в состав SCI, что несомненно является отражением нарастающего подъема науки в ПНЦ.

Рис. 2

Эти базы используются и для изучения информационно-библиографических потребностей ученых Пущинского научного центра РАН (ПНЦ), одним из направлений которого является определение иностранных журналов, обладающих наибольшей информационной значимостью для ученых ПНЦ.

Этот процесс представляет собой сочетание как традиционных методов, так и методов, связанных с использованием электронных источников информации - баз данных на CD-ROM (Medline и Science Citation Index). Так были проанализированы массивы публикаций ученых ПНЦ в иностранных журналах, включенных в базы данных Science Citation Index (SCI) и Medline за период 1991-1997 гг, и сформирована группа информативных журналов по этому показателю.

Также для оценки информационной значимости иностранной периодики использовался метод цитат-анализа, который давно завоевал признание в качестве метода исследования в информатике, библиометрии. Первое направление основано на анализе цитирования иностранных журналов в статьях ученых ПНЦ, для чего вся пристатейная библиография из публикаций ученых Центра, статьи которых были отражены в SCI за 1991-1997 гг., были выведены в отдельный массив публикаций. Затем с помощью специальной программы БЕН было построено частотное распределение журналов по количеству на них ссылок учеными ПНЦ за семь лет.

Второе направление с использованием цитат-анализа было проведено также с помощью SCI и специально разработанной программы в БЕН по определению количества цитирования научных работ заведующих лабораторий восьми НИИ Центра другими исследователями с 1991-1997 гг. По данным этого анализа был сформирован список иностранных журналов, в которых отражены статьи отечественных и зарубежных ученых, цитирующих публикации научных сотрудников ПНЦ.

Другая база данных, созданная Институтом Научной Информации США (ИНИ США), JCR содержит информацию о числе публикаций и ссылок из 4600 лучших научных журналов, в том числе из 108 российских изданий. С её помощью у ученых ПНЦ и библиотекарей есть возможность определения импакт-фактора конкретного журнала, что особенно важно в настоящее время при оценке информационной значимости научных журналов как для ученых, так и для библиотечных работников, перед которыми стоит задача формирования репертуара иностранных журналов. Именно с помощью JCR ученые ПНЦ могут получать информацию о научных журналах, в которые следует направлять статьи для публикации с целью оперативности включения результатов их исследования в мировой информационный поток.

Кроме вышеперечисленных, в ЦБП имеются и активно используются базы данных Chemical Abstracts, Biological Abstracts, а также PestBank, ChemBank, WasteInfo.

Наряду с базами данных по научной тематике большой популярностью в ЦБП пользуются правовая база данных "Консультант Плюс", Иллюстрированный энциклопедический словарь-98 (ИЭС-98). Энциклопедия из серии "Золотой фонд", подготовленная издательством "Большая Российская Энциклопедия", которая включает три энциклопедических словаря ("Иллюстрированный энциклопедический словарь", "Энциклопедический словарь Брокгауза и Эфрона", "Толковый словарь живого великорусского языка В. Даля"). Общий объем мультимедиа - энциклопедии - 225000 терминов (около 20 томов книжных первоисточников), 1 час видео, 8000 полноформатных иллюстраций, 200 карт, свыше 300 звуковых и музыкальных фрагментов. Система поиска позволяет легко и быстро найти любую статью во всех трех словарях. Гипертекстовые связи между статьями, высококачественные иллюстрации, причем не только графические, но и звуковые, и видео-иллюстрации, а также возможность выделить нужный фрагмент и перенести в текстовый редактор, создают информационный комфорт при работе с этой базой.

Не менее популярна энциклопедия "Британика", которая является одной из самых объемных, распространенных и популярных энциклопедий в мире. Она издается почти на десяти языках, библиотека имеет в своем фонде это многотомное издание как в печатном виде, так и на CD-ROM. По мнению экспертов "Britannica CD" - это информационный прорыв в XXI век. На одном диске - полный текст 32-х томов энциклопедии, а также последнее издание самого популярного в США словаря английского языка- "Merriam-Webster's Collegiate Dictionary". Она содержит 44 миллиона слов, её объем значительно превосходит другие аналогичные электронные энциклопедии. Главная её особенность - это уникальная информационно-поисковая система, а полученную информацию можно распечатать на принтере. Тысячи превосходных иллюстраций, схем, карт, таблиц делают работу с энциклопедией удобной и комфортной.

Внедрение технологий удаленного доступа в систему информационно-библиографического обслуживания предоставило новые возможности для удовлетворения потребностей специалистов ПНЦ. Проведенный анализ позволил выделить актуальные направления в использовании Интернет для информационного обеспечения пользователей: получение полнотекстовой и библиографической информации; поиск адресной информации для установления контактов с коллегами, включая авторов публикаций для получения копий; поиск сведений о различных научных фондах, конкурсах для получения грантов; поиск информации о научных мероприятиях (симпозиумах, конференциях, а также о международных научных обществах); поиск необходимой информации в библиотечных каталогах всего мира; поиск и "перекачивание" для дальнейшего использования свободно распространяемого программного обеспечения; использование Интернет для передачи информации при взаимодействии с библиотеками ЦБС БЕН и другими российскими и международными информационными и библиотечными центрами; передача и получение заказов по МБА и ММБА.

Среди баз данных, представленных в Интернет, хотелось бы отметить базу данных UnCover, содержащую оглавления из 17 000 периодических изданий. Её создает Объединение научно-технических библиотек штата Колорадо. Являясь бесплатной библиографической базой данных универсального характера, система UnCover допускает поиск по автору, названию источника, ключевым словам с возможностью сочетания терминов. Помимо получения библиографической информации владельцы базы данных предоставляют возможность получать и полные тексты статей за дополнительную плату.

Также в рамках проекта "Электронная информация для библиотек" мы получили возможность использовать базы данных EBSCO, в которых предоставлена не только реферативная, но и полнотекстовая информация.

Получая доступ к вторичной информации, ученые одновременно нуждаются в первоисточниках, которые из-за финансовых трудностей зачастую отсутствуют даже в крупных библиотеках России. Этот пробел восполняют полнотекстовые электронные версии периодических изданий ведущих издательств мира. В настоящее время, благодаря проекту "Электронная библиотека", читатели ЦБП и её филиалов имеют возможность доступа к полным текстам периодических изданий издательств "Springer", "Elsevier" и надеемся, что в этот список войдут и другие ведущие идательства, как Academic Press, Kluwer и др.

Электронные журналы, как компьютерные аналоги бумажных изданий, так и те, которые существуют исключительно в электронном виде, несмотря на некоторые неудобства при чтении статей с экрана компьютера, их использование становятся все более привычным делом, особенно, если доступ к ним возможен с рабочего места ученого. Электронные источники предоставляют огромные объемы информации, которую можно получить задолго до появления печатного аналога. Использование электронных журналов значительно улучшило обслуживание в библиотеках и значительно расширило возможности в удовлетворении ИП ученых. У электронных журналов есть ряд преимуществ перед печатными источниками, прежде всего это:

  1. более короткий срок поступления к пользователю по сравнению с журналами в печатной форме;
  2. разнообразие доступа (на CD-ROM, и в режиме он-лайн);
  3. возможность "перекачивания" полного текста статьи в память персонального компьютера пользователя;
  4. отсутствие необходимости переплета и размещения в книгохранилище;
  5. возможность одновременного использования одного и того же журнала несколькими читателями;
  6. дополнительные услуги: выборка информации и навигации внутри одного документа или среди нескольких.

И все же прежде, чем электронные журналы займут подобающее им место, необходимо преодолеть ряд организационно-финансовых и технических трудностей, а также решить проблемы, связанные с соблюдением прав на интеллектуальную собственность с учетом принципов свободного распространения информации. Но несмотря на имеющиеся трудности, электронные журналы быстро завоевывают популярность и служат хорошим дополнением к изданиям на бумажных носителях.

В настоящее время в Библиотеке уделяется большое внимание обеспечению пользователей патентной информацией, в которой крайне заинтересованы ученые ПНЦ. Одним из источников её получения являются американские, канадские, японские и французские базы данных, представленные через сеть Интернет.

По оценке пользователей лучшими поисковыми возможностями, оперативностью и полнотой предоставляемой информации выделяются следующие базы данных: USPTO и IBM (США), ESPOCENET (Европейские патенты), Japio (Япония), INPI (Франция), PATSCAN (Канада).

По результатам анализа можно сделать вывод, что наибольшим спросом для всех категорий читателей являются американские базы данных IBM, USPTO. От всех других их отличает, в первую очередь, очень хорошие поисковые возможности, большой хронологический охват документов, оперативность включения материалов в базу, а также возможность получения релевантной полнотекстовой информации.

ЦБП успешно осваивает и новую технологию электронной доставки документов, которая позволяет намного оперативнее получать требуемую информацию по сравнению с традиционными формами доставки литературы. Так, до недавнего времени, через каналы БЕН РАН, ЦБП регулярно получала по электронной почте электронные копии заказываемой литературы из Баварской библиотеки, ЦБП также активно использовала возможность передавать заказы МБА непосредственно в Институт Научной Информации Франции INIST в режиме удаленного доступа через сеть Интернет. При этом благодаря возможности удаленного просмотра электронных каталогов осуществляется заказ "не вслепую", что способствует гораздо более эффективному удовлетворению информационных нужд читателей.

Кроме того, ЦБП непосредственно принимает участие в электронном обмене документами с рядом других библиотек, в частности с американской фирмой Access Russia Incorporation (на партнерских основах), что позволило начать регулярный прием копий первоисточников из многих крупных университетских библиотек США и приобрести необходимый опыт в создании и пересылке собственных электронных версий документов.

Наряду с рассмотренными внешними информационными ресурсами важным элементом в системе ИБО для более полного удовлетворения ИП ученых ПНЦ являются собственные информационные ресурсы. Они представляют большой интерес не только для ученых ПНЦ, но и для коллег из других городов России, Ближнего Зарубежья и иностранных ученых.

Собственные информационные ресурсы ЦБП включают:

Каталоги. Они обеспечивают справочной информацией пользователей о фондах ЦБП и ЦБС БЕН.

В настоящее время ЦБП, являясь отделом Библиотеки по Естественным Наукам РАН (БЕН РАН) и используя разработки специалистов ОСИАТ БЕН РАН, активно занимается как созданием текущих электронных каталогов книг и периодических изданий ЦБП на основе соответствующих электронных каталогов БЕН, так и ретроспективным наполнением своих электронных каталогов, с целью максимально более полного представления информации о фонде библиотеки в машиночитаемом виде.

Электронный каталог книжных изданий ЦБП ведется с 1995 г. на основе программного комплекса "SOLAR", разработанного ОСИАТ БЕН РАН. Основой создания электронного каталога ЦБП служит технологическая база БЕН РАН, содержащая результаты централизованной обработки литературы. В настоящее время эта база данных в полном объеме берется два раза в месяц с сервера БЕН средствами FTP, из взятой базы программным путем отбираются записи, относящиеся только к фонду ЦБП, и формируется своя технологическая база. Затем осуществляется инвентаризация и шифровка документов, т.е. каждой новой библиографической записи присваивается свой инвентарный номер и классификационный шифр (с начала своего создания ЦБП ведет классификацию литературы по ББК, в БЕН же классификация фонда ведется по УДК), и эти данные вносятся в технологическую базу ЦБП. Новые записи добавляются к основной уже существующей базе. Так формируется сводный электронный каталог книг ЦБП. В настоящее время электронный каталог книг содержит информацию за 5 последних лет.

Более того, ЦБП проводит работу по ретроспективной конверсии обычного карточного каталога в электронную форму. С этой целью разработана оригинальная технология ретроконверсии, отличительной особенностью которой является согласованное использование различных источников данных (инвентарных книг, топографического и алфавитного каталогов, а также существующих внешних баз данных РКП и ГПНТБ) с целью свести к минимуму количество информации, требующей ручного ввода, необходимой для получения полного библиографического описания книги с шифром, инвентарным номером, сиглой библиотеки-филиала, в которой находится книга, отвечающей стандартам инвентаризации, принятым в ЦБП.

Аналогичная работа ведется и над электронным каталогом периодических изданий. Создание и поддержка периодических изданий, а также доступ к нему, осуществляется на базе комплекса программ "ДИСКАТ", разработанного также ОСИАТ БЕН РАН. Данная система обеспечивает формирование базы данных заказываемых периодических изданий для библиотек-филиалов, а также быстрый доступ и экономное размещение информации о распределении поступивших выпусков. Электронный каталог периодики ЦБП ведется с 1992 года. Кроме того, данная система используется также и для предоставления доступа к электронным каталогам отечественных и зарубежных периодических изданий фонда БЕН, регулярно обновляемым по FTP с сервера БЕН.

Кроме этого в Библиотеке создаются:

  1. Проблемно-ориентированные реферативные базы данных, которые содержат необходимую информацию по тематике научных исследований ученых Центра.
  2. Базы данных научных трудов сотрудников Центра.

Таким образом, организация комплексного информационно-библиографического обслуживания научных исследований, проводимых в ПНЦ заключается в организации предоставления свободного доступа к мировым информационным ресурсам, а также выдаче пользователям информации различного типа, начиная от результатов поиска библиографической, наукометрической и реферативной информации по запросам до предоставления первоисточников на различных носителях.

!16

Современные технологии в службе МБА БЕН РАН

С.А. Власова, Н.Е. Калёнов
(БЕН РАН
)

Одной из важнейших функций Библиотеки по естественным наукам Российской академии наук (БЕН РАН), возглавляющей крупнейшую в России централизованную библиотечную систему (ЦБС), является предоставление пользователям первоисточников по межбиблиотечному абонементу (МБА). Поскольку БЕН РАН выполняет функции центра МБА страны в области естественных наук, её абонентами может стать любая отечественная организация. В настоящее время служба МБА БЕН РАН обслуживает библиотеки 177 академических организаций страны, 116 библиотек московских неакадемических учреждений, 159 иногородних неакадемических организаций. Приоритетным обслуживанием пользуются 80 библиотек НИИ РАН московского региона, входящих в так называемую службу внутрисистемного межбиблиотечного абонемента (ВМБА). В рамках данной службы заказчикам предоставляются материалы не только из фондов собственно ЦБС БЕН РАН, но и, по возможности, из фондов других библиотек, с которыми БЕН РАН имеет договора по МБА. Все операции, связанные с обслуживанием абонентов (сбор запросов, справочно-библиографическая работа с ними, получение литературы из всех источников, развозка её библиотекам-заказчицам и возврат библиотекам-фондодержательницам), производятся в централизованном порядке через отдел МБА БЕН. На службу ВМБА приходится 60% от всех заказов, поступающих в БЕН.

В 2000 году служба МБА БЕН получила от своих абонентов 35 тысяч 800 заказов, из которых 21 тысяча заказов поступила от абонентов ВМВА, 4 тысячи 900 запросов были получены от иногородних академических библиотек, 6 тысяч - от московских неакадемических, 3 тысячи 900 - от иногородних неакадемических библиотек.

Все технологические процессы службы МБА БЕН полностью автоматизированы благодаря разработанной системе диспетчеризации заказов, которая позволяет регистрировать поступающие заказы; вводить информацию об ответах на заказы и возврате литературы; контролировать сроки обработки заказов и возврата изданий; получать всевозможную статистическую информацию о заказах; вести учет стоимости заказов для всех абонентов.

Помимо традиционных заказов, которые БЕН получает по почте, информация в систему МБА поступает из следующих источников:

Система обслуживания читателей (СОЧИ) [1] позволяет автоматизировать все технологические процессы, связанные с учетом читателей, предоставлением литературы из собственных фондов библиотеки и по межбиблиотечному абонементу.

СОЧИ поддерживает четыре взаимосвязанные базы данных: читатели, библиотеки, заказы по МБА и заказы из фондов библиотеки. Система предоставляет следующие возможности:

В процессе формирования заказа СОЧИ предоставляет возможность распечатывать бланк-заказ по МБА [2], который полностью соответствует бланку, принятому в БЕН для службы ВМБА [3]. Кроме того, система позволяет сформированные заказы выгружать в упакованном виде в текстовый файл, который затем передается в БЕН по электронной почте. Таким образом, из СОЧИ заказы поступают в БЕН либо в виде распечатанных бланков (из библиотек, не работающих с электронной почтой), либо по электронной почте. В первом случае информация в систему диспетчеризации заказов по МБА вводится непосредственно с распечатанных бланков-заказов системным администратором, во втором - специальная программа пакетного ввода обрабатывает файл заказов, полученный по электронной почте: вводит данные в систему диспетчеризации и распечатывает бланки-заказы по МБА.

С 1997 года в БЕН функционирует служба приема и обработки заказов по МБА, поступающих из разных городов России по электронной почте в специальном формате. В 1996 году на 3-ей международной конференции "Крым-96" специалистами академических библиотек (БЕН РАН, ГПНТБ СО, БАН) и РГБ был согласован предложенный БЕН РАН формат для обмена заказами по электронной почте между библиотеками России.

Заказ в этом формате состоит из совокупности обязательных и факультативных полей переменной длины, которые содержат необходимую информацию, предусмотренную ГОСТом 7.31-89 на бланк - заказ по МБА.

Перед каждым полем помещается его уникальный идентификатор - соответствующая ему метка из двух символов, заключенная в угловые скобки < >. В конце поля ставится терминатор </P>. Внутри поля допускается любое количество пробелов и символов перевода строки. Поля могут присутствовать в файле в любой последовательности. Каждый заказ заканчивается разделителем ***.

Обязательные поля записи заказа и соответствующие им метки:

Факультативные поля:

Набор факультативных полей в записи заказов должен быть достаточен для идентификации заказываемого материала, он определяется заказчиком в каждом конкретном случае.

Сформировать заказы в данном формате можно в любом текстовом редакторе. Как показал опыт, при формировании заказов "вручную" возникает большое количество ошибок, которые затрудняют обработку заказов. В связи с этим была разработана специальная программа, позволяющая вводить информацию о заказе и записывать её в файл в необходимом формате. Полученные по электронной почте заказы обрабатываются программой, которая вводит информацию в систему диспетчеризации заказов и распечатывает бланки заказов, в максимальной степени соответствующих ГОСТу 7.31-89. Данный бланк-заказ [1] был разработан специалистами БЕН и утвержден межведомственной комиссия по МБА при РГБ.

С 1999 года для абонентов БЕН начала функционировать система формирования заказов через Интернет. Данная система позволяет использовать электронные каталоги БЕН, доступные в Интернет - каталог журналов (содержит сведения о поступлениях в ЦБС БЕН, начиная с 1990 года) и каталог книг и продолжающихся изданий (отражает поступления отечественной литературы, начиная с 1993 года, и зарубежной, начиная с 1995 года).

Вход в систему осуществляется по гиперссылке "Заказ литературы из фондов БЕН" с Home Page БЕН (http://ben.irex.ru). Переход по гиперссылке "Первичная регистрация абонента" позволяет пользователю получить информацию об условиях абонирования в БЕН. После заключения договора на информационно-библиотечное обслуживание информация о пользователе (название и код библиотеки, почтовый и электронный адреса, фамилия ответственного лица) заносится в базу данных и абоненту присваивается код и пароль доступа в систему.

Для формирования заказов система предоставляет три режима работы: заказ из каталога журналов, из каталога книг и заказ без использования каталогов.

Режим заказа без использования каталогов необходим в том случае, когда требуемое издание не содержится в каталогах. В данном режиме абонент вводит информацию о заказе в окна специальной HTML - страницы. Вводятся: номер заказа, фамилия читателя, элементы библиографического описания издания, выбирается нужный носитель информации.

Процедура формирования заказа из каталога журналов состоит из последовательного перехода от странице к странице по выбранным гиперссылкам. Пользователь выбирает выпуск требуемого журнала и вводит в специальную страницу дополнительную информацию о заказе: номер заказа, страницы, автора(ов) и название статьи, носитель информации, фамилию читателя. Библиографическое описание выбранного издания (название, год, том, номер), а также шифр хранения вводятся в формирующийся заказ автоматически.

Режим "Заказ из каталога книг" позволяет осуществлять заказ литературы непосредственно из режима работы с каталогом, которая начинается с поиска требуемых изданий. Поиск в каталоге возможен по словам из библиографического описания изданий, названию, автору, году издания, ISBN, ISSN. Поисковые термины могут иметь усечение справа и соединяться всевозможными логическими связками.

Результатом выполнения запросов является информация о найденных в каталоге изданиях, которая выдаётся на экран порциями (размер которых устанавливается пользователем). Каждая запись представляет собой библиографическое описание издания, соответствующее российскому стандарту ГОСТ 7.1-84. При работе с каталогом в режиме заказа изданий рядом с каждой найденной записью появляется гиперссылка "ЗАКАЗ", переход по которой осуществит формирование заказа для данного издания, аналогично работе с каталогом журналов. Повторный заказ издания во время одного сеанса работы с каталогом исключён, поскольку библиографические описания заказанных изданий при выдаче на любой запрос будут сопровождаться вместо гиперссылок "ЗАКАЗ" сообщениями "ЗАКАЗАНО".

Результатом работы системы заказа литературы в Интернет является текстовый файл на сервере БЕН. Файл состоит из записей заказов, формат которых полностью соответствует формату заказов, поступающих по электронной почте. Данный файл обрабатывается специальной программой, которая распечатывает бланки заказов по МБА (необходимые для получения изданий из хранилища) и вводит информацию о заказах в систему диспетчеризации заказов по МБА.

Служба МБА БЕН предоставляет своим абонентам оригиналы изданий, а также микрокопии и ксерокопии требуемых материалов. В 2001 году в БЕН организована служба электронной доставки документов (ЭДД), которая обеспечивает пользователей электронными копиями заказанных статей. В настоящее время все иногородние абоненты БЕН в системе формирования заказов через Интернет могут сделать заказ на электронную копию.

Технология обработки таких заказов полностью соответствует обработке заказов на традиционных носителях: ввод информации о заказах в базу данных; распечатка бланков-заказов, библиографический поиск заказанных материалов. После получения изданий из фондов сотрудники службы ЭДД сканируют соответствующие страницы заказанных статей. Электронная копия статьи представляет собой совокупность архивированных файлов TIF формата, которые пересылаются библиотеке-заказчице по электронной почте.

Одной из составляющих системы диспетчеризации заказов по МБА является программа финансовых расчетов с абонентами БЕН. Программа для каждого абонента за заданный сотрудником отдела МБА период времени определяет количество заказов и рассчитывает стоимость обработки каждого заказа в зависимости от операций, которые над ним совершались. В расчет стоимости заказа входят следующие данные: библиографический поиск, срочность выполнения заказа, поступление по электронной почте или Интернет и вид выполнения заказа (оригинал или копия). Стоимость получения оригинала определяется его местом хранения: фонды БЕН, фонды библиотек сети, читальный зал БЕН. Если пользователь заказывает копию, то цена заказа определяется количеством страниц умноженных на стоимость копии одной страницы.

Для расчетов с абонентами службы ЭДД используется отдельная программа. Стоимость заказов определяется из следующих характеристик: место хранения источника (центральный фонд или удаленные хранилища); необходимость шифровки заказа; цена одной страницы электронной копии умноженная на количество страниц статьи.

Все большее число абонентов БЕН передают свои заказы в электронном виде, отказываясь от традиционной почты. В настоящее время в СОЧИ формируют заказы более десяти библиотек НИУ РАН Москвы, Пущино и Черноголовки. По электронной почте в соответствующем формате передают заказы иногородние библиотеки, среди которых многие академические институты Новосибирска, библиотеки университетов Сургута, Саратова, Томска.

Система формирования заказов через Интернет обеспечивает самый быстрый и удобный способ заказа литературы. На сегодняшний день более 60 абонентов используют данную систему: библиотеки Екатеринбурга, Улан-Уде, Владимира, Сергиева Посада; академические институты в Иркутске, Самаре, Красноярске, Нижнем Новгороде, Иванове; библиотеки университетов Петрозаводска, Казани, Астрахани, Брянска и многие другие.

Литература

  1. С.А. Власова, Н.Е. Калёнов. Автоматизация обслуживания читателей научной библиотеки // НТИ. Сер.1, 1993, № 2, - С. 16-19.
  2. С.А. Власова, Я.Я. Докторов, Н.Е. Калёнов, О.Д. Каллистратова. Автоматизированные рабочие места библиотечных специалистов в БЕН АН СССР // Телекоммуникационные средства использования банков данных. - Новосибирск, 1999. - С. 60 - 69.
  3. Н.Е. Калёнов, М.В. Левнер. Межбиблиотечный абонемент в условиях функционирования ГАСНТИ // НТИ. Сер.1, 1988, № 7, - С. 19-20.
!17

Развитие электронного журнального
каталога в сети Интернет

А.В. Глушановский, Т.Н. Соловьева
(БЕН РАН)

С 1996 года каталоги БЕН представлены в Интернет с обеспечением доступа к ним по протоколу HTTP через стандартные браузеры.

Каталог журналов отражает порядка 5600 отечественных и зарубежных названий журналов, поступивших с 1990 года в фонды ЦБС БЕН. В каталоге отражаются как журналы, поступившие в библиотеки ЦБС централизованно, так и журналы, полученные отдельными библиотеками, минуя ЦБ. Для автоматического ввода этой информации разработаны специальные программные средства. Работая с этим каталогом, любой пользователь Интернет может выбирать журналы из алфавитного либо тематического списков. В алфавитном режиме просмотр ведётся по трем уровням (алфавит - латиница и кириллица, алфавитный список журналов на каждую букву, описание журнала). В тематическом режиме просмотр ведется по специальному двухуровневому предметному рубрикатору журналов БЕН. Просмотр возможен по четырем уровням (рубрики, подрубрики, список журналов на каждую подрубрику в алфавитном порядке, описание журнала с перечнем поступивших выпусков).

Использование возможностей современных технологий и сети Интернет позволяет Библиотеке существенно повысить уровень сервиса для своих пользователей, в том числе удаленных. Так, в журнальном каталоге БЕН РАН создана система отсылок от страниц описания журнала к оглавлениям журналов, расположенным на сайтах издательств, выпускающих данный журнал (эта работа поддерживается РФФИ в рамках проекта 00-07-9097 "Развитие системы общедоступных электронных ресурсов БЕН РАН"). Наличие таких ссылок существенно расширяет возможности пользователей, позволяя им, не приходя в библиотеку, получать информацию не только о поступлении того или иного выпуска журнала, но и о его содержании. При этом, если в каталоге БЕН отражаются только поступившие выпуски журналов (а их количество постоянно уменьшается из-за недостатка финансовых ресурсов), то на сайтах издательств пользователи могут знакомиться как с оглавлениями текущих выпусков, так и выпусков прошлых лет, которые БЕН не выписывала.

Как показывают многочисленные исследования информационных потребностей сотрудников РАН, научные журналы являются для них важнейшим источником информации, поэтому академические библиотеки всегда уделяли вопросам комплектования своих фондов журналами наибольшее внимание из всех видов изданий. Однако из-за недостатка финансирования в последние годы резко упало количество зарубежных журналов, получаемых научными библиотеками. Большинство ведущих издательств мира в настоящее время предоставляют пользователям доступ к электронным версиям своих журналов через Интернет, но в большинстве случаев доступ к полным текстам журналов является платным, причем его стоимость соизмерима с ценой печатного издания. Очевидно, что отдельная, даже крупная библиотека, не в состоянии приобрести право доступа своих читателей ко всем интересующим их журналам, поэтому в последние годы, как за рубежом, так и в России, получила развитие практика объединения библиотек в консорциумы по совместному использованию электронных журналов. В настоящее время в РФ существует несколько консорциумов научных библиотек, в которых участвует БЕН РАН, что позволило ей сформировать достаточно представительный список доступных своим читателям электронных журналов.

РФФИ оказал существенную поддержку российским научным библиотекам. В рамках одного из приоритетных проектов РФФИ была создана Научная электронная библиотека (НЭБ). Она стала первой и пока единственной практически реализованной некоммерческой научной электронной библиотекой общероссийского масштаба. Число электронных журналов на библиотечном сервере РФФИ постоянно растет и уже превысило тысячу наименований.

В настоящее время на сайте НЭБ открыт доступ зарегистрированным пользователям к полнотекстовым электронным журналам издательств Elsevier и Kluwer, причем зарегистрированный пользователь имеет доступ к электронным журналам этих издательств только на сайте НЭБ. На сайтах собственно издательств его права доступа ограничены правами пользователей Интернета.

Стремясь к повышению уровня сервиса пользователей, разработчики автоматизированной системы БЕН РАН решили связать Интернет-каталог БЕН РАН с журналами Научной электронной библиотеки. Для решения этой задачи была достигнута договоренность с разработчиками НЭБ о передаче в БЕН файла, содержащего информацию о журналах, представленных в НЭБ, включая идентификаторы журналов, позволяющие автоматически строить ссылки на соответствующие WEB-страницы этих журналов в НЭБ. Специалистами БЕН была модифицирована программа построения Интернет-каталога журналов для обеспечения автоматического формирования ссылок на журналы, отраженные в НЭБ.

Таким образом более четырехсот зарубежных журналов из электронного каталога БЕН РАН были связаны с соответствующими страницами журналов Научной электронной библиотеки. В результате этого пользователь со страниц электронного журнального каталога БЕН РАН имеет возможность просмотреть журнал либо на сайте издательства, либо на сайте НЭБ.

В настоящее время ряд журналов каталога БЕН РАН имеет по две ссылки - на аналогичные страницы на сайте издательства и на сайте НЭБ РФФИ. В результате проведенного анализа выяснилось, что для пользователя эти ссылки несут различную функциональную нагрузку.

Просматривая электронные журналы на сайте Научной электронной библиотеки, зарегистрированный пользователь имеет следующие преимущества:

Работая с сайтом издательства пользователь:

В результате реализации разработанной технологии обслуживание пользователей БЕН РАН приобретает комплексный характер.

Полезность описанной системы отсылок проверялась в ходе проведенного в 2000-м году Интернет-опроса посетителей сайта БЕН РАН. Выяснилось, что более половины ответивших пользуются этой системой активно и еще более четверти используют её время от времени. Таким образом, отсылки оказались полезными почти для 79% опрошенных, что говорит о несомненной целесообразности поддержания и развития такой системы.

Необходимо отметить, что поддержка и развитие описанной многоуровневой системы доступа к научным журналам требует достаточно большой работы, связанной с актуализацией ссылок на сайты издательств (многие из них меняются достаточно часто) и поиском новых электронных журналов.

В настоящее время решается задача по подключению к базе данных журналов дополнительных ресурсов из других источников, доступных БЕН РАН.

!18

Разработка шлюза WWW-Z39.50

С.Р. Баженов, И.С. Баженов, Д.В. Черновский, Н.А. Малицкий
(Государственная публичная научно-техническая библиотека СО РАН)

Рассматривается разработка Web-ориентированного шлюза доступа к локальным и распределенным информационным ресурсам посредством протокола Z39.50 (стандарт ISO-23950).

Для разработки распределенных информационных систем сегодня используются различные технологии. Большая часть этих технологий по своей сути ориентирована не на работу с базами данных, а на сетевое взаимодействие программ и распределенные вычисления в гетерогенных средах. Применяя эти технологии отдельно или в комплексе, несомненно можно организовать сетевую работу с базами данных. Более того, для каждой конкретной СУБД можно подобрать технологию, обеспечивающую высокий уровень эффективности и функциональности. Однако ни одна из упомянутых технологий не обеспечивает универсальных способов работы с базами данных - необходимого уровня абстрагирования от конкретных систем и платформ при сохранении высокой степени функциональности и предоставления пользователю единого интерфейса доступа к различным СУБД.

Исходя из вышесказанного, в качестве базового средства для обеспечения доступа к распределенным корпоративным библиотечным ресурсам выбрана поддержка Z39.50 - современного эффективного протокола с богатыми функциональными возможностями, специально предназначенного для работы с базами данных. Технология сетевого доступа к БД здесь существенно отличается от других технологий, что обусловлено самой сутью протокола: ориентация на работу с базами данных, абстрагирование от конкретных систем, жесткая регламентация структуры пересылаемых данных. Одним из основных достоинств применения протокола Z39.50 является возможность организовать распределенную информационную систему общего назначения с богатыми функциональными возможностями. В этом случае обеспечивается одновременный прозрачный доступ к электронным каталогам и базам данных, находящимся на различных серверах, в разных городах и странах. Специализация технологии для доступа к базам данных и её жесткая стандартизация представляют разработчику многообразные возможности, многие из которых уникальны и очень ценны, а их самостоятельная проработка за рамками стандарта затруднена; разобщенность же разработчиков делает её просто невозможной. Таким образом, применение этого протокола при реализации идеи распределенной корпоративной библиотечной системы очевидна.

В основе Z39.50 лежит идея построения абстрактной модели работы с абстрактной базой данных. Каждый элемент этой абстрактной модели подробно описывается до однозначного толкования и стандартизуется с присвоением уникального идентификатора - OID. Работа с каждой конкретной СУБД согласно Z39.50 должна быть организована только через эту абстрактную модель, что позволяет, с одной стороны, однозначно отобразить логику запроса, абстрагируясь от синтаксиса запроса конкретной СУБД, а с другой - абстрагироваться от поисковых полей конкретной базы данных. Структурированные форматы внешнего представления позволяют после передачи по сети полностью сохранить первоначальную структуру записи, что является немаловажным в распределенных системах.

Применение протокола Z39.50 позволяет организовать распределенную многоцелевую информационную систему с богатыми функциональными возможностями, которая в совершенном состоянии должна и может удовлетворять следующим требованиям:

Однако основная задача любой информационной системы - предоставление информации конечным пользователям. С этой точки зрения важным компонентом любой, даже очень сложной распределенной системы является рабочее место клиента - набор программных и визуальных интерфейсов для доступа к информации. Распределенные информационные системы на основе протокола Z39.50 не являются исключением. Более того, специфический характер Z39.50 как универсального протокола доступа к базам данных усиливает значимость, повышает требования к архитектуре и функциональности программного обеспечения на стороне клиента, т.к. одно и то же рабочее место может быть использовано для доступа к совершенно разнородным системам - источникам совершенно различной информации. При этом на передний план выходят такие качества клиентского программного обеспечения, как максимально полное соответствие стандарту Z39.50 и максимально полное использование возможностей протокола без привязки к конкретной информационной системе. В этом случае клиентское рабочее место становится отдельным независимым слоем информационного комплекса.

Для систем на базе Z39.50 также существуют специализированные клиентские рабочие места. В качестве примера приведем характеристики двух известных коммерческих клиентов для работы с библиографическими базами данных. BookWhere2000 (Sea Change Corporation) - наиболее развитый настраиваемый клиент для работы по протоколу Z39.50, обеспечивающий множество возможностей: работа с несколькими сессиями одновременно, вывод результатов в различных форматах, сканирование базы индексов по атрибутам, тестирование доступности серверов и поддерживаемых ими возможностей, пакетный поиск и т.д. Однако развитая система конфигурирования и обилие информации часто превращается в главный недостаток этого клиента, запутывая неискушенного пользователя. Автоматическое получение метаинформации от сервера через "Explain" не поддерживается, и пользователь вынужден самостоятельно получать эту информацию с сервера поддержки Sea Change Corporation, либо непосредственно от администрации интересующего сервера.

Схожими возможностями обладает Znavigator, производства EnWare, также поддерживающий одновременную работу с несколькими серверами. Запросы можно строить простые или сложные, с использованием древообразного построителя запросов, при этом можно запускать один и тот же запрос в нескольких сессиях одновременно. Запросы, списки записей или сами записи могут быть экспортированы в другое приложение или в файл. Особенностью Znavigator является возможность функционирования в качестве DDE-сервера, позволяя внешним приложениям обращаться к нему и встраивать результаты поиска в свои структуры данных. Возможности настройки значительно ниже, чем в BookWhere2000, набор атрибутов поиска неизменен для всех серверов, отсутствует проверка возможности соединения и выборка информации из Explain.

Однако отрицательной чертой вышеупомянутых и других клиентов Z39.50 является некорректная работа с данными на русском языке, отсутствие поддержки различных кириллических кодовых таблиц и, естественно, англоязычный пользовательский интерфейс. Также для обеспечения клиентского места пользователю необходимо устанавливать у себя специализированное программное обеспечение, что неудобно при отсутствии собственного компьютера.

В последнее время появилась тенденция использовать в качестве универсального клиента информационной системы WEB-браузер. В своем самом простом варианте такой клиент работает с WEB-сервером по протоколу HTTP. Ответственность за адекватность отображения информации из баз данных при этом лежит на WEB-сервере, который для этой цели должен иметь специальные программы доступа к соответствующим базам данных, в нашем случае шлюз WWW-Z39.50.

В ГПНТБ СО РАН разрабатывается шлюз для работы как с локальными базами данных формата ISIS, так и поддерживающий протокол Z39.50.

Данная система доступа к библиографическим базам данных обладает развитыми средствами поиска, предлагает в зависимости от степени подготовленности пользователя несколько режимов составления поискового запроса: ПРОСТОЙ, СТАНДАРТ, ЭКСПЕРТ, МУЛЬТИ. Для проведения одновременного поиска в нескольких однотипных по поисковым терминам базах данных используется режим мультипоиска. При составлении поискового запроса можно воспользоваться средством работы со словарем базы данных. В процессе просмотра словаря требуемые поисковые термины могут быть выбраны для включения в текущий поисковый запрос, причем для режимов ЭКСПЕРТ и МУЛЬТИ возможен групповой выбор сразу нескольких близлежащих поисковых терминов. Формой выдачи результатов поиска можно управлять через установку таких параметров как формат и порция выдачи записей. Если количество найденных записей превышает порцию выдачи, то пользователь имеет возможность последовательно или произвольно перемещаться в их диапазоне и изменять формат выдачи. При просмотре результатов поиска возможно проведение уточняющего поиска по некоторым, определенным для этого, полям с возможностью отката к основному поиску. Найденные в результате поиска записи могут быть выборочно или все полностью сохранены пользователем в текстовый файл на его локальном компьютере. Также в рамках данной системы в ГПНТБ СО РАН реализована работа с полнотекстовыми базами данных. После проведения поиска в этих базах полные тексты, хранящиеся в различных форматах, могут быть загружены пользователем на его собственный компьютер.

Важной составной частью системы доступа является ведение базы данных статистики обращений пользователей к выставленным информационным ресурсам. Это позволяет оперативно выявлять степень использования предлагаемых сервисных возможностей системы, определять степень актуальности выставленных информационных ресурсов и, в конечном итоге, способствовать выработке дальнейшего направления развития функциональных возможностей данной системы.

Система доступа имеет своей целью обеспечить оперативный доступ к выставленным информационно-библиотечным ресурсам из любой точки мира. Поэтому важным моментом является наличие возможности работы с ней любому пользователю, как знающему русский язык, так и не знакомого с ним. Система ориентирована на работу с основными, используемыми в Internet, кириллическими кодировками (Windows-1251, KOI-8, ISO-8859-5, IBM-866/DOS, Mac). Это позволяет отечественному пользователю работать с системой практически с любого типа компьютеров и в любой из существующих операционных систем. Также система имеет англоязычный вариант интерфейса.

Одной из актуальных потребностей стала необходимость обеспечить возможность работы с отечественными библиографическими базами данных для иностранных пользователей системы. Суть проблемы заключается в отсутствии установленных кириллических кодировок на компьютере иностранного пользователя, что не позволяет правильно формировать поисковые запросы и отображать результаты поиска в русскоязычных базах данных. Говорить о создании, по крайней мере, английского варианта для каждой базы данных лишено смысла в рамках существующей технологии обработки документов и отсутствия требуемых для этого ресурсов. Единственным решением в данной ситуации является использование транслитерации русских символов. Причем существовало два варианта реализации транслитерации: либо выставлять для каждой базы данных её транслитерированный вариант, либо проводить транслитерацию "на лету", используя единственный, оригинальный экземпляр базы данных. В первом случае пришлось бы сопровождать два варианта базы данных (две её копии), что потребовало еще более значительных технических ресурсов (дискового пространства для хранения, вычислительных мощностей для проведения транслитерации базы данных при каждом её обновлении), а для случая распределенных баз данных вообще невозможность работы. Во втором случае дублирование исключается и транслитерация происходит "на лету" - когда происходит отработка поискового запроса и выдача результатов поиска.

Для однозначного соответствия конвертирования символов был выбран немецкий вариант транслитерации русских символов. Ознакомиться с правилами транслитерации пользователь может, воспользовавшись on-line подсказкой, где приведены таблица соответствия русских и латинских символов, а также простые примеры. Транслитерация реализована как в клиентской части системы доступа при работе со словарем базы данных, формировании и выполнении поискового запроса, так и в серверной части при выдаче результатов поиска. Пользователю при составлении запросов следует явно указывать, что вводимые им отдельные символы или целые слова являются транслитерированной формой соответствующих кириллических символов. Это связано с тем, что при выполнении поискового запроса системе необходимо провести обратное конвертирование транслитерированных символов в соответствующие кириллические символы. Поэтому для однозначного определения являются ли текущие, введенные пользователем, символы или слова транслитерированными их следует заключать в фигурные скобки. Если пользователь введет термин, не заключая его в фигурные скобки, то система при выполнении поискового выражения оставит его без изменения, считая его обычным иностранным словом. Важно отметить то, что транслитерация является составной частью пользовательского интерфейса системы (его англоязычного варианта) и не привязана к конкретной базе данных. Это позволяет легко и гибко в дальнейшем вносить изменения в программную логику текущей реализации транслитерации. Использование в рассматриваемой системе динамической транслитерации дало возможность, не нарушая традиционной технологии обработки баз данных, предоставить доступ к выставленным русскоязычным библиографическим базам данных для любого пользователя Интернет.

В связи с наличием широкого спектра выставленных информационно-библиотечных ресурсов в рамках данной системы была создана подсистема регистрации и управления правами доступа пользователей к этим ресурсам.

Говорить о создании Web-ориентированной системы управления библиографическими базами данных можно в том случае, когда она помимо наличия развитого поискового инструментария будет включать в себя механизм ведения данных. Это предполагает добавление, изменение и удаление записей. Поэтому следующим шагом в развитии системы доступа стала разработка программного модуля on-line ведения библиографических баз данных. Закономерно, что в качестве инструмента реализации ввода данных был выбран обычный Web-навигатор. Это связано с тем, что, во-первых, Web-навигатор, имеет стандартный, унифицированный пользовательский интерфейс, состоящий из ограниченного набора элементов, что позволяет пользователю быстро освоиться с интерфейсом; во-вторых, отпадает необходимость сопровождения клиентской части системы при внесении изменений в программный код, который загружается Web-навигатор с сервера; в-третьих, не имеет значения, где расположен компьютер пользователя - он может находиться как во внутренней Интранет сети организации, так и в любом другом месте глобальной сети Интернет. Обеспечение возможности изменения данных в on-line режиме особенно остро ставит вопрос, связанный с правами доступа пользователей на редактирование содержимого выставленных баз данных. Поэтому при реализации системы on-line ведения была решена задача аутентификации пользователей с предоставлением им возможности, в соответствии с их правами, производить редактирование в выставленных базах данных. Созданная система on-line ведения представляет собой удобный для пользователя инструмент ввода, который обладает максимально возможной функциональностью и, в то же время, легок для понимания. Интеграция данной системы ведения с уже существующей информационно-поисковой системой позволяет говорить о появления полнофункциональной Web ориентированной системы управления библиографическими базами данных.

Это является законченным решением для ведения библиографических баз данных в Интернет характерными чертами которого являются:

В заключении следует отметить, что описанная система уже находится в эксплуатации более трех лет и за это время показала свою жизнеспособность. Тем не менее, она постоянно находится в развитии, что естественно для системы такого класса. Более подробно ознакомиться с работой системы можно по адресу http://www.spsl.nsc.ru.

!19

Z39.50 и каталог журналов БЕН РАН

О.Д. Каллистратова
(БЕН РАН)

Сегодня в Интернет все больше организаций, в том числе и библиотек всего мира, объединяют свои информационные ресурсы в корпоративные информационные системы на основе протокола Z39.50, который позволяет реализовать одновременный поиск информации в неоднородной компьютерной среде с динамическим подключением различных баз данных, независимо от их структуры и метода доступа. Z39.50 является международным стандартом сетевого протокола прикладного уровня, который первоначально разработан Американским Национальным Институтом Стандартов (ANSI) для поиска в библиографических базах данных и постепенно расширяет свои возможности.

Корпоративные информационные системы на основе протокола Z39.50 впервые появились около десяти лет назад в США и через пять лет - в Западной Европе. Сегодня практически все крупные библиотеки США и Европы обеспечивают корпоративный доступ к своим каталогам и постоянно координируют свою работу по модернизации протокола Z39.50 (http://lcweb.loc.gov/z3950). В последние годы корпоративные системы стали создаваться и в России, например, RusLaNet в Санкт-Петербурге (www.ruslan.ru/z3950) и GeoLibr в Новосибирске (www.uiggm.nsc.ru/z3950). Не так давно к этому процессу подключились и библиотеки Москвы, в том числе и БЕН РАН, разумеется.

Создание корпоративной информационной системы на основе протокола Z39.50 включает в себя установку собственного сервера Z39.50 и подключение к нему собственных (а также внешних) баз данных. Для доступа к этим базам с Web-страниц дополнительно устанавливается шлюз WWW-Z39.50.

Стандарт протокола Z39.50 жёстко регламентирует правила, форматы и семантику запросов и процедур, управляющих обменом сообщениями в технологии клиент-сервер, и гораздо сложнее в реализации по сравнению с протоколом HTTP. Однако сегодня в Сети имеется несколько базовых пакетов программ для построения систем на основе протокола Z39.50, которые реализуют львиную долю его функций, таких как:

Из них наиболее популярны два свободно доступных пакета:

Оба пакета содержат прототипы Z-сервера, Z-клиента, шлюза WWW-Z39.50 для поиска с Web-страниц, а также некоторые средства для работы с базами данных. Они доступны как в виде уже готовых программ для различных платформ, так и в виде исходных текстов, что позволяет их модифицировать.

Большинство существующих сегодня корпоративных информационных систем реализовано на основе одного из этих двух пакетов. Например, в системе RusLaNet использован пакет Isite(CNIDR), а сервер ZooPARK разработан в Новосибирске на основе пакета Zebra/YAZ.

В корпоративной системе для каждой базы данных необходим свой механизм поиска, выбора и представления информации, реализация которого зависит от структуры базы данных и возможностей конкретного сервера.

Каждая база данных в такой системе должна предоставлять свою информацию в Сеть согласно правилам протокола Z39.50, в которых чётко определены структуры и форматы пересылаемых данных, а каждый элемент представляется в стандартных терминах абстрактной базы данных. Абстрактная база понимается как коллекция записей, содержащих наборы элементов данных, и описывается до однозначного толкования с помощью:

Поисковые запросы всегда формулируются только в терминах абстрактных наборов атрибутов и формируются из элементов этих наборов по правилам данного стандарта. Такой подход позволяет однозначно отобразить логику запроса независимо от конкретных элементов баз данных.

Основные наборы атрибутов поиска, поддерживаемые протоколом Z39.50:

Bib-1- Bibliographic

GILS - Government Information Locator Service

STAS - Scientific and Technical

DL - Digital Library Collections

CIMI - Museum Collection Information

GEO - Digital Geospatial Metadata

Для выдачи информации стандартом Z39.50 предусмотрен выбор определенных наборов элементов записей, а также форматов их представления, конвертирование в которые реализуется сервером автоматически через схему абстрактной записи.

Все форматы представления стандартизированы и включают в себя:

SUTRS - Simple Unstructured Text Record Syntax

GRS1 - Generic Record Syntax

OPAC - Online Public Access Catalogue

Summary - Bibliographic Summary syntax

MARC formats - USMARC, UNIMARC, UKMARC, CANMARC, RUSMARC

Explain - Server Information syntax

Extended - Extended Services record syntax (HTML, XML, PDF, TIFF, GIF, etc)

Таким образом, для включения в распределённую поисковую систему реальной базы данных необходимо определить соответствие между её элементами и элементами абстрактной базы данных по стандарту Z39.50 и разработать модули взаимодействия с сервером.

Корпоративная информационная система БЕН РАН создана в рамках проекта LibWeb и использует сервер ZooPARK. Сервер ZooPARK передаётся только в виде готовых программ для определённых платформ, поэтому его установка является чисто технической задачей в отличие от задачи реализации доступа к собственным базам данных. Сервер ZooPARK взаимодействует с этими базами данных двумя способами:

В составе данного сервера Zebra может работать с данными трёх типов:

Каталоги книг и журналов БЕН РАН формируются и представляются в Сети раздельно, т.к. их базы данных сильно отличаются по своему составу, структуре, и технологии поиска. Базы данных журналов, в отличие от баз данных книг, гораздо меньше стандартизированы, сильно структурированы, имеют меньше поисковых элементов и содержат большое количество дополнительной информации о выпусках журналов. Такую дополнительную информацию удобнее всего представлять в Сети в виде статических либо динамических HTML-страниц.

По технологии создания и обновления в Сети каталога журналов БЕН РАН информация из базы данных журналов конвертируется в текстовые файлы. Такие файлы удобно обрабатывать входным фильтром сервера Zebra, поэтому этот метод и был выбран при разработке способа включения каталога журналов БЕН РАН в корпоративную информационную систему.

Реализация этого метода включает в себя:

Входные фильтры сервера Zebra представляют собой ASCII-файлы с наборами правил, использующих элементы RegX (Regular Expressions). Эти правила определяют соответствие между элементами реальной и абстрактной баз данных. Кроме того, они позволяют "на лету" включать в сами записи ссылки на связанные с ними HTML-страницы.

Сервер Zebra подключает фильтры при индексации, поиске и выдаче информации из текстовых файлов. Кроме этого, он индексирует служебную базу данных IR-Explain-1, которая, согласно последней версии стандарта Z39.50, может хранить информацию о сервере, базах данных, атрибутах, форматах и т.д. и позволяет клиентам дополнительно настраиваться на конфигурацию Z-сервера.

В корпоративной системе БЕН РАН эта служебная база предоставляет информацию о версии сервера ZooPARK и базах данных БЕН РАН.

Разработанные программы - входной фильтр для сервера Zebra и конвертер информации, вместе с корректировкой настроечных файлов сервера, обеспечили включение в корпоративную поисковую систему каталога журналов БЕН РАН с автоматической поддержкой всех функций и форматов стандарта Z39.50, реализуемых встроенным в ZooPARK сервером Zebra.

Особо необходимо отметить, что данный метод позволил объединить в корпоративной поисковой системе преимущества двух сетевых протоколов Z39.50 и HTTP - быстрый поиск и удобное представление информации.

!20

Использование протокола Z39.50
в БЕН РАН

В.П. Варакин, С.А. Власова
(БЕН РАН)

В настоящее время протокол Z39.50, наряду с протоколом HTTP, используется для доступа к базе данных, содержащей сводный электронный каталог книг и продолжающихся изданий БЕН РАН. В его состав входят серии, труды различных организаций и обществ, материалы конференций. Каталог отражает поступления в ЦБС БЕН РАН отечественной литературы, начиная с 1993 года, и зарубежной, начиная с 1995 года.

База данных, поддерживающая каталог, имеет нестандартную структуру и нетрадиционный язык манипулирования данными, что существенно осложнило прямое использование макетного динамического провайдера, поставляемого с сервером ZooPARK (разработан ОИГГиМ СО РАН в рамках проекта Libweb), на основе которого осуществляется доступ к каталогу.

В связи с этим дополнительно были реализованы:

Предоставленный макетный провайдер данных содержит библиотеку динамических функций, которые были модифицированы в соответствии с внутренней структурой базы данных каталога.

Изменены функции поиска - dll_search и представления - dll_present: в частности, в них добавлено обращение к новым специальным функциям (proc_record, search_Z39), обеспечивающим поиск записей в электронном каталоге книг и продолжающихся изданий БЕН. В качестве алгоритма поиска был взят соответствующий алгоритм системы представления данного каталога в Интернет под протоколом HTTP.

Строка запроса sQueryBuf, передаваемая в функции исходного провайдера данных, имеет синтаксис:

sQueryBuf ::= 'a=' AttrSet rpnString

AttrSet ::= VAL_BIB1 | VAL_GILS | VAL_EXP1 |...

rpnString ::= aptString | '(o=' operator aptString aptString ')'

aptString ::= '(' ['['attrList ']'] termLen '"' term '"' ')'

term ::= string

termLen ::= integer

attrList ::= AttrSet aTyp aValue [attrList]

aTyp ::= integer

aVal ::= integer

Например, запрос на поиск записей изданий автора "Иванова", названия которых содержат термин "Геолог" с правым усечением, будет иметь вид:

a=4 (o=0 ([4 1 1003] 6 "Иванов")([4 1 4 4 5 1] 6 "Геолог"))

Функции proc_record распаковывает строку запроса, помещая данные в следующие переменные:

term1,term2,term3 - поисковые термины;

field1,field2,field3 - номера поисковых полей в БД БЕН;

comb_out12,comb_out23 - логические связки между строками запроса.

Номера поисковых полей определяются из файла TABL.INI, имеющего следующую структуру:

<номер в строке запроса - aValue > <номер поля в БД БЕН>

Функция search_Z39 принимает приведенные выше переменные, осуществляет поиск в базе данных и возвращает количество найденных записей. Найденные в результате поиска записи помещаются в файл в формате GILS, из которого производится их выдача пользователю функцией dll_present.

Созданный провайдер данных, представляющий собой динамическую библиотеку функций, был реализован в среде Windows 2000 c использованием средств Microsoft Visual C++ 6.0 и включен в систему сервера ZooPARK. Данный провайдер обеспечивает поиск в каталоге книг и продолжающихся изданий по запросам, содержащим от одного до трех поисковых терминов (допускается правое усечение), связанных логическими "И", "ИЛИ", "НЕ".

В настоящее время на стадии реализации провайдер данных для каталога НАУКА РОССИИ.

Наряду с этим осуществлена разработка нового интерфейса и модификация исполнительной части GATEWAY Z39.50 (базовый вариант разработан ОИГГиМ СО РАН).

На текущий момент GATEWAY Z39.50 БЕН РАН обеспечивает доступ к следующим базам данных.

Базы документов "Агрос" ЦНСХБ РАСХН.

В настоящее время разрабатывается новая версия GATEWAY Z39.50, обладающая дополнительными функциональными возможностями.

!21

Развитие системы формирования
тематико-типологических планов
комплектования (ТТПК)

З.Г. Дмитриева, Я.Я. Докторов
(БЕН РАН)

Технологические процессы комплектования централизованной библиотечной системы (ЦБС) БЕН РАН, включающие предварительный заказ литературы и все последующие операции, связанные с регистрацией поступления, распределением изданий и подготовкой всех сопроводительных документов, реализованы и успешно функционируют в рамках автоматизированной системы БЕН РАН (АС НАУКА) [1, 2].

В рамках системы ведется работа по созданию комплекса автоматизации комплектования ЦБС БЕН РАН. В [3] описаны задачи и общие принципы создания автоматизированной системы формирования тематико-типологического плана комплектования (ТТПК) библиотек, входящих в ЦБС БЕН, а также приведено краткое описание функционирования программ создания баз данных (БД) индексов УДК в среде DOS.

В настоящее время разработана WINDOWS - версия программного обеспечения автоматизированной системы формирования ТТПК. Новая версия системы реализована в среде визуального программирования С++ Builder 4.0; при этом авторы системы не привлекали стандартные СУБД, а использовали базовое программное обеспечение, разработанное в БЕН РАН и поддерживающее модифицированный формат ISO-2709.

Система поддерживает работу трех взаимосвязанных БД:

Работа по созданию БД индексов УДК проводится совместно с отделом систематизации БЕН РАН. Сотрудники отдела систематизации предоставляют текстовые файлы рубрик, которые конвертируются в соответствующие поля записей БД индексов УДК.

Использование среды визуального программирования С++ Builder позволило существенно расширить поисковые возможности системы. При этом элементами поиска в БД могут являться как значения поисковых полей (например, УДК, Слова из названия и Начальный фрагмент названия), так и их различные комбинации, связанные логическими "И" и "ИЛИ".

Отрицательный результат поиска сопровождается соответствующим сообщением. Результаты положительного поиска отражаются на экране дисплея (ЭД) в виде различных таблиц (сигл библиотек, записей и др.). Например, в результате поиска таблица сигл библиотек отражается на ЭД в порядке приоритета на поступившее издание. Приоритет определятся исходя из весовых коэффициентов [3], заданных в базе данных ТТПК. Весовые коэффициенты учитывают, насколько тематика организаций, обслуживаемых библиотеками ЦБС БЕН, соответствует тематике и типу поступившего издания, учитываются также количество и стоимость литературы по данной тематике, полученной библиотекой-абонентом за определенный период времени (например, за год) и т.д.

Актуализация полей БД (поддержка всех БД, корректура, сервис) сопровождается соответствующим формально-логическим контролем и дружественным интерфейсом общения с пользователем.

В настоящее время система функционирует в режиме опытной эксплуатации.

Литература

  1. А.В. Васильев. Автоматизация технологических процессов комплектования непериодическими изданиями в системе БЕН РАН (SOLAR) // Новые технологии в информационно-библиотечном обеспечении научных исследований: Сб. науч. тр. - М., 1992. - С.125-130.
  2. Я.Л. Шрайберг, Ф.С. Воройский. Автоматизированные библиотечно-информационные системы. - М.: ЛИБЕРЕЯ, 1996. - 273 с.
  3. З.Г. Дмитриева, Я.Я. Докторов, Н.Е. Калёнов. Использование базы данных ТТПК в технологии комплектования БЕН РАН. // Новые технологии в информационно-библиотечном обеспечении научных исследований: Сб. науч. тр. - М., 1999.
!22

Поиск информации с использованием структурно-химической базы данных Registry

В.М. Хуторецкий, Н.В. Круковская
(Институт органической химии РАН)
khutor@ioc.ac.ru

Стремительный рост потока научно-технической информации в 20 веке обусловил появление многочисленных реферативных журналов. С середины 20 века на основе реферативных журналов стали возникать электронные базы данных (БД), представляющие собой реферативный журнал в машиночитаемой форме. Повсеместное распространение персональных компьютеров в наше время способствует тому, что число пользователей электронными БД растет. В свою очередь электронные БД можно подразделить на БД внутренние, записанные на переносных носителях (дискетах, оптических компакт-дисках и т.д.), и на БД, находящие в режиме online (теледоступа). В рамках STN (Scientific and Technical Information Network) представлено около 70 БД по химии в режиме online. Московский информационный центр РАН-STN (МИЦ) работает с 1991 года в Институте Органической химии им. Н.Д. Зелинского и имеет значительный опыт поиска информации в электронных БД.

Отличительной особенностью химической информации является её быстрый рост и одновременно медленное старение. Трудно себе представить биолога, черпающего информацию из журналов конца 19 века, но для химиков обращение к первоисточникам 100 летней давности имеет вполне практический смысл. Пользователя, при выборе источника информации, интересует во-первых, насколько широко в нем представлена информация из максимально возможного массива первоисточников, и, во-вторых, насколько полно в нем представлена ретро информация, то есть с которого года начинается охват первоисточников по теме. Однако пользователя-химика интересует еще и насколько полно представлена в рассматриваемом источнике информация о веществах - ведь те или иные вещества упоминаются примерно в 30% всей научной литературы. Одним из крупнейших поставщиков в области химической информации является служба Chemical Abstracts Service (CAS). На сегодняшний день у реферативного журнала Chemical Abstracts практически нет конкурентов как по временному охвату (с 1907 года по настоящее время), так и по количеству реферируемых источников (около 8000 журналов, два международных патентных ведомства, около 30 национальных патентных ведомств). CAS предоставляет возможность получать информацию во всех формах: печатный реферативный журнал, CD-ROM и БД в режиме online (с несколькими вариантами интерфейса). Поскольку содержание всех этих форм одинаковое (а содержание - основное в выборе источника информации), корректно сравнить их во-первых, с точки зрения предоставляемых пользователю удобств и, во-вторых, по цене.

Сам процесс получения информации, необходимой для научного сотрудника, использующего реферативные журналы или соответствующие БД, можно условно разделить на три этапа:

 

ПЕЧАТНЫЙ РЕФЕРАТИВНЫЙ ЖУРНАЛ CHEMICAL ABSTRACTS

(1907 - TODAY)

БД НА CD-ROM

(1977 - TODAY)

БД ONLINE

1) CAOld (1907-1957)

2) CAOld/Registry (1957-1967)

3) CA/Registry

(1967 -TODAY)

4) CAPlus/Registry

(1967 -TODAY)

1

Работа с различными указателями, чтобы выбрать рефераты по интересующей тематике

Поиск по словам (фрагментам слов) или регистрационным номерам CAS

Поиск по словам (фрагментам слов) или/и структурный поиск

2

Просмотр выбранных рефератов, что позволяет более точно подобрать нужную литературу

Оценка релевантности найденной информации по заголовкам, ключевым авторским словам, индексным терминам и рефератам

3

Работа с первоисточниками

Использование электронных БД позволяет провести первый и второй этапы за существенно более короткое время. Пополнение БД ONLINE (CAPlus и Registry) происходит ежедневно - и сразу же информация доступна пользователю. Печатный реферативный журнал и БД на CD-ROM пополняются новой информацией каждую неделю или месяц, соответственно, но эта информация еще должна быть издана и доставлена. На третьем этапе в БД ONLINE возможно получение первоисточника. Следует подчеркнуть основное качественное преимущество машинного поиска в режиме ONLINE - поиск по фрагменту, неважно слова, формулы или химического названия. Однако очень важно, что только в режиме ONLINE можно проводить поиск фрагмента структурной формулы в структурно-химической БД Registry.

БД Registry производства CAS ведется с 1957 года, в настоящее время содержит данные о 31 млн. (июнь 2001) соединений. В это число включены индивидуальные органические и неорганические вещества, их соли и смеси, сплавы, полимеры, биопоследовательности. Для каждого из указанных веществ приведены их регистрационные номера по CAS (CAS RN), химические названия (как по номенклатуре CAS, так и тривиальные или торговые), структурные формулы, молекулярные формулы, список баз данных, в которых есть упоминание этих веществ. Информация, представленная в БД Registry, объединяет содержание целого ряда указателей, которые выпускаются к печатному реферативному журналу CA, причем как доступных (Chemical Substance Index, Formula Index), так и не очень. Не всякая библиотека, получающая печатное издание CA, имеет в своем распоряжении Registry Handbook, Ring Systems Handbook, Ring Systems Index. Эти издания не входят в комплект годовой подписки на реферативный журнал CA, но могут быть заказаны за отдельную плату. Содержание всех этих печатных источников, которые можно рассматривать как дополнения к указателям, представлено в БД Registry.

Представление конкретных веществ в БД СА осуществляется при помощи регистрационного номера CAS - CAS RN. БД CA широко использует в качестве индексных терминов CAS RN. Помимо CA регистрационные номера присутствуют в индексных терминах как в других библиографических, так и в фактографических БД, причем не только в STN, но и правительственных документах США и многих международных документах. Основной целью поиска в БД Registry является найти CAS RN для одного или нескольких веществ с тем, чтобы получить информацию о способах получения, физико-химических свойствах, применении, фирмах производителях и т.д. этих веществ из других, отвечающих тематике запроса, БД STN. Иногда количество веществ может достигать десятков тысяч. Из этого множества формируется список, который задается в качестве поискового термина в соответствующих тематике запроса БД STN, использующих регистрационные номера. Таким образом, БД Registry является одной из важнейших БД STN, позволяющая сфокусировать суть запроса на конкретных веществах в большом количестве БД STN.

Информация, найденная в БД Registry нужна не только как отправная точка для построения запросов в других БД, но и для того, чтобы проверить соответствие торгового или тривиального названия структурной формуле, CAS RN - структурной формуле, то есть уточнить информацию о конкретных веществах. Таким образом, БД Registry может заменять ряд справочников.

Структурный поиск, возможный во многих мелких БД, играет неоценимую роль в системе БД CAS, поскольку здесь он проводится в самом большом из имеющихся массивов. Это обстоятельство является решающим при выборе Registry в качестве основного источника информации по веществам. Около 60% поисков, выполненных в МИЦ, приходится на этот, достаточно дорогой вид поиска информации. Структурный поиск нельзя провести не только в печатных изданиях, но и в аналогичных выпусках CD-ROM.

Сравнение по ценам: годовая подписка на реферативный печатный журнал Chemical Abstracts с доставкой - $24 000, электронная БД CA на CD-ROM - $25 200. Возможность работать с удаленными БД в режиме online позволяет платить только за ту информацию, которая интересна пользователю, освобождая от необходимости оплачивать всю БД на электронном носителе или подписку на реферативный журнал.

МИЦ, благодаря поддержке РФФИ и льготам CAS, проводит поиски в БД производства CAS c 90% скидкой для академических пользователей. Для держателей грантов РФФИ по химии и биологии в БД CAS на 2001 г. предусмотрена еще и квота бесплатных поисков.

!23

База данных
"Лазерные материалы, допированные Сr(4+)"

Л.Д. Исхакова, Д.А. Чешков, М.Н. Богданова
(Научный центр волоконной оптики при ИОФ РАН)
Е-mail: ldisk@fo.gpi.ru

Неоценимую помощь в научно-исследовательской работе оказывают такие электронные базы данных, как ISI Science Citation Index Expanded (Web of Science), ставшая доступной в режиме on-line для читателей сети библиотек БЕН РАН. Возможность за короткий промежуток времени собрать обширную библиографическую информацию по конкретной проблеме существенно повышает эффективность проведения научных работ. Однако, специалистам необходимы также базы данных, содержащие научную информацию по различным разделам науки. Так, например, современные рентгеновские лаборатории не могут обойтись без использования баз данных по строению органических веществ "Cambridge Structural Database" Кембриджского Кристаллографического Центра, доступной через ИНТЕРНЕТ, а также размещенных на компакт-дисках "Inorganic Crystal Structure Database" (институт Гмелина, Карлсруэ) с данными о структурах неорганических соединений и PCPDFWIN Международного Центра по дифракционным данным с результатами рентгенографических исследований.

Особенностью создаваемой нами базы является сочетание достоинств двух типов охарактеризованных выше баз данных и, соответственно, решение двух проблем: 1) представить наиболее полный перечень имеющихся в литературе публикаций по рассматриваемой тематике; 2) дать исследователям справочный материал по физико-химическим свойствам, спектрально-люминесцентным и лазерным характеристикам соединений.

В качестве предмета для разработки мы выбрали одно из актуальных направлений, по которому проводятся работы в Центре волоконной оптики - лазерные материалы с четырехзарядным хромом и твердотельные перестраиваемые лазеры ближнего ИК-диапазона на их основе. Создание активных сред для таких лазеров с высокой эффективностью и низким порогом возбуждения генерации является интенсивно разрабатываемым направлением вследствие перспективности их применения в оптических коммуникационных системах и в области научных и медицинских исследований. На основе кристаллов соединений, допированных Cr(4+), могут быть созданы лазеры, работающие как в непрерывном, так и в импульсном режиме, в том числе и в фемтосекундном диапазоне, с различными источниками накачки. Длина волны лазера на форстерите оптимальна для терапии рака; указанный лазер использован в аппаратуре для оптической когерентной томографии и оптической биопсии.

База данных подразделяется на две части - электронный каталог с библиографическими сведениями и электронный справочник с научной информацией.

При составлении электронного каталога мы использовали результаты поиска публикаций с помощью баз данных ISI, Web of Science, "Inorganic Crystal Structure Database" и PCPPDFWIN, справочных изданий по термохимии, а также результаты просмотра публикаций по указанной тематике в отечественных и зарубежных журналах 17 наименований. В каталоге можно проводить поиск информации по следующим критериям: химическая формула и название вещества, ключевые слова, сведения об авторах, название журнала и его выходные данные. Поскольку каталог ориентирован на конкретную проблему с ограниченным перечнем ключевых слов и журналов, для сокращения времени поиска используются готовые "раскрывающиеся" списки для указанных критериев. Используемые в этой части ключевые слова согласованы с терминологией, применяемой в справочной части.

В электронном справочнике представлены сведения о допированных четырехзарядным хромом монокристаллах, стеклах и пленочных материалах. В его структуре содержатся как сведения об индивидуальных соединениях (материалах), так и сводные таблицы, в которых собраны характеристики свойств для группы соединений.

В результате поиска в режиме "Соединения" для каждого соединения на экран выводится информация по разделам:

    1. Общие свойства. В разделе указаны название, состав, химическая формула, температура и характер плавления, плотность, коэффициенты термического расширения и др.
    2. Методы получения. Здесь содержится краткая характеристика методов синтеза и методов получения материала с нужными свойствами (например, методы выращивания монокристаллов, условия получения материала в виде стекол и т.п.)
    3. Строение. Для кристаллических соединений приведены сведения о структурном типе, сингонии, пр. гр. и параметрах кристаллической решетки; даны координаты атомов и основные межатомные расстояния и углы.
    4. Спектрально- люминесцентные свойства. Раздел содержит данные о спектрах поглощения и люминесценции.
    5. Лазерные характеристики. В разделе представлена информация о режиме работы лазера, способе накачке, длине волны, мощности и других характеристиках.

Названия разделов представляют собой гиперссылки. Если щелкнуть на них, на экране появляется перечень публикаций по данному разделу.

При работе в режиме "Физико-химические свойства", после выбора какого-либо свойства из предложенного перечня на экран выводятся сводные таблицы с данными о соответствующих характеристиках всего класса соединений.

База данных создается на платформе Unix Free BSD с использованием HTML и SQL-технологии (СУБД Postgres). При разработке отдельных её разделов использовались различные Web-, HTML- и графические редакторы. Доступ к базе данных в первоначальном варианте будет представлен в локальной сети НЦВО. После ознакомления с ним работающих по указанной тематике специалистов и учета их критических замечаний, доступ будет осуществляться с web-сайта НЦВО при ИОФ РАН http://www.forc.gpi.ru/.

На семинаре представлена первая часть работы по созданию базы данных - электронные каталог и справочник для силикатов и германатов. Мы надеемся, что разработанная при её создании концепция, структура и методы внесения информации послужат основой для продолжения работ с целью создания базы данных по такому важнейшему разделу квантовой электроники как "Лазерные материалы".

!24

Характеризация некоторых научных
направлений Института кристаллографии
РАН в базе данных "Web of Science"

М.В. Лаврентьева, М.К. Мелконян, С.Н. Смирнов
(Институт кристаллографии им. А.В. Шубникова РАН)

С конца 90-х годов проблема создания высокоэффективной системы информационного обеспечения фундаментальной и прикладной науки решается внедрением в работу научных библиотек новых информационных технологий, причем последние трансформируют также традиционные формы информационно-библиографической деятельности [1 ].

Как известно, информационная работа является неотъемлемой частью научного процесса, предполагающего постоянное обращение ученого к различным базам данных. Активное взаимодействие ученого и библиотеки - одно из условий максимально полного информационного сопровождения научных работ.

Любой институт РАН является целостной системой, для регулирования научной деятельности которой нужны объективные показатели, отражающие состояние и динамику научно-исследовательских работ. Источником таких показателей является уникальный статистический материал, получаемый из базы данных "Web of Science", созданной Институтом научной информации (ISI) в Филадельфии [2]. Эта база данных охватывает более 3500 лучших научных журналов и дает исчерпывающую информацию о мировой научной литературе в области естественных наук. Несмотря на то, что в ней присутствуют всего 70 отечественных научных журналов, она отражает реальную картину российской науки [3].

"Web of Science" широко используется в мире не только для работы с научной литературой, но и для наукометрических исследований. Новые информационные технологии обеспечивают работу с этой базой в режиме "on-line", поэтому наукометрический анализ становится более оперативным, доступным и востребованным. Совсем недавно такая работа была бы невозможна в сетевых библиотеках БЕН РАН. Сегодня наукометрические работы ведутся, например, в Центральной библиотеке Пущинского научного центра [4].

Библиотека Института кристаллографии также обратилась к базе данных (ISI) для анализа научной деятельности ИК РАН с целью выявления актуальности и перспективности некоторых научных разработок ученых института. Работа с базой данных "Web of Science", в первую очередь, предполагала сбор статистического материала по публикаторской активности ученых. По каждой из выбранных научных проблем оценивалась публикаторская активность ученых в мире, в России, Москве и ряде крупных отечественных научных центров. Очевидно, что число работ из ИК РАН по любой проблеме незначительно в мировом информационном потоке, но анализ больших информационных массивов позволяет делать определенные заключения о перспективности соответствующего научного направления.

Для характеризации публикаторской активности ученых ИК РАН по годам, в соответствии с работой [3], мы ограничились периодом с 1993 г. по 2000 г., так как с 1993 г. существует один адрес - Россия, и можно выделить без ошибок только российские публикации. Поскольку нет единых правил сообщения места работы авторов публикаций в результате анализа возможна погрешность [2]. По элементам контактного адреса INST CRYSTALLOG MOSCOW количество публикаций ИК РАН в базе данных "Web of Science" за 1993-2000 г.г. составило 1 200 работ (диаграмма 1).

Уменьшение количества публикаций ИК РАН в середине 90-х годов может быть связано с тяжелыми экономическими условиями в стране в предыдущие несколько лет, когда непрерывно понижающийся уровень жизни не мог не отразиться на эффективности научной деятельности, а также с отъездом ряда ведущих сотрудников за рубеж и изменением их контактного адреса. Тем не менее, в среднем порядка 140 работ из ИК РАН ежегодно входит в базу данных ISI.

Интересно сравнить статистический материал по "Web of Science" с годовыми научными отчетами института. Так, в 2000 г. по отчетам учеными ИК РАН опубликовано 270 работ (в "Web of Science" вошли 144), не считая тезисов конференций, из них в отечественных журналах - 130 работ, в иностранных - 140. Эти 270 работ опубликованы в 40 отечественных журналах и 80 иностранных. Т.о., ученые нашего института предпочитают печататься в рейтинговых журналах (около 50% публикаций от общего числа), что важно для доведения результатов исследований до широкой научной общественности.

Как известно, ИК РАН является признанным лидером российской кристаллографии, ведущим широкомасштабные научные исследования по росту кристаллов и изучению их структуры различными дифракционными методами. Что касается роста кристаллов, то в начале 90-х годов наблюдался резкий скачок публикаторской активности ученых в мире (диаграмма 2). Аналогичный скачок имел место и в России, что связано с бурным развитием материаловедения, в частности, появлением устойчивого интереса к биокристаллам и тонким пленкам. Именно в 1993 году стала издаваться новая серия (ser.D) журнала "Acta crystallographica", посвященного биообъектам.

За последние семь лет доля работ по росту кристаллов в мировом информационном потоке увеличилась в десятки раз. Доля российских работ по этой тематике в общем массиве базы данных "Web of Science" составляет стабильно 4-6%, а доля работ ИК РАН - 10% от общего числа отечественных работ.

Из новых научных направлений, разрабатываемых в ИК РАН, интересно рассмотреть синхротронное излучение (оно развивается с начала 80-х годов -диаграмма 3), а также исследования в области нанотехнологий (устойчивый интерес к этой проблематике формируется в последние несколько лет - диаграмма 4). Что касается синхротронного излучения, то доля российских публикаций в базе данных "Web of Science" составляет приблизительно 8,6% (в 2000 г. - 12%). Эти цифры находятся в полном соответствии с данными работы (3) о доле отечественных работ в мировом потоке публикаций в области физики.

Количество работ в этой области стремительно растет. Приоритеты ИК РАН в области синхротронного излучения отражены в ряде пунктов рубрикатора РФФИ, например таких, как 02-211 - "Взаимодействие рентгеновского и синхротронного излучений и нейтронов с конденсированным веществом". ИК РАН является одним из основных исполнителей ГНТП "Синхротронное излучение. Лучевые применения". Наконец, недавно создано новое подразделение - Институт синхротронных исследований при ИК РАН, что свидетельствует о важности данного направления научно-исследовательских работ.

О наноструктурах заговорили активно с конца 80-х годов в связи с развитием современного материаловедения. По дифракционным методам их исследования число работ в мире незначительно (4000 за последние десять лет), причем доля отечественных составляет приблизительно 4%. Но из диаграммы видно, что интерес к этим исследования также растет из года в год.

Таким образом, благодаря внедрению новых информационных технологий в работу научных библиотек, последние могут не ограничиваться только информационным обеспечением научной деятельности ученых. Библиотеки способны брать на себя функции сбора статистического материала из доступных баз данных для дальнейшего наукометрического анализа информационных потоков по различным научным проблемам. Библиотека ИК РАН рассматривает такую работу как новую форму интеграции информационно-библиографической и научной деятельности.

Литература

  1. Лаврентьева М.В., Мелконян М.К., Смирнов С.Н. Принцип дополнительности в информационной работе библиотеки Института кристаллографии РАН: классические и современные технологии//Информационно-библиотечное обеспечение науки. Проблемы интеграции информационных ресурсов: материалы конференции, М.,2000. - 160 стр.
  2. Глушановский А.В., Калёнов Н.Е., Лексикова Е.Е. База данных "Science Citation Index" на CD-Rom., РАН, Москва,1993.
  3. Маркусова В.А. Российская наука в библиографических сетях цитирования//275 лет на службе науки: библиотеки и институты информации в системе РАН: сб.научн.тр. - М., 2000.
  4. Харыбина Т.Н., Использование электронных ресурсов в информационном обеспечении научных исследований. // Информационно-библиотечное обеспечение науки. Проблемы интеграции информационных ресурсов: материалы конференции, М., 2000 - 160 стр.
!25

К созданию электронных коллекций
старопечатных книг в Библиотеке
Российской академии наук: на примере
работы над двумя проектами

А.Ц. Масевич, Е.А. Савельева, А.К. Багажков
(Библиотека академии наук)

Перед учреждениями - хранителями значительных коллекций старопечатных книг стоят две взаимоисключающие задачи. С одной стороны, необходимо давать информацию об этих фондах, вводить её в научный оборот, делать сами документы доступными возможно большему числу читателей. С другой стороны, каждое предоставление оригинала старопечатной книги читателю отрицательно отражается на её физическом состоянии.

Общепринятым решением проблемы является создание массива цифровых копий старопечатных книг, иначе говоря, электронных коллекций. В настоящем докладе излагаются принятые в БАН России подходы к созданию таких коллекций, предусматривающие комплексное решение задачи. Эти подходы предусматривают разработку основных принципов систем, методики работы, основных функций программных средств, структуры массива цифровых копий, доступа к нему, поиска документов, создания и индексирования метаданных (научных описаний старопечатных изданий). Все эти вопросы рассматриваются на примере реализации БАН двух проектов.

Определение электронной коллекции БАН. Под электронной коллекцией мы понимаем информационно-поисковую систему, содержащую массив электронных текстов, в частности электронных копий документов, и метаданных об этих документах (массивов описаний или каталог электронной коллекции), а также комплекс программных и аппаратных средств обеспечивающих создание и модификацию данных, доступ пользователей к данным, выгрузку и обмен данными. Кроме того, система должна иметь средства генерации информационных продуктов различного типа: гипертекстовые системы (форматы HTML и PDF), оригинал-макеты печатных изданий.

Основные принципы разработки

Многоаспектность и междисциплинарный подход. Электронная каталогизация редких изданий - сложная междисциплинарная и многоаспектная проблема. Её решение предусматривает участие книговедов, каталогизаторов, историков, искусствоведов, системных аналитиков, программистов, специалистов по консервации и реставрации документов.

Совместимость. Создаваемые системы должны быть взаимосвязаны с другими системами БАН. Они встраиваться в автоматизированную систему БАН. Все основные проектные решения должны соответствовать национальным и международным стандартам. Система при этом должна иметь средства загрузки, выгрузки и двустороннего конвертирования метаданных в принятом в стране формате библиографической записи. (Российская версия формата UNIMARC-RUSMARC).

Однократный ввод и многоцелевое использование данных. Электронная копия издания, а также метаданные, её сопровождающие (электронная библиографическая запись) создаются однократно с возможностью дальнейших модификаций, а в дальнейшем предполагается её многоцелевое использование:

Возможность модификации данных. Электронные коллекции представляют собой открытые системы. Это означает, что при использовании коллекций данные могут подвергаться модификации. Например, в момент создания системы могут быть созданы полные копии документов или копии их фрагментов, представляющих особый научный или художественный интерес. В тех случаях, когда создаются копии отдельных страниц книги (как правило, в случае ориентации разработки на определенный информационный продукт, электронное или традиционное издание) впоследствии при необходимости могут быть отсканированы и другие страницы.

В свою очередь метаданные могут содержать лишь краткую опознавательную информацию о книге или детальное научное описание.

В ходе использования системы краткая запись может быть при необходимости и при наличие возможности дополнена и превращена в научное описание со значительной степенью детализации, а сам документ полностью отсканирован.

Автономное использование элементов системы. Электронные копии документов и метаданные, а также их фрагменты могут быть использованы независимо друг от друга.

Краткие описания проектов.

Мультимедийная система "Издания Санкт-Петербургской Академии наук и академической типографии в 18 веке".

Предполагаемые результаты проекта:

Базы данных библиографических и авторитетных записей.

Массивы графических изображений, включая полные копии документов.

Информационный продукт: Гипертекстовая система (HTML), доступная в режимах ON-LINE и OFF-LINE.

Проект выполняется при поддержке РГНФ (грант 00-05-12019в проект иссл.)

Система содержит библиографические записи на издания Академии наук с 1726 по 1825 года, а также издания, напечатанные в этот же период типографией Академии наук, хранящиеся в фондах отдела изданий Академии наук и НИИ отдела редкой книги БАН. Примерное количество книг в фондах Академического собрания и в Бронированном фонде БАН около 2000 единиц.

Предполагается создание детальных библиографических описаний изданий. Кроме того, в ходе реализации проекта принято решение осуществить роспись содержания периодических изданий. При этом каждая библиографическая запись индексируется предметной рубрикой. Создаются авторитетные записи на авторов и персоналии.

В соответствии с планом работы над системой по созданию электронных копий документов должно предшествовать создание массива метаданных. На настоящий момент составлено 660 описаний на книги и 1220 аналитических описаний, а также 600 авторитетных записей на авторов и лица, упомянутые в документе и на учреждения и предметные рубрики. Созданные в ходе реализации проекта авторитетные записи предполагается использовать в других подсистемах БАН. С другой стороны в этой работе учитывается опыт различных подразделений БАН. Например, в научно-исследовательском отделе библиографии и библиотековедения выпускается в печатном виде "Указатель к газете "Санктпетербургские ведомости". За почти 10 летний срок существования указателя в нем описано почти 16 тысяч имен. Каждой статье указателя имен (т.е. каждой персоне) присваивается индекс специально созданной классификации. (Военные, священнослужители и.д.). В авторитетных записях, созданных в рамках нашего проекта, используются накопленные нашими коллегами данные и их классификация.

Из вышеизложенного можно заключить, что данная система не вполне отвечает нашему определению электронной коллекции. В ней на настоящий момент преобладает текстовая информация. Однако, на следующем этапе (с сентября текущего года) в систему планируется ввести значительное количество графической информации - полностью сканированных книг, а также образцов книжной орнаментики. Кроме этого предполагается использовать графические данные в качестве иллюстративного материала (например, портреты персон).

Рис. 1. Представление краткой биографической справки, созданной на основе авторитетной записи.

На предварительном этапе разработки осуществлено полное сканирование одного документа (рис.2), а также некоторых материалов по книжной орнаментики, разработана методика сканирования, созданы программные средства, которые описываются ниже.

Рис. 2. Просмотр полной копии книги в режиме preview
Электронная коллекция "Издания типографии Свято-Успенской Почаевской лавры (17 - нач. 20 веков) в собраниях научно-исследовательского отдела редкой книги и славянского фонда БАН".

Проект выполняется при поддержке института "Открытое общество", грант RFG024

Ожидаемые результаты проекта: Электронные копии документов. База данных книжной орнаментики изданий Почаевской лавры. База данных научных описаний документов.

Информационные продукты: Гипертекстовая система, доступная в режимах ON-LINE и OFF-LINE (см рис. 3), печатное издание.

Рис. 3. Страница гипертекстового варианта электронной коллекции "Издания типографии Свято-Успенской Почаевской лавры (17 - нач. 20 веков) в собраниях научно-исследовательского отдела редкой книги и славянского фонда БАН".

Собрание изданий типографии Почаевской лавры в собрании научно-исследовательского отдела редкой книги БАН сравнительно невелико - около 120 названий и 150 единиц хранения, но оно, тем не менее, хорошо представляет издательскую деятельность Почаевской лавры, одного из важных центров украинского книгопечатания XVIII - XX веков.,

Кроме этого в систему введены записи на так называемые псевдопочаевские старообрядческие издания, то есть издания, где Почаевская лавра ложно указана в выходных данных в качестве места издания.

Всего в систему введено 205 детальных научных описаний каждого экземпляра коллекции в формате UNIMARC-БАН. На сегодняшний день создано 6 полных копий документов (общим объемом 900 страниц) планируется создание еще 9 полных копий. Во всех остальных документах (кроме псевдопочаевских книг) осуществлено сканирование тех страниц, на которых присутствуют элементы книжной орнаментики (иллюстрации, виньетки, наборные орнаменты, инициалы). Кроме того, во всех изданиях отсканированы образцы шрифтов Всего в настоящее время отсканировано более 980 изображений, причем каждое из них сохранено в нескольких файлах с различными форматами.

Кроме того описаны и частично отсканированы отдельные знаки бытования книг - владельческие знаки, экслибрисы, старые шифры хранения и т.д.

Помимо сканированных изображений планируется использование цифровых фотографий. На фотографиях представляется общий вид документа и некоторые его особенности: переплет, обрезы и т.д.

В гипертекстовой и печатной версиях систем предполагается создать серию традиционных указателей (указатели имен, заглавий, учреждений), а также указатель книжной орнаментики (указатели виньеток, инициалов, иллюстраций, наборных орнаментов). (рис 4)

Рис. 4. Фрагмент одного из указателей орнаментики (указатель наборных украшений, черновой вариант).

Помимо полных электронных копий документов и их фрагментов разрабатываемая система будет содержать научные публикации по истории книгоиздательской деятельности Почаевского монастыря, особенностям Почаевских изданий, истории собраний редкой книги БАН и др. Публикации будут представлены в форме гипертекстов со ссылками на текстовые и графические данные. В порядке эксперимента подготовлено издание книги "Акафист св. великомученицы Варвары" в транслитерации в современный русский алфавит с научными комментариями.

Краткое описание технологии сканирования, аппаратных и программных средств:

Научные описания документов создаются в среде CDS/ISIS в формате UNIMARC - БАН. В формат введен блок полей локального использования для описания каждого типа элементов книжной орнаментики. Специалист по старопечатной книге вносит в эти поля номер листа, на котором находится изображение, краткое описание и комментарий по нему. После этого каждому изображению автоматически по определенному алгоритму присваивается имя (набор цифр и однобуквенный код категории элемента орнаментики), которое автоматически вносится в поле. После этого система генерирует для каждой книги направление на сканирование - список подлежащих сканированию элементов с указанием страниц и некоторых идентификационных признаков изображения. При этом автоматически создаются в файле, а затем распечатываются закладки на соответствующие страницы. Книги с закладками и направлением поступают на сканирование, где полученным графическим файлам присваивается имя, указанное в направлении и на закладке. С этим же именем (но с другим расширением) система генерирует и файл HTML, который используется в гипертекстовой системе.

При создании полных копии книг используется автоматизированная система обработки массивов сканированных изображений, разработанная в отделе информатики и автоматизации БАН.

Сканер - HP ScanJet CX-2, разрешение 300 dpi, цветность 24 бита. Применение планшетного сканера безусловно имеет значительные отрицательные стороны. Однако приобретение дорогостоящеий техники - книжного сканера - в данный момент не представляется возможным.

Программы для обработки изображений - Adobe PhotoShop 5.5, DjVuShop 2

Форматы сжатия DjVu, jpg

Формат сканирования - tif, при этом объем одной страницы составляет в среднем 20 Мб, сжатое изображение в формате jpg занимает объем около 1 мб; сжатое изображение в формате DjVu в фоторежиме занимает 600 кб, в текстовом режиме - 40 Кб, при этом удается добится более высокого качества изображения, чем в формате jpg

Просмотр полных копий книг осуществляется посредством DjVu броузера, встроенного в internet explorer. При просмотре реализовано увеличения и уменьшение изображения, посмотр всех страниц в режиме предварительно просмотра (preview) (рис. 2) с выбором нужной страницы, листанием, увеличением фрагментов и другими сервисными возможностями.

Изображения фрагментов книг, элементов книжной орнаментики представляются в формате jpg

Заключение. Таким образом, оба проекта представляют собой комплексные, многоаспектные научные разработки. Особенностью нашей разработки является ориентация на детальное научное описание объекта, а не на краткое опознавательное описание. По этой причине наш проект требует значительных трудозатрат. Однако, как было показано, выше детальность разработки может быть определена при постановке задачи, а также изменена в ходе реализации.

В ходе реализации проектов разрабатываются и корректируются методические подходы, технические решения, технологические схемы, а также осуществляются содержательные. Результатом обоих проектов, помимо информационных продуктов, станет технологическая схема создания электронных коллекций старопечатных изданий с набором созданных программных средств.

!26

Электронная коллекция отдела рукописей
и редких книг Казанского госуниверситета

С.К. Куранов, А.В. Скоробогатов, В.Д. Соловьев, Е.Л. Столов
(Казанский государственный университет)
solovyev@mi.ru

Введение. При создании электронных коллекций основное внимание уделяется современной литературе, в первую очередь, научной. Перевод в электронный формат старинных книг и рукописей практически еще не начинался. Проект создания электронной коллекции на базе отдела рукописей и редких книг библиотеки Казанского госуниверситета является одним из первых в этом направлении. В данной статье обсуждаются две основные проблемы, с которыми столкнулись разработчики проекта. Первая - это отбор литературы, определение последовательности перевода в электронный формат, вторая - создание системы распознавания символов, позволяющей перейти от графических файлов, получающихся при сканировании (или фотографировании на цифровую камеру), к текстовым файлам. В статье приводятся общие сведения о фондах отдела рукописей и редких книг и описывается созданная система идентификации шрифтов старинных книг.

Этапы создания электронной коллекции. Авторы проекта руководствовались следующими основными критериями при определении последовательности перевода книг в электронную форму. 1. Наличие в библиотеке КГУ богатых книжных фондов, представляющих интерес для научного сообщества. 2. Легкость создания системы распознавания символов. 3. Возможность использования результатов проекта в научных исследованиях, проводимых в КГУ в настоящее время.

Исходя из этих критериев, решено начать создание электронной коллекции с книг 18-го века. Это связано с: 1) широким представительством книг 18-го века в библиотеке КГУ, наличием ряда очень редких и ценных изданий, 2) книги этого периода напечатаны гражданским шрифтом, относительно легким для распознавания, 3) исследованиями, проводимыми на кафедре истории русского языка КГУ, грамматики русского языка 18-го века, а также исследованиями, проводимыми на кафедрах истории русской литературы и отечественной истории до XX века.

В дальнейшем предполагается перейти к произведениям более ранних эпох.

Характеристика библиотечных фондов. По количеству изданий 18-го века Научная библиотека КГУ - одно из крупнейших книгохранилищ России, что связано с особенностями ее создания и комплектования ее фондов. Начало книжной коллекции положили собрания Г.А. Потемкина и секретаря Российской Академии художеств В.И.Полянского. В последующие годы библиотека Казанского университета пополнялась не только закупками, но и дарами профессоров университета и частных коллекционеров. Особенно значительное поступление книг 18-го века было осуществлено после Октябрьской революции, когда библиотеке КГУ были переданы частные дворянские библиотеки и библиотеки расформированных государственных и учебных заведений, в том числе Казанской духовной академии. К настоящему времени коллекция книг 18-го века составляет несколько тысяч томов. В ней представлены книги по многим отраслям знаний: математике, астрономии, географии, военному и морскому делу, истории, юриспруденции, экономике, сельскому хозяйству, медицине, философии и филологии, художественная литература.

Среди философских произведений большое место занимают переводы работ французских просветителей Вольтера, Руссо и др., а также различных статей из Энциклопедии Дидро и Д'Аламбера. Это естественно, поскольку при увлечении Екатерины II французским просвещением эти книги печатались огромными тиражами. Однако присутствуют и книги более редкие, например, труды Х. Вольфа, С. Пуффендорфа. Встречаются и книги русских мыслителей С. Десницкого, Д. Казинского и др. Широко представлена в собрании юридическая литература.

Художественная литература представлена довольно большим числом сочинений русских и западноевропейских писателей 18-го века. В числе русских писателей и поэтов издания М.В. Ломоносова, г.Р. Державина, А.П. Сумарокова, В.И. Тредиаковского, И.А. Крылова и др.

В настоящее время в Отделе рукописей и редких книг ведется работа по научной электронной каталогизации русских книг гражданской печати 18-го века. В ходе этих работ выяснилось, что к настоящему времени необходимо уже не только каталогизировать книги 18-го века, но и создать на их основе полнотекстовую электронную библиотеку.

Проблема распознавания символов. В настоящее время типографии, печатающие книги, имеют, как правило, стандартный набор шрифтов для тиражирования. Поэтому задача распознавания графического изображения современного книжного текста достаточно хорошо решается при помощи известных программных продуктов, например "Fine Reader". Но если в качестве объекта распознавания взять печатный текст русских книг прошлых веков, то возникают следующие проблемы:

  1. Текст имеет символы, не включенные в современный алфавит.
  2. Достаточно большое разнообразие используемых шрифтов.

Первая проблема решается при помощи настройки имеющихся программ распознавания. Но если оставить без внимания вторую проблему, то настройки придется производить заново, если шрифт следующего документа отличается по каким-либо параметрам. К тому же, если объединить все возможные шрифты в одной конфигурации программы распознавания, то качество распознавания станет хуже.

В связи с этим для повышения качества автоматического распознавания предлагается выполнить следующее:

Разделить множество шрифтов на классы по признаку схожести начертания путем создания соответствующего алгоритма классификации.

Для каждого выделенного класса шрифтов создать набор параметров настройки для программы распознавания.

Причем набор параметров настройки создается достаточно просто с использованием средств обучения программы распознавания текста. Напротив, создание универсального алгоритма классификации - нетривиальная задача.

Классификация, как правило, состоит из двух основных частей: выделения необходимых признаков объекта (шрифта или отдельной буквы) и работы решающего правила, разделяющего объекты на классы, исходя из полученных признаков.

Выбор параметров измерения для шрифта. Рассматривая проблему с исторической точки зрения, можно выяснить, что первоначально книги печатались лишь в нескольких типографиях. Причем каждая типография имела ограниченное количество технических средств для печати. Поэтому целесообразно выдвинуть гипотезу, что шрифты можно классифицировать исходя из технических параметров печатающих устройств.

Как известно, буквы для печати отливались в специальных формах и поэтому в качестве первого признака можно взять размер формы для отдельной буквы (с некоторой точностью он равен усредненному размеру одинаковых букв). К тому же отдельные буквы при наборе печатного листа помещались в специальные крепления. Размеры этих креплений, в частности межстрочное расстояние, также можно взять в качестве измеряемого признака.

Для проведения измерений разработана специальная программа для Windows с удобным графическим интерфейсом. Программа подсчитывает межстрочное расстояние и размер отдельных букв в отсканированном графическом изображении печатного текста. В качестве эталона измерений берется отсканированный вместе с исследуемым документом круг известного размера.

Но в связи с тем, что старинный печатный текст в отсканированном изображении имеет много погрешностей, результаты измерений программы практически невозможно использовать без усреднений. Для подсчета усредненного межстрочного расстояния было увеличено количество строк, участвующих в измерении. Пользователю предоставляется возможность выбрать их количество. Что касается букв, то здесь задача немного сложнее. Самый простой вариант - это предложить пользователю отметить нужные буквы самостоятельно, а затем произвести обобщенные измерения. Но в этом случае работа с программой потребовала бы слишком много времени. Чтобы сократить время работы, был реализован механизм поиска аналогичных букв по заданной букве. При этом возможность корректировки результатов поиска со стороны пользователя сохраняется. Таким образом, размер исходной формы для буквы измеряется с достаточной точностью.

Решающее правило классификации. Для классификации шрифтов по межстрочному расстоянию достаточно взять отсканированный вариант одной книги (эталона) и измерить межстрочные расстояния на достаточно большом количестве страниц. После этого необходимо определить среднее значение и максимально возможное отклонение межстрочного расстояния для данной книги, то есть для определенного класса шрифта. В дальнейшем, исследуемый шрифт, имеющий межстрочное расстояние, отличающееся от эталонного в заданных пределах, считается принадлежащим данному классу.

Далее эксперименты проводятся и на других книгах. В случае различия измеряемых параметров более допустимых значений, шрифт данной книги считается принадлежащим другому классу и измерения производятся снова.

Если шрифт книги попадает сразу в два класса, то предпочтение отдается тому классу, расстояние до эталона которого меньше. То есть классификация производится по кратчайшему расстоянию.

Кроме межстрочного расстояния для классификации можно использовать размеры нескольких букв. Причем, если использовать большое количество букв, то качество разделения на классы повышается. Вместе с тем повышается сложность алгоритма классификации и время выполнения задачи.

Эксперименты показывают, что для первых печатных изданий вполне достаточно классификации по межстрочному расстоянию и размерам одной буквы. Классификация по размерам нескольких букв бывает необходима для более поздних изданий, так как при производстве более поздней печатной продукции использовалось большое количество технических средств.

С развитием технических средств печати книг стало возможным при издании широко варьировать параметры размеров текста. В связи с этим использование прямых измерений в качестве параметров классификации становится нецелесообразным. В этом случае можно применять относительные величины измерений.

Например, можно рассчитать отношения размеров нескольких букв. В этом случае размер одной буквы берется в качестве эталона (её размер считается равным единице), а размеры остальных букв рассчитываются как отношение к эталонному. Таким образом, получаем вектор, характеризующий шрифт. Размер вектора равен количеству рассматриваемых букв и подбирается таким образом, чтобы при достаточном качестве распознавания алгоритм классификации был достаточно простым и, соответственно, работал быстрее. Зависимость такова, что при рассмотрении большего количества букв качество распознавания повышается, но вместе с тем сложность и продолжительность работы алгоритма классификации возрастет.

При помощи настройки подобных алгоритмов можно добиться того, что шрифт будет классифицирован программой в автоматическом режиме.

!27

Создание цифровых коллекций редких книг и рукописей из сибирских хранилищ

С.Р. Баженов, В.Н. Алексеев, А.Ю. Бородихин, Е.И. Дергачева-Скоп, А.В. Шабанов
(Государственная публичная научно-техническая библиотека СО РАН)

В докладе описываются различные варианты создания цифровых коллекций старопечатных и рукописных книг из сибирских хранилищ для предоставления их широкому кругу исследователей и учебных целей. При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Дополнительно в электронную версию включаются описания, указатели, исторический материал. К июлю 2001 года созданы электронные версии " 300 единиц хранения общим объемом более 50 тыс. страниц. Помимо "традиционных" графических форматов начато изучение возможностей новых форматов.

Электронные версии старопечатных и рукописных книг создаются для предоставления их широкому кругу исследователей и учебных целей.

Основное сибирское хранилище раритетов - Фонд редких книг и рукописей в Государственной публичной научно-технической библиотеке Сибирского отделения Российской академии наук г. Новосибирска. Фонд содержит разнообразные собрания русских и западноевропейских книг XIV-XIX вв. В их числе - знаменитая коллекция древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова, завещанная им в 1965 г. сибирской академической библиотеке. Особый интерес представляют древнерусские книги, поступившие в библиотеку в результате 35-летних экспедиционных работ в среде сибирских старообрядцев. Эти книги образовали целый ряд территориальных коллекций, запечатлевших бытование книг и уровень духовной культуры русских людей, осваивавших бескрайние просторы Сибири. Много интересных экземпляров редких и рукописных книг имеется и в других сибирских городах.

При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, нами была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Ведь важно отразить фактуру бумаги, особенности почерка и печати, цветовую гамму. Конечно, при современном уровне развития аппаратных и программных средств вычислительной техники, это возможно только в довольно ограниченной форме. Для исследовательских и, особенно, учебных целей крайне полезна возможность дополнительного включения в электронную версию описания, указателей, сопутствующего исторического материала.

Нам представляется, что единообразного проектного решения, подходящего для всех коллекций, скорее всего не существует. Мы индивидуально выбираем аппаратные средства и способы программной обработки первоначальных изображений для каждой из коллекций, которую начинаем переводить в электронную форму. При этом не ставится задача "резкого улучшения читаемости" исходного текста (и тем более распознавания), более важно адекватно отобразить первоисточник.

К июлю 2001 года созданы электронные версии следующих коллекций Фонда редкой книги ГПНТБ СО РАН: "Прижизненные издания А.С. Пушкина", "Книги пушкинской эпохи", "Вестник Европы: 1802 - 1820 гг." и 8 рукописных книг XVII - XIX вв. из собрания рукописных книг Тобольского филиала Государственного архива Тюменской области и Фонда редких книг и рукописей ГПНТБ СО РАН. Общий объем всех коллекций - более 50 тыс. страниц.

Начата работа над коллекцией древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова.

По всем вопросам просьба обращаться по E-mail - rbook@spsl.nsc.ru.

В качестве первой в электронную форму переведена коллекция "Прижизненные издания А.С. Пушкина в Фонде редкой книги ГПНТБ СО РАН".

Технология обработки изображений и создания этой коллекции была описана ранее в [2].

Аналогичным образом обрабатывались коллекции "Книги пушкинской эпохи" и "Вестник Европы".

Создание электронных версий рукописных книг гораздо более сложно. Для адекватного отображения первоисточника, безусловно, требуется работать с цветными изображениями. Почти всегда нужны варианты просмотра с различными степенями увеличения, включая и довольно значительные. Соответственно, исходные файлы изображений должны быть весьма больших размеров. Конечный же результат практически всегда желательно разместить на одном компакт-диске.

Описание технологии см. в [3]. Эти версии созданы в рамках "традиционного" подхода - Jpeg + html + JavaScript.

Доступ ко всем вышеописанным коллекциям через Internet одинаков и не отличается от описанного ранее в [1] доступа к библиографическим базам ГПНТБ СО РАН.

Новые возможности, вероятно, появляются вместе с новыми графическими форматами, основанными на Wavelet технологиях. Возможно использование как коммерческих вариантов (ldf - LizardTech), так и бесплатных (в основной части) - Jpeg 2000. Мы реализуем свои пробные варианты для Jpeg 2000 с использованием программ на Java. Однако пока еще представляется, что и "обычный" Jpeg далеко еще не исчерпал своих возможностей и, по сумме всех факторов, предпочтительнее.

Затронем также такой актуальный вопрос, как создание "корпоративной" российской библиотечной программы по оцифровке и созданию различных цифровых коллекций - это могло бы кардинально увеличить наши общие возможности...

Выводы

Таким образом, в ГПНТБ СО РАН разработаны основы технологии подготовки и предоставления электронных версий старопечатных, рукописных и редких книг из сибирских хранилищ. Исследуются новые подходы в этой области.

Литература

  1. Создание программного комплекса доступа из Интернет к базам данных на основе WWW-ISIS / Баженов С.Р., Мазов Н.А., Малицкий Н.А., Баженов И.С. // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: 5-я международная конференция "Крым-98": Материалы конференции. - М., 1998. - Т. 2. - С. 581-584.
  2. 2.Баженов С.Р., Шабанов А.В., Новоженин А.Ф. Создание полнотекстовых баз данных как основы электронной библиотеки ГПНТБ СО РАН // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: 6-я Междунар. конф. "Крым-99": Материалы конф. - Судак, 1999. - Т. 1. - С. 290 - 292.
  3. Баженов С.Р., Алексеев В.Н., Бородихин А.Ю., Дергачева-Скоп Е.И.,Шабанов А.В. Создание электронных версий старопечатных, рукописных и редких книг из сибирских хранилищ // 8-я Междунар. конф. "Крым-2001": Материалы конф. - Судак, 2001.
!28

Опыт работы Интернет-центра НБ ТГУ с выпускниками Американских обменных образовательных программ

Л. Кичигина
(Американский Информационный Образовательный Центр в Научной библиотеке Томского государственного университета)

C 1994 года Американский Образовательный Информационный Центр в Томске сотрудничает с Американской некоммерческой организацией Прожект Хармони Инк. Все эти годы представители этой некоммерческой организации и участники обменных программ, администрируемых Прожект Хармони, принимали активное участие в развитии Томского Образовательного Информационного Центра.

В декабре 2000 года, благодаря длительной совместной творческой работе стало возможно подписание договора о совместной деятельности на 3 года, результатом которого и явилось открытие Интернет Центра для работы с выпускниками обменных образовательных программ, финансируемых Правительством США на базе Американского Образовательного Информационного Центра в Томске.

Интернет Центр оснащен современным сетевым и компьютерным оборудованием, имеет 10 рабочих мест, постоянно подключенных к Интернет, и снабженных видеокамерами, которые позволяют организовывать телеконференции. Место преподавателя оборудовано демонстрационным проектором, принтером, сканером. Для поддержки локальной компьютерной сети и размещения Web-сайтов, в Интернет центре имеется мощный сервер.

Интернет Центр предоставляет выпускникам Американских программ не только свободный доступ к Интернет, но и возможность совершенствования своих знаний, умений и навыков в их использовании новейших интернет технологий для проведения научных исследований на образовательных сессиях, тематических семинарах, конференциях, возможность создания методических пособий, материалов, обучающих курсов. Центр рекламирует мини-конкурсы, объявляемые Прожект Хармони, и консультирует по оформлению документов для участия в этих конкурсах.

Но самое главное, что эта работа в Интернет Центре объединила выпускников Американских программ, которые являются представителями местных сообществ и государственных структур. С помощью полученной образовательной подготовки и тренинга они станут тренерами по передаче своих знаний новым пользователям Интернет и смогут поддержать местные сетевые инициативы.

Интернет Центр является мощным инструментом:

Многие выпускники были лишены возможности поддерживать творческие, научно-исследовательские, культурные связи после окончания Американских программ, что ухудшало их потенциальные возможности продолжать свои творческие инициативы и их дальнейшую самореализацию.

Совместные усилия всех заинтересованных сторон могут дать очень мощный толчок для дальнейшего взаимовыгодного сотрудничества и развития Томского региона. Только гармонично развивающееся общество может предоставить всем равные условия для самореализации.

!29

Современные информационные
технологии в процессе обучения по курсу
"Основы информационной культуры"

Е. Кичигина
(Библиографический информационный центр Научной библиотеки Томского государственного университета)

В современных условиях увеличивающегося потока информации, умение находить и использовать информацию является обязательным элементом образования и самообразования. В Научной библиотеке Томского государственного университета разработан специальный курс "Основы информационной культуры", который и направлен на реализацию библиотечно-библиографического обучения.

Программа курса состоит из двух разделов и рассчитана на 18-20 часов учебного времени каждой группы 22 факультетов ТГУ.

Первый раздел - " Основы информационной культуры и библиотековедения" - предназначен для студентов 1-го курса всех факультетов, изучается в первом учебном семестре и рассчитан на 10 учебных часов.

Основная цель:

Второй раздел - "Научно-информационный поиск. Отраслевая библиография", изучается во втором семестре того курса, на котором студенты пишут первую учебно-исследовательскую (курсовую) работу и занимает 8 часов.

Цель этого раздела:

Информатизация образования требует создания новых средств обучения и обучающая страница позволит активизировать процесс обучения, сделает его более ярким, интересным и доступным для восприятия.

При создании обучающей страницы курса "Основы информационной культуры" ставился комплекс задач, которые необходимо было решить на данном этапе:

Технология библиотечно-библиографического обучения, основанная на традиционной передаче информации через слово (устное или печатное), не позволяла активизировать познавательную деятельность учащихся. Благодаря использованию компьютерных технологий становится возможным передача образной информации с помощью картинок, фотографий и у обучающегося появляется возможность многократного обращения к учебному материалу в удобном для него темпе. У учащегося возникает интерактивный учебный диалог с компьютером, который дает возможность управлять процессом обучения.

Созданный перечень вопросов и возможных ответов по той или иной учебной теме, помогает проверить уровень знаний обучающихся. Через обратную связь происходит влияние на процесс усвоения знаний. Задача студента выбрать один правильный ответ или написать свое осмысление информации. Использование гипертекстовых ссылок делает процесс обучения индивидуальным, т.к. пользователь может выбрать свой индивидуальный алгоритм поиска информации, свою стратегию чтения.

Обучающая страница может быть использована, как на занятиях в аудитории, так и при дистанционном обучении. В ТГУ создан Институт дистанционного образования, на котором учатся студенты из других городов России и Казахстана. Обучающая страница сделает процесс библиотечно-библиографического обучения доступным и возможным на расстоянии.

Обучающая страница легко корректируется и обновляется по мере необходимости и автоматически обеспечивает весь процесс обучения: от постановки познавательных задач до ориентирования на самообразование.

В процессе создания и использования обучающей страницы возникли новые идеи по расширению курса дополнительной темой, которая позволила бы обучать работе в Интернет, показать неограниченные возможности получения информации через Интернет, используя современные поисковые машины, каталоги.

Создание обучающей страницы в курсе "Основы информационной культуры" стало возможным благодаря открытию Интернет центра на базе Американского Образовательного центра в рамках Программы расширения доступа к Интеренет в России, поддерживаемой американской некоммерческой организацией Прожект Хармони.

!30

Ориентация на пользователя
- основа сотрудничества
научно-медицинской библиотеки
Сибирскогo государственного
медицинского университета с Американской некоммерческой
организацией "Project Harmony, Inc."

Л.М. Федорова, Д.Н. Тупицин, Г.В. Захарова, Н.В. Молодцова, В.А. Фокин
(Научно-медицинская библиотека Сибирского государственного медицинского университета, Томск, Россия
Представительство "Project Harmony INC." в Томской области, Томск, Россия
Кафедра медицинской кибернетики Сибирского медицинского университета)

Приведены возможные пути реализации образовательной функции научно-медицинской библиотеки на базе Интернет-класса, открытого при поддержке "Прожект Хармони Инк." (США) в научно-медицинской библиотеке Сибирского государственного медицинского университета. Представлена концепция и программа реализации проекта по проведению образовательных курсов "Интернет-технологии в медицинском образовании". Представлены различные формы обучение пользователей-медиков методике поиска научно-медицинской информации в Интернет и навыкам работы с основными программно-техническими средствами, используемыми в Интернет по созданию собственных образовательных информационных ресурсов.

Новая социальная функция библиотек

Стремительное развитие локальных и глобальных компьютерных сетей, внедрение в научную практику современных информационных средств коммуникаций, качественное изменение способов обработки и доставки информации и изменение форм доступа к ней ставит перед библиотеками совершенно новые задачи в обеспечении пользователей оперативной научной информацией на традиционных и новых носителях.

Современная социальная функция библиотек стремительно видоизменяется. Библиотеки встают на качественно иной уровень развития. Сохраняя традиционные функции хранителей научной информации, библиотеки выступают в роли создателей собственных информационных ресурсов. Сотрудники библиотек выполняют функцию операторов- консультантов для пользователей. Библиотеки и информационные структуры библиотек, соответственно, должны быть ориентированы на пользователей с различным уровнем информационной подготовки. Перед библиотеками встала новая социальная функция по обучению пользователей владению современными компьютерными технологиями. В настоящее время библиотеки должны играть роль как информационного, так и образовательного посредника между пользователем и всем многообразием имеющейся научно-медицинской информации.

Разработка обучающих программ и проведение образовательных тренинг-семинаров для специалистов , использующих Интернет для своей научно-практической и творческой деятельности - одно из приоритетных направлений в деятельности библиотек сегодня.

Информационная культура библиотечных специалистов

Для проведения образовательных мероприятий для пользователей операторы-консультанты библиотек должны ориентироваться в следующих вопросах:

Информационная культура пользователей

Современный пользователь научной информации должен быть ориентирован в следующих элементах информационной культуры:

Новая социальная функция современной библиотеки невозможна без привлечения финансовых средств соответствующего уровня. Реализации этих задач способствует участие библиотек в грантовых программах.

Научно-медицинская библиотека Сибирского медицинского университета привлекает грантовые поддержки различных организаций для организации обеспечения пользователей научно- медицинской информацией на современном уровне, который соответствует все возрастающему уровню запросов пользователей.

"Прожект Хармони Инк." (США)

Существенную помощь библиотекам в этой работе оказывают различные фонды и некоммерческие организации, деятельность которых направлена на поддержку и развитие образовательных и культурных инициатив. Одной из таких организаций является Американская некоммерческая корпорация "Прожект Хармони Инк." (Project Harmony Inc.), которая уже в течение 15 лет проводит на территории России и стран СНГ культурные, профессиональные и образовательные инициативы.

С мая 1999 года "Прожект Хармони Инк." приступила к работе над программой "Обучение и доступ к Интернет" (Internet Access and Training Program), проводимой и финансируемой Управлением Культурных и Образовательных Программ Государственного Департамента США (Bureau of Educational and Cultural Affairs of the US Department of State). Основной целью этой программы является упрочнение отношений между Россией и США через развитие открытой коммуникации между гражданами и организациями, в частности через развитие некоммерческого доступа к Интернет и обучение широких слоёв населения работе в этой глобальной информационной сети. Для этого во многих городах России и странах СНГ создаются центры открытого доступа к Интернет и финансируется проведение образовательных курсов, конференций, семинаров и конкурсов минигрантов.

В январе 2001 года в рамках региональной программы "Обучение и доступ к Интернет" в Томской области, проводимой "Прожект Хармони Инк.", были созданы три новых класса открытого доступа к сети Интернет, одним из которых стал Интернет-класс в Научно-медицинской библиотеке Сибирского государственного медицинского университета.

Интернет-класс "Прожект Хармони Инк." (США) в научно-медицинской библиотеке

Американская некоммерческой корпорации "Прожект Хармони Инк." США и Сибирский государственный медицинский университет (СГМУ) подписали договор о совместной деятельности в целях реализации гранта Управления Образовательных Культурных Программ Государственного Департамента США "Обучение и доступ к Интернет". И в январе 2001 года в научно-медицинской библиотеке Сибирского государственного медицинского университета г. Томска был создан Интернет-класс открытого доступа к Интернет.

Класс укомплектован 10 компьютерами и сервером, имеющим доступ в Интернет по ISDN каналу. В комплектацию также входят средства организации видеоконференций, сканер, цифровой фотоаппарат и компьютерный проекционный монитор. Работа класса предполагает представление всего спектра информационных услуг посетителям библиотеки: поиск научно-медицинской информации, консультации по организации работы с поисковыми системами, полнотекстовых и справочно-библиографических базах данных и каталогах, а также самостоятельную работу сотрудников и студентов по поиску необходимой информации через сеть Интернет и возможность создания собственных веб-ресурсов.

Образовательные курсы

Для реализации социальной функции библиотек по обучению пользователей поиску научно-медицинской информации и созданию собственных информационных ресурсов "Прожект Хармони Инк." предоставил научно-медицинской библиотеке грант на проведение и организация образовательных курсов по Интернет-тематике.

Получение образовательного гранта позволило библиотеке разработать и организовать систему обучающих тренингов для пользователей-медиков и операторов-консультантов, задействованных в обслуживании пользователей медиков города Томска.

Для реализации обучающей функции библиотеки были разработаны концепция и подробная программа обучающих мероприятий в библиотеке.

Концепции реализации проекта

В основу "Концепции реализации проекта в библиотеке" был положен принцип непрерывности проведения обучающих мероприятий в библиотеке.

Концепция образовательных курсов предусматривала решение следующих задач:

При разработке концепции организации и проведения образовательных курсов были учтены следующие очень важные, на наш взгляд, моменты:

Программы образовательных курсов

Глобальная цель программы была ориентирована на внедрение Интернет- технологий в образовательный процесс медицинских учебных заведений и расширение круга медицинских специалистов различного профиля, использующих Интернет-технологии для совершенствования образовательной, профессиональной и творческой деятельности.

Конкретная цель - раскрыть возможности Интернет для получения, обмена и представления информации медицинского характера и обучить слушателей навыкам работы с основными программно-техническими средствами, используемыми в Интернет, по созданию собственных образовательных информационных ресурсов.

На основе Концепции были разработаны несколько вариантов программ для разных групп пользователей. Программы разработаны таким образом, чтобы слушатели, получившие элементарные базовые знания, имели возможность обновлять их, углублять и получать информацию о новациях, которые имеются в научно-медицинской информации и в информационном обслуживании.

Базовая программа для интенсивных образовательных курсов: "Интернет-технологии в медицинском образовании"

При финансовой поддержке некоммерческой организации "Project Harmony, Inc" научно-медицинской библиотекой совместно с кафедрой медицинской и биологической кибернетики Сибирского государственного медицинского университета была разработана программа образовательных курсов "Интернет-технологии в медицинском образовании".

Образовательные курсы были открыты на базе Интернет-класса открытого доступа научно-медицинской библиотеки СГМУ.

Для преподавательской деятельности были приглашены операторы-консультанты Интернет-класса открытого доступа научно-медицинской библиотеки СГМУ и сотрудники кафедры медицинской и биологической кибернетики СГМУ.

Слушателями курсов стали профессора, доценты, ассистенты и аспиранты кафедр Сибирского государственного медицинского университета, сотрудники научно-исследовательских институтов ТНЦ СО РАМН, а также сотрудники научно-медицинской библиотеки СГМУ. В процессе обучения перед всеми слушателями была поставлена задача - создание собственного Web-ресурса, отражающего научные интересы подразделения.

Необходимыми требованиями к базовой подготовке слушателей были определены: первоначальные навыки работы в операционной среде Windows, умение использовать стандартные приложения Windows для создания текстовых и графических документов, наличие педагогического стажа не менее 1 года.

Структура базового курса "Интернет-технологии в медицинском образовании"

Курс состоит из 4 частей:

1. Стационарный курс обучения методом интенсивного обучения - 40 часов ежедневных аудиторных занятий, из которых 8 - лекции, 28 - практические занятия, 4 - семинарские занятия. На стационарных курсах обучения прошли обучение 80 слушателей - сотрудников СГМУ, медицинских учреждений г. Томска и научно-медицинской библиотеки Сибирского государственного медицинского университета.

2. Послесессионное обучение - однодневные семинары по 4 часа, ориентированные на более детальное изучение узловых разделов курса. Послесессионное обучение прошли 114 слушателей, проведено 30 часов тематических повышающих семинаров.

Примерные программы для однодневных семинаров:

3. Дистанционное обучение

36 слушателей прослушали 20 часов индивидуальных консультаций. На дистанционном этапе обучения предполагается самостоятельная работа выпускников образовательных курсов в Точке открытого доступа IATP и на рабочих местах над выпускным проектом. С целью обсуждения выпускных проектов и разрешения вопросов, возникающих в процессе работы над ними, организуются консультации в количестве 20 часов (8-10 консультаций), периодичность проведения - 2 раза в месяц. Консультации проводят лекторы, читающие образовательные курсы. Время проведения консультаций назначается по согласованию. Индивидуальные и групповые консультации осуществляют сотрудники библиотеки, прошедшие обучение на курсах, в течение рабочего дня в точке открытого доступа.

Программа курсов включает также заочный этап обучения для выполнения дипломного проекта.

Дипломный выпускной проект

Требования к выпускному проекту: Выпускной проект представляет собой создание и размещение в Интернет собственного образовательного Web-ресурса слушателя. Web-ресурсы, созданные слушателями в рамках выполнения проекта, представляются в качестве выпускных проектов на получение дипломов установленного образца от "Project Harmony, Inc.". Дипломы дают право их обладателям проводить аналогичные образовательные курсы с целью расширения круга медицинских специалистов различного профиля, использующих Интернет-технологии в научно-практической и образовательной деятельности.

По результатам обучения на курсах слушателями выполнено 45 выпускных проектов, которые размещены на Web-сайте "Интернет-класс открытого доступа в научно-медицинской библиотеке СГМУ" (http://study.tomsk.ru) Сибирского медицинского университета.

4. Программы ежемесячных семинаров по актуальным проблемам поиска информации и создания собственных информационных ресурсов с курсом непрерывного обучения, рассчитанного на 3 года.

Введение в Интернет

Разработан курс еженедельных семинаров для узкоспециализированных групп (кафедр института, подразделений лечебных учреждений) "Первые шаги в Интернет" и "Введение в Интернет".

Обучение пошли 52 сотрудника кафедр Сибирского государственного медицинского университета и лечебно-профилактических учреждений города Томска, на которых слушатели знакомятся с методикой поиска информации в Интернет.

Web-сайт "Интернет-класс открытого доступа в научно-медицинской библиотеке"

Для интерактивного общения со слушателями курсов научно-медицинской библиотекой организован и функционирует Web-сайт "Интернет-класс открытого доступа в научно-медицинской библиотеке СГМУ", созданный при поддержке американской некоммерческой организации "Прожект Хармони Инк", в рамках программы IATP (Обучение и Доступ к Интернет). На сайте http://study.tomsk.ru выставлена и постоянно обновляется информация о программе "Project Harmony, Inc", об образовательных курсах в классе открытого доступа к сети Интернет в научно-медицинской библиотеке, информация об операторах - консультантах класса IATP и о преподавателях образовательных курсов. Представлена также актуальная информация о текущих новостях и мероприятиях, проводимых в классе открытого доступа к Интернет, гиперссылка на страницу новостей Web-сайта научно-медицинской библиотеки по адресу: http://medlib.tomsk.ru.

Заключение

Сотрудничество Научно-медицинской библиотеки и американской некоммерческой организацией "Project Harmony, Inc." по проведению обучающих мероприятий для пользователей медиков получило свое логическое продолжение. В мае 2001 года научно-медицинская библиотека Сибирского медицинского университета получила мини-грант на организацию и проведение образовательных курсов "Поиск научно-медицинской информации в Интернет" для профессионально ориентированных групп пользователей медиков. В период с мая по июль на курсах будут обучены алгоритму поиска научно-медицинской информации в Интернет 36 операторов-консультантов, которые составят 3 профессионально ориентированных группы. В первую группу войдут руководители Интернет-классов Сибирского государственного медицинского университета, во вторую войдут заведующие медицинскими библиотеками медицинских учреждений города Томска и третью группу составят библиотекари научно-медицинской библиотеки Сибирского медицинского университета.

Обучение операторов-консультантов обеспечит профессиональное обслуживание пользователей медиков города Томска.

Организация обучающих курсов по Интернет-технологиям на базе научно-медицинской библиотеки ориентирована на разные группы пользователей. Во время разработки концепции и программ обучающих мероприятий определены точки соприкосновения пользователей медиков, операторов-консультантов и преподавателей по использованию Интернет-технологий в медицинской науке, практике и образовании, что позволяет моделировать и реализовывать конструктивные обучающие мероприятия с реальными результатами.

Совмещение обучения с элементами практической деятельности является эффективным способом знакомства с современными информационными технологиями, обучения методике поиска медицинской информации и создания собственных ресурсов и их размещение в сети Интернет.

!31