!1!

А.В. Глушановский, Н.Е. Калёнов

(БЕН РАН, Москва)

ОСНОВНЫЕ НАПРАВЛЕНИЯ
РАЗВИТИЯ СИСТЕМЫ
ИНФОРМАЦИОННО-БИБЛИОТЕЧНОГО
ОБЕСПЕЧЕНИЯ НАУЧНЫХ ИССЛЕДОВАНИЙ
В БЕН РАН

ВВЕДЕНИЕ

Современная ситуация в области информационно-библиотечного обеспечения ученых России характеризуется: с одной стороны, резко уменьшающимися возможностями финансирования (при возрастающих мировых информационных потоках), с другой - ускоренным развитием компьютерных информационных сетей (включая мировую сеть INTERNET), возрастанием потока информации, предоставляемой с помощью этих сетей (в том числе информации, существующей только в электронной форме). В связи с этим, наряду с сохранением в качестве основного направления комплектования сети БЕН РАН информацией на традиционных носителях (в пределах имеющихся финансовых возможностей), система информационно-библиотечного обеспечения должна шире использовать информацию на машиночитаемых носителях (дискеты, компакт-диски), а также информацию, доступную по сети INTERNET.

При решении вопроса о соотношении информации, существующей как на традиционных носителях, так и в электронной форме, следует руководствоваться соображениями сравнительной финансовой эффективности приобретения той или иной версии. Однако в настоящее время производится все больше информации, доступной только в электронной форме (библиографические, реферативные, полнотекстовые, фактографические базы данных, электронные журналы, телеконференции INTERNET и т.п.), при этом относительная её доля в мировом информационном потоке быстро нарастает. В связи с этим одним из основных направлений развития БЕН РАН должно стать максимальное (в пределах имеющихся финансовых и технических возможностей) использование электронных форм информационного обслуживания с целью предоставления пользователям мировой научной информации в полном объёме.

Следует также учитывать, что в условиях крайне недостаточного финансирования библиотечной деятельности в масштабах страны (что приводит к невозможности полно и оперативно предоставлять читателям интересующие их первоисточники не только в системе библиотек РАН, но и в центральных библиотеках России) существенно возрастает роль оперативного предоставления пользователям библиографической и реферативной информации, полученной в электронной форме с использованием сетей передачи данных. Предоставление такой информации (которая в ряде случаев опережает выход традиционных изданий) обеспечивает возможность последующего установления прямой связи (с использованием электронной или традиционной почты) между российскими учеными и их зарубежными коллегами с целью получения копий интересующих статей. Существенным ресурсом восполнения недостаточного информирования ученых может быть использование ими электронных телеконференций сети INTERNET (а также участие в них).

При изложении концепции развития БЕН РАН как информационно-библиотечного центра целесообразно выделить четыре составляющие, характеризующие его деятельность: предоставление первоисточников; предоставление вторичной информации; внутренняя технология, обеспечивающая выполнение первых двух функций; генерация собственных информационных ресурсов.

Рассмотрим каждую из перечисленных составляющих.

ПРЕДОСТАВЛЕНИЕ ПЕРВОИСТОЧНИКОВ

Первоисточники (полные тексты научных материалов) были и останутся впредь основой информационного обеспечения любого ученого.

Развитие системы предоставления первоисточников должно осуществляться в следующих направлениях:

Совершенствование комплектования централизованной библиотечной системы (ЦБС) БЕН РАН путем разработки автоматизированных систем формирования оптимального заказа на издания с учетом тематических планов комплектования (ТПК) входящих в ЦБС библиотек, данных о спросе по всем каналам обслуживания, экспертных оценок информационной ценности тех или иных первоисточников.

Анализ возможностей использования электронных публикаций, доступных в сети INTERNET и распространяемых на машинных носителях; приобретение таких публикаций или прав доступа к ним и создание условий для работы с ними читателям ЦБС.

Автоматизация процессов обслуживания читателей ЦБ, повышающая комфортность и оперативность предоставления первоисточников читателям и включающая возможность заказа литературы непосредственно в процессе работы с электронным каталогом, выдачу сообщений об отказах непосредственно в момент заказа литературы, распечатку требований в отделе фондов, накопление информации о спросе на издания.

Развитие системы МБА с использованием сетей передачи данных и возможностью заказа изданий непосредственно из режима удаленной работы с каталогами БЕН, доступными в сетевом режиме. Эта работа предполагает разработку специального программного обеспечения, проверяющего статус заказчика, наличие предоплаты для абонентов, работающих с БЕН на договорных условиях и т.п.

Использование в интересах МБА сети INTERNET для поиска литературы в каталогах других библиотек с последующим заказом копий по электронной почте или непосредственно в режиме online.

Организация системы копирования материалов в электронной форме (путем сканирования) для последующей рассылки абонентам по электронной почте. Эта работа (учитывая зарубежный опыт) является достаточно перспективной, поскольку повышает оперативность обслуживания и существенно снижает финансовые затраты на пересылку материалов и ей предполагается уделить значительное внимание.

ИНФОРМАЦИОННОЕ ОБСЛУЖИВАНИЕ

Под информационным обслуживанием традиционно понимается оперативное обеспечение ученых вторичной (реферативной, библиографической) информацией о публикациях, а также фактографической информацией. В этой области могут быть наилучшим образом использованы современные электронные формы поиска, доставки и предоставления информации с использованием компьютерных сетей и различных видов носителей.

Одним из основных направлений этой составляющей библиотечно-информационной деятельности БЕН РАН является использование локальных библиографических и реферативных баз данных в электронной форме (дискеты, компакт-диски) для текущего (в режиме ИРИ) обслуживания институтов РАН, а также ретроспективного обслуживания ученых по разовым запросам. На данный момент предпочтение отдается политематическим базам данных в области естественных наук и смежных с ними областей знаний. В связи с этим предполагается продолжить приобретение и использование БД "Science Citation Index" и "Current Contents". Одновременно будет вестись поиск и анализ аналогичных политематических зарубежных и отечественных БД, руководствуясь критериями оперативности, полноты отражения информации (в первую очередь - зарубежной), а также стоимости.

Развитие системы информационного обслуживания по имеющимся в БЕН базам данных будет осуществляться в направлении развития системы приема запросов и отправки результатов поиска по электронной почте, что позволит охватить системой удаленных пользователей, лишенных в настоящее время возможности использования ресурсов БЕН.

Для развития этого направления в БЕН РАН предполагается существенная модернизация технических средств доступа к CD-ROM с целью расширения их возможностей, включая приобретение комплекса, обеспечивающего работу локальной CD-ROM сети, включающей 8-10 рабочих мест и поддерживающей одновременный доступ к 16-24 дискам.

Однако наиболее перспективным, с учетом современных тенденций развития мировой информационной инфраструктуры, является направление, связанное с использованием возможностей сети INTERNET для информационного обеспечения ученых РАН.

В этой области выделяются следующие основные задачи:

РАЗВИТИЕ ВНУТРИБИБЛИОТЕЧНОЙ
ТЕХНОЛОГИИ

Развитие внутрибиблиотечной технологии, без которого, в конечном счете, невозможна реализация полноценной системы обслуживания, связывается с широким внедрением компьютеров в практику работы ЦБС БЕН, совершенствованием сетевого взаимодействия между центральной библиотекой (ЦБ) и библиотеками сети, использованием возможностей INTERNET для доступа к отечественным и мировым библиотечным ресурсам, а также с кооперацией в обработке литературы, предусмотренной созданием Российского центра кооперативной каталогизации.

Существенной проблемой является поддержка актуальной и достоверной версии сводного электронного каталога в условиях роста количества децентрализованных поступлений. Организация технологии добавления информации о децентрализованных поступлениях в сводный электронный каталог является первоочередной задачей.

Переход на электронную обработку всего потока изданий, реализованный в автоматизированной системе БЕН РАН, создает предпосылки для сокращения количества традиционных каталогов, что является одной из актуальных задач, однако ее решение требует повышения надежности функционирования локальной вычислительной сети Библиотеки.

Для задач развития внутрибиблиотечной технологии предполагается использовать также возможности INTERNET в следующих направлениях:

Трудности комплексного развития ЦБС БЕН РАН связаны с отсутствием техники в библиотеках сети. Это существенно затрудняет развитие системы информационно-библиотечного обеспечения ученых и усложняет технологическое взаимодействие внутри ЦБС. Разработанное в БЕН программное обеспечение позволяет перейти на унифицированную систему ведения баз данных трудов сотрудников РАН, локальных каталогов, существенно упростить библиотечные процессы, как в ЦБ, так и в библиотеках сети. Однако для решения этой задачи необходимо целевое финансирование приобретения техники для библиотек НИИ РАН, оцениваемое (для московского региона) в 300-350 тысяч долларов.

СОЗДАНИЕ СОБСТВЕННЫХ
ИНФОРМАЦИОННЫХ РЕСУРСОВ

Основными информационными ресурсами БЕН РАН являются сводные каталоги. Развитие электронных каталогов осуществляется в трех направлениях:

Совершенствование программного обеспечения в направлении создания максимальных возможностей для поиска информации (в т.ч. путем создания внутрисистемных таблиц перехода с естественного языка на классификацию УДК, с помощью которой индексируется литература);

Предоставление доступа к каталогам БЕН через сеть INTERNET. Для решения этой задачи осуществляется разработка принципиально нового программного обеспечения и предполагается организация круглосуточной работы сервера БЕН РАН.

Постепенный перевод в электронную форму ретроспективной информации о фондах ЦБС. Эта проблема представляется достаточно сложной, однако международный опыт показывает необходимость ее решения, и она рассматривается как одна из последующих задач.

В области создания различных собственных баз данных имеется также ряд перспективных задач, которые могли бы быть решены при наличии специального их финансирования.

Так БЕН РАН, имея тесную связь с библиотеками НИИ РАН, могла бы создать на основе картотек (а в ряде библиотек - баз данных) трудов сотрудников НИИ РАН объединенную базу данных трудов сотрудников РАН, которая представляла бы значительный интерес и могла бы формироваться и распространяться на CD-ROM. Программное обеспечение для децентрализованной подготовки такой базы и слияния полученной информации разработано специалистами БЕН РАН по гранту РФФИ и испытано в ряде НИИ РАН и других ведомств.

Имея сведения о читателях библиотек сети (в настоящее время в базе данных, сформированной в БЕН РАН, содержится около 20 000 записей) и объединив их с информацией о публикациях (см. выше), БЕН РАН могла бы создать базу данных "Who is who in Russian science", распространяемую на CD-ROM в двуязычном (русском и английском) вариантах.

ЦБС БЕН располагает уникальным фондом редкой научной книги. Представляется целесообразным создать соответствующую базу данных, которая бы содержала не только библиографию, но и изображения отдельных фрагментов изданий.

ЗАКЛЮЧЕНИЕ

В настоящее время БЕН РАН приступила к поэтапной реализации изложенной концепции развития своей информационно - библиотечной системы. В 1997 году в значительной мере обновлена техническая база ЦБ, введен в действие класс доступа к INTERNET, начат эксперимент по обмену электронными копиями публикаций с зарубежными партнерами, внедрена электронная почта в технологию работы отделов комплектования и МБА, ведется модернизация программного обеспечения и т.д.

Более подробная информация об отдельных направлениях развития системы приведена в специальных материалах сотрудников БЕН РАН, приведенных в настоящем сборнике.

!2!

С.И. Бессонов, Е.Д. Зиновьева,
В.А. Цветкова, А.В. Шапкин

(ВИНИТИ, Москва)

ЭЛЕКТРОННЫЕ РЕФЕРАТИВНЫЕ
ЖУРНАЛЫ ВИНИТИ

ВИНИТИ - один из крупнейших производителей информационных продуктов и услуг на информационном рынке России, СНГ, и других стран. Его продукцию, в первую очередь, Реферативный журнал (РЖ), выписывают почти в 60-ти странах мира. Следует отметить, что даже в эти трудные годы, несмотря на довольно высокие цены, информационные продукты ВИНИТИ не утратили интереса со стороны пользователей. Более того, последние полтора-два года наблюдается стабилизация подписки и продаж информационных продуктов ВИНИТИ на информационном рынке России и стран СНГ, где в явной форме присутствует « отложенный" спрос, связанный с крайне низким финансированием науки, ВУЗов, падением платежеспособности именно той части населения страны (ученые, преподаватели, студенты), которая нуждается в информации, предоставляемой ВИНИТИ. На рынке стран дальнего зарубежья замечен некоторый рост объемов продаж после резкого спада в 1990 г.

С одной стороны, устойчивость положения ВИНИТИ на информационном рынке в значительной мере обеспечивается традиционным печатным Реферативным журналом. С другой стороны, стремительное развитие и внедрение во все сферы жизни компьютеров, телекоммуникационных сетей, в первую очередь, Internet, привело к тому, что появился новый слой потребителей, требующий нового современного сервиса в обслуживании, такого, который может быть достигнут только в электронных продуктах. Печатная форма РЖ стала вызывать значительные нарекания, связанные с неудобством доставки, включая высокие тарифы за услуги почты, недостаточно широким справочным аппаратом, большими площадями под хранилища, высокой стоимостью производства и, соответственно, значительными ценами.

В этих условиях ВИНИТИ занял активную позицию по продвижению своих продуктов и услуг на формирующийся информационный рынок России и СНГ, поиску новых и модификации имеющихся форм обслуживания. В числе таких продуктов наибольшего внимания заслуживает Электронный Реферативный Журнал (ЭРЖ), который сочетает привычные потребителю качества реферативного журнала и обладает новыми возможностями, присущими только электронным продуктам. Следует отметить, что в мире нет больше примеров подобного представления информации, что не говорит об исключительности данного метода, но показывает, что у России есть свои особые формы работы на информационном рынке.

ВИНИТИ предлагает ЭРЖ на дискетах с 1995 г. На первом этапе это был практически полный аналог печатного РЖ, но с поисковым аппаратом. Поиск документа можно производить по ключевым словам, авторам, источникам, а также свободный поиск по всему тексту.

По сравнению с традиционным печатным изданием ЭРЖ приобрел ряд преимуществ:

Накопленный опыт работы с ЭРЖ показал, что для потребителей наибольшие неудобства доставляют:

В настоящее время прорабатывается вопрос об использовании современных форм электронных коммуникаций для передачи информации, что даст возможность получения отдельных РЖ по электронной почте за счет потребителя. Для удобства работы с ЭРЖ в конце полугодия можно объединить все номера в одну базу, что сократит количество дискет и время поиска рефератов. Использование CD-ROM дает возможность сократить количество дискет в случае большого заказа.

ЭРЖ по желанию пользователя предоставляется как для работы в DOS, так и WINDOWS.

Состояние работы по распространению ЭРЖ на дискетах за период 1995-1997 год характеризуется данными, приведенными в следующей таблице.

 

1995 год

1996 год

1997 год

(по состоянию на 10/08)

Количество подписчиков

12

34

38

Объем подписки (кол-во выпусков)

81

229

680

Цена подписки (тыс. руб.)

28.314

76.000

373.875

Среди потребителей ЭРЖ можно выделить следующие категории:

Для пользователей большой интерес представляет возможность получения ретрофонда. Например, Центральная клиническая больница получила ЭРЖ с 1990 года.

Следует отметить, что практически все организации, начавшие использовать ЭРЖ в 1995 году, продолжают работать с ним и в 1996 и в 1997 годах.

Часто возникает вопрос о том, заменит ли электронный продукт печатную версию? Опыт ВИНИТИ по распространению Реферативного журнала в печатной и электронной формах (аналогичных по содержанию) показывает, что рынок электронных продуктов в России и СНГ еще только формируется. Сегодня еще рано говорить не только о замене одной формы на другую, но даже о какой-либо их конкуренции между собой. При этом следует иметь в виду, что на зарубежном информационном рынке печатные информационные продукты не изжили себя и сосуществуют вместе со своими современными формами и видами. Примерами являются издания реферативных журналов в печатной форме такими службами как CAS, BIOSIS, INIS, INSPEC и т.д. По-видимому, производители информационных продуктов и услуг должны учесть, что стремительно формируется новый слой потребителей (потребители электронных продуктов), и при формировании своей маркетинговой стратегии учитывать интересы сторонников и классических форм, и современных. Только в этом случае можно сохранить свою нишу на существующем информационном рынке и завоевать место на формирующемся рынке электронных продуктов.

Говоря об электронной форме Реферативного журнала ВИНИТИ, нельзя не затронуть базы данных ВИНИТИ. Они распространяются сегодня в стандартной номенклатуре (около 250 выпусков баз данных), а также доступны в телекоммуникационном режиме. Здесь наблюдается тенденция увеличения числа абонентов, пользующихся телекоммуникационным режимом, особенно с подключением к сетям Relcom и Internet. Это можно объяснить тем, что сегодня формирование баз данных, включая закупку, поддержку и ведение требуют значительных ресурсов. На этом фоне работа в телекоммуникационном режиме более привлекательна, удобна, экономически выгодна.

Все сведения об информационных продуктах ВИНИТИ приведены на WWW-сервере: http://viniti.msk.su.

!3!

М. Бирман, Н. Бирман (Сан-Франциско),
В. Глухов (Москва), В. Захаров (Санкт-Петербург),
Н. Калёнов (Москва), О. Лаврик (Новосибирск),
Т. Филатова (Москва), В. Хисамутдинов (Москва)

ЭЛЕКТРОННОЕ КОПИРОВАНИЕ И ОБМЕН
НАУЧНЫМИ ПУБЛИКАЦИЯМИ:
ОПЫТ РОССИЙСКО-АМЕРИКАНСКОГО
СОТРУДНИЧЕСТВА

В 1996 году группа российских специалистов из Москвы, Санкт-Петербурга и Новосибирска, работающих в информационных центрах и библиотеках Российской академии наук, вместе со специалистами из Сан-Франциско, представляющими американскую информационную компанию Access Russia, Inc. (ARI), приступила к разработке совместного проекта по созданию технологии телекоммуникационного доступа к ресурсам академических библиотек России, с одной стороны, и к ресурсам университетской библиотечной сети Калифорнии, с другой. Этот проект, вначале казавшийся несбыточным, в настоящее время в значительной степени реализован и взаимное предоставление публикаций по запросам российских и американских ученых, специалистов и бизнесменов осуществляется ежедневно в нормальном производственном режиме.

Компания Access Russia, Inc. [1-3] является бесприбыльной. Мы рассматриваем деятельность этой компании, как своеобразные "ворота" в информационные "кладовые" России и США. Основное направление её деятельности - разработка и реализация новых информационных технологий, которые должны обеспечить более тесное взаимодействие российских и американских информационных центров и библиотек. Реализация рассматриваемого проекта есть серьезный практический шаг в укреплении такого взаимодействия. Большую помощь и поддержку в создании рассматриваемой системы оказала известная американская информационная компания ACCESS INNOVATIONS, Inc и лично её руководители М. Хлава и Дж. вен Еман.

Созданная технология электронного копирования и доставки документов включает:

Известно, что многие годы существовало несоответствие между быстрым доступом к информации, хранящейся в базах данных, и медленным доступом к книгам и журналам, хранящимся на полках библиотек. В первом случае оперировали секундами, во втором - часами, днями и, нередко, неделями и месяцами. В первом случае использовались компьютеры и их возможности хранения и быстрого поиска информации, во втором - ксероксы, микрофильмирующее и другое, в основном, копировальное оборудование.

Начало сближению этих, казалось бы, никогда не смогущих приблизиться друг к другу технологий, положило применение CD-ROM. Возможность записи и долговременного хранения десятков, сотен тысяч страниц текста на диске диаметром всего около 12 см, их быстрое и дешевое тиражирование открыли перспективы компьютерной обработки полнотекстовых документов. В результате, появились электронные журналы и книги на CD-ROM, и число их непрерывно растет.

Второе обстоятельство, радикально меняющее технологию обработки и доставки полнотекстовых документов, - это появление многочисленных программ, ориентирующих компьютер на обработку изображений. Естественно, что появление таких программ стало возможным благодаря новым аппаратным возможностям современных компьютеров, и в первую очередь, большой памяти, как оперативной, так и дисковой, и высокой скорости выполнения операций, что принципиально важно при обработке двумерных объектов. Сюда же следует отнести разработку программ автоматического распознавания текстов. Нельзя не сказать добрых слов в адрес программы распознавания текстов FineReader, разработанной в России. Она обладает мощными распознавательными возможностями, а в распознавании кириллических текстов у неё нет в мире конкурентов. Известно, что в США эта программа пользуется большой популярностью.

И, наконец, третье - это невероятно быстрый прогресс в области телекоммуникаций и, конечно же, Internet со всеми ее возможностями. Прогресс в развитии методов создания электронных текстов с применением SGML и HTML технологий, несомненно, также способствовал решению поставленной нами задачи.

Всё это и послужило фундаментом, на котором нам удалось создать действующую международную систему электронного копирования и доставки документов. На всех этапах мы пытаемся максимально использовать перечисленные достижения в развитии компьютерных технологий и внедрить их в нашу систему.

Технологический процесс начинается с приема запросов от абонентов. Подход абонентов к работе с системой несколько отличается в России и в США. В США для работы с клиентами нами используются две абонентские сети: широко известная сеть OCLC (Online Computer Library Center) и созданная ARI собственная абонентская сеть. Следует сказать, что библиотеки США прекрасно укомплектованы литературой, изданной и в СССР до его распада, и той, что издана в России после 1991 года. Как правило, к нам из OCLC поступают сложные заказы, главным образом, из университетских библиотек, на литературу, опубликованную, преимущественно, 30-40 лет назад. Довольно часто поступают запросы на литературные источники, изданные даже в прошлом веке или в начале нынешнего. Это те источники, что отсутствуют в сети библиотек, входящих в OCLC. Внутренняя сеть ARI включает многие университеты США и Канады, известные исследовательские лаборатории, крупные промышленные компании, юридические конторы и, конечно, аналогичные информационные службы, большинство из которых не может справиться с выполнением заказов на информацию из России и передает их в ARI. Наш анализ показал, что эти службы не хотят работать с российскими библиотеками напрямую по разным причинам и, необходима специальная служба в США, которая быстро и надежно выполняет заказы из России.

Запросы из OCLC поступают в стандартном режиме, установленном регламентом этой службы. Ежедневно проверяется поступление запросов с помощью программного обеспечения, предоставленного OCLC, Inc. при заключении договора с ARI. Поступивший запрос содержит все или часть библиографических данных, необходимых для поиска; адрес, по которому следует выслать копию; срок, установленный для выполнения заказа; OCLC- символы поставщиков информации, которые ответственны за выполнение данного заказа; и ряд других данных, необходимых для обработки. В большинстве заказов, поступивших в систему, присвоенный ARI в OCLC - символ, A4R, оказывается в одиночестве, что означает, что кроме как на нашу систему абоненту рассчитывать не приходится, т.е., если запрос поступил из OCLC, то практически наверняка заказанный источник отсутствует во всех библиотеках, входящих в эту сеть. Средний срок, устанавливаемый в OCLC для выполнения заказа, составляет около месяца. Интересно отметить, что во многих случаях наши попытки уточнить параметры заказа или изменить некоторые условия его выполнения, вызывают своеобразную и немедленную реакцию пославшего заказ библиотечного работника: "Тогда мы отменяем заказ". Во всех случаях, когда в такой ситуации нам удавалось, минуя библиотеку, найти непосредственного и заинтересованного заказчика, реакция была полностью противоположной: "Никакого отказа, продолжайте поиски, умоляю найти публикацию".

Заказы от абонентов внутренней сети поступают по электронной почте, через Internet-сервер и по факсу. В отличии от OCLC, здесь абонент просит найти и послать ему интересующий его документ в считанные часы или дни. Поэтому вопрос доставки имеет ключевое значение в общей технологии решения данной проблемы.

В России абонентская сеть только начинает складываться. Если в США - это сотни коллективных и индивидуальных абонентов, то в России, пока, единицы. И одна из первоочередных наших задач - создать в России такую сеть. Здесь абонентами пока являются сотрудники академических институтов, читатели, которые не могут получить нужные публикации в российских библиотеках из-за финансовых проблем, создавших дефицит при комплектовании библиотечных фондов. Но для российских клиентов, в отличие от американских, в первую очередь, требуются свежие публикации, в основном, за текущий или предыдущий годы издания.

Полученные запросы вносятся в системную базу данных, обслуживающую технологию в ARI, каждому из них присваивается уникальный номер, и после этого они по электронной почте передаются в ту библиотеку или в тот информационный центр, где вероятнее всего будут выполнены. Если заказ поступил от американского абонента, то, в первую очередь, проверяется, а нельзя ли найти заказанный источник в какой-либо американской библиотеке. Такой поиск проводится в on-line режиме, через TELNET в сводном компьютерном каталоге, содержащем литературу, представленную в фондах практически всех университетских библиотек западного побережья США. Это - Беркли, Стенфорд, Сан-Франциско, Лос-Анджелес и многие другие известные и престижные библиотеки. Поскольку возможен сетевой доступ к каталогам этих библиотек, то рассчитывать на то, что абонент самостоятельно не смог найти документ, в действительности, всё-таки находящийся в библиотеках США, и обратился к нам с просьбой найти его в России, маловероятно. Это случается, главным образом тогда, когда абонент не умеет правильно представить поисковую библиографию в транслитерированной форме, как это требуют условия работы с этим каталогом, либо имеет библиографию для поиска, в переводе на английский язык, либо просто не умеет работать с электронным каталогом. До сих пор подавляющее большинство запросов, поступивших в ARI, действительно касалось документов, отсутствующих в библиотеках США.

Если запрос очень срочный и для его выполнения установлен жесткий срок, он отправляется в Россию одновременно нескольким исполнителям, а в телесовещаниях, которые мы ежедневно проводим, используя Internet, обсуждаются особенности и пути скорейшего выполнения этого заказа, и определяется исполнитель, который наиболее вероятно сумеет найти заказанный документ.

При выполнении заказов от российских абонентов на зарубежные издания также сначала проверяется, есть ли нужный источник в России. Например, если заказ поступил от новосибирского абонента, то сначала выясняется, нет ли требуемого источника в Москве или С.-Петербурге. Если источника нет, заказ направляется в ARI.

Мы убеждены, что постоянные контакты с абонентом являются залогом успеха в работе системы. Поэтому мы заканчиваем разработку программ слежения за ходом выполнения каждого заказа. Планируем установить эту программу в Internet и дать доступ каждому нашему абоненту к информации о том, на какой стадии выполнения находится его заказ и когда он может быть реально выполнен.

Следующий шаг - это сканирование найденной публикации. Используя современные технические средства, все же в некоторых случаях требуется интуиция и опыт исполнителя, чтобы решить с каким оптическим разрешением сканировать текст. Высокое разрешение позволяет более качественно воспроизводить тексты, особенно угасшие, но может привести к значительному увеличению длительности передачи. Возникают вопросы: будет ли распознаваться сканированный текст или текст будет отправлен в виде изображений. Если будет отправлен как изображение, то в каком формате, какими средствами изображение будет компрессироваться. Ответы на эти вопросы, да и на многие другие, могут оказаться ключевыми при развитии технологии электронного копирования.

В процессе передачи текстов используется FTP-сервер или электронная почта. Каждый исполнитель имеет на сервере свой "почтовый ящик", в который он кладет найденную им информацию или забирает информацию, найденную для него. В нашей технологии при передаче информации из России в США и обратно мы используем самые различные форматы, включая TIF, PCX, RTF. Нередко это определяется аппаратными и программными возможностями, а иногда и индивидуальными привязанностями исполнителя к тому или иному формату. В США, если полученные из России изображения отправляются абоненту транзитом в электронной форме, практически во всех случаях должна быть сделана конверсия в PDF-формат и это - главное требование абонента. В других случаях производится распечатка на бумагу и отправка абоненту либо регулярной или курьерской почтой, либо факсом.

Следует заметить, что уверенное воспроизведение даже достаточно сложных текстов, имеющих большую гамму символов разных размеров, низкую контрастность печати, серый фон и т.п., достигается при разрешении в пределах от 150 до 300 dpi. Сканирование может производиться как непосредственно оригинала, так и ксерокопии. Исправление дефектов печати производится средствами фильтрации, изменением контраста и яркости и другими инструментами, которые предлагают современные программы обработки изображений. И, как ни парадоксально с точки зрения классической теории информации, качество электронной копии оказывается нередко выше, чем качество оригинала.

Программы распознавания текста используются нами тогда, когда бывает необходимо проводить дальнейшую компьютерную обработку текста, например, перевод на английский язык автоматическими переводческими программами, или превращение текста в HTML-формат для его представления в Internet, или производство полнотекстовых баз данных. Однако, отсутствие кириллических шрифтов в компьютерах многих американских пользователей сдерживает применение распознающих программ. Мы использовали программы автоматического перевода на английский язык для сканированных и распознанных текстов по заказу исследовательских лабораторий и юридических контор в ситуациях, когда стилистические погрешности были менее важны, нежели быстрота получения перевода. Во всех случаях заказчик остался доволен качеством перевода. В качестве примера использования распознанных текстов и их преобразования в HTML-формат можно привести массив оглавлений российских журналов, который был обработан специалистами Института информации по общественным наукам Российской Академии наук (ИНИОН) и Access Russia. В настоящее время этот массив помещен в Internet, на страницу www.arussia.com и доступен любому желающему поработать с этим массивом. Эти же программы использовались для производства на CD-ROM полнотекстовых баз данных по российскому законодательству и праву.

В процессе выполняемой работы происходит накопление больших массивов данных. Сегодня - это тысячи документов, а если учесть, что многие из них поступают в систему в форме изображений, то возникает проблема ресурсов для их хранения и систематизации. В настоящее время ARI производит запись накапливаемых документов на CD-ROM, и это, как правило, происходит с частотой один раз в два месяца. Естественно, что наряду с архивированием, постоянно ведется каталог, позволяющий найти нужный документ в архиве. Таким образом, реализуется первый шаг к созданию полностью электронной библиотеки.

Во всех случаях мы стараемся сделать доступной в США российскую библиографию о науке и технике, политике и праве, культуре и образованию. Этим мы пытаемся "спровоцировать" в США больший интерес к российским публикациям, который, по нашему мнению, падает, и не только потому, что российская наука испытывает кризис, но и потому, что информация из России, отражающая содержание научных исследований, недостаточно полно представлена в США. Из всего разнообразия баз данных, создаваемых в России, а по некоторым литературным источникам их свыше 2 500, в США, насколько нам известно, в on-line доступе находятся только две. Это база данных ИНИОН по общественным наукам, доступная десяткам американских университетов через информационную сеть RLIN и база данных ИТАР-ТАСС, обрабатываемая в системе DIALOG. Поэтому в настоящее время Research Library Group, осуществляющая управление сетью RLIN, рассматривает созданную нами систему, как основу для доставки публикаций по запросам американских пользователей базы данных ИНИОН.

К сожалению, российские научно-технические и патентные базы данных, практически, не представлены в США, хотя интерес к ним проявляется большой. Откуда же тогда американские специалисты черпают информацию для заказа копий? Мы регулярно проводим такой анализ. Выясняется, что информация попадает к ним или через "третьи" базы данных, такие, как CAS или INSPEC, которые с запозданием помещают информацию из РЖ ВИНИТИ, или из пристатейной библиографии, которая публикуется в российских журналах, имеющихся в фондах американских библиотек. Следует заметить, что в университетские библиотеки западного побережья США Реферативный журнал ВИНИТИ, за исключением некоторых серий (Астрономия, Геология), перестал поступать ещё в середине 80-х годов. Этим, наверное, и можно объяснить устойчивый интерес в США к давно опубликованным российским научным работам.

В настоящее время мы пытаемся изменить сложившуюся ситуацию. В программе наших будущих работ есть создание базы данных по препринтам, издаваемым, в первую очередь, научными институтами Российской Академии наук. Демонстрационный образец такой базы подготовлен, и в настоящее время изучается реакция рынка на эту базу. В разгаре находится работа по представлению в американскую библиотечную сеть электронных версий содержания российских научных журналов, которые неизвестны в США. К этой работе проявляют интерес многие американские библиотеки и информационные центры, поскольку и они испытывают определенные финансовые затруднения с комплектованием. Такой интерес, по нашему мнению, подкрепляется их уверенностью, что благодаря нашей системе, любая публикация, заказанная в результате поиска в базах данных, будет доставлена из России в США в считанные часы.

Начинается работа по использованию цифровых фотокамер для передачи изображений страниц текста через Internet с возможностью быстрого просмотра "свежих" журналов и книг на расстоянии и заказа копий.

В заключение следует сказать, что мы открыты как для новых поставщиков информации, так и для новых потребителей. Хотелось бы также подчеркнуть, что данная работа является хорошей иллюстрацией и доказательством эффективности взаимодействия на международном уровне, когда совместное использование передовых информационных технологий, взаимная помощь и поддержка, да и просто желание сделать шаг вперед в информационном обслуживании, позволяют успешно решать важные и сложные научно-технические задачи.

Литература:

1. М. Бирман, Н. Бирман, Jay ven Eman, M. Hlava, Т. Филатова Access Russia, Inc.: Прошлое, настоящее, перспективы // Информационные ресурсы России, 1996. - № 6. - С. 32-34.

2. Access Russia now participating in OCLC ILL Document Supplier Program // OCLC Newsletter, 1997. - № 226. - С. 33

3. New Access to Information from Russia will soon be available from ACCESS RUSSIA, Inc.// Information Today, 1995, vol. 12 (10) : 5

!4!

Ф.С. Воройский, Я.Л. Шрайберг

(ГПНТБ России, Москва)

МЕЖДУНАРОДНЫЙ
БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЙ
АНАЛИТИЧЕСКИЙ ЦЕНТР:
ЦЕЛИ И ЗАДАЧИ

Целью создания Международного библиотечного информационного аналитического центра (МБИАЦ), офис которого уже создан ГПНТБ России в Вашингтоне, является оптимизация доступа к научной, деловой и другим видам информации из России и стран СНГ для американских пользователей. Действуя от имени российского библиотечно-информационного сообщества, МБИАЦ должен стать "информационными воротами" в Россию на территории США. С другой стороны, в его функции входит и обратная задача: облегчение доступа Российских пользователей к информационным ресурсам США. Создание Центра на территории США будет способствовать быстрой и качественной доставке информации и первичных документов как для американских, так и для российских библиотек, компаний и отдельных пользователей с целью ускорения международного информационного обмена.

Помимо головного исполнителя проекта (ГПНТБ России) в проекте участвуют более 30 ведущих библиотек и информационных центров, университетов, издательств и коммерческих фирм России. В США в поддержку Проекта с подписанием соответствующих соглашений высказалось более 40 библиотек, организаций и компаний, среди которых: Американский Совет по обучению русскому языку, Библиотека Конгресса США, Нью-Йоркская публичная библиотека, 8 университетских библиотек, компании "Interloc Systems Group", "Cambridge Scientific Abstracts", Arrow и ряд других.

Предусматриваются две основные формы сотрудничества юридических и физических лиц с МБИАЦ: в качестве соучредителей и/или поставщиков информационной продукции и услуг. При этом тематический, жанровый и видовой состав последних не ограничен. Основной действующий принцип отбора и предоставления их на внешние информационные рынки - выявленный или высокий потенциально прогнозируемый спрос и качество.

МБИАЦ планирует осуществление своей деятельности в рамках следующих программ:

1. Библиотечная Программа, обеспечивающая:

2. Программа по технологическому обмену, обеспечивающая:

3. Образовательная Программа, обеспечивающая:

4. Программа по бизнес-информации, обеспечивающая:

5. Консалтинг-программа, обеспечивающая:

6. Телекоммуникационная программа, обеспечивающая:

С предложениями о сотрудничестве можно обращаться по адресу:

103919, Россия, Москва, ул. Кузнецкий мост, д. 12,

ГПНТБ России.

Тел.: 928-73-79, 925-74-45

Факс: (095) 921-98-62

E-mail: fsv@gpntb.msk.su.

!5!

Л.Ф. Размахнина, С.Р. Баженов

(ГПНТБ СО РАН, Новосибирск)

ФОРМИРОВАНИЕ И ИСПОЛЬЗОВАНИЕ
ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ
РЕГИОНАЛЬНЫХ БАЗ ДАННЫХ

Проблемно-ориентированные региональные базы данных (Б.Д) являются ценным информационным источником о научно-технических достижениях и внедрении их в практику.

В ГПНТБ СО РАН БД создаются на основе региональных текущих указателей литературы (ТУЛ) по оественным наукам, природе, природным ресурсам Сибири и Дальнего Востока, их охране и рациональному использованию, тематика которых определяется информационными потребностями ученых и специалистов. Подготовка региональных ТУЛ ведется с использованием ЭВМ типа СМ-4. Отбор и обработка информации осуществляются в традиционном (ручном) режиме. Формирование массива указателя, вспомогательного аппарата - в автоматизированном, для чего дополнительно к библиографическому описанию вводится система определителей: авторов, соавторов, составителей, редакторов; географических рубрик; раздела систематизации и символы для каждого указателя. Это позволяет осуществлять одноразовый ввод информации, ее тиражирование в соответствии с тематикой, форматирование документов, формирование вспомогательного аппарата.

Обработка информации и формирование массива указателя проводятся ежемесячно. Информационные массивы используются для формирования региональных баз данных, содержащих словари поисковых терминов. Поиск информации осуществляется по авторам, заглавиям, географическим рубрикам, шифрам разделов и другим параметрам в диалоговом режиме. Обслуживающие программы выводят на экран словари и позволяют строить запрос путем выбора терминов непосредственно на экране.

Базы данных региональной информации могут быть использованы для подготовки кумулятивных изданий, информационных справок по отдельным запросам, ведения ретроспективного тематического поиска, распространения информации на магнитных и традиционных (бумажных) носителях.

!6!

Б.М. Герасимов

(ВИМИ, Москва)

НОВЫЕ ФОРМЫ СИГНАЛЬНОГО
ИНФОРМИРОВАНИЯ УЧЕНЫХ
И СПЕЦИАЛИСТОВ

Вот уже ряд лет продолжается заметное падение подписных тиражей научной периодики. При этом развитие возможностей теледоступа к базам данных и к электронным версиям реферативных и других изданий, в общем-то, не компенсирует происходящее снижение профессиональной информированности ученых и специалистов. Правда, этот негативный процесс не вызывает резкой обеспокоенности руководителей отечественной науки, поскольку катастрофический спад ее финансирования уже привел к многократному снижению числа и объема исследований и разработок и в системе РАН, и в промышленных НИИ и КБ, и в среде вузовских ученых. Тем не менее, информационные и библиотечные работники ощущают свою ответственность за поддержание информационного обеспечения НИОКР, о чем свидетельствует, в частности, сохраняющийся интерес к настоящему семинару, и поиски новых форм хотя бы сигнального информирования ученых и специалистов.

Одной из таких форм является достигнутое по инициативе Ассоциации информационных работников соглашение между редакциями ведущих периодических методических изданий, ориентированных на распространение опыта информационной работы в новых условиях и передовых информационных технологий. Речь идет о старейшем нашем сборнике "Научно-техническая информация", который продолжает выпускать ВИНИТИ в 2-х сериях, о научно-практическом журнале "Информационные ресурсы России", издаваемом Объединением Росинформресурс, о научно-методическом журнале ВИМИ "Межотраслевая информационная служба", выходящем уже несколько лет без ограничительного грифа "для служебного пользования".

Редакции договорились о взаимной публикации оглавлений вышедших номеров этих родственных изданий, что позволяет подписчикам хотя бы одного из них иметь представление почти обо всех статьях, появляющихся на страницах их профессиональной печати. Читатели могут получать наложенным платежом ксерокопии заинтересовавших их материалов, что, конечно, существенно дешевле соответствующих подписок. Таким же образом доводится до наших коллег информация, а затем и отчеты о конференциях и семинарах в области информационно-библиотечных технологий. С течением времени эта практика распространилась и на другие издания, которые могут представить интерес для наших читателей - "Вестник Российского общества информатики и вычислительной техники", сборник "Вопросы защиты информации", украинский журнал "Информация и рынок". Особенно важно присоединение к данному соглашению наиболее массового на сегодня ежемесячника "Научные и технические библиотеки".

Существенным развитием этой инициативы стало решение Проблемного совета Госкомоборонпрома РФ по информационному обеспечению и статистике о выпуске в ВИМИ библиографического указателя "Сигнал" на основе десятков еще выходящих в оборонных отраслях промышленности ведомственных научно-технических сборников и журналов, мало доступных широкому кругу ученых и специалистов. В 1994 г. Вышло два выпуска "Сигнала" - в серии "Радиоэлектроника" опубликованы данные о 140 статьях из 15 отраслевых изданий, в серии "Машиностроение" - о 155 статьях из 32 изданий. В четырех выпусках "Сигнала", вышедших в первом полугодии 1995 г., отражены 486 статей из 93 номеров различных отраслевых научно-технических изданий по радиоэлектронике, связи, приборостроению, метрологии, автоматике, вычислительной технике, энергетике, электротехнике, экономике, организации производства и др. В указателе приводятся адреса, по которым можно заказать копии статей, размещается реклама продукции различных предприятий и организаций.

Контактный телефон "Сигнала": (095) 4918365.

!7!

А.Ф. Василевич, С.П. Зиновьев, Л.И. Молотков

(МЦНТИ, Москва)

ИСПОЛЬЗОВАНИЕ БАЗ ДАННЫХ
СИСТЕМЫ STN INTERNATIONAL В МЦНТИ

Базы данных STN International

STN International является международной системой баз данных, учрежденной в 1984 году тремя крупнейшими центрами научно-технической информации:

В настоящее время STN International предоставляет своим пользователям в режиме онлайн более 170 баз данных, которые содержат информацию практически во всех областях научных исследований, техники, промышленности и бизнеса. Суммарный объем баз данных превышает 140 млн. документов. Большинство баз данных представляет собой уникальные информационные источники с глобальным международным охватом, недоступные российским ученым, инженерам, промышленникам и предпринимателям по другим каналам.

По типу охватываемой информации все базы данных системы STN International делятся на 5 основных групп:

Тип БД Количество БД

-------------------------------------------------------------------------

Библиографические БД 101

Полнотекстовые БД 15

Справочные БД 35

Числовые БД 27

БД по химическим структурам 9

-------------------------------------------------------------------------

1. Библиографические БД.

Библиографические базы данных содержат библиографические описания и в большинстве случаев рефераты документов и предназначены для быстрого поиска публикаций по интересующей теме, автору, названию организации и т.д. Практически в каждой области науки и техники в системе STN International имеется несколько баз данных, обеспечивающих в совокупности полный охват информационных источников этой области. Так например, в химии - это базы данных Chemical Abstracts, CIN, CBNB, физике, электронике, вычислительной технике - INSPEC, PHYS, ELCOM, биологии - BIOSIS, BIOBUSINESS, LIFESCI, металлургии - METADEX и др. Широкий тематический спектр библиографических баз данных дополняют такие известные мультидисциплинарные базы данных, как Science Citation Index, COMPENDEX, NTIS.

Исключительно широко представлена в системе STN International патентная информация. Крупнейшая международная патентная база данных INPADOC, мировой указатель патентов World Patent Index и базы данных, охватывающие сведения о национальных патентных документах США (БД IFIPAT), Германии (PATOSDE) и других стран, позволяют пользователям проводить эффективные поиски патентов в любой интересующей отрасли знания и промышленности.

Наряду с базами данных по науке и технике в систему STN International загружен ряд крупнейших баз данных, содержащих информацию в различных областях экономики, бизнеса, маркетинга. Использование баз данных PROMT (Predicasts Overview of Market and Technology, JPNEWS, MATBUS и других аналогичных по назначению баз данных дает возможность получить актуальную информацию о зарубежных рынках, производственной и финансовой деятельности компаний, инвестициях, правительственной политике в различных сферах деятельности, новых технологиях.

Значительный интерес представляет возможность поиска в каталогах крупнейших библиотек ФРГ, что позволяет обеспечить заказ копии практически любого из документов в этих библиотеках.

2. Полнотекстовые БД.

Базы данных этого типа наряду с библиографической информацией содержат полные тексты документов. Пользователи могут просматривать в режиме он-лайн на дисплее весь текст или отдельные фрагменты интересующей публикации. В целях экономии времени и денег можно отправить текст публикации на свой адрес (или адрес другого пользователя) в сетях Internet или STN по электронной почте. В системе STN International пользователи имеют доступ к таким крупнейшим полнотекстовым базам данных, как CJACS (полные тексты статей из журналов по химии, публикуемых Американским химическим обществом, ABI-INFORM (статьи из журналов, издаваемых в различных областях экономики, бизнеса, управления), NLDB (более 600 бюллетеней новостей в различных областях промышленности, бизнеса и сферы услуг), USPATFULL (полные тексты патентов, выданных в США), INVESTEXT (аналитические обзоры по зарубежным рынкам продукции, включая финансовые отчеты о деятельности фирм, подготавливаемые ведущими аналитиками из более чем 280 инвестиционных фирм по всему миру).

3. Справочные БД.

Имеющиеся в системе STN справочные базы данных разнообразны по своему содержанию и могут включать:

4. Числовые БД.

Все числовые базы данных, доступные в системе STN, делятся на две основные группы:

Имеется специальный справочный файл NUMERIGUIDE, с помощью которого пользователь может оперативно определить, в какой из числовых баз данных содержатся интересующие его физико-химические и механические свойства. В системе STN пользователь имеет возможность проводить поиски самых разнообразных веществ и материалов, в том числе с указанием требуемых значений (или в заданном диапазоне значений) их параметров и характеристик.

5. БД по химическим структурам
и реакциям веществ

Базы данных этого типа (REGISTRY, BEILSTEIN, CASREACT и др.), наряду с идентификационной и справочной информацией о веществах, содержат также их химические структуры. Пользователь имеет возможность провести поиск интересующих его соединений, продуктов реакций, свойств вещества по точной химической структуре вещества или ее фрагменту.

Основные преимущества использования
баз данных STN International

Поиск в базах данных STN осуществляется с помощью информационно-поисковой системы Messenger. Наряду с традиционными средствами поиска, характерными для онлайновых систем, такими как использование операторов булевой логики, операторов контекстной близости поисковых терминов, арифметических операторов сравнения, эта система имеет следующие важные преимущества и особенности:

а) возможность мультифайлового поиска, при котором пользователь проводит поиск одновременно в нескольких базах данных с последующей идентификацией и удалением дублированных документов;

б) наличие специальной функции INDEX, с помощью которой пользователь может выбрать базы данных, максимально соответствующие его запросу. Используя эту функцию, можно тестировать поисковую стратегию до реального включения в базу данных;

в) возможность статистической обработки результатов поисков. Функция SmartSelect позволяет анализировать содержание заданных полей (год публикации, язык, страна, вид документов, название фирмы и т.п.) и получать распределения документов по различным параметрам. В результате можно формировать перечни источников публикаций, выявлять и получать ранжированные перечни организаций. Эта функция полезна для решения многих прикладных информационных задач, включая исследование изобретательской активности фирм в различных областях техники, анализ деятельности конкурентов и др.;

г) возможность кросс-файлового поиска, который позволяет использовать результаты поиска в одной базе данных в качестве поисковых терминов или поискового запроса к другой базе данных. Например, регистрационные номера химических веществ, найденные в БД REGISTRY, могут быть многократно использованы в течение онлайнового сеанса для поиска информации об этих веществах в других библиографических и числовых базах данных;

д) возможность отправки результатов поиска по электронной почте STN или сети Internet. При этом информацию можно переслать во время работы в STN как на собственный адрес пользователя, так и на адрес любого другого пользователя STN или Internet.

Для пользователей STN International разработаны специальные программные средства STN Express и STN Personal File System (PFS), позволяющие существенно повысить эффективность их работы с базами данных STN.

Программное обеспечение STN Express предоставляет возможность:

Информационно-поисковая система для персональных компьютеров STN PFS является фактически комплексом программных продуктов, необходимых информационному и библиотечному работнику. PFS позволяет в считанные минуты сформировать локальную базу на основе документов, найденных в результате поиска в режиме онлайн в базах данных STN. Для описания структуры базы данных можно использовать готовые шаблоны, поставляемые вместе с пакетом. Для поиска в локальной базе данных, созданной в системе PFS, используется язык команда, аналогичный языку STN Messenger. Система PFS ориентирована на лиц, не имеющих компьютерного образования, она проста в установке и использовании.

Доступ к базам данных STN International
из Учебного центра в МЦНТИ

Онлайновый доступ к системе STN International из Учебного центра МЦНТИ осуществляется через сетевой адрес Internet (stn.fiz-karlsruhe.de) с использованием телекоммуникационных услуг, предоставляемых узлом связи Научно-исследовательского института ядерной физики (НИИЯФ). Связь между МЦНТИ и НИИЯФ осуществляется по выделенной телефонной линии сети ИСКРА-2 с использованием высокоскоростных модемов ZyXEL U-1496E+.

Регулярно в течение каждого месяца Учебный центр STN проводит от двух до четырех семинаров для всех, кого интересует возможность получать информацию из баз данных STN. Проводятся как бесплатные ознакомительные семинары, так и платные учебные курсы для начинающих пользователей и пользователей, имеющих опыт работы с системой.

В настоящее время МЦНТИ предоставляет возможность провести поиск в любой из баз STN на чрезвычайно льготных условиях. При выполнении запросов потребителям предоставляется скидка в размере 75-90% от стоимости услуг по прейскуранту цен сети STN. В зависимости от базы данных, в которой производится поиск, стоимость одного часа работы в системе колеблется от 45 до 300 тыс. рублей. Время проведения одного поиска составляет в среднем 10-15 минут. Результаты поисков передаются заказчику на бумаге или дискетах. Возможна отправка информации по электронной почте Internet и Relcom.

В 1994 году услугами учебного центра STN воспользовались 50 организаций и предприятий, для которых было выполнено 250 поисков. Суммарное время работы с базами данных в режиме онлайн составило около 100 часов. В 1995 году, судя по первым месяцам работы, объем использования системы STN может утроиться.

Для тех, кто пожелал более подробно ознакомиться с возможностями системы STN International в 1994 году было проведено 25 учебных курсов и семинаров. В работе семинаров приняли участие 192 специалистов из 100 организаций.

Пользователи STN могут заказать копию полного текста любого документа, найденного в базах данных. Более 25 информационных служб, центров и библиотек мира сотрудничают с системой STN и обеспечивают ее пользователей копиями первоисточников. Одна из таких служб, Центральная научно-техническая библиотека университета Ганновера (ФРГ), в рамках совместного проекта с ГПНТБ и МЦНТИ специально для пользователей STN в России предоставит бесплатно до 500 копий документов из своих фондов.

Учебный центр STN в МЦНТИ оказывает содействие институтам и организациям в заключении договоров с системой STN International на получение онлайнового доступа к этой системе и обеспечивает в дальнейшем консультационно-методическую поддержку пользователей этих организаций.

!8!

В.В. Васильчиков, Т. Н. Харыбина, Н.А. Харыбина, И.Ю. Черкасова

(ЦБП, Пущино)

ОПЫТ АВТОМАТИЗАЦИИ
ИНФОРМАЦИОННО-БИБЛИОТЕЧНОГО
ОБСЛУЖИВАНИЯ В ПУЩИНСКОМ
НАУЧНОМ ЦЕНТРЕ РАН

Центральная библиотека Пущинского научного центра РАН (ЦБП) является отделом БЕН РАН и входит в ее централизованную библиотечную систему (ЦБС), возглавляя, в свою очередь, локальную ЦБС, состоящую из библиотек институтов ПНЦ. Эта структура выделяет ЦБП из ряда библиотек, входящих в ЦБС БЕН. ЦБП является центром, обеспечивающим информационную поддержку всех научных исследований, проводимых в ПНЦ. ЦБП, одной из первых в ЦБС БЕН (в 1979 году) приступила к регулярному информационному обслуживанию ученых с использованием вычислительной техники. Опыт работы, накопленный за это время, позволяет сделать однозначный вывод о том, что информационно-библиотечное обеспечение ученых, включающее информирование об имеющихся в мире публикациях по тематике исследований и оперативное предоставление первоисточников по запросам невозможно без использования современных информационных технологий и коммуникационных средств. При этом необходимо подчеркнуть, что в настоящее время наибольший интерес у наших пользователей вызывают зарубежные базы данных. В области естественных наук в мире создано огромное количество баз данных. Мы остановимся непосредственно на тех, которые есть у нас и которые мы используем в нашей работе.

Особой популярностью у наших пользователей пользуется база данных Science Citation Index на CD-ROM, которая дает исчерпывающую информацию о мировой научной литературе в области естественных наук. По своим поисковым возможностям она является уникальной - кроме традиционного поиска (по авторам, ключевым словам, адресам научных учреждений) позволяет также вести поиск по ссылкам на определенные работы и определенных авторов в пристатейной библиографии. Уникальной ценностью этой базы является также возможность поиска работ по совместному цитированию одних и тех же источников. Эта база позволяет проводить анализ развития ПНЦ и оценивать значение научных работ наших ученых в мировой информационной системе.

Не менее популярна и база данных "Current Contents". Серию "Life Sceinces" с 1993г. мы получали на дискетах, а с 1995 г. в рамках проекта Российско-Американского консорциума и сотрудничества с Тенесским университетом США, был подписан контракт с ISI США о предоставлении нам доступа ко всем 7 сериям "Current Contents Search" в режиме on-line. Таким образом, мы имеем постоянный доступ к базам данных:

Информация из "Current Contents" значительно опережает появление первоисточников на выставке новых поступлений и служит надежным подспорьем в научно-исследовательской работе.

Большой интерес представляет для пользователей нашей библиотеки база данных на CD-ROM по биомедицине "Medline" (созданная Национальной медицинской библиотекой США), содержащая информацию с 1966 г. по текущий год, которую мы получаем благодаря поддержки фонда Сороса. Она имеет очень хорошее наполнение и прекрасные поисковые возможности. Программное обеспечение позволяет по 2-3 ключевым словам быстро провести поиск по нужной проблеме и получить информацию в виде библиографического описания с кратким рефератом. "Medline" позволяет обеспечивать пользователей информацией по следующим направлениям: молекулярная биология, медицинская биохимия, биофизика и т.д. В базу данных включены статьи из многих известных зарубежных и отечественных журналов.

Кроме рассмотренных выше баз данных, библиотека имеет еще Pest Bank, Chem-Bank, WasteInfo, а также энциклопедии и справочники на CD-ROM, среди них: Britanica, Science Technology, Molecular Biology и другие, которые приобретены для ЦБП в рамках проекта Российско-Американского консорциума.

Анализ статистических данных за 1995-1996 годы показал существенное увеличение количества запросов, выполняемых на основе использования баз данных на компакт-дисках. Если в 1995 г. было выполнено 760 запросов, то в 1996 г. их количество составило 1228.

Библиотека уделяет большое внимание обеспечению ученых патентной информацией. В настоящее время фонд описаний изобретений составляет более 320 тыс. экз. С 1976 года по заявкам патентных служб ведется информирование по постоянно действующим запросам. Источником информирования является официальный бюллетень "Изобретения" (РФ), журнал "Изобретения за рубежом", американские, канадские и японские патентные базы данных, которые мы широко используем через Internet.

Наша библиотека является активным пользователем Internet. Сегодня уже ни у кого не возникает вопрос, нужен ли Internet в библиотеке. Internet открыл новые возможности огромного информационного простора, о котором раньше можно было только мечтать. Ученые, студенты получили неограниченные возможности доступа к удаленным информационным ресурсам: библиотечным каталогам, базам данных, информационным системам и сетям. В настоящее время в библиотеке 4 рабочих места подключенных к Internet.

Библиотека приступила к созданию своей "Home page". Web-страница, которая представляет нас в Internet - это не только рекламный листок или визитная карточка нашей библиотеки в сети, "Home page" дает уникальную возможность для библиотеки предоставлять свои информационные материалы многомиллионной аудитории пользователей компьютерных сетей. Основной задачей "Home page" является оперативное, качественное и полезное информационное обеспечение потребителей разноплановой информацией. Первоначально мы начали с краткой информации о библиотеке и ее филиалах, а в настоящее время ведется активная работа по наиболее полному предоставлению наших информационных ресурсов в Internet. Наша страница имеет следующие разделы:

Мы с радостью ждем Вас, посетите нашу страницу по адресам:

http://sun.ipr.serpukhov.su/~vvv/, http://sun.protres.ru/~vvv/

Наряду с развитием информационного обслуживания пользователей Библиотека уделяет огромное внимание автоматизации библиотечной технологии. Всю свою работу в этом направлении наша библиотека основывает на разработках ОСИАТ БЕН РАН. ЦБП, одной из первых библиотек ЦБС БЕН, приступила к автоматизации библиотечных процессов. Но в течение 2-х последних лет работа в этой области особенно активизировалась и сконцентрировалась в трех направлениях:

Комплекс технических средств автоматизированной библиотечной системы (АБС) ЦБП включает сервер 5х86-Р5-133 с памятью 12 Мбайт с 3-мя CD-ROM, 1 РС: АМ 486DX4-100 с 2 CD-ROM, 3 РС AmD5x86-P75-133, 2 РС 80286, все компьютеры включены в локальную сеть, 4 из них с выходом в Internet, принтер HP LaserJet 6L, 1 матричный принтер.

Создание и поддержка электронного каталога периодических изданий осуществляется на базе системы "Дискат", разработанной в БЕН РАН [1], обеспечивающей:

На сегодняшний день электронный каталог периодических изданий содержит информацию за 5 последних лет. В настоящее время мы вводим в электронный каталог сведения за более ранние годы, т.е. полностью переводим карточный каталог журналов в электронную форму.

С 1996 г. Библиотека приступила к созданию электронного каталога книг по программам комплекса "SOLAR", разработанным в БЕН РАН [2]. Основой создания электронного каталога ЦБП служит технологическая база БЕН, содержащая результаты централизованной обработки литературы. Эта база данных 2 раза в месяц в полном объеме по электронной почте пересылается на сервер ЦБП и представляет для нас некий аналог OCLC; из нее формируется технологическая база ЦБП. Затем осуществляется шифровка, инвентаризация литературы и формируется сводный электронный каталог ЦБП. Электронный каталог обеспечивает для пользователей быстрый поиск информации по различным элементам библиографического описания и значительно улучшает сервис. В настоящее время электронный каталог содержит информацию о книгах за 3 последних года.

Оба электронных каталога установлены на сервер ЦБП и еженедельно дублируются на сервер Института белка и Института биофизики клетки и доступны с любого компьютера локальной сети ЦБП. К нему имеют доступ филиалы библиотеки в НИИ ПНЦ и читатели, если их компьютер подключен к городской компьютерной сети. В дальнейшем мы планируем обеспечить доступ к обоим каталогам через INTERNET

Кроме того, на сервере ЦБП установлены сводные электронные каталоги БЕН РАН, содержащие сведения о фондах ЦБС БЕН; эти каталоги ежемесячно обновляются, путем передачи информации по E-mail.

Программная система обслуживания читателей ("СОЧИ"), разработанная в БЕН РАН [3], внедрена в 3- филиалах ЦБП. "СОЧИ" обеспечивает ввод и обработку сведений о читателях, их заказах на литературу по МБА и на абонементе. Система предусматривает постановку читателя на очередь, предоставляет статистические сведения по составу читателей, книговыдаче, срокам обработки заказов, информацию о задолжниках и невыполненных заказах по МБА. Использование системы исключает необходимость заполнения бланков заказов вручную, теперь они могут быть распечатаны на принтере или выведены в специальный файл и отправлены по электронной почте в БЕН РАН.

Пущинский научный центр - ведущее звено в системе биологической науки страны и за рубежом. В Пущино регулярно проводятся международные совещания, симпозиумы. В связи с этим в ЦБП и во всех филиалах ведутся картотеки трудов сотрудников. В настоящее время ведется работа по переводу их в автоматизированный режим на базе системы "Наука России", разработанной в БЕН РАН [4]. Это даст возможность проводить поиск работ по фамилиям авторов, наименованиям институтов и ключевым словам.

Перспективы развития информационно-библиотечного обеспечения ученых Центра связаны с дальнейшим совершенствованием и внедрением современных технологий. Мы считаем, что ЦБП должна являться органической частью мировой информационной системы, обеспечивать свободный доступ к собственной информации, а также предоставлять своим пользователям возможность получения информации из любого источника без временных, географических и иных ограничений.

Для этого необходимо:

Следующий этап в области развития современных технологий в ЦБП связан с автоматизацией работы отдела обслуживания. Для этого предполагается создать полный электронный каталог и базу данных читателей с выдачей им ламинированных читательских билетов с нанесенным на них штриховым кодом; снабдить весь фонд идентификаторами в виде штрих-кодов;

В последнее время значительно возрастает интерес зарубежных специалистов к научным публикациям российских ученых. В то же время появившиеся возможности тесного сотрудничества с зарубежными учеными и коллегами ставят задачу донесения до них информации о российских публикациях. Проведенный анализ показывает, что зарубежные базы данных (Current Contents, SCI) очень незначительно отражают русскоязычную литературу. Поэтому мы планируем создание на основе имеющихся в ЦБП материалов баз данных, информирующих иностранных пользователей о публикациях российских ученых. В качестве примера таких БД могут быть выбраны научные направления, наиболее развитые в ПНЦ, а именно: биотехнология, экология, биофизика и т.п.

В заключение хотелось бы отметить, что созданные в БЕН автоматизированные библиотечные системы отвечают нашим требованиям как библиотечных специалистов. Однако автоматизированные системы, реально эксплуатируемые в библиотеках, требуют непрерывного развития и совершенствования, исходя из требований практики. Не следует осуществлять автоматизацию лишь только для автоматизации, ее результатом в этом случае будут только экспонаты и образцы. Наша библиотека, работает в тесном контакте с разработчиками программного обеспечения - сотрудниками ОСИАТ БЕН, являясь своего рода "полигоном" для отработки на практике тех или иных программных решений для библиотек ЦБС. Это - сложный процесс с каждодневными "за" и "против", с нахождением оптимального решения поставленной задачи. Поэтому наша работа по автоматизации библиотечных технологий с ОСИАТ БЕН находится в постоянном развитии. Но одно можно сказать твёрдо - коллектив нашей библиотеки уверенно вошел в этот процесс и принимает в нем активное участие, ставя перед собой все новые задачи.

ЛИТЕРАТУРА

1. Каллистратова О.Д. Электронный каталог распределенного фонда периодических изданий в ЦБС // Применение ЭВМ в информационно-библиотечной технологии. - М., 1995. - С. 52-57.

2. Васильев А.В. Автоматизированный комплекс "Solar" // Применение ЭВМ в информационно-библиотечной технологии. - М., 1995. - С. 35-38.

3. Власова С.А. Развитие системы обслуживания читателей "СОЧИ" // Применение ЭВМ в информационно-библиотечной технологии. - М., 1995. - С. 72-74.

4. Глушановский А.В., Ефремов И.А., Калёнов Н.Е. Интегрированная база данных "Наука России" // Межотраслевая информационная служба: научно-методический сборник. - 1994. - N2. - С. 10-13.

!9!

Ulle Must

(Tartu University Library)

ELECTRONIC INFORMATION SERVICES
IN TARTU UNIVERSITY LIBRARY

Briefly about Tartu University

The Tartu University has 10 faculties with about 70 departments, institutes and clinics, a library of 3,500,000 volumes, several branch libraries and department libraries, a computer centre and botanical gardens. The University employs nearly 3,000 people, including 850 of academic staff. There are 8150 students, incl. 3 per cent international students. The university campus is located in different parts of the town, but all the departments are connected to Internet and the backbone of the university computer and communication network is a optical fibre net.

Electronic information services
in Tartu University Library

The history of electronic information service in TUL goes back to 1992. At present the Tartu University Library information department gives access to 100 computerised information databases (Current Contents, Medline, Proquest General Abstracts, Inspec, Chemical Abstracts etc.). It carries out information searches in fee-based online information sources (STN, USA-Stat, Lexis Nexis, EUROBASES, ECHO). The working area with 10 multimedia workstations and two PC 486 are available for the users 12 hours a day.Having the richest collection of scientific information resources in Estonia, the department has provided electronic reference service to many academic institutions and libraries all over Estonia.

Further objectives

The main task of the modern library is to give access to its resources to the largest number of people possible. This includes the availability of information to remote access. The only open access library catalogue in Estonia up till now is INGRID - Tartu University Library electronic catalogue which reflects the acquisitions since 1994. In September 1995 the Consortium of Estonian Libraries Network (ELNET Consortium) was formed. The aim of the organisation is to acquire a common integrated library system for all the member libraries (seven research libraries) and to make the bibliographic databases and union catalogue of Estonian libraries accessible via Internet. The group of experts choose INNOPAC. The work is in the stage of tests. The next step in improving the quality of information services in university level should be the networking of most heavily used CD-ROM and local databases. As the departments and institutes are all connected to university computer network and the access to various sources of information in electronic environment right from the scholars' workstations has become natural, the faculty and staff have continuously expressed their preference to use the scientific information databases at their workstations. The networking of CD-ROM would be very beneficial for the daily work of the library as well. The access to several bibliographic databases that are now available only on standalone workstations in the public area of the information department is in fact indispensable to the librarians working in the areas of acquisitions, bibliographic references, interlibrary loan or information retrieval.

!10

М.А. Аветисов

(ЦНСХБ, Москва)

ИСПОЛЬЗОВАНИЕ ИПС АРТЕФАКТ
ДЛЯ ПРЕДОСТАВЛЕНИЯ ИНФОРМАЦИОННЫХ
РЕСУРСОВ ЦНСХБ В INTERNET

Уже значительное время идет процесс включения российских библиотек в Internet. При этом основная масса библиотек создает свои WEB-узлы, на которых размещается информация о библиотеке и ее фондах. Дизайн страниц, которые мы видим при обращении к библиотечному узлу, варьируется от достаточно простого, представленного обычными текстами с минимальной графикой до "крутых" страниц с большим количеством графики, движущимися строками и т.п. Это - закономерный процесс, отражающий возрастание профессионального уровня специалистов в библиотеках, отвечающих за предоставление информации в Internet. Но для специалистов, которые обращаются в библиотеку для того, чтобы получить информацию о библиотечных фондах, найти литературу по интересующей их теме, это как раз и не самое главное. А главное для них, если говорить об обеспечении научных исследований - возможность найти через Internet информацию по проводимой научной работе.

Для этого должен быть обеспечен доступ к электронному каталогу. Если библиотека осуществляет аналитическую роспись источников, то и к соответствующей базе данных. А если взять в качестве примера для подражания лучшие решения не Западном рынке информационного обеспечения ученых, то и к базам данных, содержащим полные тексты документов.

И вот здесь уже гораздо меньшее число библиотек могут показать свои достижения. Связано это и с отсутствием достаточно представительных баз данных, и с невозможностью приобрести или разработать (и то и другое дорого) соответствующую систему доступа к этим данным.

ЦНСХБ уже в течение 15 лет совместно с Всероссийским научно-исследовательским институтом информации и технико-экономических исследований в агропромышленном комплексе осуществляет подготовку базы данных по сельскому хозяйству. Естественно, возник вопрос предоставления этих информационных ресурсов в Internet.

Предпринятый в начале 1997 года поиск необходимых программных средств привел нас к тому, что для библиотек с их жалким финансированием нет доступных ИПС для установки их на своих WEB-серверах. Разработки в рамках программы LIBWEB, предпринимаемые в ГПНТБ России и БЕН РАН, еще только разворачивались. Зарубежными программными продуктами воспользоваться из-за их чрезвычайной дороговизны, практически, невозможно. Практически единственным программным продуктом для предоставления больших баз данных в Internet оказалась ИПС АРТЕФАКТ, разработанная специалистами информационного агентства "Интегрум-Техно", удовлетворяющая всем нашим требованиям. Переговоры с "Интегрум-Техно" завершились тем, что агентство и ЦНСХБ совместно решили осуществить проект, заключающийся в создании на базе ЦНСХБ типового узла WWW. Предполагается создать в ЦНСХБ Web-сервер сети Internet со следующими функциональными возможностями:

В настоящее время база данных объемом более 700 тысяч документов размещена, поддерживается и пополняется на Web-сервере "Интегрум-Техно" (Web-адрес: http://www.integrum.ru). База данных включает библиографические описания книг, сборников, депонированных рукописей и т.п., а также аналитическую роспись профильных журналов. Библиографические описания дополняются краткими аннотациями, рефератами (15% статей), сопровождаются терминами тезауруса, рубриками рубрикатора по сельскому хозяйству и т.п.

В конце этого года ЦНСХБ будет располагать необходимыми техническими средствами, что позволит в соответствии с проектом после доработки модели базы, интерфейса и программных средств, разместить базу на технических средствах обеих организаций. Созданный в результате реализации продукт предполагается распространять в качестве типового библиотечного on-line центра. В частности, нами совместно подана заявка в программу LIBNET.

ИПС АРТЕФАКТ обладает уникальными характеристиками, являясь практически единственной в России информационно-поисковой системой, предназначенной для обработки, в первую очередь, документов, написанных на русском языке. Поиск терминов запроса осуществляется как по всему тексту документа, так и по выделенным полям.

В настоящее время база данных ЦНСХБ представляет возможность осуществлять поиск по 30 полям, таким как "автор", "заглавие", "дата и место издания", "термины тезауруса", "код рубрики" и т.д. АРТЕФАКТ не накладывает ограничений на число выделенных полей, и ограничения диктуются только практическими соображениями.

Интерфейс пользователя прост, он, может быть, несколько нетрадиционен для библиотечных ИПС, но позволяет формировать как простые, так и очень сложные запросы. Язык запросов включает все традиционные механизмы - логические операции, соседство терминов, поиск по подполям, по контексту, включая левые и правые усечения, а также особые виды поиска - по сходству (поиск с опечатками), по парадигме (однокоренных слов), с учетом склонений и спряжений слов в русском языке. Имеется развитый Help - примеры запросов, инструкция к поиску, таблица транслитерации, таблицы полей базы и т.п.

Практика почти полугодовой работы с базой данных под ИПС АРТЕФАКТ показала, что для использования ИПС в библиотечной практике необходимы незначительные доработки, в основном связанные с поиском по фамилиям. Кроме того, у ЦНСХБ имеется естественное желание иметь возможность отмечать документы для последующей организации заказа по Internet, но это уже следующие этапы совместной работы.

!11

 

Е. Сергеева

(ГПНТБ России, Москва)

ВОЗМОЖНОСТИ ГПНТБ
ПО ИНФОРМАЦИОННОМУ ОБЕСПЕЧЕНИЮ
НАУКИ КАК ЦЕНТРА ON-LINE
И CD-ROM ОБСЛУЖИВАНИЯ

В настоящее время Государственная публичная научно-техническая библиотека России является крупнейшим комплексным библиотечно-информационным и научно-исследовательским учреждением, включающим информационно-вычислительный центр и репрографическое предприятие, а также ведущей организацией по развитию общероссийских автоматизированных систем библиографического информирования и созданию автоматизированной библиотечной телекоммуникационной сети.

Все большее значение в последние годы приобретает использование, наряду с традиционными видами носителей информации, баз данных на компактных оптических дисках и дискетах, успешно развиваются телекоммуникационные и сетевые технологии, совершенствуется используемый справочный аппарат библиотеки. Сводный каталог России и стран СНГ содержит информацию о фондах отечественной и иностранной литературы по науке, технике, сельскому хозяйству и медицине более чем 1000 библиотек.

Совместно с крупнейшими библиотеками страны ГПНТБ России готовит общероссийские сводные печатные каталоги по наиболее спрашиваемым видам литературы - зарубежным книгам и периодическим изданиям в области естественных наук, техники, сельского хозяйства и медицины.

Научными подразделениями ГПНТБ России разрабатываются и совершенствуются следующие направления информационно-библиотечных технологий:

В соответствии с Государственной научно-технической программой "Федеральный информационный фонд по науке и технике" ГПНТБ осуществляет разработку 6 основных проектов.

ГПНТБ также осуществляет комплекс научных и прикладных исследований и разработок, направленный на создание единого информационного пространства. Это такие перспективные проекты, как Создание российского центра доставки документов Международной сети STN, создание технологии функционирования на базе ГПНТБ России Федерального центра по обеспечению документами в области НТЛ с целью реализации Международной Программы всеобщей доступности публикаций, ведение оперативной сводной базы данных в области перспективных направлений компьютерных наук и технологий, разработка и внедрение в эксплуатацию сетевой технологии автоматизированной системы словарного и лингвистического обеспечения АИС ГПНТБ России (АССО/ЛС).

Основные результаты научных исследований публикуются в сборнике научных трудов ГПНТБ России "Современные издательские технологии в библиотечно-информационной деятельности".

На основе созданного электронного сводного регионального каталога ГПНТБ России совместно с Научно-техническим центром "Нанотроника" издает ежемесячный реферативный журнал "Компьютерный вестник", который распространяется в печатной форме и на дискетах на коммерческой основе (по подписке). В "КомВест" входит до 2500 записей в год. Ценным дополнением к изданию является возможность получения копий первоисточников всех материалов сборника.

Интегрированная
библиотечно-информационная
система ИБИС

В настоящее время в ГПНТБ начала функционировать интегрированная библиотечно-информационная система ИБИС, предназначенная для автоматизации традиционных библиотечно-информационных технологий в библиотеках и ориентированная на работу в локальной сети (ЛВС). ИБИС представляет собой совокупность взаимосвязанных автоматизированных рабочих мест (АРМ) 4-х типов: АРМ "Каталогизатор", АРМ "Читатель", АРМ "Книговыдача", АРМ "Администратор".

Автоматизированная система
доступа к информационным ресурсам
ГПНТБ России

Характеризуя сложившийся в ГПНТБ России многоуровневый комплекс взаимосвязанных автоматизированных систем, необходимо отметить, что он явился результатом исследований и разработок ГПНТБ в области автоматизации библиотечно-информационных процессов с целью создания высокоэффективной библиотечной технологии, основанной на использовании современных средств вычислительной техники. Эта система включает общероссийский автоматизированный банк данных, электронный каталог, специализированные базы данных и базы данных на CD-ROM.

Совместно с крупнейшими библиотеками и НИИ ГПНТБ России приступила к работам по проекту "Формирование Автоматизированного банка данных научно-технической литературы распределенного фонда сети НТБ России", который предусматривает продолжение работ по развитию интернационального информационного ресурса в виде Сводного каталога с учетом изменения инфраструктуры российских библиотек, а также для сохранения информационных связей с бывшими республиками СССР.

Постоянно совершенствуется система Российских сводных каталогов и автоматизированная технология электронного каталога ГПНТБ России, а также телекоммуникационные технологии доступа к БД ГПНТБ России и межбиблиотечный обмен информацией, специализированные базы данных и технологии, а также комплекс проблемно-ориентированных и специализированных баз данных (в том числе на компактных оптических дисках) для обслуживания в локальном и удаленном доступе. В настоящее время ГПНТБ закуплено оборудование и готовится к выходу издание электронного каталога на CD-ROM.

Система теледоступа к информационным
ресурсам ГПНТБ России

ГПНТБ России ведет работы по организации телекоммуникационного доступа к своим информационным ресурсам с 1984 г. С 1992 г. ведутся работы по созданию системы телекоммуникационного доступа к ресурсам, размещенным в среде ЛВС.

В качестве первого этапа была избрана схема однопользовательского теледоступа в режиме удаленного управления. Затем были последовательно реализованы схемы с отдельно стоящим хостом теледоступа и с хостом на базе рабочей станции ЛВС. Для удобства использования основного пакета прикладных программ CDS/ISIS/M был разработан специальный дружественный интерфейс пользователя, позволивший предоставить приемлемый уровень сервиса.

С января 1994 г. функционирует система телекоммуникационного доступа (СTД-2), являющаяся новым поколением систем удаленного доступа к ресурсам библиотеки в среде ЛВС Novell Netware c использованием коммутируемых каналов телефонной сети общего пользования. Кроме электронных каталогов, пользователям ГПНТБ предоставляется возможность доступа к 20 проблемно-ориентированным базам данных, электронные издания и электронные справочники, режимы обмена файлами и электронной почты.

В настоящее время принято решение вести дальнейшее развитие системы в направлении многопользовательского режима с использованием надежных и скоростных сетей передачи данных, работающих по протоколам X.25 и TCP/IP. В ЛВС в настоящее время объединены 70 PC.

Проблемно-ориентированные
базы данных и базы данных на СD-ROM

В национальном докладе "Автоматизированные и информационные ресурсы России. Состояние и тенденции развития" ГПНТБ России названа в числе других крупнейших генераторов баз данных.

Среди 30 ПОБД, генерируемых в ГПНТБ России, наибольшим спросом пользуются БД "Искусственный интеллект", "Вычислительные сети", "Базы и банки данных", "Экология". Особый интерес представляет база данных "grey literature".

При создании проблемно-ориентированных баз данных основными этапами технологии являются экспертный анализ отечественной и зарубежной литературы по данной тематике, ввод и редактирование библиографических описаний с рефератами и ключевыми словами, а также индексирование на основе имеющихся и специально разрабатываемых классификационных схем.

Большим спросом пользуются библиографические, реферативные, а также полнотекстовые базы данных на оптических дисках. В библиотеке создан CD-ROM центр, включающий дисплейный и компьютерный залы, целью которого является обслуживание информационными продуктами на оптических дисках, а также информирование пользователей о существующих базах данных и их производителях.

Значительный интерес к данным продуктам обусловлен не только удобством работы, большими объемами доступной информации и высокой скоростью ее получения. Одной из существенных причин является нехватка литературы в библиотеках России и трудность получения информации по конкретному вопросу.

Для удобства обслуживания пользователей в настоящее время разрабатывается система автоматизированного обслуживания пользователей дисками CD-ROM. Эта система содержит информацию о дисках, имеющихся в библиотеке: наименование диска, название организации - поставщика информации, тип базы данных, количество выпускаемых дисков, периодичность поставки, количество записей и частота обновления, краткое содержание на русском языке. Система обеспечивает представление информации в удобной форме в рамках простой информационно-поисковой системы. Существенно упрощается процесс обслуживания пользователей, т.к. автоматически загружается соответствующая поисковая система для выбранного CD-ROM диска.

Более 20 БД на дисках CD-ROM имеется в ГПНТБ в полном объеме. Они пользуются большим спросом у читателей. Это такие БД, как PolTox (загрязнение и охрана окружающей среды), AQUALINE, ASFA (Aquatic sciences and Fisheries Abstracts), Waterlit (гидрология, использование водных ресурсов и рыболовства), Life Sciences Collection (различные аспекты медико-биологических исследований), Medline (медицина), Drug Information Source (сведения о лекарствах) и многие другие.

В настоящее время ГПНТБ при активном сотрудничестве с OCLC предоставляет пользователям право доступа в режиме on-line к базам данных OCLC.

!12

Е.Е. Лебедева, Н.В. Маркина, В.Б. Иванов

(ГНЦ РФ НИИАР, Димитровград)

СОСТОЯНИЕ ИНФОРМАЦИОННОГО
ОБЕСПЕЧЕНИЯ НАУЧНЫХ ИССЛЕДОВАНИЙ
В ОБЛАСТИ ЭКСПЕРИМЕНТАЛЬНОЙ БАЗЫ
РЕАКТОРНОГО МАТЕРИАЛОВЕДЕНИЯ

С целью информационного обеспечения научных исследований в ГНЦ РФ НИИАР разработан комплекс информационных систем (ИС) по экспериментальной базе реакторного материаловедения, ориентированный на предоставление информации различным категориям пользователей в области атомной науки и техники.

ИС разрабатывались с использованием современных программных средств и с учетом следующих общих требований к составу информации и возможностям:

Для обоснования структуры данных информационных систем рассмотрены основные категории пользователей разработанного комплекса с учетом их потребностей в информации, а именно: конструкторов, материаловедов, специалистов по реакторным испытаниям и технологии, физике и безопасности реакторов, работников аппарата управления.

Основные элементы экспериментальной базы, информация о которых должна быть представлена исследователю в виде независимых ИС, были определены на основе анализа процедуры получения данных о свойствах материалов в реакторном и послереакторном экспериментах. В комплекс включены: ИС РЭМ "Исследовательские реакторы России", ИС АЗК "Защитные камеры", ИС МЕРИ "Каталог методов реакторных испытаний".

ИС РЭМ "Исследовательские реакторы России. Фактографические данные и экспериментальные возможности" предназначена для сбора, хранения и выдачи потребителю информации по экспериментальным возможностям исследовательских реакторов в зависимости от задачи планируемых исследований.

В настоящее время ИС РЭМ содержит информацию о 20 реакторах, базирующихся в 13 институтах страны, и позволяет получить информацию о каждой из реакторных установок, начиная от общего описания вплоть до конкретных данных по нейтронно-физическим характеристикам экспериментальных каналов.

ИС "Атлас защитных камер" предназначена для получения информации об экспериментальных возможностях материаловедческих комплексов России и осуществления целевого выбора защитной камеры (ЗК) для проведения послереакторных испытаний материалов и изделий ядерной техники.

В настоящее время ИС АЗК содержит информацию по 106 защитным камерам, базирующимся в 5 основных исследовательских центрах страны, и позволяет получить информацию по технологическим параметрам (транспортные возможности всего комплекса и отдельных защитных камер, геометрические размеры камеры, допустимая активность, системы удаления отходов) и размещенному в ЗК исследовательскому и технологическому оборудованию.

ИС МЕРИ "Каталог методов реакторных испытаний материалов и изделий ядерной техники" позволяет оперативно получать информацию о методах исследования свойств материалов; характеристиках и показателях точности отдельных методов исследования; разработчиках отдельных установок и устройств и т.д.

В настоящее время ИС МЕРИ содержит информацию о 556 разработанных методиках реакторных испытаний из 40 организаций бывшего СССР, номенклатура изучаемых свойств - 269, номенклатура материалов - 129. Содержащаяся в ИС информация достаточна для оценки уровня методического обеспечения реакторного материаловедения.

Информационная часть банков данных дополнена экспертной системой автоматизированного выбора места и метода проведения исследований на основе разработанных критериев. Цель создания экспертной системы - предоставление исследователю вариантов планирования экспериментов, обеспечивающих высокую эффективность работ и экономически целесообразные решения.

Экспертная система МАТРЭКС содержит знания из всех вышеперечисленных ИС и служит интеллектуальным интерфейсом между пользователями и системой в целом.

В базе знаний ЭС МАТРЭКС использованы опыт и знания ведущих специалистов отрасли в области разработки и эксплуатации действующих реакторных установок и реакторного материаловедения. Она включает в себя информацию о составляющих реактор конструктивных элементах, условиях, в которых эти элементы будут эксплуатироваться, и тех свойствах материалов, которые необходимо изучить прежде, чем рекомендовать эти материалы в качестве базовых для новой конструкции.

С другой стороны, в базе знаний на основе массивов информации, содержащихся в ИС РЭМ, АЗК и МЕРИ, формируются знания по существующей экспериментальной базе реакторного материаловедения.

Экспертная система планирует программу исследований путем сравнения требуемых параметров и существующих разработок. При этом ЭС использует заложенные в нее правила, отражающие рекомендуемый или обязательный порядок проведения испытаний.

Будучи связанными единым требованием - созданием возможности оценки состояния экспериментальной базы, каждая из этих ИС предназначена для систематизации, накопления и анализа информации по конкретным объектам, имеющим специфический набор сопровождающих параметров, характеристик и атрибутов. Поэтому при создании каждой ИС проводилось независимое исследование предметной области, построение инфологической модели данных, даталогическое проектирование и разработка соответствующих программных средств.

Все разработанные информационные системы адаптированы к потребностям пользователей, установлены в нескольких организациях и постоянно используются для получения информации.

К перспективам развития комплекса ИС можно отнести следующее:

!13

В.Г. Веселаго

(МФТИ, Москва)

БИБЛИОГРАФИЧЕСКИЕ РЕСУРСЫ INTERNET.
СЛУЖБА ИНФОМАГ

Данная работа поддерживается РФФИ,
Министерством науки и технологий и РОСНИИРОС.

В докладе рассматривается наполнение INTERNET библиографической, прежде всего научной, информацией. Такого рода материалы представлены в основном в четырех видах:

1. Оглавления научных журналов.

2. Аннотации и рефераты статей из журналов.

3. Полнотекстовые версии журналов.

4. Каталоги библиотек.

Источники информации первого типа всегда бесплатны и как правило поддерживаются большими издательскими домами, например SPRINGER FERLAG. Как правило такие службы доступны в интерактивном режиме через WWW сервера, и, кроме того, они распространяют оглавления журналов через электронную почту. Не сильно ошибаясь, можно утверждать, что сейчас в INTERNET доступны оглавления практически всех основных, сколько-нибудь значимых, западных научных журналов. Более того, сейчас интенсивно пошел процесс представления в INTERNET полнотекстовых электронных версий журналов. Этот сервис однако всегда платный, за исключением, быть может, отдельных демонстрационных случаев. Как правило, подписчики на бумажную версию журнала одновременно получают право на перекачку файлов электронной версии. Цена подписки только на электронную версию чуть ниже цены подписки на бумажную версию.

Что касается получения рефератов статей, то эта услуга, как правило, тоже платная, и в качестве примера можно указать на лидирующую в этой области систему STN, терминалы которой имеются и в Москве. Следует учесть, что, несмотря на существенные скидки для пользователей из России, эта услуга все еще не по карману нашим ученым.

Что касается электронных версий газет, то они часто являются "украшением" центральных WWW серверов крупных сервис-провайдеров сетевых услуг.

И наконец последний, четвертый тип услуг наиболее ярко представлен библиотекой конгресса США, которая через свой ОН-ЛАЙН каталог дает бесплатную информацию о всех книгах, хранящихся в этой библиотеке.

Все сказанное выше относится прежде всего к западным сетям. В нашей стране все перечисленные услуги либо отсутствуют, либо находятся в самом начале своего становления. В докладе приводятся имеющиеся на сегодня библиографические возможности русского INTERNET, и в частности, дается подробный анализ деятельности службы ИНФОМАГ, которая в содружестве с БЕН и ВИНИТИ бесплатно предоставляет пользователям оглавления около 200 русских и зарубежных журналов, полнотекстовые научные бюллетени, списки книг, поступивших в библиотеки и другую научную информацию. Все материалы службы можно получать как через WWW сервер http://www.ripn.net/infomag, так и через списки рассылки. На 1 июня 1997 года около 1000 пользователей получали материалы ИНФОМАГа через списки рассылки, причем общее число подписчиков было около 7000.

Подробные правила пользования службой ИНФОМАГ высылаются в ответ на команду <HELP>, посланную по адресу ims@ripn.net.

Сейчас, однако, надо четко понимать, что магистральным путем развития электронных научных публикаций является во-первых, широкое распространение электронных версий уже издающихся журналов, а во-вторых, издание сугубо электронных журналов, может быть имеющих некую вспомогательную бумажную версию.

К сожалению, в нашей стране большинство редакций научных журналов очень настороженно и нерешительно относятся к изданию электронных версий своих изданий, считая, что это может привести к снижению доходов от подписки. Это мнение, вообще говоря, совершенно неправильно, так как контингенты подписчиков на бумажную и электронную версии практически не перекрываются.

Учитывая, что многие бумажные научные журналы сейчас находятся на грани гибели, встает вопрос об издании чисто электронных научных журналов. Такого рода журналы должны иметь, прежде всего, совершенно иную, чем бумажные журналы, технологию получения, рецензирования, редактирования и публикации статей. Все эти этапы должны проводиться через электронную почту. К сожалению, пока такого рода научные журналы являются очень редким исключением. В то же время, у нас известен очень популярный ежемесячный электронный ВЕСТНИК РАН и ВЫСШЕЙ ШКОЛЫ, который уже несколько лет выпускается только в электронном виде на дискетах. Служба ИНФОМАГ также распространяет этот журнал.

Одной из проблем в этой области является очень важная, и не сводящаяся только к журналам, проблема авторских прав в INTERNET. Эта проблема сейчас крайне слабо разработана, хотя наше законодательство и признает сейчас это понятие - электронный журнал - и такие журналы (в основном ненаучные) существуют и у нас, и за рубежом. Однако до сих пор ученые не решаются публиковать в INTERNET существенно новые научные результаты. Это относится и к публикациям в журналах, и к сообщениям в телеконференциях. Так, за 4 года систематического слежения за содержанием телеконференций sci.physics и sci.physics.research мне не удалось обнаружить ни одного сообщения о полученных новых результатах. Это связано с тем, что автор такой публикации рискует потерять свой приоритет, в случае, если кто-то другой возьмет его электронную публикацию и перепечатает в бумажном журнале за своей подписью. Такая возможность вполне реальна и при публикации даже в официально зарегистрированном электронном журнале. Кроме того, для электронных публикаций существует серьезная проблема их длительного хранения. По отношению к текстам на бумажном носителе роль такого хранителя выполняют библиотеки. Различного рода носители электронной информации (магнитные диски и ленты, CD диски) гораздо менее долговечны, чем бумага, и сейчас еще не осознана необходимость создания официальных, профессиональных хранилищ информации в электронной форме. Такого рода хранилища должны (и/или могут) хранить и поддерживать в читаемом виде всю сколько-нибудь важную электронную информацию, содержащуюся в INTERNET.

!14

А.В. Глушановский, Т.С. Гусева,
И.М.
Круглова, И.Б. Пронина

(БЕН РАН, Москва)

ИСПОЛЬЗОВАНИЕ INTERNET
В ОБСЛУЖИВАНИИ

ПОЛЬЗОВАТЕЛЕЙ БЕН РАН

Использование компьютерных форм предоставления информации является одним из основных направлений в развитии обслуживания пользователей в БЕН РАН.

Мировая компьютерная сеть INTERNET открывает перед своими пользователями доступ ко многим мировым информационным ресурсам. Сюда входят библиографическая, реферативная и полнотекстовая информация из публикуемых традиционным способом источников, электронные публикации (не имеющие печатных аналогов и получающие все более широкое распространение), различные фактографические, адресные, справочные базы данных, каталоги различных библиотек и издательств и многое другое. Это создает для библиотек и их читателей дополнительные возможности, использование которых позволяет существенно повысить скорость и эффективность получения научной информации.

В связи с этим в 1996 г. перед БЕН РАН возникла задача подключения Библиотеки к сети INTERNET. При этом рассматривались два основных направления:

Второй задаче посвящена отдельная статья данного сборника, поэтому в настоящей статье рассматриваются только работы, связанные с первым из указанных направлений.

Доступ к INTERNET был предоставлен БЕН РАН с апреля 1996 г. в рамках Межведомственной программы развития телекоммуникаций, поддержанной РФФИ. Доступ осуществлялся по телефонному каналу сети "Искра" со скоростью 14400 б/сек. В качестве провайдера и технического консультанта выступил ИППИ РАН.

С конца 1996 г. в БЕН РАН начал работу компьютерный класс открытого доступа к INTERNET, имеющий 7 рабочих мест. Класс создан в результате договора с Советом по Международным Исследованиям и Научным Обменам (IREX) США, представляющим часть оборудования и технические консультации. Другая часть оборудования для класса предоставлена Институтом открытого общества (фонд Сороса). Он же обеспечивает сейчас доступ пользователей класса к INTERNET (адреса, обеспечение маршрутизации, техническая помощь). В настоящее время класс работает по выделенному телефонному каналу со скоростью 64 Кб/сек. Оплата канала связи и всего трафика также осуществляется Институтом открытого общества.

В соответствии с имеющимися соглашениями, положенными в основу при создании класса, он является общедоступным и имеет разнообразный круг пользователей - от академиков до студентов, от ученых РАН до представителей коммерческих организаций и пенсионеров, хотя (в силу специфики БЕН РАН) большую часть пользователей составляют представители академической науки.

Класс обслуживается сотрудниками БЕН РАН, организующими работу пользователей (предварительная запись, распределение рабочих мест, контроль за соблюдением правил пользования), а также оказывающими консультации по работе с программным обеспечением и основными поисковыми средствами INTERNET.

В связи с тем, что диапазон информации, предлагаемой в INTERNET, равно как и круг интересов пользователей класса, весьма широк и политематичен, перед консультантами не ставится задача оказания помощи пользователям в нахождении конкретных данных. Задача консультанта - помочь человеку воспользоваться средствами INTERNET как инструментом извлечения информации, а что будет найдено с помощью этого инструмента, остается проблемой пользователя. В то же время, в силу специфики БЕН РАН, сотрудниками класса разработан ряд пособий, указывающих стартовые точки INTERNET для поиска информации по основным направлениям естественных наук.

Опыт общения с пользователями класса, многие из которых впервые приобщаются к INTERNET, показывает, что их ожидания (сформированные обычно на основе популярных публикаций) зачастую оказываются завышенными. Многие из них полагают (в том числе, это относится и к серьезным академическим ученым), что INTERNET может стать универсальным средством получения полной и исчерпывающей информации по интересующим их вопросам. Одного-двух сеансов бывает достаточно, чтобы убедиться, что это не совсем так.

Основные причины этой ситуации, с нашей точки зрения, связанные с тем, что INTERNET является огромной и весьма разнородно организованной многоязычной системой, таковы:

Тем не менее, INTERNET является огромным хранилищем разнообразной, часто весьма ценной информации, и пользователи, понявшие и принявшие указанные выше "правила игры", получают при работе с INTERNET хорошие результаты и немало полезной информации для своей деятельности. Для них (как и для нас) является очевидным, что INTERNET, хотя и не может заменить других видов и форм информационного обслуживания, но, в сочетании с ними, является важной его частью, представляющей новые интересные возможности.

Как указывалось выше, круг информационных потребностей пользователей класса весьма широк, и поэтому достаточно трудно определить, какая информация представляет для них наибольшую ценность, однако применительно к традиционному для БЕН РАН контингенту (академическим ученым) могут быть сделаны некоторые выводы.

Как показывает наш опыт, для ученых РАН, в первую очередь, представляет интерес информация о публикациях (библиографическая, реферативная, полнотекстовая). Эта информация представлена в INTERNET в довольно заметном объеме. В настоящее время нами накоплен список из более чем двух десятков адресов, через которые пользователь может получить доступ к более чем 2000 наименований зарубежных журналов (разнородной, но в основном, научно-технической, тематики). Организациями, представляющими эту информацию являются: издательства ("Эльзивир", "Шпрингер" и т.п.), различные научные общества (Американское химическое общество, Institute of Physics (Великобритания) и т.п.), специализированные организации внутри INTERNET (типа Виртуальной библиотеки). В этот перечень входят только журналы, по которым могут быть получены свободно хотя бы оглавления. Часть журналов представляет также рефераты статей и значительно меньшая часть - полные тексты. Следует заметить, что во многих случаях организации, являющиеся подписчиками издания в традиционной форме, могут получить свободный доступ к электронной версии издания, и в дальнейшем БЕН РАН предполагает получить такой доступ, в частности, к журналам издательства "Шпрингер".

Информация о вновь выходящих выпусках журналов в INTERNET является, часто, весьма оперативной и значительно опережает поступление издания в библиотеки.

Другим видом информации, интересующей пользователей, является адресная информация (персоналии, включая авторов публикаций, организации, фирмы). INTERNET, например, имеет специализированные поисковые средства для нахождения адреса электронной почты интересующего лица, и получив библиографическую информацию, пользователь может связаться непосредственно с автором заинтересовавшей его публикации для получения оттиска.

В некоторых случаях пользователи находят (с помощью поисковых средств INTERNET или зная конкретный адрес) фактографическую информацию по тематике своей работы. В этом случае возможно получение разнообразных сведений, включая таблицы, изображения и т.п.

Весьма оперативно, хотя далеко не в полном объеме, отражаются в INTERNET сведения о международных конференциях (прошедших и предстоящих), что также часто является предметом поиска пользователей.

Представляют интерес и сведения о различных научных фондах, предоставляющих гранты, причем иногда в INTERNET можно наиболее оперативно получить полную информацию, включая все формы требуемых документов.

Наконец, весьма популярным предметом поиска и "перекачивания" для дальнейшего использования является свободно распространяемое математическое обеспечение, которое достаточно широко представлено в INTERNET.

Как для читателей, так и для библиотечных работников может также представлять интерес доступ к каталогам различных библиотек и издательствам. Этот вид доступа может использоваться, как для получения информации о вновь вышедшей или готовящейся к изданию (в издательствах) литературе, так и для библиографического уточнения неполных сведений. Эта информация (применительно к каталогам библиотек) активно используется отделом международного МБА БЕН РАН для уточнения наличия требуемой литературы в конкретной библиотеке перед ее заказом. В настоящее время в ряде случаев имеется возможность непосредственного (при работе с каталогом библиотеки) оформления заказа на первоисточник, и БЕН РАН предполагает использовать эту возможность, хотя это требует решения ряда юридических и финансовых вопросов.

Класс INTERNET в БЕН РАН пользуется заметной популярностью. За семь месяцев работы класса (январь-июль 1997 г.) его услугами пользовались около 200 человек (некоторые постоянно), отработавшие в INTERNET около 3000 часов.

Таким образом, доступ к сети INTERNET прочно занял свое место в ряду других инструментов, используемых БЕН РАН, как для непосредственного обслуживания своих читателей, так и для решения ряда библиотечных задач.

!15

Ю.И. Фенин, В.У. Гуральник

(Библиотека Администрации Президента РФ)

WEB САЙТ БИБЛИОТЕКИ АДМИНИСТРАЦИИ ПРЕЗИДЕНТА РОССИЙСКОЙ ФЕДЕРАЦИИ

1. Состав информации WEB сайта

Библиотека предоставляет в INTERNET гипертекстовый вариант бюллетеней, публикуемых после периодического отбора последних пополнений её двух баз данных с библиографическими описаниями книг и статей из периодических изданий.

Отбор статей проводится по постоянным запросам, сформулированным на основе тезауруса Библиотеки. Оглавления бюллетеней статей создаются с использованием этого тезауруса. Оглавление бюллетеня "НОВЫЕ КНИГИ" строится с использованием УДК.

Тематика бюллетеней является отправной точкой просмотра информации WEB сайта и приводится в его первой странице "ТЕМАТИКА ИМЕЮЩИХСЯ БЮЛЛЕТЕНЕЙ" по актуальному состоянию WEB сайта (см. п. 3).

2. Технология поддержки и ведения WEB сайта

2.1. Технология ведения WEB сайта

Подготовка публикации бюллетеней выполняется в локальной сети Библиотеки. Все WEB страницы (в среднем от 10 до 80) очередного выпуска бюллетеня собираются в один архивированный файл с соответствующим именем для передачи в другое подразделение Администрации Президента Российской Федерации, где имеется хост-узел INTERNET. Сотрудники этого подразделения в соответствии с согласованным регламентом добавляют новые и удаляют старые выпуски бюллетеней (при этом существенна система имен файлов WEB страниц), после чего запускают разработанную в Библиотеке программу актуализации двух страниц WEB сайта: "ТЕМАТИКА ИМЕЮЩИХСЯ БЮЛЛЕТЕНЕЙ" (см. п. 3) и "СПИСОК ПЕРИОДИЧЕСКИХ ИЗДАНИЙ".

2.2. Технология поддержки WEB сайта

Домашняя страница Библиотеки создана в подразделении, где имеется хост-узел INTERNET, с использованием информации, предоставленной Библиотекой, и по согласованию с ней.

Все страницы WEB сайта Библиотеки разработаны и модифицируются ею. Например, последнее добавление к первоначальному дизайну состоит в использовании фреймов: отдельных подокон для кнопок и подокна документов - собственно страниц бюллетеней.

3. Схема WEB сайта и его первая страница

Для ориентирования пользователей в навигации по гипертекстовой информации WEB сайта в начале его первой страницы приводится схема сайта со связями на уровне страниц.

Пример WEB страницы "ТЕМАТИКА ИМЕЮЩИХСЯ БЮЛЛЕТЕНЕЙ":

Домашняя страница
ПЕРЕЧЕНЬ ТЕМАТИК БЮЛЛЕТЕНЕЙ С НОМЕРАМИ ИХ ВЫПУСКОВ

СХЕМА WEB-САЙТА БЮЛЛЕТЕНЕЙ. BULLETINS WEB-SITE OUTLINE

ТИП WEB СТРАНИЦЫ.
WEB PAGE TYPE

ССЫЛКИ НА ДРУГИЕ WEB СТРАНИЦЫ.
LINKS TO OTHER WEB PAGES

1

Тематика имеющихся бюллетеней.
Subjects

1.1

1.2

         

1.1

Периодические издания.
Serials

1

1.2

         

1.2

Титульная страница бюллетеня.
Title page
*

1

1. 1.3

1.4

(1.5)

[1.6]

   

1.3

Раздел бюллетеня.
Bulletin issue Chapter*

1

1.2

1.3

1.4

(1.5)

[1.6]

[1.7]

1.4

Указатель Авторов в бюллетене.
Authors Index*

1

1.2

1.3

(1.5)

[1.6]

[1.7]

 

1.5

Указатель Периодики в бюллетене (не для НОВЫХ КНИГ).
Serials Index (not for New Books)*

1

1.2

1.3

1.4

     

1.6

Указатель Редакторов в бюллетене [только НОВЫЕ КНИГИ].
Editors Index [for New Books only]*

1

1.2

1.4

1.7

     

1.7

Указатель Заглавий в бюллетене [только НОВЫЕ КНИГИ].
Titles Index [for New Books only]*

1

1.2

1.4

1.6

     

ПЕРЕЧЕНЬ ТЕМАТИК БЮЛЛЕТЕНЕЙ С НОМЕРАМИ ИХ ВЫПУСКОВ
[Subjects List and Links]

Периодичность + НАЗВАНИЕ ТЕМАТИКИ + номера выпусков

W + "ПРОБЛЕМЫ ВОЗРОЖДЕНИЯ РОССИИ" +30 +31 +32 +33 +34 +35 +36 +37

F + "ВОПРОСЫ КУЛЬТУРЫ И ОБРАЗОВАНИЯ" +14 +15 +16 +17 +18

W + "ПРОБЛЕМЫ РЕГИОНОВ РОССИИ" +30 +31 +32 +33 +34 +35 +36 +37

W + "ПАРЛАМЕНТАРИЗМ В РОССИИ" +30 +31 +32 +33 +34 +35 +36 +37

F + "ВЫБОРЫ В МЕСТНЫЕ ОРГАНЫ ВЛАСТИ РОССИЙСКОЙ ФЕДЕРАЦИИ" +13 +14 +15 +17 +18 +19

M + НОВЫЕ КНИГИ +06 +07 +08

Serials - Периодические издания, отбираемые для подготовки бюллетеней (всего наименований периодики 212)

Периодичность подготовки и срок хранения
бюллетеней на Web сервере:

!17

О.Д. Каллистратова, Т.Н. Соловьева

(БЕН РАН, Москва)

ЭЛЕКТРОННЫЙ КАТАЛОГ
ЖУРНАЛЬНОГО ФОНДА
БЕН РАН В INTERNET

Библиотека по естественным наукам РАН (БЕН РАН) участвует в проектах, связанных с обеспечением доступа к сети Internet, который финансируется Российским фондом фундаментальных исследований (РФФИ) и фондом Сороса. Одним из направлений, реализуемых в рамках этих проектов, является обеспечение доступа через Internet к электронным каталогам библиотек с помощью стандартных клиентских WWW-приложений в качестве пользовательского интерфейса.

Последние несколько лет в БЕН РАН формируются сводные электронные каталоги периодических и непериодических изданий, поступающих в централизованную библиотечную систему (ЦБС) БЕН, с использованием собственных программных средств и локальной компьютерной сети Novell NetWare.

Электронный каталог фонда периодических изданий ЦБС БЕН РАН на сегодняшний день содержит информацию о зарубежных изданиях более пяти тысяч названий с 1990 года издания и отечественных около тысячи названий с 1994 года издания (всего порядка 500 000 единиц хранения), поступивших по различным каналам (покупка, международный книгообмен, благотворительная помощь различных обществ и т.д.).

В настоящее время локальная сеть БЕН РАН подключена к Internet при поддержке ряда организаций-спонсоров, таких как РФФИ, IREX и фонд Сороса, что позволило организовать в БЕН РАН WWW-сервер сначала на компьютере PC Pentium-66 с OS FreeBSD 2.1, затем - на компьютере фирмы IBM RS/6000 с OS AIX 4.1.4.

Для доступа к собственным электронным каталогам в Internet в БЕН были выбраны два различных метода, использующие существенные различия в представлении информации о периодических и непериодических изданиях.

Поиск информации о книгах основывается, как правило, на ключевых словах и других поисковых элементах, для чего требуется сильно развитый поисковый аппарат типа WAIS либо собственные программные шлюзы для формирования выходной информации по запросам на основе CGI-технологии, как это реализовано, например, в ГПНТБ (см. http://gpntb.iitp.ru).

Что касается электронных каталогов периодических изданий, то, как показал опрос пользователей, для них наибольшее значение имеет возможность просмотра алфавитного и тематического списков имеющихся в фондах журналов и выбора из них необходимых для получения данных о поступивших выпусках. Поэтому для представления электронного каталога фонда журналов БЕН РАН в Internet были разработаны программы конвертирования информации из локального каталога в удобную и наглядную структуру (дерево) HTML-страниц.

БЕН РАН начинала своё представление в Internet в 1996 году с демонстрации "Home Page" (http://ben.irex.ru), которая содержит информацию о библиотеке, её фондах и услугах, об адресах серверов библиотек сети, о текущих мероприятиях, проводимых библиотекой. Информация представлена на двух языках.

Для создания электронного каталога периодических изданий на сервере БЕН были разработаны программы выборки и конвертирования, преобразующие информацию о периодическом издании в дерево HTML страниц. Программой конвертирования обрабатывается массив описаний журналов, который формируется программой выборки из электронного каталога и содержит следующую информацию о журнале: название журнала, страна, ISSN, шифр хранения БЕН РАН, год, тома и номера изданий, имеющиеся в фонде. Программа конвертирования формирует статические HTML страницы, которые периодически обновляются с помощью специальных программных средств.

Пользователь может просматривать каталог в алфавитном либо тематическом режиме. В алфавитном режиме просмотр ведётся по трём уровням (алфавит, список журналов на каждую букву, описание журнала). В тематическом режиме просмотр ведется по рубрикатору, разработанному и использующемуся в БЕН РАН с 1980 года. Просмотр возможен по четырем уровням (рубрики, подрубрики, список журналов на каждую подрубрику в алфавитном порядке, описание журнала). Описание журнала представлено в удобной и наглядной форме. На странице наряду с основными библиографическими сведениями (название журнала, страна издания, ISSN, шифр хранения БЕН РАН) также представлена информация о поступивших томах и номерах выпусков журнала по годам издания.

Организован удобный для пользователя интерфейс. Информация представлена на двух языках (русский и английский).

В настоящее время пользователям Internet доступен каталог иностранных периодических изданий с 1993 года выпуска основного фонда БЕН (более 2000 названий).

В перспективе - создание сводного каталога с указанием у каждого журнала адресата (библиотек с их реквизитами), а также реализация возможности заказа журналов по МБА.

!18

В.А. Данилова

(Институт электрофизики УрО РАН, Екатеринбург)

ИСПОЛЬЗОВАНИЕ ЭЛЕКТРОННОЙ ПОЧТЫ
В ИНФОРМАЦИОННОМ ОБСЛУЖИВАНИИ
НАУЧНЫХ СОТРУДНИКОВ

В 1992-93 годах ухудшение финансирования научных библиотек привело к значительному сокращению валютных журналов, являющихся основным источником информации для академических ученых. Особенно остро возникла проблема ознакомления научных сотрудников института хотя бы с оглавлениями некоторых из них. Известные в России информационные службы не могли обеспечить необходимой информацией. С 1993 года библиотека начала пользоваться услугами Physics and Materials Science Department Elsevier Publishers, организовавшего бесплатное электронное обслуживание (free electronic service) Contents-Alert, благодаря которому за неделю, а то и за две до публикации журналов, мы узнавали их оглавления. В настоящее время через Contents-Alert можно получить информацию о содержании 11 журналов, среди которых: Surface Science, Vacuum, Materials Science & Engineering, Chem. Phys. Letters, Thin Solid Films и другие. Копии заинтересовавших статей можно заказать через издательство (за установленную плату), либо получить от автора. Что касается отечественных журналов, информация о них начала поступать через Инфомаг. Большой интерес у наших ученых вызвали электронные журналы: Physics News Update, HC Update - обзоры наиболее интересных публикаций с рефератами и указанием, где это было опубликовано. В начале 1994 года в Венгрии начали выходить узкоспециализированные журналы: MIX - по мессбауэровскому эффекту и IBIS - по ионной имплантации. В Челябинском Техническом Университете с начала 1995 года выходят электронные журналы по сопротивлению материалов и по расплавам. Близкими по сути электронным журналам являются постоянно действующие электронные конференции и заочные семинары, например, заочный семинар "Применение лазеров в науке и технике".

В октябре 1992 г. в Триесте была организована электронная библиотека препринтов. В настоящее время библиотека имеет порядка 20 баз данных из различных областей знаний. Библиотека пользуется: condensed matter, chem. phys., superconductivity, materials theory, accelerator physics. Ежедневно в библиотеку поступает список зарегистрированных препринтов с аннотациями, просматривая которые, пользователи отмечают заинтересовавшие их работы и заказывают полный текст препринта. В случае необходимости можно связаться с автором препринта (E-mail адрес указан в библиографическом описании). Читатель библиотеки может также стать одним из ее авторов. Пользование этой библиотекой является бесплатным, оплачивается только трафик. В качестве дополнения к библиотеке препринтов по физике конденсированного состояния в мае 1993 в Финляндии организована информационная служба, цель которой - собрать материалы конференции, семинаров, сообщения о новых журналах в этой области. Сведения из этой базы данных можно также получить по электронной почте.

Использование перечисленных выше информационных каналов позволило библиотеке ИЭФ обеспечить научных сотрудников оперативной информацией.

!19

Р.Е. Павлова

(ГПНТБ. СО РАН, г. Новосибирск)

БАЗЫ ДАННЫХ ПО СВОДНЫМ КАТАЛОГАМ

В настоящее время из-за подорожания печатной продукции значительно сократились поступления литературы, как отечественной, так и зарубежной. В такой ситуации возрастает роль сводных каталогов, которые охватывают и раскрывают фонды нескольких библиотек, независимо от их подчиненности и информируют о местонахождении конкретного документа.

Сводные каталоги используются в первую очередь в работе МБА, в системе информационного и справочно-библиографического обслуживания, в работе отделов комплектования, научной обработки документов и др.

В ГПНТБ СО РАН с 1988 года начали создаваться базы данных по отечественным и зарубежным периодическим изданиям, по сибирским и дальневосточным периодическим и продолжающимся изданиям с 1789 по 1980 гг., по сибирским и дальневосточным книгам XYlll в. - 1917 г. (1-й период) и с 1918 по 1930 гг. (11-й период).

На основе перечисленных баз данных формируются сводные каталоги:

Вышеназванный сводный каталог является универсальным по содержанию библиографическим пособием, информирующим о произведениях печати, изданных на территории Сибири и Дальнего Востока с начала книгопечатания по 1917 год включительно. Для удобства пользования каталогом сформировано 8 вспомогательных указателей, которые раскрывают его содержание по многим параметрам.

В настоящее время формируется база данных каталога литературы, изданной с 1918 по 1970 гг.

Созданные базы данных сводных каталогов могут быть представлены заинтересованным лицам и организациям, как в печатном виде, так и на магнитных носителях.

!20

Ф.С. Воройский

(ГПНТБ России, Москва)

ПРОБЛЕМЫ КООРДИНАЦИИ
И ОБЕСПЕЧЕНИЯ РАБОТ
ПО СОЗДАНИЮ АБИС

И ИХ РЕГИОНАЛЬНЫХ СЕТЕЙ
В РОССИИ

Обсуждаются организационные, проектные, технологические и другие проблемы автоматизации публичных и массовых библиотек России. С целью обеспечения "единого информационного пространства" и сокращения неэффективных затрат ресурсов предлагаются общие для разных регионов принципы формирования программ и управления их реализацией, а также - требования к проектированию АБИС и их сетей. Эффективности внедрения современной информационной технологии должно способствовать также создание небольших территориальных (региональных) профессиональных центров и межрегиональных координационных органов или групп специалистов.

Начатый и ставший массовым процесс автоматизации библиотек России выявил ряд проблем, которые являются достаточно общими для участвующих в нем организаций независимо от их ведомственной и территориальной принадлежности. Указанные проблемы связаны с организационными, проектными, нормативными, технологическими и образовательными аспектами обеспечения создания, поддержки функционирования и развития автоматизированных библиотечных систем на местах, а также их региональных и межрегиональных сетей.

Отсутствие единой Государственной программы автоматизации библиотек, современной нормативной и методической базы, низкий профессиональный уровень в области современной информационной технологии большинства лиц, принимающих важные организационные и проектные решения, а также их реализующих, приводят не только к неоправданным затратам и без того незначительных ресурсов, но и создают предпосылки для образования в перспективе "рваного" информационного поля, затраты на преодоление которого будут соизмеримы с сегодняшними затратами на его создание.

Отдавая себе отчет в масштабах и многогранности поднятого вопроса, остановимся на некоторых путях его решения на местах в части функционально близких объектов автоматизации - публичных и массовых библиотек, а также их территориальных сетей.

Центральными пунктами обсуждения, по нашему мнению, являются:

1. Содержание региональных программ автоматизации и согласованных требований к разработкам,

2. Создание территориальных "точек опоры" автоматизации,

3. Их организационное обеспечение,

4. Создание внутри- и межрегиональных постоянно действующих общественных координационных органов (комитетов, групп специалистов, совещаний, конференций и т.п.).

1. Предложения к содержанию программ
и требований к проектированию

На наш взгляд, общими для разработок программ автоматизации сетей и библиотек разных уровней должны быть следующие положения:

1. Выполнение работ по проектированию, созданию и развитию средств автоматизации в публичных (включая научно-технические) и массовых библиотеках городов и регионов России должно производиться в рамках общегородских (областных или других территориальных) программ, согласованных с общенациональной программой Информатизации общественного производства РФ или Государственной программой автоматизации библиотек России (ввиду отсутствия этой или соответствующей ей по целям программы, название дано произвольно - прим. авт.).

2. Функции руководства разработками, внедрением и развитием систем должны быть возложены на подчиненные непосредственно соответствующей территориальной администрации (например, комитеты или управления культурой) организации или рабочие группы.

3. Автоматизация публичных и массовых библиотек регионов должна выполняться по правилам и нормам создания единой системы с сетевой структурой организации.

4. Функции звеньев системы должны выполнять автоматизированные библиотечно-информационные системы (АБИС) библиотек городов, включая:

а) Центральное звено (или звенья) системы (ЦЗС) - наиболее развитые центральные публичные городские, областные и /или республиканские библиотеки, непосредственно замыкающие на себя звенья системы первого уровня (в Москве, например, - ЦГПБ им. Н.А. Некрасова) и осуществляющие непосредственное системное, организационно-методическое и информационное взаимодействие с общенациональными библиотеками (например, ГПНТБ России, РГБ, БЕН РАН, ЦМНБ и др.) и информационными центрами (например, ВИНИТИ, ИНИОН, региональные ЦНТИ и др.);

б) Звенья системы первого уровня, замыкающие на себя соответствующие звенья системы второго уровня - другие центральные городские центральные районные и отдельные городские библиотеки (в Москве, например, указанную роль выполняют: Центральная городская детская библиотека им. Гайдара и Центральные районные библиотеки (ЦРБ) ЦБС административных округов и бывших районов г. Москвы);

в) Звенья системы второго уровня - отдельные небольшие массовые библиотеки и филиалы централизованных библиотечных систем.

5. Автоматизированная сеть в целом и каждое ее звено, в частности должны создаваться на основе современных проектных решений, обеспечивающих:

5.1. Повышение полноты, точности и оперативности удовлетворения запросов читателей (пользователей) на основе как собственных фондов и организуемых в ее звеньях баз данных (БД), так и ресурсов не входящих в ее состав автоматизированных библиотек и информационных органов (в том числе - ГПНТБ России, БЕН РАН, ВУЗовских библиотек, ВИНИТИ, ВНТИЦентра, региональных ЦНТИ, библиотечных систем других регионов России и т.п.), а в последующем - и зарубежных библиотечных систем;

5.2. Расширение номенклатуры услуг пользователям до уровня соответствующего современным зарубежным библиотекам равной с ними категории, включая теледоступ абонентов к электронным каталогам, удаленный прием и реализацию заказов на литературу и данные, оперативное обеспечение справочной информацией, предоставление услуг на основе CD ROM и средств мультимедиа и др.;

5.3. Существенное сокращение трудозатрат на выполнение внутри библиотечных работ и операций;

5.4. Повышение комфортности условий труда персонала библиотек и обслуживания читателей.

6. Проектные, организационные и технические решения, реализуемые во всех АБИС должны предусматривать:

6.1. Единство для всех звеньев сети библиотек средств форматного обеспечения на основе использования международного стандарта MARC (в версии UNIMARC или US MARC) и согласованного (вначале на региональном, затем - межрегиональном уровнях) дополнения его необходимым для условий работы отечественных библиотек составом полей описания документов и данных (до создания коммуникативного библиотечного стандарта России);

6.2. Совместимость средств лингвистического обеспечения на основе выполнения требований отечественных стандартов СИБИД и согласованных (на начальном этапе - на региональном уровне, а в дальнейшем - межрегиональном) словарей общесистемных терминов;

6.3. Совместимость средств программного и технического обеспечения на основе использования унифицированных операционных систем, согласованных характеристик средств сопряжения прикладных программ, единых протоколов передачи данных и IBM-совместимых технических средств;

6.4. Модульный принцип построения программных, технических и других средств, обеспечивающий привязку технических решений к особенностям каждой библиотеки и поэтапное наращивание средств автоматизации в соответствии с возникающей необходимостью и/или возможностями;

6.5. Поэтапный характер внедрения и развития средств автоматизации в системах и отдельных их звеньях с учетом особенностей каждой системы и/или библиотеки, стоящих перед ними задач по обслуживанию пользователей, социальных, экономических и др. условий;

6.6. Преемственность использования информационных ресурсов, программных и технических средств при поэтапном развитии входящих в систему АБИС или их модернизации;

6.7. Непрерывную работу библиотек в период внедрения средств современной информационной технологии;

6.8. Минимальный уровень затрат денежных, материальных и трудовых ресурсов на внедрение средств автоматизации и их последующую модернизацию;

6.9. Одноразовую обработку входных документальных потоков для их многофункционального и многоразового использования;

6.10. Сохранность информационных ресурсов и их защиту от несанкционированного доступа и разрушения;

6.11. Централизованное (внутри регионов или территорий) обучение и возможно быструю адаптацию персонала библиотек и пользователей (читателей) к условиям работы с системой и ее терминалами;

6.12. Координированную (на начальном этапе - внутрирегиональную, а затем - и межрегиональную) совместную обработку документальных потоков и использование накопленных информационных ресурсов.

2. Необходимость и роль "точек опоры"

При всей важности для перевода библиотек на современную информационную технологию достаточного и, в частности, централизованного государственного финансирования, первостепенную роль мы отдаем наличию того, что в общем плане произвольно можно назвать "точками опоры" или "центрами кристаллизации".

Тот факт, что в Москве практически с нуля в середине 1993 г. начался нарастающий процесс автоматизации массовых библиотек, объясняется в первую очередь тем, что в лице ИПКИРа и ЦГПБ им. Н.А. Некрасова массовые библиотеки получили поддержку в решении целого комплекса проблем, стоящих в совершенно новой для них профессиональной области деятельности. В указанном контексте решающее значение имели:

1. Организация систематического и функционально-ориентированного начального обучения персонала и директорского корпуса;

2. Определение (концепцией и программой) целей и пути создания отдельных АБИС и сети в целом;

3. Техническая и методическая помощь в выборе, а также приобретении программных и технических средств, их установке, наладке и освоении;

4. Организационная, методическая и технологическая помощь на начальных этапах внедрения АБИС в подразделениях комплектования и обработки входных потоков документов.

И хотя предпосылок для улучшения финансирования библиотечной деятельности не было (как нет и сейчас), появившаяся "точка опоры" позволила директорам 27 центральных библиотек и ЦБС Москвы произвести в целом успешное изыскание необходимых средств. С другой стороны, инвесторы (как государственные органы, так и частные фирмы) начали выделять деньги, поскольку определились достойные цели финансирования и предпосылки эффективности вложения выделенных ресурсов.

Подобные примеры можно привести и по другим регионам России, включая и Пермскую область.

Названное нами "точкой опоры" условие успеха внедрения современной технологии распространяется и на все последующие этапы жизненного цикла автоматизированных систем любого уровня, включая отдельные подразделения или группы сотрудников в каждой конкретной библиотеке. Реализация таких "точек" в региональной сети библиотек предполагает их организационное оформление в виде технологических, методических, учебных и/или других центров (в т.ч. в виде отдельных организаций, подразделений или групп специалистов), в больших библиотеках - подразделений автоматизации, групп администрирования базами данных, в отделах и малых библиотеках - "менеджеров" и т.п.

К сожалению мы имеем и печальный опыт, который показывает, что ослабление "точки опоры" ведет к замедлению процессов внедрения новой технологии, снижению качественных и количественных показателей производственной деятельности, застою или даже к откату от занятых позиций (в частности, в организационном, технологическом и образовательном планах).

3. Организационное обеспечение программ
и работ по автоматизации библиотечных процессов

Практика показала, что процесс автоматизации массовых библиотек на основе неутвержденных программ ведет к неэффективному расходованию всех видов ресурсов не только из-за их распыления а также за счет:

1. Отсутствия общесистемного механизма управления проектированием и развитием сети, контроля внедрения проектных решений и расходования выделенных средств, организации, технологии и содержания работ, выполняемых в автоматизируемых библиотеках, значение которых представляет интерес для системы в целом;

2. Отсутствия централизованной профессиональной поддержки задач проектирования локальных систем, обучения сотрудников, разработки типовых организационных и технологических решений, разработки общесистемных средств и документации, поддержки эксплуатации (не говоря уж о поставке) технических и программных средств.

Сказанное проявляется:

1. В случайном выборе характера программных, технических и др. средств автоматизации, проектных и конструкторских решений (если последние вообще имеют место) а также их столь же необоснованной замене или модернизации;

2. В неверном определении приоритетов и содержания этапов автоматизации (зачастую эти работы выполняются спонтанно "под выделенные деньги" без всякой предварительной проработки);

3. В нарушениях технологии обработки документов, требований коммуникативного формата, правил лингвистической обработки и т.п.

На примере библиотек не только Москвы мы убедились, что их сотрудникам (даже самым опытным) не под силу не только выработка необходимых проектных и организационных решений, связанных с созданием, функционированием и развитием своих АБИС, но и разработка сравнительно несложных технологических документов и инструкций.

Можно сказать больше - сотрудники библиотек к работе в условиях строгой технологической дисциплины, без которой эффективность автоматизации процессов становится сомнительной, еще и психологически не готовы. Сказанное - не вина, а беда современных библиотечных работников. И даже тех из них, кто прошел (к сожалению - краткосрочное) обучение на курсах повышения квалификации. Результат - жуткая неразбериха в характере массивов, существенные потери и/или многочисленные "дубли" документов при вводе, неверное толкование содержания и правил заполнения полей библиографического описания, самодеятельное и порой невероятное изобретение правил составления ключевых слов и т.п. Очевидно, что результаты подобной обработки документов могут быть потеряны не только для "совместного" но и локального использования.

В сложившихся условиях, усугубляемых малочисленностью профессионалов, которые могли бы взять на себя функции контроля и помощи в каждой библиотеке (сегодня для директоров большинства библиотек любой человек, называющий себя "программистом", рассматривается как "специалист по автоматизации самого широкого профиля"), необходимо наличие в регионе небольшой, но очень квалифицированной организации или группы специалистов, основными функциями которой должны являться указанные задачи. Причем подчиняться (включая финансирование) указанные организации или подразделения должны непосредственно соответствующему региональному административному органу.

Работники Комитета по культуре Москвы считают, что эту роль должна выполнять ЦГПБ им. Н.А.Некрасова, поскольку она является "по определению" методическим центром сети массовых библиотек города. В других городах и областях России по аналогии с Москвой расчеты строятся на соответствующие городские и областные библиотеки. Однако функции реализации программ автоматизации далеко выходят за рамки методических и требуют качественно других методов, организационных, профессиональных и технических средств обеспечения. Кроме того, как ни уверяйте директора любой библиотеки, что он "отвечает за автоматизацию всех библиотек города", он этого делать не будет: у него своих проблем по горло, да и профессионально он к этому не готов, как впрочем и ответственный чиновник администрации.

Если по каким-либо причинам, что наиболее вероятно, создание такой организации невозможно, то, на наш взгляд, следует создавать при наиболее подготовленных для этих целей учреждениях или на их базе специализированных подразделений, выполняющих указанные функции под непосредственным руководством соответствующего управления администрации города (области, региона). Значительная часть работ может выполняться координационными группами, состоящими из наиболее подготовленных сотрудников автоматизируемых библиотек и других организаций данного территориального образования, работающих в указанных группах без отрыва от своей библиотеки по совместительству.

4. Межрегиональные координационные органы

Создание "единого информационного пространства" библиотек России, обеспечение информационных связей с зарубежными библиотеками и информационными центрами, как и оптимизация проектных, конструкторских и технологических решений и их внедрение в практику территориальных (региональных) библиотечных систем невозможны без координации соответствующих видов деятельности регионов. Сегодня трудно рассчитывать на то, что указанной деятельностью сможет заняться какая либо одна государственная организация. Более того - организации и фирмы, начавшие предлагать свою продукцию на "рынок автоматизации", в силу конкуренции самостоятельно не способны объективно определять качество предлагаемых решений в конкретных условиях их применения.

В этих условиях роль независимых арбитров, по нашему мнению, должны взять на себя межрегиональные координационные органы и их комиссии, составленные из ведущих специалистов - представителей различных организаций и регионов.

!21

А.В. Васильев, С.А. Власова,
А.В. Глушановский, Н.Е. Калёнов

(БЕН РАН, Москва)

СИСТЕМА "НАУКА РОССИИ"
И ЕЕ ИСПОЛЬЗОВАНИЕ
В ИНФОРМАЦИОННО-БИБЛИОТЕЧНОЙ
ТЕХНОЛОГИИ

Разработка информационно-аналитической системы "Наука России" ведется с 1994 года при поддержке РФФИ с целью создания унифицированного программного обеспечения позволяющего децентрализовано создавать библиографические базы данных типа Science Citation Index с последующим их слиянием и централизованной обработкой.

Система включает два комплекса - комплекс, обеспечивающий децентрализованный ввод информации, по которому можно получать локальные справки (РОНА-Л), и комплекс, обеспечивающий слияние децентрализовано подготовленных баз данных в одну и проведение всестороннего анализа информации (РОНА-Ц).

Информационная база комплекса "РОНА-Л" включает в себя 4 взаимосвязанных подбазы:

1. Подбаза организаций. В ней содержатся официальные реквизиты учреждения и информация, обеспечивающая возможность связи с учреждением.

2. Подбаза персоналий (БДП). В подбазу включаются фамилия, имя и отчество, сведения о специальности и квалификации ученого, месте (местах) его работы, сведения о его публикациях и их цитировании.

3. Подбаза публикаций (трудов) (БДТ). Данные, включаемые в подбазу, содержат библиографическое описание публикации, ее тематические индексы, сведения о цитируемых и цитирующих работах.

4. Подбаза источников. Подбаза содержит сведения об изданиях, в которых публикуются работы, отраженные в подбазе 3.

Поскольку система с самого начала была ориентирована на работу пользователей - библиотечных специалистов, в большинстве своем не имеющих специальной подготовки для работы с компьютерами, при ее разработке существенное внимание уделялось простоте интерфейса, защите от ввода ошибочной информации, обеспечению возможностей гибкой настройки на требуемые поля данных.

Каждая из описанных выше подбаз имеет идентичную специально разработанную структуру хранения данных (включая систему перекрестных ссылок между подбазами), и состоит из нескольких бинарных и текстовых файлов. Текстовые файлы содержат перечень меток полей с их названиями, которые пользователь желает видеть в подбазе, и таблицу очередности их вывода в меню программы ввода информации. Перед меткой может быть введен один из специальных символов, указывающий на форму контроля данных этого поля. В частности, содержимое отдельных полей может выбираться из прямого (например, ученая степень) или иерархически построенного списка (рубрикаторы ВАК и ГРНТИ).

Комплекс "РОНА-Л" обеспечивает:

Комплекс "РОНА-Л" включает также набор сервисных программ, позволяющий производить все необходимые операции по обслуживанию системы. К их числу относятся:

Как показала практика, комплекс "РОНА-Л" достаточно удобен для формирования библиографических баз данных в библиотеках. С его помощью силами 6-ти организаций различных ведомств создана и продолжает пополняться база данных отечественных публикаций по геофизическим методам разведки. В процессе ее создания подтверждена эффективность специальных алгоритмов и программного обеспечения для распознавания дублированных библиографических описаний (в слитой базе, содержащей около 30-ти тысяч записей, программными средствами было выявлено и исключено после подтверждения специалистами около 2-х тысяч дублированных записей). В настоящее время комплекс активно используется библиотеками НИУ РАН для ведения баз данных трудов сотрудников НИУ.

Другое применение комплекс нашел в системах избирательного распространения информации, реализуемых в библиотеках академических институтов. Поскольку он обеспечивает возможность формирования фрагментов базы данных, содержащих лишь записи, отвечающие введенному запросу.

В настоящее время ведутся работы по обеспечению возможности работы с системой "Наука России" через Inernet.

!22

А.И. Бродовский

(ГПНТБ России, Москва)

ИНТЕГРИРОВАННАЯ
БИБЛИОТЕЧНО-ИНФОРМАЦИОННАЯ
СИСТЕМА ИРБИС - ТИПОВОЕ РЕШЕНИЕ
ДЛЯ АВТОМАТИЗАЦИИ МАЛЫХ
И СРЕДНИХ БИБЛИОТЕК

Интегрированная библиотечно-информационная система ИРБИС представляет собой типовое решение в области автоматизации традиционных библиотечных технологий и предназначена для распространения и использования в условиях средних и малых библиотек.

Предпосылками для выполнения данной разработки явились, с одной стороны, желание обобщить многолетний опыт ГПНТБ России в области автоматизации и, с другой стороны, насущная потребность в создании готового современного продукта, который мог бы послужить основой для комплексной автоматизации средних и малых библиотек, - тех библиотек, которые не имеют возможности создавать собственные разработки и не располагают средствами для приобретения дорогостоящих фирменных продуктов.

Говоря о системе ИРБИС как о типовой, мы прежде всего подразумеваем наличие широких возможностей при адаптации ее к условиям работы конкретной библиотеки, т.е. при передаче и установке системы может производиться ее настройка в соответствии со специфическими требованиями пользователя в достаточно широких пределах - начиная со структуры библиографического описания и кончая пользовательскими режимами работы.

ОБЩЕСИСТЕМНЫЕ ХАРАКТЕРИСТИКИ ИРБИС, определяющие его преимущества по сравнению с другими библиотечными системами:

ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
И ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ

Система ИРБИС ориентирована на работу в локальной вычислительной сети (ЛВС) и представляет собой совокупность взаимосвязанных автоматизированных рабочих мест (АРМ) пяти типов:

АРМ "КОМПЛЕКТАТОР" - представляет собой рабочее место библиотечного работника, выполняющего функции по комплектованию и учету фондов библиотеки на основе ведения специальной базы данных (БД);

АРМ "КАТАЛОГИЗАТОР" - представляет собой рабочее место библиотечного работника, выполняющего операции каталогизации и систематизации изданий, т.е. функции по формированию баз данных Электронного каталога;

АРМ "ЧИТАТЕЛЬ" - представляет собой рабочее место конечного пользователя Электронного каталога и предназначен для всеобъемлющего поиска в Электронном каталоге, просмотра/печати найденной информации и формирования заказа на выдачу найденной литературы;

АРМ "КНИГОВЫДАЧА" - представляет собой рабочее место библиотечного работника, выполняющего функции по выдаче литературы в соответствии с формируемыми заказами и ее возврату;

АРМ "АДМИНИСТРАТОР" - представляет собой рабочее место специалиста, выполняющего системные операции над базами данных в целом, направленные на поддержание их в актуальном состоянии.

Остановимся более подробно на каждом из АРМов.

АРМ "КОМПЛЕКТАТОР" - обеспечивает решение следующих задач на основе ведения специальной БД:

В части ПЕРИОДИЧЕСКИХ и ПРОДОЛЖАЮЩИХСЯ ИЗДАНИЙ:

В перспективе при появлении на рынке Каталога Роспечати, а также Планов издательств и других каталогов на машиночитаемых носителях они могут быть использованы для первичного ввода описаний изданий и автоматической корректуры изменений реквизитов подписки.

В части НЕПЕРИОДИЧЕСКИХ ИЗДАНИЙ:

В технологии ввода/корректуры и поиска записей в БД комплектования используются все возможности, реализованные в АРМе "КАТАЛОГИЗАТОР".

АРМ "Каталогизатор". В условиях ЛВС система обеспечивает функционирование произвольного количества АРМов "Каталогизатор" с возможностью одновременного изменения/пополнения одной базы данных.

Для формирования БД Электронного каталога АРМ "Каталогизатор" предлагает технологию, в которой можно выделить следующие основные характеристики:

Помимо формирования БД Электронного каталога АРМ "Каталогизатор" также используется для создания и ведения БД Читателей.

АРМ "Читатель". В условиях ЛВС система обеспечивает возможность одновременного поиска в одних и тех же базах данных Электронного каталога произвольным количеством пользователей, т.е. обеспечивается одновременное функционирование произвольного количества АРМов "Читатель".

Необходимо отметить следующие основные характеристики АРМа "Читатель":

АРМ "Книговыдача". В условиях ЛВС система обеспечивает работу с очередью формируемых заказов на выдачу в режиме реального времени, т.е. заказы, формируемые на АРМах "Читатель", автоматически поступают на АРМ "Книговыдача".

Можно отметить следующие основные характеристики АРМа "Книговыдача":

АРМ "Администратор". Данный АРМ служит для выполнения операций над БД системы в целом, которые направлены на поддержание их актуальности и сохранности. Почти все режимы работы АРМа "Администратор" связаны с существенными преобразованиями баз данных - вплоть до их полного опустошения -, поэтому к работе с данным АРМом должен допускаться только ответственный и подготовленный работник.

Система предоставляет пользователю средства конфигурирования, которые, в частности, позволяют определить пользовательский уровень каждого конкретного рабочего места (ПЭВМ), т.е. определить, какие АРМы доступны на данном рабочем месте, и тем самым определить вид Главного меню системы (для DOS-версии).

ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ

Информационную основу системы составляют пять баз данных (БД):

Как уже отмечалось, структура БД Электронного каталога основана на международном формате UNIMARC, который позволяет вести детальное и всестороннее библиографическое описание различных видов литературы. Пользователю - в зависимости от конкретных условий его работы - предлагается использовать для библиографического описания детальные экранные формы (рабочие листы), реализующие структуру UNIMARC в полной мере, или использовать простые формы, основанные на упрощенной адаптации этого стандарта.

Система предлагает технологию автоматического формирования словарей по различным элементам библиографического описания - авторам, заглавиям, коллективам, ключевым терминам, кодам рубрикаторов и т.д., - которые обеспечивают быстрый (не связанный с последовательным перебором) поиск информации в БД Электронного каталога.

В качестве основного тематического классификатора, обеспечивающего эффективный поиск, предлагается Рубрикатор ГРНТИ, который в полном объеме - около 8000 статей - встроен в систему. Он дает возможность пользователю просто и с высокой степенью точности локализовать в политематической базе данных Электронного каталога содержательную область, отвечающую его информационной потребности. Соответствующий режим в АРМе "Читатель" обеспечивает простую и удобную технологию "навигации" по рубрикатору - перемещение "вверх/вниз" по уровням иерархии и по "горизонтали" в соответствии с отсылками типа "смотри" и "смотри также" - и отбор необходимых тематических разделов для поиска.

ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

Система может функционировать в локальной вычислительной сети и на автономных ПЭВМ типа IBM PC. Имеется полная версия системы - 5 АРМов - для MS DOS и версия из 3 АРМов - "Каталогизатор", "Читатель" и "Администратор" - для Windows.

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

Базовым программным обеспечением системы является ППП CDS/ISIS (ЮНЕСКО). Основная часть прикладных программ DOS-версии написана на языке ISIS-PASCAL, остальные - на языке Си. Версии АРМов для Windows реализованы на Delphi.

ДОКУМЕНТАЦИЯ

Система сопровождается документацией, которая содержит общее описание и инструкцию по установке системы, общие инструкции для пользователей каждого АРМа, а также специальные инструкции - Инструкция каталогизатора и Инструкция комплектатора, в которых дается подробное описание технологии работы в соответствующих АРМах.

!23

Я.Я. Докторов, Н.Е. Калёнов

(БЕН РАН, Москва)

ПРОГРАММНЫЙ КОМПЛЕКС
ДЛЯ РАБОТЫ С ПЕРИОДИЧЕСКИМИ
ИЗДАНИЯМИ

Комплекс предназначен для автоматизации всех аспектов работы с периодическими изданиями (формирование подписки, регистрация поступлений с формированием алфавитных списков, ведение электронного каталога с возможностью заказа нужного выпуска из фондов). Он ориентирован на работу как отдельных изолированных библиотек, так и библиотек, входящих в ЦБС БЕН РАН.

Комплекс поддерживает работу двух связанных между собой баз данных - заказов (БДЗ) и поступлений (БДП); разработан на языке С++ в среде MS-DOS.

Отметим, что в предыдущих версиях отсутствовала возможность просмотра словаря и поиска записей по различным комбинациям поисковых полей. В новой версии существенно расширены поисковые возможности, для чего потребовалась переработка структуры баз данных.

Ниже дано описание новой версии системы для пользователей.

Установка системы

Инсталляция системы осуществляется с помощью специальной дискеты вызовом программы SETUP.EXE.

Вход в систему

Начало работы осуществляется запуском программы REGJ-DBN.EXE, после чего производится настройка системы в соответствии с появившейся на экране дисплея (ЭД) таблицей. Ввод трехсимвольного кода библиотеки осуществляется клавишей ENTER. Остальные параметры могут принимать значения (+/-), их можно изменять нажатием клавиши INSERT (Ins), а переход от одного поля к другому - обычными клавишами редактирования "вперед/назад", "вверх/вниз". При задании условий контроля значений Шифра или ISSN, система будет следить за вводом их значений в последующем: в случае неверного значения их контрольных знаков, будут появляться соответствующие предупреждения.

Для выхода из программы необходимо нажать клавишу F10, после чего в средней части экрана появится альтернативное приглашение-выбор:

Выход из системы? Да - Нет

Если выбрано Нет, то происходит возврат в предыдущее состояние, после чего, для входа в главное меню системы, достаточно нажать на F2.

Главное меню системы имеет вид:

Работа с БД поступл. (БДП) Работа с БД заказов (БДЗ)

Выбор режима работы осуществляется подведением к нему курсора и нажатием клавиши Enter.

При передаче системы одновременно с программным комплексом библиотеке предоставляется база данных журналов, которые были получены для нее через централизованную систему БЕН РАН и зарегистрированы с помощью системы DISKAT АС НАУКА. Поэтому описание системы начнем с режима регистрации поступлений.

3. Работа с БД поступлений (БДП)

Регистрация поступлений. Данный режим служит как для ведения регистрации поступлений журналов, так и для оформления нового заказа на выбранный год. Отметим сразу, что в данном режиме в некоторых случаях (см. ниже) существует возможность добавления нового названия журнала (новой записи) в БДЗ. Итак, после выбора режима на ЭД появится приглашение ввести основные поля: Год, Идентификатор, Том и Номер. Под идентификатором мы будем понимать:

После ввода значения в поле "Год" или просто при переходе на второе поле в окне подсказок появится:

Enter - поиск по полному Шифр/ ISSN

F3 - поиск по нач. фрагм. слова

F7 - поиск по нач. фрагм. назв.,

В зависимости от результатов поиска на ЭД могут появиться различные сообщения или предупреждения. Если ввести, к примеру, значение фрагмента названия "ZZZ", то после нажатия функциональной клавиши F7 появится сообщение :

Записи с фрагментом ZZZ не существует в БДЗ...

Если ввести значение фрагмента названия, равное "пробелу", то на экране появится список названий, содержащих хотя бы один пробел. Клавишами "вверх/вниз" можно перемещать курсор и просмотреть все найденные названия журналов. После выбора наименования происходит автоматическое занесение соответствующего значения шифра в поле Шифр. Если у такого журнала на такой год уже были регистрации поступлений, то в окне подсказок добавится подсказка:

Tab - окно список поступлений, и на ЭД появится список поступлений - отсортированный список уже зарегистрированных томов и номеров. По Tab система "перейдет" в окно "список поступлений", где имеется возможность корректировать значения поступивших томов и номеров, после чего клавишей Esc можно вернуться к регистрации поступлений. После ввода значения поля "Том" добавится подсказка: F2-сохранить. В случае отсутствия значений тома или номера следует просто проигнорировать их ввод и перейти к выполнению следующих операций.

После сохранения записи курсор возвращается в поле Год. Если повторить ввод с предыдущими значениями года и шифра, то при переходе на третье поле система покажет все ранее введенные значения томов и номеров (в том числе - и только что введенное). Если зарегистрированных поступлений больше 18, то строки, отсутствующие в текущем окне (в т.ч. только что введенное поступление), можно просмотреть с помощью клавишей "вверх/вниз". При этом в верхней строке окна высвечивается как общее количество зарегистрированных томов-номеров, так и порядковый номер строки, где находится курсор.

Если для поиска был задан несуществующий шифр (случай "полное слово") или год, на который не было заказа, то после нажатия Enter система пригласит Вас либо ввести новую запись в БДЗ, либо ввести новый заказ соответственно.

При добавлении новой записи в БДЗ должны соблюдаться следующие правила:

Нарушение любого из вышеуказанных правил сопровождается соответствующими предупреждениями и ввод записи не производится.

Добавление в БДП с дискеты. Данный режим служит для добавления новых поступлений, сформированных в процессе централизованной регистрации журналов в системе DISKAT БЕН РАН. Выполнение режима осуществляется выбором соответствующего дисковода и имени входного файла новых поступлений из предложенного списка. При этом записи с заказами, отсутствующими в БДЗ, сохраняются в файле с тем же названием, но с расширением ".ds_". Остальные записи файла, после их переноса в БДП, уничтожаются.

Копирование БД на дискету. Этот режим позволяет сохранять все БД в виде их копий на дискете.

Индексирование. По мере работы с БДП и БДЗ постоянно происходит изменение содержания БД. Данная опция осуществляет физическое удаление ранее логически удаленных записей, т.е. происходит "сжатие" файлов.

Распечатка новых поступлений. После запуска данного режима происходит распечатка алфавитного списка новых поступлений, который хранится в файле NEWPOST.

Настройка выходных параметров. Выполнение настройки в данном режиме полностью совпадает с описанием начала работы системы и включено в меню для удобства пользователя.

4. Работа с БД заказов (БДЗ)

Актуализация записей. Режим служит для внесения различных изменений в поля записей БДЗ. Поиск необходимой записи осуществляется по правилам, описанным в разделе 3, т.е. имеется возможность как поиска в словаре, так и поиска по различным комбинациям значений поисковых полей.

Результаты поиска выводятся в соответствующее окно; при этом возможны варианты:

Когда выбрана необходимая запись, система переходит в режим корректуры полей записи. Передвигаясь курсором по меткам полей можно выбрать поле для корректировки. Подсказка Del-удал. появляется лишь в том случае, если в записи поле с меткой <zak> является пустым. Если произведена коррекция какого-либо поля, то появляется еще одна подсказка: F2 - сохранить, которая исчезает после ее выполнения.

В этом режиме клавишами PgDn и PgUp можно просматривать записи последовательно вперед и назад соответственно.

Ввод заказа (только одного за один ввод) должен происходить согласно формату <посл. две цифры года><-><заказ><;>. Нарушение этого формата сопровождается предупредительным звуком и повторным приглашением для ввода. После правильного ввода заказ автоматически сохранится в соответствующих файлах.

Таким образом, система предоставляет возможность редактирования и удаления заказов. При возврате из этого режима назад по клавише Esc выводимое окно перерисовывается с учетом последних изменений полей.

Добавление записей в БДЗ. Данный режим был описан в режиме Регистрация поступлений. Отличие состоит в том, что здесь:

Индексирование. Режим ничем не отличается от аналогичного режима, описанного при работе с БДП.

В заключение отметим, что эксплуатация системы показала ее надежность и удобство при работе даже неподготовленного пользователя.

!24

В.П. Захаров, Н.Д. Зиганшина, Т.В. Ипполитова,
А.Ц. Масевич, Н.А. Панченко, Ю.Б. Пугач,
С.В. Реуф, В.В. Рубцов

(БАН, Санкт-Петербург)

АВТОМАТИЗИРОВАННАЯ СИСТЕМА
ОБРАБОТКИ НОВЫХ ПОСТУПЛЕНИЙ В БАН

В конце 1996 г. в Библиотеке Российской академии наук (БАН) была закончена разработка автоматизированной системы обработки новых поступлений, и Библиотека приступила к автоматизированной обработке новых поступлений и накоплению массива записей для электронного каталога, начав с иностранных монографий. В настоящей публикации представлено описание системы, обеспечивающей выполнение этой работы.

Задачи системы. Основной задачей системы является создание массива машиночитаемых записей многоцелевого назначения. Основными продуктами системы должны быть:

1. Электронный каталог - массив машиночитаемых записей, доступный любым пользователям в режиме online;

2. Печатные карточки для традиционных каталогов БАН;

3. Машинные записи БАН в обменном формате для реализации межбиблиотечных проектов, в частности, для Российского сводного каталога научно-технической литературы (НТЛ);

4. Библиографические указатели типа бюллетеня новых поступлений и т.п.

Мы предполагаем, что создание массива осуществляется двумя основными путями.

Во-первых, генерация записей в самой Библиотеке. Во-вторых, использование записей других библиотечных и информационных учреждений. В БАН практически отсутствует опыт использования "чужих" записей. Однако, загрузка в систему тестового массива записей из Российской книжной палаты показала, что для их использования принципиальных препятствий не существует.

Техническое и программное обеспечение системы. Ввод информации, необходимой для создания машинной записи, осуществляется на компьютерах с процессором 286. Редактирование записей, генерация и распечатка карточек осуществляется на компьютерах Pentium и матричных и струйных принтерах.

Основные используемые программные средства: пакет CDS/ISIS и текстовый процессор WORD 6 или 7 для WINDOWS. На языке ISIS-Pascal написан ряд модулей, позволяющих решать стоящие перед системой задачи с учетом специфики нашей библиотеки.

Представляется существенным несколько подробней остановиться на создании печатной карточки. Предполагается, что в БАН параллельно с разработкой и внедрением автоматизированных систем будут долгое время сохраняться традиционные карточные каталоги. В настоящее время в связи с остановкой работы типографии БАН печатание карточки оказывается чрезвычайно сложной и тяжелой проблемой. Поэтому получение карточки из автоматизированной системы становится первостепенной задачей. Причем требования к каталожной карточке в БАН очень высоки. Кроме соблюдения правил ГОСТ 7.51-84 "Карточки для каталогов и картотек. Общие требования" в отношении размеров карточки, расположения на ней элементов библиографического описания и т.п., от нас требовалось воспроизведение графики различных языков. Эти требования вылились в разработку отдельной подсистемы подготовки печатных карточек, которая может эксплуатироваться как в составе комплекса, так и автономно.

Формат записи.

В качестве формата записи используется UNIMARC. Использование UNIMARC в условиях БАН имеет ряд особенностей, которые мы здесь не анализируем. Остановимся лишь на группе полей локального использования. В связи с тем значением, которое мы вынуждены придавать генерации каталожной карточки, мы прибегли к следующему решению. В нашей системе буквы европейских языков с диакритическими знаками представляются по специально разработанной схеме. После каждой буквы, использующей диакритический знак, ставится символ @, за которым следует три цифры. (Например, a umlaut выглядит так: a@001). На наш взгляд, использование таких символов в основных полях UNIMARC может создать определенные трудности при передаче наших записей в другие организации, например, в сводный каталог НТЛ. По этой причине мы создали поля локального использования, дублирующие те поля UNIMARC, где могут встретиться буквы с диакритическими знаками. Например, поле 200 имеет в нашей системе "двойник" с меткой 920. Фактически информация вводится именно в поля "двойники". Затем, после завершения создания записи, информация автоматически переносится в соответствующие поля UNIMARC; при этом условные значки убираются. Такая процедура выполняется независимо от того, содержит ли текст буквы с диакритическими знаками.

Технологический цикл

В БАН на сегодняшний день практически отсутствует локальная сеть. Существует лишь небольшой ее фрагмент, охватывающий часть компьютеров отдела обработки. Поэтому технологическая цепочка строится на передаче промежуточных данных через дискеты.

Первый этап создания машиночитаемой библиографической записи осуществляется в отделе комплектования библиотечных фондов. Здесь в запись вводится следующая информация: номер акта, валовый номер единицы хранения, фамилия и инициалы первого автора, заглавие документа.

Меню отдела комплектования выглядит следующим образом

Библиотека РАН. Отдел комплектования

A - Ввод новых записей потоком

B - Создание новой записи в базе данных

C - Редактирование записей в базе данных

D - Печать акта - вывод в файл A9999.ACT

E - Печать акта - вывод на принтер

F - Выгрузка актов в ISO-файл для ОСИ (ГМД)

G - Выгрузка актов в ISO-файл для ОСИ (винч)

I - Актуализация словаря поисковых терминов

X - Возврат в предыдущее меню

?

Каждая из функций реализуется посредством оригинального программного модуля, написанного на языке ISIS-Pascal.

Отметим, что комбинация цифр, состоящая из текущего года, номера акта и валового номера образует уникальный идентификатор записи, который автоматически вводится в поле 001 формата UNIMARC. В отделе комплектования вводятся только те элементы записи, которые нужны для ее идентификации в процессе обработки и создания сопроводительной документации.

После создания массива записей для актов производится распечатка актов по форме, принятой в БАН, и предмашинных рабочих листов (ПРЛ) для отдела систематизации. Распечатанные ПРЛ вкладываются в книги.

Предмашинный рабочий лист выглядит следующим образом:

Год 1996 Акт № 119 Вал.№ 610

H.Kohl.

Theorie der abbildung mit unelastisch...

Перевод заглавия:

Индексы ББК:

Рубрики ГАСНТИ:

Ключевые слова:

Аннотация:

Кроме акта в отделе комплектования автоматически генерируется экспортный файл для передачи сформированных сокращенных машинных записей на следующий этап обработки, в отдел систематизации (ОНСЛ).

При загрузке актов с дискеты в ОНСЛ осуществляется контроль на наличие вводимых записей в базе данных. Повторный ввод акта блокируется, а пользователь получает сообщение типа "Данный акт уже имеется в базе данных. Содержит 10 записей. Повторная загрузка запрещена".

При вводе данных осуществляется быстрый поиск необходимой записи по валовым номерам или номерам актов и вызов на экран рабочего листа. По окончании обработки партии книг система позволяет осуществлять быстрый контроль заполнения полей в записях. После этого используется процедура выгрузки записей соответствующих актов на дискету или "Винчестер", и обработанный таким образом массив записей передается в отдел научной обработки (ОНОЛ), где существует два режима работы и, соответственно, два меню: администратора системы и каталогизатора. Последнее выглядит следующим образом:

ОТДЕЛ НАУЧНОЙ ОБРАБОТКИ ЛИТЕРАТУРЫ RXON1

G - ONVV Поиск и редактирование данных

M - ONVVMT Обработка томов многотомных изданий

A - SHIFRD Генерация, редактирование и печать биб. карточек

C - DIACOP Обработка диакритич. разметки по интервалу mfn

D - DIAHIT Обработка диакритич. разметки по последнему hit-файлу

E - AIF Актуализация словаря

F - ISO_A3 Проверка заполненности документов акта

X - Выход в исходное меню

? -

Здесь, как и на предыдущем этапе, происходит поиск записей по валовым номерам или номерам актов и далее вводится все описание в соответствии с форматом UNIMARC.

В настоящей работе мы не касаемся специальных проблем, связанных с UNIMARC, они должны быть рассмотрены отдельно.

В заключение хотелось бы отметить наш вариант решения вопроса описания многотомников. В нашей системе используются поля связи 46-. Набор оригинальных программ позволяет связывать между собой описания многотомников в целом и описания отдельных томов. При этом обеспечиваются два вида представления записей на каталожных карточках: запись типа многотомник со спецификацией томов и запись, когда на каждый том создается отдельная карточка.

После завершения ввода информации каталогизатор приступает к генерации печатной карточки.

Указав MFN обрабатываемой записи или диапазон MFN мы получаем на экране образ карточки

1/1

Lagarou, Vassiliki.

 

Untersuchungen zur Bildung einer

"Rhenium-Nitrogenase" in Azotobacter vinelandii und

Rhodobacter capsulatus: Diss. ... Univ. Bielefeld /

Vorgelegt von Vassiliki Lagarou. - Bielefeld, 1995.

106 с : ил; 21 см. - Библиогр.: с. 95-103.

 

Е492.171.21-72 +

Е492.111-72

 

MFN начальн. 1

N - следующий

F - запись в файл

Q - карт. вперед

MFN конечн. 1

B - предыдущий

R - редактировать

Z - карт. назад

MFN текущий 1

S - выбрать

P - печать

X - выход

Меню внизу экрана позволяет выполнять ряд операций, таких как редактирование записи (по команде R, позволяющей войти в рабочий лист). Команда S позволяет выбрать определенный документ из отобранного массива записей. С помощью команды F осуществляется генерация файла для печати карточки:

1996л//1009@SH1

II@SL1

David, Serge.@AU

Chimie mole@002culaire et supramole@002culaire des sucres: Introduction

chimique aux glycosciences. - Paris : InterEd : CNRS Ed : CNRS Ed, 1995,

1995. - @T300 с : ил; 23 см@T. - ISBN 2 7296 0528 2. - ISBN 2 271 05254

8.@DS

Г291 + Г291.223@BBK

(4091)@VN

6717-96@IND

Файл загружается в текстовый процессор WORD 6 (или 7) под WINDOWS, где серией макропоследовательностей он преобразуется в формат карточки. Опираясь на символы @AU, @DS и другие, специально созданные макропоследовательности "разбрасывают" элементы описания по областям карточки, производят контекстную замену условных символов на буквы с диакритическими знаками. На завершающем этапе в ряде случаев, тем не менее, требуется ручная "доводка" печатной карточки средствами редактора. Далее карточка распечатывается в требуемом количестве экземпляров и включается в карточный каталог.

Созданные машиночитаемые записи собираются в специальной базе данных. По накоплении представительного массива они будут предоставлены читателям БАН. В настоящее время, кроме иностранных монографий, библиотека приступила к созданию записей по отечественным изданиям, не обеспеченным карточками и, соответственно, машинными записями РКП. В следующем году планируется приступить к созданию записей на другие виды документов.

!25

С.А. Власова

(БЕН РАН, Москва)

ПРОГРАММНЫЕ СРЕДСТВА
ДЛЯ АВТОМАТИЗАЦИИ РАБОТЫ МБА

Предоставление пользователям первоисточников по межбиблиотечному абонементу (МБА) является важнейшей задачей для Библиотеки по естественным наукам Российской академии наук (БЕН РАН), которая возглавляет одну из наиболее развитых в стране централизованных библиотечных систем (ЦБС). ЦБС БЕН РАН включает около 250 библиотек научных исследовательских учреждений (НИУ) РАН.

БЕН РАН является общероссийским центром МБА по естественнонаучной литературе, обслуживая библиотеки страны по фондам центральной библиотеки (ЦБ), и центром МБА своей ЦБС, предоставляя литературу по заказам ученых РАН из библиотек, входящих в ЦБС, а также из фондов центральных библиотек страны, с которыми у БЕН РАН имеются соответствующие соглашения.

Для автоматизации процессов предоставления пользователям литературы в ЦБС БЕН РАН специалистами БЕН была разработана двухуровневая система обслуживания читателей, включающая систему обслуживания читателей для библиотек НИУ РАН и систему диспетчеризации заказов по МБА для ЦБ [1,2].

Система обслуживания читателей, предназначенная для отдельных библиотек ЦБС и получившая сокращенное название СОЧИ, позволяет автоматизировать все технологические процессы, связанные с учетом читателей, заказом литературы из собственных фондов библиотеки и по межбиблиотечному абонементу, выдачей и возвратом изданий, а также статистической обработкой данных.

В настоящее время СОЧИ функционирует в ряде библиотек НИУ РАН в Москве, Пущино и Черноголовке. Из этих библиотек заказы по МБА поступают в БЕН в виде распечатанных бланков-заказов, информация с которых вводится в систему диспетчеризации заказов по МБА в ЦБ. С начала 1997 года библиотека Института белка (г. Пущино) передает заказы в БЕН по электронной почте в виде текстового файла, содержащего записи заказов, сформированные в процессе работы системы обслуживания читателей. С помощью специальной программы в БЕН осуществляется распечатка полученных заказов и автоматический ввод в систему диспетчеризации заказов по МБА.

Последняя версия программного обеспечения обработки заказов по МБА в ЦБ включает в себя блок финансовых расчетов с абонентами, не входящими в ЦБС БЕН РАН. Этот блок позволяет определять стоимость обработки каждого заказа в зависимости от операций, которые над ним совершались, контролировать оплату услуг каждым абонентом, получать необходимые статистические и справочные сведения.

Являясь центром МБА по естественным наукам в масштабах страны, БЕН РАН ведет большую работу по унификации форматов представления заказов по МБА, циркулирующих между библиотеками. В 1996 году на 3-ей международной конференции "Крым-96" специалистами академических библиотек (БЕН РАН, ГПНТБ СО, БАН) и РГБ был согласован предложенный БЕН РАН формат для обмена заказами по электронной почте между библиотеками России.

Заказ по МБА в данном формате представляет собой запись, состоящую из полей переменной длины, которые содержат необходимую информацию для заказа литературы: адрес и название библиотеки-заказчицы, код для заказа по МБА, фамилию ответственного лица, номер заказа, дату заказа, допустимый носитель информации, а также элементы библиографического описания издания [3]. Перед каждым полем находится соответствующая ему метка из двух символов, заключенная в скобки < >. В конце поля ставится терминатор </P>. Запись заказа заканчивается разделителем ***.

Любая библиотека, имеющая персональный компьютер и описание указанного формата, при помощи текстового редактора легко может сформировать заказ по МБА, записать его в файл, а затем направить по электронной почте библиотеке-фондодержательнице. Для избежания возможных ошибок при формировании заказов "вручную" специалистами БЕН РАН была разработана специальная программа, позволяющая вводить информацию о заказе и записывать ее в файл в необходимом формате. Данная программа имеет простой пользовательский интерфейс, снабжена системой подсказок, в ней предусмотрен формально-логический контроль вводимой информации и обеспечивается автоматический ввод данных, постоянных для библиотеки-заказчицы.

Библиотека-фондодержательница, получив по электронной почте файл с записями заказов, может их распечатать в виде бланков-заказов по МБА. Для этой цели создана программа, которая обеспечивает формирование и печать бланков-заказов в форме, максимально приближенной к ГОСТу 7.31-89. Данная форма бланка-заказа разработана специалистами БЕН, согласована с межведомственной комиссией по МБА при РГБ и сотрудниками ГПНТБ РФ [4].

В настоящее время БЕН обменивается заказами в представленном формате по электронной почте с ГПНТБ СО РАН. Кроме того, в БЕН направляют свои заказы библиотеки Сургутского государственного университета, Саратовского государственного университета, Хабаровского института тектоники и геофизики ДВО РАН, Екатеринбургского института электрофизики УРО РАН, а также ряд библиотек СО РАН г. Новосибирска. Программные средства для формирования и распечатки заказов по МБА переданы в РГБ, где используются для получения заказов от своих абонентов.

Технология передачи по электронной почте заказов по МБА упрощает и ускоряет процедуру заказа литературы, что обеспечивает повышение оперативности предоставления первоисточников читателям.

 

Литература

1. Власова С.А., Калёнов Н.Е. Автоматизированная система обслуживания читателей научной библиотеки // НТИ. Сер.1. - 1993, - № 2. - С. 16-19.

2. Власова С.А. Система обслуживания читателей (СОЧИ) // Эффективность использования интерактивных библиотечных систем. - Новосибирск, 1994, - С. 62-69.

3. Калёнов Н.Е., Васильев А.В., Власова С.А., Глушановский А.В. Программные средства для создания библиографических баз данных // Библиотечное дело и демократия: тезисы докладов и сообщений научной конференции (М., 8-10 апреля 1997г.). М., 1977. - Ч. II, - С. 48.

4. Калёнов Н.Е. Проблемы автоматизации библиотечной технологии // НТИ. Сер.1. - 1992. - № 6, - С. 21-23.

!26

В.В. Васильчиков

(БЕН РАН, Москва)

СВОДНЫЙ КАТАЛОГ ГПНТБ КАК ИСТОЧНИК ЗАПИСЕЙ ДЛЯ ФОРМИРОВАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА БЕН РАН

С 1995 года БЕН РАН осуществляет в автоматизированном режиме обработку новых поступлений и это служит основой ведения электронного каталога (ЭК) книг и периодических изданий. При этом остается открытым вопрос о вводе в ЭК информации о всем фонде имеющейся в БЕН и ее сети литературы.

Одним из дополнительных источников информации для ЭК может служить Сводный Каталог, формируемый в течение многих лет ГПНТБ России. Он содержит записи об изданиях, поступивших в крупнейшие библиотеки СССР (а с 1991-го года - России), передаваемые в ГПНТБ самими библиотеками. В настоящий момент ГПНТБ готова бесплатно предоставить каждой библиотеке ее информацию, накопленную с середины 80-х годов в электронном виде.

В июле 1997 года БЕН РАН получила из ГПНТБ около 35000 "своих" записей и приступила к конвертированию их во внутренний формат своего ЭК. Поскольку мы оказались первыми, кто пытается таким образом использовать записи Сводного Каталога ГПНТБ, есть смысл описать их.

Полученный из ГПНТБ массив содержит библиографические описания отечественных и иностранных книг, начиная с 1986 года издания.

Формат поставки представляет собой некоторую модификацию UNIMARCа, но не являющуюся его подмножеством. Строго говоря, этот формат не соответствует ISO 2709 - основному стандарту для обмена информацией. Дело в том, что весь массив, полученный из ГПНТБ, усыпан символами перевода строки (кодами 0D0A), в основном, через каждые 80 символов полезной информации. При этом длина записи (содержимое первых 5 байт каждой записи), адреса полей и длины полей в справочнике записи приведены без учета этих символов.

Следующее отступление от правил ISO 2709 связано с наличием поля 914, не содержащим ни индикатора, ни идентификатора (это поле копирует поле 001, для которого такая форма записи справедлива).

Символы европейских языков, отличные от латиницы и кириллицы, представлены тремя символами, из которых первым всегда является знак @.

В маркере записи заполнены только обязательные поля - длина записи, базовый адрес и данные об элементах справочника. Отсутствует чисто библиографическая информация.

В основном заглавии (подполе 200a) встречаются угловые скобки "<" и ">", иногда заменяющие двойные кавычки, а иногда ограничивающие несортируемые символы, например, артикль "The". Для нормального конвертирования таких записей требуется довольно изощренный алгоритм.

И, наконец, следует учитывать, что хотя в конкретной записи может стоять код Вашей библиотеки (а именно по значению этого кода и были отобраны записи для БЕНа), автором записи может быть другая библиотека, давшая в ГПНТБ информацию об этом издании раньше Вас. Поскольку подходы к каталогизации в разных библиотеках могут несколько различаться, могут потребоваться специфические алгоритмы конвертирования библиографической информации.

Для полноты картины приведем перечень полей, встречающихся в записях Сводного Каталога ГПНТБ (таблица получена из ГПНТБ 12.08.97 г.):

Наименование поля

Метка

Подполя

Макс. длина

Идентификатор записи

001

`

 

ISBN

010

a

20

ISSN

011

a

8

Инвентарный номер РКП

020

b

20

Данные общей обработки

100

a

40

Язык

101

a

20

Страна публикации

102

a

5

Кодированные данные

105

a

15

Основное заглавие

200

aeihfd

700

Сведения о переизд.

205

a

50

Сведения о cерии

225

aevfxih

300Z

Место изд., изд-во, год выхода

210

acd

300

Объём издания, ил.

215

ac

40

Общие примечания

300

a

300

Библиография

320

a

100

Периодичность

326

a

10

Аннотация

330

a

1000

Иная форма заглавия

517

a

200

Предыдущее заглавие СИ

520

a

210

Перевод заглавия

541

a

300

Персоналия

600

ab

40

Предм. руб-ка

606

afx

200

Ключевые слова

610

af

200

Индекс УДК

675

a

120

Автор 1

700

abg

40

Автор 2,3

701

ab

200

Составитель, редактор

702

ab

220

КА, мероприятия

710

ahdefc

120

Другие КА

711

ahdefc

120

Поставщик

801

abc

40

Ур-нь, РКП, вид, тираж, признак

900

abcde

60

Сигла, шифр, том, номер СИ

901

abcdefgqt

500

Алкод

914

 

50

Код страны (расшифровка)

915

ab

55

Код языка (расшифровка)

916

 

35

Код периодичности(расшифровка)

917

ab

35

Заглавие приложения к СИ

918

ax

250

Перевод аннотации

963

a

1000

Рубрика ГРНТИ

964

a

30

Перевод пред. Рубрики

966

a

200

Ключевые слова

661

 

100

Для сценарного раб. листа

999

 

100

Cигла (расшифровка)

941

abc

400

Статистический анализ полученного БЕН из ГПНТБ массива показал наличие нескольких десятков записей с "неправильными" полями - без индикаторов и идентификаторов. По-видимому, это - некоторые сбои, которые в дальнейшем будут устранены.

Большим достоинством полученного из ГПНТБ массива является наличие в каждой записи кодов библиотек, получивших в свое время соответствующее издание. Это позволяет (с некоторой осторожностью) использовать ЭК в службе МБА. Недоверие связано с тем, что в Сводном Каталоге ГПНТБ отсутствует информация о списании литературы. На наш взгляд, в дальнейшем следовало бы продумать механизм учета в Сводном Каталоге научно-технической литературы, который Постановлением Правительства РФ (№ 950 от 24.07.97 г.) поручено вести ГПНТБ, как получения, так и списания литературы библиотеками и информационными центрами.

Тем не менее имеющаяся информация помогает службе МБА сузить область поиска первоисточника и ускорить его получение.

Собираясь использовать информацию из Сводного Каталога ГПНТБ для формирования локального электронного каталога в той или иной библиотеке, следует заранее продумать технологию исключения из него информации о списанной литературе.

!27

В.П. Варакин

(БЕН РАН, Москва)

ИНФОРМАЦИОННАЯ СИСТЕМА
"КАТАЛОГ БЕН РАН"

Разработчики информационных систем (ИС), вне зависимости от целевой направленности ИС, в настоящее время располагают широким набором средств, обеспечивающих создание многофункциональных приложений, которые просты в использовании и снабжены наглядным интерфейсом.

Системы управления базами данных, на основе которых строятся ИС, за последние годы приобрели целый ряд качественно новых возможностей за счет ориентации на OLE технологию [3,4], использование стандарта SQL [1,2], визуальное программирование [3,4] и сетевую среду [5,6], что позволяет в достаточно короткие сроки создавать приложения, отвечающие современным требованиям.

Привлекательность использования СУБД в качестве основы для реализации ИС, в отличие от сред визуального программирования [3], состоит в том, что они изначально предназначены для автоматизации информационных процессов и обладают развитым аппаратом поддержки баз данных (в т.ч. индексирование, средства реорганизации, поддержка встроенных процедур, реализация соединений баз данных с серверами и т. д. [1-4]) и поиска (напр. RUSHMORE technology [4]), не говоря уже о внутренних объектно-ориентированных языковых средствах, средствах визуального программирования, организации интерфейса пользователя и обширном инструментарии от библиотек функций низкого уровня до средств автоматизации программирования (WIZARDs).

Приложение, построенное на основе современной СУБД может быть как сервером БД, так и клиентом практически любого сервера в среде WINDOWS NT/95. Перечисленные выше возможности обеспечивают реализацию приложений, функционирующих как в локальных [5,6], так и глобальных [1,2,5,6] сетях.

Наряду со сказанным, следует отметить, что использование СУБД в качестве базового инструмента при создании целевых ИС, обеспечивает соблюдение требований стандартизации данных, что немаловажно при взаимодействии приложений с внешними серверами (приложениями) с точки зрения информационной совместимости. Кроме того, СУБД, по определению, позволяет достичь желаемой степени интеграции данных при реализации группы ИС, использующих пересекающиеся подмножества объектов специфицированной концептуальной модели данных.

На базе подобной СУБД в БЕН РАН создана информационная система "КАТАЛОГ БЕН РАН", включающая в себя следующие компоненты:

Конвертер, реализованный как приложение (*.APP, *.EXE, *.DLL), предназначен для импорта в систему данных из файлов в структуре ISO-2709 (в.ч. различных модификаций MARC-форматов) и "распакованных" текстовых файлов, состоящих из записей, разделенных специальным терминатором, каждое поле в которых имеет вид: <метка поля> [значение поля] <терминатор поля>. БД ИС "КАТАЛОГ БЕН РАН" состоит из нескольких таблиц и поддерживает связи "один ко многим" и "многие к одному", а также соединения с SQL серверами. В процессе загрузки формируются индексы, обеспечивающие реализацию доступа при инвертированной организации данных. С точки зрения пользователя в БД находятся библиографические описания первоисточников и словари. В случае разрушения БД конвертер обеспечивает возможность ее восстановления.

Локальная ИС также представляет собой автономное приложение, выполняющее следующие функции:

С точки зрения пользователя система реализует поиск по году издания, авторский поиск, поиск по терминам заглавия первоисточника и его библиографического описания.

ИС, функционирующая в среде INTRANET/INTERNET, представляет собой приложение-сервер, выполняющее запросы пользователя, сформулированные на активных страницах [7]. Система обеспечивает авторский поиск, поиск по терминам заглавия и библиографического описания, году издания и ISBN. В процессе работы ИС взаимодействует со стандартным WEB-сервером, совместимым с конкретной операционной системой.

В системе также предусмотрено наличие аппарата, реализующего контроль дисциплины доступа, как на уровне аутентификации, так и на функциональном уровне.

Созданные приложения базируются на OLE технологии, функционируют в среде WINDOWS 95/NT 4.0 и поддерживаются штатным программным обеспечением. Система в целом имеет дистрибутив, позволяющий осуществлять установку ее компонентов, используя стандартный SETUP.

ЛИТЕРАТУРА

1. СУБД. Серверы Баз Данных. 1/97. - М.,1997. - 96 c.

2. СУБД. Серверы Баз Данных. 2/97. - M.,1997. - 96 c.

3. Д. Мэтчо Delphi 2. МАСТЕР. Руководство для профессионалов. - С. - П.: "BHV - Санкт- Петербург",1997. - 739 c.

4. С. Каратыгин, А. Тихонов, Л. Тихонова. Работа в Visual FoxPro. - М.: БИНОМ, 1997. - 506 c.

5. LAN. Журнал сетевых решений. Приложение к номеру 5, том 3. - М., 1997. - 56 c.

6. Сети. Network World. Глобальные сети и телекоммуникации. - M.,1997. - №6. - 128 c.

7. Стивен Спейнаур, Валери Куэрсиа. Справочник Web-мастера. - Киев: BHV, 1997. - 367 c.

!28

О.М. Гиацинтов,
Н.Е.
Калёнов, Е.И. Козлова

(МГТУ им. Н.Э. Баумана, Москва)
(БЕН РАН, Москва)

МОДЕЛЬ ФОРМИРОВАНИЯ
ОПТИМАЛЬНОГО ЗАКАЗА
НА НАУЧНЫЕ ЖУРНАЛЫ
ДЛЯ ФОНДОВ БЕН РАН

Как известно [1,2], научные журналы являются основным источником информации для ученых, занимающихся фундаментальными исследованиями; без постоянной работы с ними в современных условиях невозможно получение важных научных результатов. Поэтому журналы составляют основную часть фондов многих научных библиотек, в частности, фонд БЕН РАН, возглавляющей централизованную библиотечную систему (ЦБС), на 80% состоит из журналов, 80% которых, в свою очередь, составляют зарубежные.

Задача отбора перечня журналов, подлежащих заказу, является одной из важнейших для научных библиотек; в последние годы она существенно усложнилась в связи с резким сокращением финансирования. Если до 1992-го года средняя экземплярность зарубежных журналов в ЦБС БЕН равнялась трем (при том, что выписывались все наиболее важные - мировые научные журналы), то сейчас не обеспечивается формирование и половины сложившегося за многие годы "репертуара" зарубежных журналов в одном экземпляре.

В этой ситуации в БЕН исключительно остро встала проблема формирования оптимального (в смысле максимального соответствия информационным потребностям ученых) фонда журналов в условиях постоянного сокращения финансовых ресурсов, решению которой посвящена настоящая работа.

Для решения задачи формирования оптимального журнального фонда необходимо построение математической модели, позволяющей численно оценить качество каждого журнала, который потенциально может быть включен в заказ. Очевидно, что показателем такого качества является информационная ценность (информативность) журнала для пользователей - сотрудников РАН. Если предположить, что тематика и качество публикаций данного наименования научного журнала достаточно стабильны (резкие изменения случаются достаточно редко и, как правило, сопровождаются изменением названия журнала), информативность журнала может быть оценена с помощью трех наиболее распространенных групп показателей:

При этом необходимо учитывать, что для политематической библиотеки, каковой является БЕН РАН, при формировании заказа на журналы необходимо обеспечивать информационную поддержку всех научных направлений (естественно, в зависимости от их важности). Поэтому необходимо рассматривать не абсолютную информативность журналов (которая, в значительной степени определяется спецификой данной научной области), а относительную - внутри каждого тематического раздела. Соответственно, дополнительной проблемой является разработка методики предварительного распределения ассигнований между тематическими разделами, без которого может оказаться, что максимальная информативность фонда обеспечивается заказом журналов лишь по одному-двум научным направлениям.

Таким образом, разрабатываемая модель должна решать следующие задачи:

Модель базируется на автоматизированной системе БЕН РАН (АС НАУКА), в рамках которой накапливаются данные о спросе на все издания по всем каналам обслуживания и данные о распределении читателей по библиотекам ЦБС; в базах данных АС НАУКА содержатся все сведения о заказах на журналы за каждый год, начиная с 1990 г. В основе тематического распределения журналов лежит специально разработанный рубрикатор БЕН РАН, успешно используемый в технологии с 1980 года (см., например, [3]).

Рассмотрим каждую из двух составляющих модели.

Распределение ассигнований
между тематическими разделами

Для распределения денежных средств между тематическими разделами используются следующие показатели:

Значимость тематического раздела определяется относительным количеством пользователей, в работе которых необходима информация по данной тематике (в дальнейшем, возможно, будут использованы другие показатели, связанные, например, с государственными целевыми программами). Основой для получения этого показателя служат данные о количестве ученых в НИИ РАН и профиле комплектования библиотеки данного института.

По каждому разделу науки (i), отраженному в сводном тематическом плане комплектования (ТПК) ЦБС БЕН РАН, выбираются библиотеки, заинтересованные в материалах по этому разделу, и определяется суммарное количество читателей этих библиотек (Ki). Относительная значимость тематики (Ti) определяется как

Коэффициенты стоимости изданий по каждому научному направлению (Di) определяются по формуле

,

где Sj - средняя стоимость журнала по i-той тематике,

S - средняя стоимость всех журналов.

Средние величины рассчитываются на основе массивов данных подписки за предыдущие годы. Как показывает анализ, они оказываются достаточно стабильными, несмотря на ежегодное удорожание журналов.

Доля ассигнований, выделяемая на i - тое тематическое направление определяется как

,

где V - общая сумма средств, выделенных на заказ журналов.

Формирование оптимального заказа

Для формирования оптимального заказа необходимо численно выразить информативность каждого журнала и сопоставить с его ценой. Для определения информативности в системе БЕН РАН в настоящее время используются следующие данные:

.

В дальнейшем предполагается к этим данным добавить показатель цитируемости журналов по данным Института научной информации США.

Для обеспечения сравнимости различных показателей и удобства вычислений вместо абсолютных значений каждого показателя используются внутри каждого тематического раздела относительные величины. Кроме того, при расчетах учитываются поступления журналов.

В общем случае информативность каждого журнала (Ij) определяется как

Здесь символ "~ " над параметром означает его относительную величину; Ri - весовые коэффициенты, характеризующие сравнительную значимость того или иного параметра при вычислении информативности журнала. Выбор этих коэффициентов представляет отдельную задачу, и от него существенно зависит конечный результат.

В рассматриваемой модели показатель копирования с ВНП определен как базовая оценка и принят равным 1. Остальные коэффициенты (за исключением коэффициента при экспертной оценке) определяются через отношения соответствующих показателей к количеству копий, заказанных на ВНП.

Пользуясь данными, накопленными в АС НАУКА, можно получить списки журналов, ранжированные в порядке убывания их информативности. Вообще говоря, порядок следования журналов в этих списках зависит от весового коэффициента для экспертных оценок. Однако, как оказалось на практике, влияние этого коэффициента при реальных экспертных оценках незначительно (это объясняется тем, что более высокие оценки получают более спрашиваемые журналы). Выбор весового коэффициента для экспертных оценок определялся, исходя из опыта комплектования. В качестве модели оптимального комплектования был взят массив подписки на зарубежные журналы за 1990 год. Это было время наименьших финансовых ограничений и налаженных связей с достаточно большим количеством экспертов. Коэффициент, обеспечивающий максимальное соответствие рассчитанного по модели списка журналов подписки 1990 года, оказался равен 0,1.

Определение информативности и получение ранжированного (рекомендательного) списка журналов является начальным этапом процесса формирования заказа на журналы на следующий подписной год. В этом списке, как правило, содержатся журналы, имеющие достаточно близкую (или равную) информативность, но существенно различные цены, поэтому необходимо определить правила формирования из полученных списков окончательных заказов, т.е. установить порядок распределения средств внутри тематических групп. Для этого предлагается разделить ранжированные списки журналов на зоны комплектования [4] и использовать различные методы отбора изданий в заказ в зависимости от зоны комплектования.

Выделяются три зоны информативности:

Журналы из "ядра" должны включаться в заказ безусловно, журналы из активной зоны - выборочно, исходя из условий обеспечения максимальной информативности заказа.

Деление журналов на зоны осуществляется заданием процентов информативности "ядра" и активной зоны от общей информативности внутри тематических разделов.

Исходя из первоначально заданных границ зон, проверяется возможность включения в заказ всего "ядра". Если стоимость "ядра" превышает сумму ассигнований, то его границы уменьшаются до достижения заданной суммы, при этом происходит отсев менее ценных изданий внутри "ядра" по сравнению с теми, которые остаются.

Если границы "ядра" были уменьшены из-за недостатка денег, то при условии получения дополнительных ассигнований формирование следующего заказа начнется как продолжение предыдущего заказа и, в первую очередь, будет заполнено "ядро" до заданных границ.

В активную зону входят издания, стоящие в ранжированном тематическом списке после "ядра" до назначаемой границы информативности. В активной зоне издания ранжируются по увеличению их стоимости и включаются в заказ до исчерпания суммы, определенной для тематики и оставшейся после заполнения "ядра".

Оставшиеся от активной зоны какого-либо тематического раздела деньги передаются для другой тематики, в которой средств для заполнения активной зоны не хватает.

Моделированием формирования подписки на зарубежные журналы прошлых "благополучных" лет установлено, что оптимальной границей "ядра" являются издания из верхней части списка, имеющие до 40% информационной ценности.

Предложенная модель реализована в БЕН РАН с помощью специально разработанных в среде WINDOWS программных средств. В качестве входных данных используется информация, формируемая в АС НАУКА в процессе ее функционирования; величина ассигнований, выделенных на заказ изданий; граничные значения "ядра" и "активной" зоны. Результатом работы являются списки журналов, рекомендуемых для включения в заказ по каждому тематическому разделу. Программный комплекс допускает варьирование значений весовых коэффициентов. В процессе работы можно получить значения информативности любого журнала, абсолютные и относительные данные о спросе на отдельные журналы по всем каналам обслуживания, ранжированные в порядке убывания информативности списки журналов из фонда БЕН.

Отдельной проблемой, не охватываемой данной моделью, является заказ новых журналов. Он обычно осуществляется только на основе рекомендаций специалистов ознакомившихся с рекламными материалами. При наличии достаточного финансирования на заказ новых изданий выделяется некоторая отдельная сумма.

Литература:

  1.  Edward Evans. Developing Library and Information Center Collections.- 3rd ed.- Englewood, Col.: Libraries Unlimited, Inc., 1995. - P. 186-187.
  2.  Большой А.А., Захаров А.Г., Калёнов Н.Е. Информационно-библиотечные потребности ученых филиалов и научных центров АН СССР // Науч. и техн. б-ки СССР. - 1983. - № 8. - С. 13-18.
  3.  Указатель иностранных периодических изданий, выписанных централизованной библиотечной системой БЕН АН СССР в 1991 году. Ч.1. Алфавитный список. - М., 1990. - С. 348 - 354.
  4.  Столяров Ю.Н. Вторичный отбор.- Библиотекарь. - 1975. - № 6. - С. 55-56.
!29

А.Н. Ефимов, С.Б. Литвинюк

(Московский Государственный Университет Путей Сообщения)

ТЕХНОЛОГИЯ КОНТРОЛЯ И ИССЛЕДОВАНИЕ
ОШИБОК ПРИ АВТОМАТИЗИРОВАННОМ
ВВОДЕ И РАСПОЗНАВАНИИ ТЕКСТА
ДОКУМЕНТОВ

В докладе рассматриваются понятие "достоверности информации", классификация типов ошибок, возникающих в процессе работы программ оптического распознавания символов. Рассматриваются возможные методы поиска и исправления ошибок, возникающих на этапе ввода, а также производится сравнительный анализ эффективности методов их коррекции.

Одним из способов ускорения ввода информации, содержащейся на жесткой копии документа в вычислительную систему (например, для дальнейшей ее обработки) является сканирование - процесс, в результате которого получают растровый графический образ исходного документа. А затем, обрабатывая полученную информацию специальной программой распознавания текста - OCR (Optic Character Recognition), получают файл в удобном для последующей обработки формате. Однако существует множество проблем, связанных с искажением исходных данных, вводимых в ЭВМ. С развитием технологии автоматизированной обработки информации меняются и способы сбора, подготовки и ввода данных в ЭВМ, но, к большому сожалению, ошибки были всегда, и до настоящего момента проблема борьбы с ними остается открытой. Тем более, что вместе со сменой оборудования и технологии ввода информации изменяются характер и качество искажений.

Существует много определений понятия достоверности информации. В одних источниках под Достоверностью Информации понимают степень (или уровень) адекватного отображения ею реальных событий или процессов. В других - как свойство не иметь скрытых ошибок. Чтобы более точно определиться, какой смысл вкладывается в это понятие, необходимо ввести ряд терминов, тесно связанных и взаимоопределяющих друг друга.

Адекватное отображение - уточнение этого термина предлагает Ю.Н. Мельников [3], говоря о равенстве реальной информации некоторым истинным значениям в пределах заданной точности.

Под Ошибкой или Искажением обычно понимаются различие между реально существующим значением данных и истинным [6].

В системах автоматизированной обработки информации принято определение сообщения. Обычно под Сообщением понимают ту часть информации, которая переносится на машинный носитель и в последствии поступает в ЭВМ для дальнейшей обработки или хранения.

Для того, чтобы в дальнейшем не было путаницы, Документом назовем исходный материал (информацию), представленную в виде печатного листа - жесткой копии. А так как нашей целью является изучение процесса автоматизации ввода информации с документа в ЭВМ; и достоверность именно этой части информации нас интересует, то и сами определения Сообщения и Документа, в нашем случае, примем как тождественные.

Как же оценивать достоверность информации? Основным показателем достоверности информации принято считать вероятность появления в ней ошибок или связанную с ней очевидным соотношением степень достоверности информации (безошибочность информации) :

.

В [2] выделяются следующие основные причины искажения данных:

  1.  Несовершенство структуры системы обработки информации (сюда относятся, и недостатки технологического процесса обработки данных, и недостатки модели объекта управления);
  2.  Несовершенство алгоритмов, ошибки в программах, которые обрабатывают запросы на выдачу определенных сообщений;
  3.  Ненадежность работы оборудования;
  4.  Ошибки человека-оператора.

Тогда, принимая во внимание все вышеизложенное, будем придерживаться определения достоверности данных как их свойства адекватного отображения реального мира и оценивать ее с помощью вероятностей и.

Далее, необходимо определить влияющие на достоверность факторы. Авторами [3] и [9] предпринята попытка сгруппировать ошибки в информации по степени их влияния на показатели качества функционирования АСУ (по степени тяжести последствий от ошибок):

  1.  Ошибки, существенно не влияющие на качество функционирования системы;
  2.  Ошибки, приводящие к небольшому снижению качества работы системы (проявляются обычно в неверных действиях системы);
  3.  Ошибки, резко снижающие качество работы системы и тем самым приводящие к невозможности ее эксплуатации.

Возможна также классификация ошибок по месту их зарождения и месту их расположения. Такая классификация была предложена в [6]. Из нее следует, что по месту зарождения ошибки могут появляться на этапе заполнения входных документов (в нашем случае - это этап формирования и создания исходного документа), на этапе ввода информации в ЭВМ, а также на этапе машинной обработки.

Для того, чтобы определить свойства и типы ошибок, нам потребуются следующие определения:

Запись - структура, обычно содержащая определенное число компонент (полей) - реквизитов. Реквизиты в записи не обязательно должны быть одного типа.

Реквизит - некоторое поле, которое используется для различных объектов одного и того же типа.

Таким образом, запись можно представить в виде строки, состоящей из последовательности реквизитов.

Блоком записей можно будет назвать набор таких строк.

Разделяя ошибки по типам, авторы [1] и [8] выделяют символьные (семантические), форматные простые и форматные сложные (синтаксические). Форматные ошибки изменяют структуру и форму сообщения, нарушая его содержание. Для таких ошибок характерно [1] изменение значности (разрядности) реквизита (добавление или пропуск символов), появление "запрещенных символов" в реквизите, сдвиг реквизитов, нарушение макета информационного сообщения, изменение количества реквизитов в сообщении и т. п. Семантические ошибки, в свою очередь, делятся на орфографические, смысловые (корреляционные) и блочные.

Практически все авторы работ по проблеме достоверности информации единодушно отмечают, что основным источником ошибок является человек-оператор ЭВМ. А поскольку из всех этапов технологического процесса обработки данных в ЭВМ, самая большая доля труда человека-оператора приходится на этапе сбора и первичной обработки исходной информации, то этот этап и становится центром внимания при решении задач повышения достоверности информации в АСУ. По данным [4], [5] и [7] на этапе сбора, подготовки и ввода сообщений вносятся от 61% до 98% всех ошибок.

Результат распознавания

OCR-программой

Распознаваемый символ, повторенный

100 раз

при нормальном межсимвольном интервале

при межсимвольном интервале 25 пунктов

распознанный

символ

количество повторений символов

распознанный символ

количество повторений символов

"

0

"

ft

It

lf

ll

11

tt

tr

tf

0

44

7

12

7

7

8

3

27

^

^

/ \

А(русс)

Л

2

14

4

80

^

Л

0

100

ж

ж

2

13

ж

100

м

м

ьЛ

71

1

1

1

2

м

100

у

у

100

у

Y

0

99

ы

ы

78

22

ы

100

 

Таблица 1

В ходе выполнения экспериментов были выявлены устойчивые закономерности распознавания некоторых отдельных символов, а также их сочетаний. На основе обработки полученного материала была составлена таблица наиболее устойчивых результатов распознавания, фрагмент которой, приведен в Таблице 1. Этот фрагмент иллюстрирует поведение OCR-программы при распознавании текста, состоящего из 100 повторов одного и того же символа. Данный тест оказался весьма строгим и позволил выявить наибольшее количество символов, которые не могли быть распознаны правильно. Здесь же отмечается большое количество переходов одних символов в другие. Так, например, во второй строке таблицы представлено, как символ "кавычки" ни разу не был распознан при нормальном межсимвольном интервале, и в каком разнообразии вариантов этот же символ был распознан при увеличении этого интервала до 25 пунктов. Здесь и далее в таблице в столбце "Распознаваемый символ, повторенный 100 раз" перечислены отдельные символы или группы символов, в которые перешел исходный, а в столбце "количество повторений символов" указано число таких комбинаций, встретившихся в тестовом примере.

Для того чтобы разнообразие анализируемых переходов было разумным по объему, были введены строгие ограничения на качество тестируемого материала и на частоту появления ошибки. Таким образом, в статистических расчетах нашли отражение лишь наиболее часто возникающие ошибки.

Результатом анализа полученных экспериментальных данных стало выделение трех классов ошибок, возникающих в процессе работы OCR-программ:

  1.  Подмена символа;
  2.  Добавление символа;
  3.  Потеря символа.

При этом, если такая ошибка как подмена символа, чаще всего возникает из-за неправильного распознавания символа, и в результате, как правило, происходит подмена символа на другой - по начертанию схожий; например: "0" "О" (ноль в О); "О" русская в "O" латинскую; строчные буквы в заглавные и наоборот, то два других класса ошибок можно описать лишь статистически из-за большого разнообразия этих ошибок. Так, например, добавление символа чаще всего происходит из-за того, что при ошибке программы в подборе шага сравнения эталона с оригиналом, буква М может быть распознана дважды (по частям) как 1 и Л (действительно, похоже: ), что в результате дает на выходе два символа против ожидаемого одного.

Аналогично может произойти "объединение" нескольких соседних символов в один: 2U  W, или часто наблюдаются переходы 84 М. При распознавании очень мелкого шрифта (5 пунктов) строка из всех восьмерок давала устойчивый результат: 888 Ш. В этих случаях имеет место ошибка распознавания, приводящая к потере символов. Аналогичная ошибка происходит при игнорировании программой распознаваемого символа.

Для обобщения результатов, представленных в таблице, было предложено в качестве математической модели использовать граф, подобный известному в теории кодирования графу переходов разрешенных кодовых комбинаций в запрещенные [12]. Предложенный граф описывает характер и веса вероятностей переходов распознаваемого символа : самого в себя (правильное распознавание) ; в другой отдельный символ ; в набор (сочетания) символов ; потеря символа ,
где
, , и - веса соответствующих вероятностей переходов (См. Рисунок 1).

Такой граф соответствует каждой строке таблицы. Однако он по отношению к множеству повторенных экспериментов окажется устойчивым лишь при определенных условиях:

Изменение хотя бы одного из этих параметров может повлечь за собой изменения в весовой (вероятностной) картине приведенной таблицы.

Таким образом, можно составить целое дерево, описывающее зависимость вероятности появления ошибок при распознавании и параметров, характеризующих качество оригинала. Так если представить, что некий оригинал имеет набор характеристик , то есть , то для выборки из различных по своим параметрам оригиналов можно построить граф изменения вероятности распознавания символов (см. Рисунок 2.).

Для проведения анализа возможных ошибок введём понятие разрешенный алфавит, которым назовем набор символов, отвечающий определенным требованиям. Например, можно определить некий алфавит, как набор символов, состоящий только из кириллических заглавных букв. В этом случае аналогичные строчные буквы соответствовать данному алфавиту не будут. Таким образом, если разрешенным алфавитом для исходного документа является набор цифр, то с уверенностью можно заявить об имеющей место ошибке, если после операции распознавания на выходе появились любые другие символы, не принадлежащие этому алфавиту. Аналогичные заявления можно сделать и для таких разрешенных алфавитов, как буквы, знаки препинания, а также для смешанных алфавитов, представляющих собой набор из символов нескольких различных алфавитов. Всякий раз, когда на выходе системы распознавания будет появляться символ, не относящийся к известному, заранее определенному (разрешенному) алфавиту, можно гарантировать, что произошла ошибка распознавания.

Имеется вероятность возникновения такой ошибки, когда символ на выходе, распознанный неверно, будет принадлежать разрешенному алфавиту. Такого вида ошибки обнаружить гораздо сложнее. Подобное явление широко освещено в теории кодирования [12]. Так известно, что при передаче данных на расстояние, каждый байт дополняется контрольной суммой - битом, который принимает такое значение, которое приводит сумму всех значений битов в информационном байте к четному числу. Зная это правило, на принимающей стороне легко можно будет обнаружить однократную ошибку, которая переведет полученную сумму из четной в нечетную. Однако при возникновении двойной ошибки, которая может привести к восстановлению четности, доказать некорректность данных будет гораздо сложнее.

Из всего вышесказанного можно сделать заключение, что существует некий разрешенный алфавит, которому принадлежат символы исходного документа; существует некая программа, которая преобразует информацию из одного формата исходного документа в другой. Тогда, если на выходе программы преобразования возник символ, не соответствующий разрешенному алфавиту - можно констатировать факт возникновения ошибки. В случае, когда полученный символ принадлежит разрешенному алфавиту, необходимо будет предпринять ряд дополнительных мер для проверки качества распознавания. Цель проводимого исследования - оценить вероятности возникновения ошибок при распознавании и максимально конкретизировать причины их возникновения.

Литературы

  1. Бройдо В.Л. Достоверность экономической информации в АСУ. - Л., изд-во ЛГУ, 1984, 199 с.
  2. Мамиконов А.Г., Цвиркун А.Д., Кульба В.В Автоматизация проектирования АСУ. - М., ЭнергоАтомИздат, 1981, 328 с.
  3. Мельников Ю.Н. Учебное пособие по курсу "Основы построения АСУ". - М., МЭИ, 1978.
  4. Пивоваров А.Н. Опыт использования рациональных приемов и методов обеспечения достоверности обработки постоянной информации в АСУ. - Л., 1978.
  5. Пивоваров А.Н. К оценке искажений в реквизитах информации при обработке данных в АСУ. -Управляющие системы и машины, 1978, №2, с. 44-47.
  6. Пивоваров А.Н. Методы обеспечения достоверности информации в АСУ. - М., Радио и Связь, 1982, 144 с.
  7. Синавина В.С. Оценка качества функционирования АСУ. - М., Статистика, 1976, 136 с.
  8. Тимофеев Б.Б., Литвинов В.А., Методы обнаружения ошибок в алфавитно-цифровых последовательностях на этапе подготовки и ввода данных в ЭЦВМ. - Управление системы и машины, 1977, №4, с. 20-27.
  9. Шульц Я. Ограничения влияния ошибок входных данных в АСУ. - Podnikova organizace, 1976, V.30, #12, p 44-46. (ВЦП.№-А-47612).
  10. Резер В.С. Рациональный выбор параметров схем обработки первичной информации в подсистемах АСУ ЖТ. - М., Диссертация на соискание уч. степени Кандидата Тех. Наук, 1988.
  11. Журнал "МИР ПК", 7/91; 1/92; 12/95.
  12. Харкевич А.А. "Борьба с помехами", М.: Наука,1992. с. 192-195.
!35

А.Н. Ефимов, Я.М. Голдовский

(Московский Государственный Университет Путей Сообщения)

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ
ОПЕРАЦИЙ
НАД БАЗАМИ ДАННЫХ,
СОДЕРЖАЩИМИ ОШИБКИ

Рассматривается случай, когда над данными, содержащимися в БД реляционного типа, совершаются операции, необходимые для формирования ответа на запрос. Исходные данные содержат ошибки. Исследуются типы и количественные характеристики ошибок в результатах операций. Теоретические результаты сопоставляются с результатами моделирования.

Одним из важнейших критериев качества базы данных является достоверность сведений, получаемых пользователями системы. Обычно конечных пользователей интересует обработанная некоторым образом информация. Ошибки в ней являются следствием ошибок в хранимой информации, ошибок в алгоритмах обработки, отказов и сбоев аппаратуры. В докладе демонстрируется, что, даже при безупречной работе алгоритмов и аппаратуры, вероятность ошибок в обработанных данных может существенно отличаться от вероятности ошибок в самих данных и зависит от запросов, адресуемых к базе данных.

Анализируя различные ошибки в хранимой в базе данных информации, можно выделить три вида несоответствия между истинным содержанием базы данных и ее фактическим состоянием:

Был проведен анализ влияния ошибок в операндах на ошибку в результате при выполнении различных операций реляционной алгебры - объединение, пересечение, разность, произведение, ограничение по предикату и т.д. - для случая, когда только один операнд содержит ошибки только одного типа, ошибка типа "замена" только одна. При этом исследовались типы ошибок и их количественные и вероятностные характеристики.

Анализ показал, что:

С целью проверки достоверности и применимости полученных формул разработана программная модель, реализующая основные операции реляционной алгебры над массивами чисел, имитирующими отношения, хранящиеся в базе данных.

Проверка полученных формул расчета вероятности ошибки в результате операций реляционной алгебры по вероятностям ошибки в операндах с помощью программной модели подтвердила достоверность данных формул при вышеуказанных допущениях.

!30

И.В. Маршакова-Шайкевич

(ИГУиСИ МГУ им. Ломоносова, Москва)

ИСПОЛЬЗОВАНИЕ БАЗЫ ДАННЫХ
ISI/NATIONAL SCIENCE INDICATERS
В БИБЛИОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ
НАУКИ

I. К середине 90-х годов на информационном рынке баз данных появляется фактографическая база данных NATIONAL SCIENCE INDICATORS, продуцентом которой является филадельфийский Институт научной информации ISI (шт. Пенсильвания,США). Библиометрический материал, содержащийся в ней, сразу привлекает внимание многих мировых информационных служб, связанных с научным мониторингом, и начинает активно использоваться в наукометрических исследованиях, проводимых ими, целью которых является слежение за развитием отечественной, как правило, и реже - мировой науки, выявление вклада государственного сектора, университетов и различных фирм в общемировой прогресс науки. Необходимо подчеркнуть, что в это время исследования науки именно библиометрическими методами широко проводятся не только в США, но и в ряде стран Западной Европы (Нидерланды - Центр науки и техники при Лейденском университете, Франции - Марсельский университет, Испании - здесь даже появляются первые магистры и доктора в области библиометрии), а также Австралии и Индии. Безусловно, возможности библиометрического анализа расширяются, когда ученые имеют в своем распоряжении не только ежегодные библиографические базы данных, даже такие уникальные, как SCIENCE CITATION INDEX, SOCIAL SCIENCE CITATION INDEX, ARTS & HUMANITIES CITATION INDEX или JOURNAL CITATION REPORTS, но и кумулятивные базы данных за 15-летние периоды, включающие в себя обширный статистический материал по различным областям естествознания, социальным и гуманитарным наукам для более чем 100 стран.

К середине 90-х годов исследователям науки становится доступным широкий спектр баз данных ISI, различных как по типу информации, включенной в них, так и по временному охвату. Эти базы содержат библиографическую или статистическую информацию, реже - аналитическую, как для отдельных стран, так и для всего научного сообщества. Ниже представлены типы и некоторые имена баз данных ISI, доступных пользователям. (Сразу оговоримся, что заказчиками (покупателями) этих баз данных являются, как правило, государства в лице различных Комиссий по науке или министерств науки, крупные университеты или фирмы ; в Россия нет ни одной из нижеперечисленных баз данных (на 1997 год)).

SUMMARY DATABASES :

BIBLIOGRAPHIC DATABASES:

OTHER:

II. В докладе подробно рассматривается структура и тематическое наполнение кумулятивных баз данных NATIONAL SCIENCE INDICATORS on Diskette (NSIOD) пяти версий: от NSIOD,1981-1992 до NSIOD,1981-1996. Последняя база данных включает библиометрические показатели, выявленные при анализе более 9.5 млн. статей и 80 млн. ссылок; стоимость этой базы - 12 000 USD.

III. В заключение обсуждаются результаты библиометрического анализа вклада стран в общемировой прогресс, проведенного по материалам баз данных ISI NATIONAL SCIENCE INDICATORS 1981-1994 и RESEARCH FRONTS 1990. Основные выводы сводятся к следующему.

Страны со сложившейся научной системой - ведущие развитые страны показывают нормальное развитие науки с определенным стабильным процентом роста числа публикаций. Такие страны как США, Япония, Германия и Великобритания вносят значительный вклад в развитие всех областей естественнонаучного знания, в такой же степени это утверждение можно отнести к Франции и Канаде. Вклад СССР и России особенно ощутим в области физики, астрофизики, химии, молекулярной биологии и генетики, материаловедении, технических науках и науках о Земле. В этих областях знания на протяжении 80-х - начала 90-х годов СССР, и прежде всего Россия, занимали лидирующее положение в мировой науке.

Анализ вклада стран в развитие науки обнажил следующие тенденции.

В Европе: а) мощный рывок в науке делает Италия, особенно в таких областях как фармакология, биология и биохимия, астрофизика, физика, математика, и химия; б) из средиземноморских стран Испания по числу публикаций догоняет ведущие европейские страны.

Страны Дальнего Востока (китайской цивилизации), к которым относятся прежде всего Китай и, так называемые, "азиатские тигры" - страны, развитые в экономическом отношении: Южная Корея, Тайвань, Гонконг, Сингапур, достигают значительных научных успехов; это безусловно можно рассматривать как первые плоды культурной революции этих стран.

Богатые, малочисленные страны Аравии, и, прежде всего, Саудовская Аравия также начинают активно развивать науку. Можно отметить отдельные научные прорывы слаборазвитых стран в прикладные области знания, в частности, в ботанику и зоологию, сельскохозяйственные науки, иммунологию (в связи с борьбой со СПИДом, особенно актуальной в этих странах), фармакологию (связанную с выращиванием местных лекарственных растений).

При анализе вклада стран в развитие отдельных областей знания учитывалось два фактора:

  1. как развита данная отрасль науки;
  2. каков статус этой страны.

На этом фоне можно было пренебречь случайными колебаниями библиометрических показателей отдельных стран.

!31

В.Б. Сверчкова

(ИАПУ ДВО РАН, Владивосток)

ТЕЗАУРУСНЫЙ ПОДХОД К СОЗДАНИЮ
ИНФОРМАЦИОННОЙ МОДЕЛИ
НАУЧНОЙ ПРОБЛЕМЫ

Предлагается один из подходов к переориентации традиционного информационного поиска - создание информационной модели научного исследования, позволяющей ориентировать процессы поиска, отбора и хранения информации на машинную реализацию.

В основе модели - древовидное представление научной проблемы, отличающееся тем, что формируются 2 дерева, каждое из которых составляют усеченные схемы пертинентных областей знаний, представляющих по отдельности теоретическую и прикладную базу научного исследования. Ветви деревьев формируются в процессе декомпозиции каждой дисциплины в отдельности по родо-видовым связям между составляющими ее понятиями. Каждый уровень иерархии оценивается по критериям достаточности и необходимости. После чего принимается решение о дальнейшем расширении иерархии. Завершающим этапом является формирование концевых вершин, являющихся неделимыми элементами данной модели.

В результате получаем два дерева: дерево теоретических оснований и дерево прикладных оснований научной проблемы. Концевые вершины деревьев определяют строки и столбцы матрицы - информационной модели научного исследования. Каждая клетка матрицы заполняется парой нормализованных терминов, представляющих сочетание теоретического и прикладного аспектов для соответствующего понятия модели (соответствующей концевой вершины каждого из деревьев).

Эти термины составляют основу проблемно-ориентированного микротезауруса. Ассоциативные отношения между терминами для каждого дерева формируются в результате анализа междисциплинарных и межпредметных связей понятий и фиксируются в бинарных матрицах, углубляя микротезаурус. Расширение микротезауруса достигается введением синонимов дескриптора в каждую словарную статью.

Таким образом формируется проблемно-ориентированный информационно-поисковый язык, тезаурус конкретного научного исследования.

В процессе создания такой информационной модели участвуют как информационный специалисты, выступающие в роли инженеров знаний, так и исполнители НИР в качестве экспертов.

Предлагаемое информационное моделирование научной проблемы способствует эффективной машинной реализации автоматизированной информационной системы, а также качественному отбору и полному использованию научной информации из национальных информационных ресурсов и доступных зарубежных баз данных.

!32

Е.Н. Васина, О.Л. Голицына, Н.В. Максимов

(РГГУ, Москва)

ОРГАНИЗАЦИЯ ЧЕЛОВЕКО-МАШИННОГО
ПОИСКА ИНФОРМАЦИИ В КОМПЛЕКСНЫХ
БАЗАХ ДАННЫХ

Современные автоматизированные поисковые системы (АИПС), и, в первую очередь, те, которые предназначены для обработки вторичной информации, в большинcтве своем используют в качестве средства доступа к документам термины (ключевые слова, рубрики, заголовки).

Концептуальной основой поиска информации в таких АИПС является предположение, что существуют единые (симметричные) методы формирования тематического описания предмета документа и запроса. Под "темой" обычно подразумевается совокупность понятий, каждое из которых задается упорядоченной совокупностью возможно взвешенных терминов, обозначающих объект или аспект его описания в документе. Таким образом, при поиске соотносятся заданные на множестве терминов базы данных логические выражения понимания индексатором темы документа с выражением понимания потребителем темы запроса.

Учитывая вероятностный характер поиска, обусловленный, в первую очередь, субъективностью построения поисковых образов, сходство между которыми может трактоваться достаточно широко, а также предопределенность вопросно-ответного сценария с жесткой ориентацией на формирование "наилучшего" и "окончательного" поискового образа по запросу, следует констатировать, что средствами традиционных ИПЯ, ориентированных на поиск "по вхождению", построить поисковое предписание, которое обеспечивало бы высокие показатели качества поиска, достаточно трудно даже для профессионала-информационщика.

Определяя требования к АИПС и учитывая реальность практического использования баз данных непрофессионалами, для которых система может провести поиск не лучше, чем они сформулируют запрос, можно сказать, что:

Основные положения организации человеко-машинного поиска в документальных БД реализованы в АИС IRBIS v 2.1, предназначенной для многофункциональной обработки баз данных разнородных документов.

В системе предусмотрены три способа формирования поискового запроса:

1) язык логических выражений, включая упрощенный сценарий пошагового уточнения запроса;

2) QBE - формулировка задания поисковых выражений по отдельным полям, объединяющимся средствами языка формы документа, в том числе с разновидностью весового поиска "по подобию полей" - аналогов конкретного документа;

3) язык-процесс последовательной кластеризации лексического и документального пространства. При этом пользователь, не вводя логические и другие операторы, а используя только контекстную информацию индексирования документов, получает упорядоченные выдачи.

Т.о., классическая схема поиска документов "по запросу-выражению" расширена до динамически управляемого процесса кластеризации пространства документов и терминов.

Такой процесс обеспечивает реформулировку исходного запроса, сводящуюся к автоматическому формированию задаваемых дескрипторами аспектов проблемы, построенному как на кластеризации контекстного поля (терминов и документов), для чего используются данные обратной связи (оценка выдачи и ранжирование словников), так и на использовании структуры семантического пространства, зафиксированной в рубрикаторах, тезаурусах и документах базы данных.

Несмотря на то, что основной задачей поискового интерфейса является нахождение путей к документу и получение текста, в контексте двойственности цели поискового процесса процедурный интерфейс IRBIS обеспечивает симметричность возможностей: при подготовке ПП можно формировать файл документальной (текстовой) части результата, а при формировании результата (поиске, просмотре, реформулировке запроса) - строить запрос.

Такой подход не заставляет пользователя заботиться об отложенных действиях при оперативной работе с запросом и результатами. При этом процесс поиска построен по принципу "расходящихся кругов", основная задача которого - поиск центров активации искомого образа в семантической сети БД, т.е. построение цепочек документов, которые в свою очередь могут послужить мостом к понятиям (документам), не содержащим терминов исходного запроса.

!33

В.П. Захаров, А.Ц. Масевич

(БАН, Санкт-Петербург)

АКТУАЛЬНЫЕ ПРОБЛЕМЫ
ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ
АВТОМАТИЗИРОВАННЫХ СИСТЕМ
КРУПНЫХ БИБЛИОТЕК РОССИИ

К сфере лингвистического обеспечения мы относим три основные задачи, которые должны решаться при создании любой автоматизированной библиотечной системы - структуризация библиографической записи, индексация библиографической записи средствами информационно-поискового языка и представление библиографической записи.

Таким образом, под лингвистическим обеспечением (ЛО) следует понимать совокупность средств естественного и искусственных языков, применяемых в АИПС для структуризации, индексации, поиска и представления библиографических записей.

Как представляется, эти три составляющих ЛО присутствуют в любой информационной системе, независимо от ее технической базы - от карточных каталогов и печатных библиографических указателей до новейших информационных систем.

Отметим при этом, что проблемы теории лингвистического обеспечения нами в настоящем материале подробно не рассматриваются, т.к. эти вопросы требуют специальной детальной публикации. Просто перечислим те из них, которые нам представляются особенно существенными.

1. Вопрос о "предмете документа", дефиниции, когнитивно-лингвистический и философский аспекты проблемы.

2. Проблема "адекватности" при функционировании любого ИПЯ, и вообще в библиотечно-библиографических процессах. Сюда, в частности, следует отнести и проблему полноты/краткости библиографической записи.

3. Контекстуальная субъективность при индексации и библиографическом поиске документов, устойчивость и последовательность описания и индексирования документа.

В настоящей статье мы касаемся только 2-х вопросов, связанных с ЛО - нашего подхода к проблемам машинного формата и индексации библиографических записей, а также отдельных вопросов, касающихся организации работы над созданием лингвистического обеспечения информационной системы БАН. Как раз с одной из организационных проблем хотелось бы начать.

На наш взгляд, один из наиболее сложных вопросов - это организация работы по созданию АИБС вообще и их ЛО в частности.

Когда говорят о решении проблемы автоматизации крупных библиотек, в качестве основной (и в представлении многих едва ли не единственной) трудности называются вопросы экономики. У специалистов по технике и программированию, особенно у тех, кто впервые сталкивается с библиотекой, часто возникает иллюзия, что автоматизация библиотеки - концептуально несложная задача, требуются лишь деньги, чтобы ее реализовать. Как говорил дон Базилио из "Севильского цирюльника": "Вы дайте денег, а я вам все устрою.".

Нам представляется, что даже на уровне проектирования системы возникает ряд проблем, который следует отнести к области социальной психологии.

Во-первых, это хорошо известный конфликт между "радикалами и консерваторами". Позволим себе процитировать несколько строк из речи бывшего директора Баварской государственной библиотеки Франца Георга Кальтвассера, опубликованной в библиотечном журнале "Zeitschrift fur Bibliothekswesen":

"[Автоматизация библиотеки была] совсем не легкой задачей потому, что многим сотрудникам, которые хотели бы оставить все как есть, приходилось объяснять, что их работа имеет будущее только при использовании новых технических средств. С другой стороны, чересчур рьяным технократам надо было дать понять, что они своей грубой сенокосилкой, которой я бы уподобил созданную без должного понимания и чрезмерно упрощенную АИПС, не должны стричь клумбу редких цветов".

Сегодня эта проблема возникает в новом ракурсе. Уже не осталось, пожалуй, даже среди представителей самого старшего поколения библиотекарей таких, кто выступал бы против автоматизации вообще. Проблема состоит скорее в том, что программисты часто плохо представляют себе, что именно они должны сделать, а библиотекари, плохо представляя реальные возможности автоматизации вообще и в конкретной библиотеке в частности, во-первых, не умеют внятно объяснить, что нужно сделать, во-вторых, имеют неадекватные ожидания, приводящие, разумеется, к разочарованиям.

Часто те и другие претендуют на главную роль в разработке системы, роль ее идеолога. При этом, как мы попытаемся показать ниже, библиотекари часто настаивают на механическом следовании традиции докомпьютерной библиотеки или на весьма субъективных, часто неполных или эклектических представлениях об автоматизированных системах.

Программисты, напротив, часто игнорируют библиотечную традицию, считают многие реалии библиотечного дела глубокой архаикой и норовят стричь клумбу редких цветов".

Во-вторых, создание системы и ее ЛО - работа междисциплинарная. Следовательно, в ней должны участвовать различные специалисты. Взаимопонимание и координация работы таких междисциплинарных групп часто представляет собой проблему. Кроме этого, сегодня необходимость обмена данными ясна каждому - это требует взаимодействия различных библиотек. Эта проблема находит отражение в литературе. Сошлемся здесь на статью: Kaiser A. Computer supported cooperative work: Moderscheinung oder Paradigma // NfD. - 1994. - №5.

Эта статья посвящена новому направлению в информатике - Computer supported cooperative work (CSCW), которое определяется как использование компьютерной среды группой лиц или организаций для решения некоторой общей задачи. Иногда в литературе используется термин groupware по аналогии с software - некоторая концепция групповой компьютерной разработки.

Перейдем теперь к двум основным элементам ЛО АИБС.

Структура записи. К проблеме машинного формата библиографической записи существует разное отношение.

Многие библиотеки (и БАН в т.ч.) считают необходимым применение формата типа MARC. Однако среди сторонников MARC'а также существуют разногласия о том, какую версию MARC следует принять.

Некоторые считают целесообразным принять за основу одну из существующих версий, например, USMARC, UKMARC или UNIMARC. Кстати, о недостатках и преимуществах каждой из них ведутся эмоциональные и малопродуктивные споры. Слишком большая приверженность какой-либо одной версии (например, многие у нас в БАН считают UKMARC - единственно возможным решением) - это, на наш взгляд, пример "библиотечного" подхода к проблеме.

Существует также мнение, что следует разработать собственную версию MARC - RUSMARC - национальный формат.

Известна и еще одна точка зрения - согласно ей MARC (любой версии) вообще представляет собой архаизм, создание которого связано в основном с такими малоприменяемыми сегодня носителями информации, как магнитные ленты. Противники MARC'а видят в его довольно сложной структуре источник ненужных трудностей при создании записи. При этом, считают противники MARC, разработанная техника конвертирования записей позволит при необходимости получать библиографические записи в любом из видов MARC. В этой точке зрения мы видим некоторую категоричность программиста.

Мы считаем использование MARC необходимым по следующим причинам.

MARC - это логическое продолжение истории традиционного библиографического описания. В нем обобщен опыт многих поколений каталогизаторов.

MARC - это, помимо всего прочего, мощный информационный язык, который может быть охарактеризован в терминах лингвистики следующим образом:

Использование и интерпретация формата MARC в библиотечной практике соответствует лингвистической прагматике.

Наконец, существенным моментом является необходимость учесть то обстоятельство, что в ходе внедрения MARC в конкретной библиотеке рассматривается ряд решений, специфичных исключительно для нее.

Если продолжить использование нашей лингвистической метафоры, то в данном случае можно говорить о "диалекте" языка формата. "Диалект" языка формата неизбежно возникает при использовании той или иной версии MARC в конкретных условиях конкретной библиотеки. На наш взгляд, возникновение "диалектов" формата абсолютно неизбежно и обязательно должно учитываться при работе над лингвистическим обеспечением.

При этом мы считаем, что различия между отдельными версиями MARC не носят принципиального характера.

В БАН принято решение использовать UNIMARC в качестве основы для формата машиночитаемой библиографической записи. Вот основания нашего решения:

При создании библиографических записей в UNIMARC неминуемо встанет и вопрос авторитетного контроля - создание авторитетного файла - еще одна сложная и трудоемкая задача, которую вряд ли может решить отдельно взятая библиотека. Кстати говоря, в известных нам российских системах (ГПНТБ, БЕН) авторитетный файл вообще не предусмотрен.

Сегодня в библиотеке начата работа по созданию ИПС "Новые поступления иностранной литературы в БАН", которая должна стать моделью будущего электронного каталога. На ней уже отрабатывается структура и выходной формат записи.

Информационно-поисковый язык. Особенно важной представляется нам задача содержательного раскрытия фондов. Эта задача связана с индексацией библиографических записей. Нам представляется единственно целесообразным использовать предметный вход в электронный каталог. Здесь, однако, перед нами встает проблема информационно-поискового языка.

В БАН отсутствует предметный каталог - нет традиции предметизации документов. Ведется только систематический каталог, организованный по ББК. По проблемам систематического каталога вообще и ББК в частности существует достаточно много работ. Как правило, в этих работах ББК оценивается с точки зрения удобства ее использования для индексатора - возможности выразить средствами индекса "предмет документа". Однако нет, кажется, ни одной которая бы хоть в какой-то степени оценивала бы эту классификацию в качестве поискового средства.

И действительно, оценка эффективности поиска в традиционном карточном каталоге большой библиотеки невозможна. Широко известно, однако, что классификации практически нигде не используются в качестве ИПЯ. Можно представить себе использование классификации в качестве вспомогательного средства поиска (например, для создания контекста по предметной рубрике или ключевому слову). В отдельных случаях (например в Библиотеке Конгресса США) классификация используется для расстановки книг на полке.

Но тогда что же должно быть использовано в качестве ИПЯ?

Сегодня можно рассмотреть несколько вариантов. При этом мы исходим из двух предпосылок:

1. Создание ИПЯ трудоемкая и дорогостоящая работа. Не следует обольщаться, что есть какие-то быстро реализуемые варианты. Их нет. И разработка системы индексов при создании ИПС, и содержательное индексирование документов при ее ведении - это "узкое бутылочное горло" в теории и практике автоматизированных ИПС, одна из тех операций, которые, несмотря на обилие разработок по автоматическому индексированию, вряд ли будет в ближайшее время полностью доверена машине.

2. ИПЯ должен быть предметизационного, а не классификационного типа. Наиболее передовые библиотеки мира пользуются именно такими ИПЯ.

Итак, возможны следующие подходы к созданию ИПЯ для электронного каталога БАН.

1) В настоящее время в Российской национальной библиотеке осуществляется работа по созданию авторитетного файла предметных рубрик (ПР) на основе рабочей картотеки ПР предметного каталога РНБ. РНБ является владельцем уникального предметного каталога, содержащего около 2.5 млн. предметных рубрик. В настоящее время обсуждается вопрос о принятии федеральной программы создания национального списка и авторитетного файла предметных рубрик на его основе. Однако, существующий список ПР требует огромных затрат по его редактированию и созданию авторитетного файла. БАН мог бы принять участие в такой федеральной программе.

2) Одна из французских систем предметизации - RAMEAU - предусматривает использование ПР Библиотеки Конгресса США, разумеется, с переводом их на французский язык. При Библиотеке Конгресса есть ассоциация пользователей ее ПР, причем при редакции списка учитываются пожелания и добавления, поступившие от ее членов. Условия вступления в эту ассоциацию необходимо уточнить. Здесь потребуются весьма значительные трудозатраты на перевод ПР Библиотеки Конгресса, на освоение методики индексации. Однако такое решение было бы дополнительным фактором интеграции БАН в мировую информационно-библиотечную систему.

3) Можно также использовать опыт создания тезаурусов на основе классификационных систем. В качестве источника такого дескрипторного языка может служить ББК. Аргументом в пользу такого решения является то обстоятельство, что в БАН имеется группа специалистов, много лет профессионально работавших с ББК. На базе словесных формулировок классификационных делений может быть разработан дескрипторный язык, который в дальнейшем будет использоваться как основной ИПЯ электронного каталога БАН. Кроме того, подобная работа уже несколько лет ведется в Российской государственной библиотеке. При таком подходе ценным и интересным может оказаться опыт РГБ.

4) Наконец, существует еще один подход - выделение ключевых слов из заголовков и/или аннотаций. Метод поиска по ключевым словам из заглавий - KWIC (Key Words in the Context) получил в литературе характеристику "быстрый и грязный". Использование ключевых слов из заглавий может представлять некоторую ценность лишь как дополнительный источник тезаурусной лексики, причем скорее всего только для технической и естественнонаучной литературы.

Предлагаемые подходы необязательно альтернативны, они могут дополнять друг друга.

Кроме того, прежде чем принять решение о создании ИПЯ, следует отчетливо представить себе концепцию системы, в данном случае что, как и с какой целью мы собираемся индексировать, в частности:

Подведем некоторые итоги.

Создание ЛО АИБС крупной универсальной библиотеки - трудоемкая и требующая значительных материальных затрат задача. По своей экономической емкости она сопоставима с приобретением техники, приобретением (или разработкой) и освоением сложного программного обеспечения.

Однако, помимо чисто экономических проблем, существуют и другие факторы, тормозящие разработку ЛО, а, следовательно, и автоматизацию библиотек. Среди них:

!34

И.Н. Жиганов, В.Д. Мильграм

(ООО "Биоинформсервис")

ОПЫТ ОРГАНИЗАЦИИ КОМПЛЕКСНОГО
ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ
В ОБЛАСТИ НАУК О ЖИЗНИ

В рамках Государственной научно-технической программы "Средства обеспечения исследований в области физико-химической биологии и биотехнологии" (руководитель академик РАН Д.Г. Кнорре) в 1992 г. выделено специальное направление "Информационное обеспечение и поддержка исследований", одной из основных задач которого является организация работы биологической научной сети в России.

Во всем мире все более возрастает необходимость в доступе к достоверной и современной информации в области наук о жизни и биотехнологии. В последние годы в странах бывшего СССР наблюдается дисбаланс между высоким уровнем научных исследований и разработок в области наук о жизни и биотехнологии и низким уровнем их информационного обеспечения. В современных условиях нестабильной экономики и слабого финансирования науки в странах СНГ возникла особая необходимость в оперативном доступе к информации о научных фондах и финансировании научных исследований, что особенно важно для сохранения научных кадров.

Состояние развития информационной инфраструктуры в СССР, и особенно телекоммуникации, всегда было недостаточным. В настоящее время, как следствие проблем перестройки экономики и общественной жизни, нарушена координация исследований, разрушены многолетние связи и кооперация между научными сотрудниками и организаторами науки. Деятельность многих информационных служб как головных, так и ведомственных, по разным причинам практически остановлена. И хотя в настоящее время только в Москве начали функционировать несколько телекоммуникационных систем, они рассчитаны на потребителя, способного оплачивать такие услуги по коммерческим ценам, и поэтому недоступны для работников науки и высшей школы и других видов "некоммерческих" пользователей. Жизненно необходимо искать новые, нетрадиционные источники информации и способы коммуникации между российскими учеными и их коллегами, как внутри СНГ, так и за рубежом. Таким образом, необходимость создания в России хорошо развитой Региональной информационной службы по наукам о жизни и биотехнологии для решения важнейшей задачи организации обмена биологической информацией и предоставления доступа к важнейшим источникам международной и отечественной научной информации для широкого круга научных работников очевидна.

Для координации всех работ по информационному обеспечению было создано малое предприятие (ныне Общество с ограниченной ответственностью) "Биоинформсервис", выполняющее функции головного предприятия по направлению "Информационное обеспечение и поддержка исследований".

Технически создаваемая биологическая научная сеть Биосеть представляет собой автоматически действующий узел Internet, работающий внутри России через другие узлы Internet (коммуникационные сети Гласнет, Релком) или непосредственно с региональными и доменными узлами Биосети, создаваемыми в рамках проекта. Система является открытой для расширения, и поэтому дополнение новых узлов или отдельных пользователей не приведет к остановке или перестройке ее работы.

При выборе организаций-исполнителей учитывалось наличие в их распоряжении информационных и коммуникационных ресурсов, опыта информационного и сетевого обслуживания, а также наличие квалифицированного персонала.

В соответствии со структурой Программы финансировались следующие НИОКРы:

Биосеть начала функционировать как домен из 11 сетевых адресов:

Описание узлов Биоинформсети дано на примере узлов в НИИ ФХБ им. А.Н. Белозерского и Биотехнологическом центре Санкт-Петербургского университета как наиболее продвинутого в техническом и информационном плане.

1. E-mail сервер (SERVE@INDY.GENEBEE.MSU.SU) обеспечивает поиск по банкам последовательностей и третичных структур биополимеров, а также и некоторые другие процедуры биокомпьютинга. В настоящий момент на сервере представлены следующие виды обработки:

а) поиск по ключевым словам (словам описаний и их комбинациям);

б) поиск участков сходства (быть может неточного) с паттерном (консенсусом);

в) поиск гомологий относительно последовательности или выравнивания (такой поиск может идти с учетом нескольких матриц весов замены остатков);

Сервер обеспечивает регулярное обновление и хранение в специальном формате следующих банков данных: нуклеотидных последовательностей (GenBank), белковых последовательностей (SwissProt) и банка третичных структур биополимеров (PDB). В настоящее время сервер доступен для любого пользователя сети Internet через электронную почту (SERVE@INDY.GENEBEE.MSU.SU). Подготовлен 1-й вариант WWW-сервера, работающего по HTTP протоколу (WWW.GENEBEE.MSU.SU), который будет включать также и дополнительные виды биокомпьютерной обработки:

Для работы сервера частично были использованы вычислительные программы из пакета программ GeneBee для IBM PC, частично были написаны новые программы графической станции INDY и для транспьютерного комплекса. Формирование поступающего по электронной почте запроса на обработку может производиться либо с помощью установленного на компьютере пользователя пакета программ GeneBee (программы-клиента), либо формироваться по файлу-образцу. В случае обращения к WWW-серверу, запрос формируется пользователем в интерактивном режиме, с помощью предоставляемого сервером меню, отображаемого на компьютере пользователя WWW-клиентом (Mosaic, Netscape, Lynx).

Ежедневные обновления банка нуклеотидных последовательностей (GenBank) перекачиваются на сервер каждые 12 часов в автоматическом режиме. Данные поступают из FTP-сервера Национального центра биологической информации при Национальном институте здравоохранения США (NCBI-NIH) и архивируются в единую базу данных на центральном компьютере комплекса - графической станции INDY. Каждый новый выпуск полного GenBank'а также автоматически перекачивается по FTP и архивируется, проводя тем самым синхронизацию накопленного материала. Другие два банка (SwissProt и PDB) автоматически обновляются по мере появления их очередных версий на соответствующих FTP-серверах.

Взаимодействие конечных пользователей с сервером (GeneBee-NET) происходит по схеме клиент - сервер. Пользовательский компьютер (IBM-совместимый) снабжается программой-клиентом, позволяющей в графическом и псевдографическом режимах составлять задания на обработку, связываться с сервером по электронной почте или HTTP протоколу, получать результаты обратно и, наконец, манипулировать полученным результатом обработки.

2. Узел Биоинформсети в Биотехнологическом центре СПГУ.
Исполнитель - Биотехнологический центр СПГУ.

Первый из региональных узлов "Биоинформсети" начал функционировать в Санкт-Петербурге. Большинство институтов Санкт-Петербурга крайне заинтересовано в работе Биоинформсети, так как имеют ограниченный доступ к другим источникам информации. Поскольку этот региональный узел имеет выход в Internet, экономически оптимальным для него (при наличии льгот) является получение информации из баз данных STN International, доступ к которым обеспечивается Московским информационным центром РАН-СТН и МПП "Биоинформсервис". В связи с этим очевидна актуальность задачи поддержания функционирования и дальнейшего совершенствования работы узла в Санкт-Петербурге, с одной стороны, поставляющего биологическую информацию пользователям по электронным сетям, а с другой - связывающегося с Центральным или другим узлом в Москве и другими узлами сети Internet, располагающими небесплатной информацией.

Узел Биоинформсети предоставляет пользователям по электронным сетям:

Результаты поиска сходных последовательностей по банкам последовательностей биополимеров с помощью программ FASTA, BLAST и программ пакета Genebee.

В настоящее время СПГУ имеет IP-подключение к глобальной сети Internet (адрес 193.124.85.210 или hq.lgu.spb.su). Это значительно повышает возможности узла по оказанию информационных услуг пользователям.

3.Узел Биоинформсети в Институте молекулярной биологии РАН. Исполнитель - Институт молекулярной биологии РАН

Узел в ИМБ предоставляет услуги пользователям как из ИМБ РАН, так и пользователям из Института кристаллографии, Центра "Биоинженерия" РАН, Института биологии гена, Института общей генетики РАН и Института биологической и медицинской химии РАМН. Для конечных пользователей сети реализована возможность доступа к ресурсам Internet через новые информационноемкие технологии с современным интерфейсом (WWW, MIME, Netscape). Для сетевых узлов введены таблицы маршрутизации и таблицы Domain Name Service (DNS). Выполнялась регулярная профилактика операционной системы централизованного узла (backup, контроль задействованных пользователями ресурсов, постановка новых версий программного обеспечения), а также проводились консультации и занятия, организован семинар.

Узел Института молекулярной биологии РАН включен в режим GateWay, т.е. организована маршрутизация пакетов информации для узлов, не принадлежащих Институту (с подключением новых удаленных узлов). Авторизованы пользователи из ИМБ и других учреждений РАН. Локальная сеть расширена посредством высокоскоростной связи (10 МБит/сек) по коаксиальному кабелю. В течение года подключено два новых сегмента локальной сети, установлены 24 новых домена в разных зданиях Института. Существующие четыре сегмента сети объединены через центральный роутер TCP/IP. Подобная топология сети стала de facto стандартом для создания единого информационного пространства в большинстве научных учреждений в странах с высоким уровнем развития информационных технологий.

Осуществлена установка программного комплекса DNS: серверной части BIND (Berkley Internet Name Domainserver) - на UNIX-компьютерах и клиентной части - на узлы локальной сети. Установлены серверная часть IMAP (Internet Mail Access Protocol) на центральном UNIX-компьютере, клиентная часть протоколов IMAP и NNTP (News Network Transfer Protocol) на узлы локальной сети, а также клиентная часть HTTP (Hyper Text Transfer Protocol) на графическую станцию Silicon Graphics (Mosaica).

Проведена адаптация программных комплексов молекулярной механики ICM и ZMM для графической станции Silicon Graphics 4D/70 GT. Проведена адаптация для этой станции графического пакета программного комплекса ICM. Были осуществлены занятия с пользователями по комплексу ICM (обучение командному языку, работа с меню).

Поддеpжка и использование баз данных
и дpугих видов инфоpмационного сеpвиса

В настоящее время работы по информационному обеспечению разделились на два направления:

Анализ этих ресурсов показал наличие достоинств и недостатков у обоих типов ресурсов, однако в любом случае их нельзя рассматривать как альтернативные. Пеpвое напpавление использует уже сложившиеся инфоpмационные технологии (Сurrent Contents on Diskettes и Science Citations Index, онлайн доступ через соответствующего провайдера).

Поддержка и использование баз данных Информационное обеспечение исполнителей ГНТП, составляющих приоритетное направление "Науки о жизни и биотехнология", проводилось на некоммерческой основе с использованием ресурсов, имеющихся в распоряжении Институтов РАН, МГУ и "Биоинформсервис". Особое внимание уделялось кооперации с организациями-поставщиками баз данных (Институтом биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова, Московским информационным центром РАН-СТН, НИИ физико-химической биологии МГУ), которые получали финансовую поддержку из различных источников, в частности РФФИ и Фонда Сороса. Такой подход позволил использовать с максимальными скидками платные базы данных, которые имеют гарантированную полноту охвата материала, развитые системы индексации и поисковых команд.

Учебно-научный центр при ИБХ РАН проводил обслуживание участников госпрограмм на основе баз данных Current Contents, Dervent Biotechnology Abstracts, Medline (на компакт- и флоппи-дисках). К текущей информации из этих баз обращались пользователи из 22 организаций Москвы, Пущино, Новосибирска, Санкт-Петербурга и Саратова. Исполнители - МИЦ РАН-СТН, МП "Биоинформсервис".

Обслуживание с передачей файлов по электронной почте и/или на дискетах проводилось на основе баз данных Biological Abstracts, Chemical Abstracts и Medline в системе STN International, которая предоставила пользователям России значительные скидки. Информацию из этих баз данных получили 30 научных организаций Москвы, Пущино, Санкт-Петербурга, Саратова, Владивостока и других городов России.

Функционирование библиотечного
узла Биоинформсети

Продолжалось информационное наполнение библиотечного узла системы. По мере централизованного поступления информации в академические библиотеки через БЕН РАН отбирались, вводились в компьютер и передавались по электронной почте для ввода в библиотечный узел библиографические описания непериодических изданий по биологии и данные о поступивших журналах. В течение 1995 года в библиотечный узел введено описаний более 500 отечественных и 1000 зарубежных книг и данные о поступлении 20000 выпусков журналов.

Работы по издательской деятельности
Исполнитель - ООО "Биоинформсервис"

В рамках этого проекта расширена издательская база, приобретены лазерный принтер и копировальный аппарат RICOH FT 2260. Продолжено издание методических руководств по поиску информации в базах данных системы STN International: опубликована брошюра "Базы данных STN (краткое описание и кластеры)", подготовлены к изданию - "Поиск патентной информации" и "Поиск в базе данных Chemical Abstracts". В стадии переработки и дополнения находится "Общий справочник организаций, выполняющих работы по физико-химической биологии и биотехнологии, финансируемых Миннауки РФ". С 1995 г. начато издание журнала "Обозрение по генной инженерии и биотехнологии". Подготовка издания осуществляется под эгидой Всероссийской общественной организации "Академия биотехнологии" и ГНТП "Средства обеспечения исследований по физико-химической биологии и биотехнологии" (исполнитель "Биоинформсервис") при поддержке Миннауки РФ. Журнал издается на русском языке и соответствует англоязычному варианту "Genetic Engineering and Biotechnology Monitor", выпускаемому ЮНИДО. Первый номер выпущен тиражом 400 экземпляров. В целях ознакомления и привлечения подписчиков 300 экземпляров журнала направлены в Научные советы по ГНТП, научные, производственные и общественные организации, а также в учебные учреждения Минвуза РФ. Планируется продолжение выпуска информационного бюллетеня по ГНТП и журнала "Обозрение по генной инженерии и биотехнология", а также издание бюллетеня по законченным разработкам.

Дальнейшие перспективы

1. Расширить разработки по поддержанию сетевых узлов, в частности оказать поддержку их организации в Казанском университете, Саратове и Новосибирске.

2. Продолжить работу по обеспечению участников госпрограмм научно-технической информацией. Предусмотреть возможности приобретения лицензионных ресурсов Биоинформсети, так как доступ к используемым в настоящее время ресурсам в значительной мере определяется льготами, предоставляемыми зарубежными партнерами.

3. В узле при Институте молекулярной биологии РАН провести установку и обучение конечных пользователей новым информационным технологиям с современным интерфейсом (WWW, MIME, Netscape). Осуществлять поддержку дальнейшего развития локальной сети ИМБ с подключением новых сегментов домена, а также установления нового высокоскоростного соединения с сетевым координационным центром в ИОХ РАН (радиомост со скоростью 2 Мбит/сек между среднеудаленными доменами).

4. Увеличить число провайдеров (коммуникационных посредников). В частности, целесообразно построить работу регионального узла в СПГУ на базе открытого в 1995 г. отделения сети STN Санкт-Петербурга. Это позволит расширить возможности доступа к базам данных этой сети, сократить расходы на оплату коммуникаций и время получения информации.

5. Подготовить и издать каталог программных и информационных продуктов, представляющих интерес для пользователей, ведущих исследования в рамках ГНТПР, входящих в приоритетное направление "Науки о жизни и биотехнология".

!37

 

IREX INTERNET PROJECTS

Телекоммуникационные проекты

В дополнение к профессиональным обменам в течение последних пяти лет IREX активно разрабатывает и проводит телекоммуникационные проекты, целью которых является подключение к INTERNET всего спектра участников программ IREX. Основная задача - содействовать сотрудникам научных, учебных и общественных организаций в получении доступа к сетевым информационным ресурсам. Сотрудники IREX проводят консультации по подключению к сети и работе с INTERNET, готовят информационные материалы о доступе к сетевым ресурсам в странах СНГ, предоставляют книги по работе с сетью как на уровне пользователя, так и администратора сети.

Назначение телекоммуникационных проектов IREX:

"Проект расширения доступа к INTERNET"
("US-Eurasia INTERNET Access and Training Program")

В рамках финансируемого Информационным Агентством США (USIA) проекта волонтеры-американцы (INTERNET Fellows) - региональные координаторы проекта, консультанты проекта и сотрудники отдела телекоммуникационных проектов IREX в течение 1997 года будут работать в городах в России, а также в Беларуси, Украине, Грузии, Узбекистане, и Киргизстане.

Региональные координаторы проекта организуют работу точек свободного доступа к INTERNET и откроют общедоступные Web-мастерские в библиотеках, университетах и академических институтах, где они будут проводить консультации по работе с электронной почтой, ресурсами INTERNET, обучать созданию электронных гипертекстовых публикаций для размещения в World Wide Web.

В первую очередь "Проект расширения доступа к INTERNET" предназначен для помощи исследователям, специализирующимся в области гуманитарных и общественных наук и представителям общественных организаций. В рамках реализации проекта на конкурсной основе возможно предоставление необходимого оборудования, справочных материалов, обучение и консультации академическим учреждениям и некоммерческим организациям.

Общедоступная Web-мастерская

В рамках проекта создан общедоступный компьютерный класс, подключенный к сети INTERNET, в котором проводится обучение и консультации по созданию собственных WWW-страниц. Некоммерческие организации могут бесплатно разместить на сервере информацию о своей деятельности.

Компьютерный класс также используется для проведения лекций и семинаров, посвященных телекоммуникационным проблемам. Проект проводится в Москве совместно с Публичной исторической библиотекой России.

Консультативная поддержка пользователей

Специалисты IREX проводят демонстрационные и обучающие семинары по работе в INTERNET, распространяют информацию о развитии академических и коммерческих сетей в странах бывшего Союза. Часть этих материалов размещена на Web-серверах IREX в Москве и Вашингтоне.

Об USIA

Информационное Агентство Соединенных Штатов (USIA), расположенное в Вашингтоне, Округ Колумбия, являясь частью правительства США, работает с 1952 года как независимое агентство по международным вопросам. Академические обмены, программы обучения, новости и информация являются элементами основной деятельности USIA. Благодаря этой работе, USIA способствует развитию взаимопонимания между народами США и других стран и помогает свободному обмену информацией между ними.

!36

 

ACCESS RUSSIA

приглашает к сотрудничеству

Access Russia, Inc., американская компания, специализирующаяся в области обработки разнообразной информации, преимущественно связанной с Россией и другими странами бывшего СССР. В сферу деятельности компании входят следующие виды информационной деятельности:

1. Электронная доставка публикаций из России в США по заказам американских пользователей и из США в Россию по заказам российских пользователей, используя технологию сканирования, распознавания и сетевые возможности современных коммуникационных средств и систем.

2. Разработка специализированных баз данных по различным аспектам российской науки и техники, законодательства и права, культуры и образования, политики и бизнеса. На основе анализа результатов изучения американского информационного рынка определяются направления специализации, позволяющие ориентироваться в текущих потребностях рынка и быстро создавать продукцию, отвечающую этим потребностям.

3. Использование различных систем автоматического языкового перевода для перевода на английский язык публикаций, доставляемых из России по заказам американских пользователей.

4. Организация и поддержка Internet-сервера для представления российских партнеров и их информационных возможностей на американском рынке. Разработка технологии и программных средств для установки на сервере различной информационной продукции Access Russia, Inc. и её российских партнеров и обеспечения on-line доступа к этой информации. Проведение работ по продвижению информационной продукции, производимой различными российскими производителями, и оказываемых ими информационных услуг на американский рынок.

5. Информационное сопровождение различных совместных российско-американских бизнес-проектов.

В настоящее время партнерами Аccess Russia, Inc. являются десятки крупнейших информационных центров и библиотек в различных городах России и других стран СНГ.

Потребители информации в США - это около 100 библиотек крупнейших американских и канадских университетов, исследовательских центров, правительственных организаций и промышленных компаний, входящих в информационную сеть, организованную Access Russia, Inc. Вместе с тем, Access Russia, Inc. является активным поставщиком информации в On-line Computer Library Center (OCLC). Access Russia, Inc. является членом различных библиотечных ассоциаций США, участвует во многих национальных и международных конференциях и выставках.

Одним из важных направлений деятельности Access Russia, Inc. является финансовая поддержка некоторых российских проектов, связанных с исследованиями в области информационно-библиотечного дела.

Access Russia, Inc. располагается в Калифорнии, в пригороде Сан-Франциско.

Адрес: 1000 Washington Avenue, Suite # C

Albany, CA 94706, USA

Телефон: 510-528-0536

Факс: 510-558-9118

E-mail: info@arussia.com

Internet Web Site: www.arussia.com

Мы открыты для сотрудничества.

!40

Контактные телефоны и E-mail*

!41