Информационное обеспечение науки Новые технологии

В.В. Васильчиков

(БЕН РАН, Москва)

СВОДНЫЙ КАТАЛОГ ГПНТБ, КАК ИСТОЧНИК ЗАПИСЕЙ ДЛЯ ФОРМИРОВАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА БЕН РАН

С 1995 года БЕН РАН осуществляет в автоматизированном режиме обработку новых поступлений и это служит основой ведения электронного каталога (ЭК) книг и периодических изданий. При этом остается открытым вопрос о вводе в ЭК информации о всем фонде имеющейся в БЕН и ее сети литературы.

Одним из дополнительных источников информации для ЭК может служить Сводный Каталог, формируемый в течение многих лет ГПНТБ России. Он содержит записи об изданиях, поступивших в крупнейшие библиотеки СССР (а с 1991-го года - России), передаваемые в ГПНТБ самими библиотеками. В настоящий момент ГПНТБ готова бесплатно предоставить каждой библиотеке ее информацию, накопленную с середины 80-х годов в электронном виде.

В июле 1997 года БЕН РАН получила из ГПНТБ около 35000 "своих" записей и приступила к конвертированию их во внутренний формат своего ЭК. Поскольку мы оказались первыми, кто пытается таким образом использовать записи Сводного Каталога ГПНТБ, есть смысл описать их.

Полученный из ГПНТБ массив содержит библиографические описания отечественных и иностранных книг, начиная с 1986 года издания.

Формат поставки представляет собой некоторую модификацию UNIMARCа, но не являющуюся его подмножеством. Строго говоря, этот формат не соответствует ISO 2709 - основному стандарту для обмена информацией. Дело в том, что весь массив, полученный из ГПНТБ, усыпан символами перевода строки (кодами 0D0A), в основном, через каждые 80 символов полезной информации. При этом длина записи (содержимое первых 5 байт каждой записи), адреса полей и длины полей в справочнике записи приведены без учета этих символов.

Следующее отступление от правил ISO 2709 связано с наличием поля 914, не содержащим ни индикатора, ни идентификатора (это поле копирует поле 001, для которого такая форма записи справедлива).

Символы европейских языков, отличные от латиницы и кириллицы, представлены тремя символами, из которых первым всегда является знак @.

В маркере записи заполнены только обязательные поля - длина записи, базовый адрес и данные об элементах справочника. Отсутствует чисто библиографическая информация.

В основном заглавии (подполе 200a) встречаются угловые скобки "<" и ">", иногда заменяющие двойные кавычки, а иногда ограничивающие несортируемые символы, например, артикль "The". Для нормального конвертирования таких записей требуется довольно изощренный алгоритм.

И, наконец, следует учитывать, что хотя в конкретной записи может стоять код Вашей библиотеки (а именно по значению этого кода и были отобраны записи для БЕНа), автором записи может быть другая библиотека, давшая в ГПНТБ информацию об этом издании раньше Вас. Поскольку подходы к каталогизации в разных библиотеках могут несколько различаться, могут потребоваться специфические алгоритмы конвертирования библиографической информации.

Для полноты картины приведем перечень полей, встречающихся в записях Сводного Каталога ГПНТБ (таблица получена из ГПНТБ 12.08.97 г.):

Наименование поля

Метка

Подполя

Макс. длина

Идентификатор записи

001

`

 

ISBN

010

a

20

ISSN

011

a

8

Инвентарный номер РКП

020

b

20

Данные общей обработки

100

a

40

Язык

101

a

20

Страна публикации

102

a

5

Кодированные данные

105

a

15

Основное заглавие

200

aeihfd

700

Сведения о переизд.

205

a

50

Сведения о cерии

225

aevfxih

300Z

Место изд., изд-во, год выхода

210

acd

300

Объём издания, ил.

215

ac

40

Общие примечания

300

a

300

Библиография

320

a

100

Периодичность

326

a

10

Аннотация

330

a

1000

Иная форма заглавия

517

a

200

Предыдущее заглавие СИ

520

a

210

Перевод заглавия

541

a

300

Персоналия

600

ab

40

Предм. руб-ка

606

afx

200

Ключевые слова

610

af

200

Индекс УДК

675

a

120

Автор 1

700

abg

40

Автор 2,3

701

ab

200

Составитель, редактор

702

ab

220

КА, мероприятия

710

ahdefc

120

Другие КА

711

ahdefc

120

Поставщик

801

abc

40

Ур-нь, РКП, вид, тираж, признак

900

abcde

60

Сигла, шифр, том, номер СИ

901

abcdefgqt

500

Алкод

914

 

50

Код страны (расшифровка)

915

ab

55

Код языка (расшифровка)

916

 

35

Код периодичности(расшифровка)

917

ab

35

Заглавие приложения к СИ

918

ax

250

Перевод аннотации

963

a

1000

Рубрика ГРНТИ

964

a

30

Перевод пред. Рубрики

966

a

200

Ключевые слова

661

 

100

Для сценарного раб. листа

999

 

100

Cигла (расшифровка)

941

abc

400

Статистический анализ полученного БЕН из ГПНТБ массива показал наличие нескольких десятков записей с "неправильными" полями - без индикаторов и идентификаторов. По-видимому, это - некоторые сбои, которые в дальнейшем будут устранены.

Большим достоинством полученного из ГПНТБ массива является наличие в каждой записи кодов библиотек, получивших в свое время соответствующее издание. Это позволяет (с некоторой осторожностью) использовать ЭК в службе МБА. Недоверие связано с тем, что в Сводном Каталоге ГПНТБ отсутствует информация о списании литературы. На наш взгляд, в дальнейшем следовало бы продумать механизм учета в Сводном Каталоге научно-технической литературы, который Постановлением Правительства РФ (№ 950 от 24.07.97 г.) поручено вести ГПНТБ, как получения, так и списания литературы библиотеками и информационными центрами.

Тем не менее имеющаяся информация помогает службе МБА сузить область поиска первоисточника и ускорить его получение.

Собираясь использовать информацию из Сводного Каталога ГПНТБ для формирования локального электронного каталога в той или иной библиотеке, следует заранее продумать технологию исключения из него информации о списанной литературе.