!1!

Н.Е. Калёнов

Библиотека по естественным наукам РАН

Электронные каталоги, MARC-формат и автоматизация библиотечной технологии

Широкое распространение и относительная доступность достаточно надежных и простых в обращении средств вычислительной техники обусловили в последнее время значительный интерес библиотек к проблемам автоматизации информационно-библиотечной технологии. Спрос порождает предложение, и в печати стали все чаще появляться рекламные материалы, предлагающие библиотекам программные комплексы, сулящие огромные преимущества автоматизированной технологии по сравнению с традиционной.

На практике же зачастую оказывается, что использование приобретенных программных средств вовсе не "облегчает жизнь" сотрудников библиотек, а требует дополнительных трудовых затрат, не давая взамен существенного качественного выигрыша. Это объясняется многими причинами, но одной из наиболее существенных является то, что многие разработчики представляют библиотечную автоматизацию как одну из обычных информационных систем, функции которой ограничиваются вводом и поиском библиографической информации, т.е. созданием электронного каталога. Это вполне естественно для читателей, каковыми и являются в большинстве разработчики, решившие попробовать себя в библиотечной информатике. Согласно этому распространенному мнению, достаточно взять какой-либо зарубежный формат представления данных, организовать в любой библиотеке ввод библиографических описаний в компьютер в этом формате, после чего можно объявлять о подключении библиотеки к мировой информационной системе.

На самом деле электронный каталог - это лишь вершина айсберга библиотечной технологии, и его создание в отрыве от других её процессов, если последние осуществляются "ручными" методами, не только требует значительных финансовых затрат, но и не дает никакого эффекта ни для библиотечного персонала, ни для читателей. В этом случае электронный каталог может использоваться лишь как справочный аппарат к фондам, зачастую менее удобный для пользователя, чем традиционный карточный каталог. Дело в том, что многие посетители библиотек, придя туда, знают, какая литература им конкретно нужна и пользуются каталогом для выяснения вопроса, есть ли она в данной библиотеке и какой у неё шифр хранения. Для ответов на эти вопросы карточные каталоги не только не уступают электронным, но и более удобны, поскольку одновременно доступны большому числу читателей; иметь же достаточное количество терминалов для одновременного доступа к электронному каталогу многим библиотекам "не по карману".

Эффективность автоматизации (под которой понимается ликвидация технических операций,, сокращение времени на технологические процессы, предоставление дополнительного сервиса по сравнению с традиционной технологией, как для библиотечного персонала, так и для читателей) может быть обеспечена лишь при комплексном подходе, когда библиотека рассматривается как единое производственное предприятие, с присущими ему технологическими процессами, обеспечивающими переработку информации. Автоматизация библиотеки - это не создание компьютерной информационно-поисковой программы, а разработка специфической АСУ с присущей этому классу задач перестройкой технологии, организационной структуры, методов управления.

В любой библиотеке (а многие из них являются и информационными центрами, обеспечивающими пользователей вторичной информацией) можно выделить следующие группы технологических процессов.

  1. Процессы, связанные с комплектованием библиотеки, включающие:
    1. Анализ информационных потребностей пользователей и формирование на его основе совокупности признаков, по которым должна отбираться из мирового потока информация и литература для приобретения библиотекой (в библиотечной терминологии - формирование тематико-видового плана комплектования - ТПК).
    2. Анализ предложений мирового информационного рынка (для краткости под этим термином будем подразумевать множество издаваемых на традиционных и нетрадиционных носителях материалов, в т.ч. литературу, базы данных, другие информационные материалы, могущие представлять интерес для данной библиотеки); выявление его части, соответствующей ТПК.
    3. Определение перечня изданий и других материалов, подлежащих приобретению, и источников приобретения, исходя из условия обеспечения максимальной информативности материалов для пользователей при ограничениях на имеющиеся в библиотеке финансовые ресурсы.
    4. Формирование необходимой заказной документации;
  2. 1.5.Заказ отобранных материалов, контроль и регистрация их поступлений, рекламирование не поступивших материалов.
    1. формирование приходно-расходных бухгалтерских документов и документов, предусмотренных инструкциями по учёту фондов.
  3. Процессы обработки поступивших материалов и создания справочного аппарата по ним, включающие:
    1. Научную обработку поступивших материалов (каталогизация, систематизация), цель которой обеспечить возможность создания справочного аппарата (системы каталогов) по фонду библиотеки.
    2. Техническую обработку поступивших материалов инвентаризация, шифровка), в результате которой фиксируются принадлежность данного издания (или другого объекта) данной библиотеке и его местоположение (адрес хранения в фондах).
    3. Организацию справочного аппарата (формирование читательских и служебных каталогов библиотеки как результат выполнения процессов 2.1 и 2.2), позволяющего осуществлять пользователям многоаспектный поиск материалов, имеющихся в библиотеке, и сотрудникам библиотеки подбирать конкретные материалы, заказанные пользователем.
    4. Расстановку материалов в фонде в соответствии с их адресами хранения.
  4. Процессы, связанные с обеспечение пользователей материалами, имеющимися в фондах и информацией о них, включающие:
    1. Формирование информационных массивов о пользователях (запись читателей в библиотеку) с указанием статуса каждого из них;
    2. Предоставление возможностей пользования элементами справочного аппарата, сформированного на этапе 2.3;
    3. Формирование пользователем заказов на первоисточники или их копии, передача заказов в хранилище;
    4. Подбор заказанных материалов (выполнение копий), регистрация их выдачи и возврата (в читальных залах и на абонементе), сообщение об отсутствии заказанных материалов на месте и, при необходимости, постановка заказа на очередь; резервирование за читателем изданий в читальных залах; контроль сроков пользования выданными материалами.
  5. Процессы, связанные с обеспечением литературой по межбиблиотечному абонементу (МБА), включающие:
    1. Обеспечение возможности для пользователей и сотрудников доступа к электронным каталогам других библиотек;
    2. Формирование заказов по МБА;
    3. Определение местонахождения заказанного издания;
    4. Регистрация заказов, их направление в соответствующую библиотеку;
    5. Получение заказанного издания, выдача его заказчику, прием от заказчика, контроль сроков пользования, отсылка владельцу.
  6. Процессы, связанные с информационно-библиографической работой, включающие:
    1. Поиск информации в базах данных, приобретаемых библиотекой;
    2. Предоставление различного рода разовых библиографических справок (уточнение названия издания, определение местонахождения конкретного издания и т.п.);
    3. Подготовка различного рода информационных материалов (указателей подписки, бюллетеней новых поступлений, тематических подборок литературы и т.п.). Чтобы библиотека как система устойчиво функционировала, в её технологии необходимо организовать формирование и обработку данных "обратной связи". Для этого в системе должны присутствовать процессы управления (6), включающие:
  7. 6.1. Формирование и статистическую обработку информации, характеризующей полноту и ритмичность поступлений заказанных материалов;
  8. 6.2. Получение информации о сроках выполнения технологических процессов 1 и 2;
  9. 6.3. Анализ использования фондов библиотеки и запросов по МБА с целью корректировки комплектования библиотеки;
  10. 6.4. Получение статистических сведений о пользователях библиотеки;
  11. 6.5. Анализ запросов, поступающих в информационно библиографическую службу библиотеки.

Наконец, библиотека, как и любое другое учреждение, должна решать проблемы, связанные с материально-техническим снабжением, бухгалтерским и кадровым учётом и т.п.

Эффективная автоматизированная система должна предусматривать однократный ввод информации с многократным и многоцелевым её использованием. Автоматизация отдельных процессов может в ряде случаев привести к существенному усложнению работы библиотечных специалистов, не давая особого эффекта для пользователей.

Из приведенного перечня видно, что формирование электронного каталога есть процесс, тесно связанный с технологической цепочкой, начинающейся с предварительного заказа литературы. С другой стороны, электронный каталог должен быть связан с процессами группы 3 и, если они не автоматизированы, то электронный каталог в значительной мере теряет свою эффективность. Необходимо учитывать, что при наличии в библиотеке библиографических баз данных, содержащих значительные массивы информации, сформированные мировыми центрами подготовки данных, и развитые процессы группы 5, пользователь получит с их помощью несравненно больше сведений, чем из электронного каталога библиотеки. Для определения же наличия известного издания в библиотеке использовать электронный каталог ничуть не более удобно, чем традиционный, если затем требование заполняется вручную.

Это говорит, о том, что начинать автоматизацию библиотеки с создания изолированного электронного каталога во многих случаях экономически нецелесообразно. Такой подход может быть оправдан при использовании библиотеками результатов централизованной электронной каталогизации изданий или при наличии компьютерной сети, обеспечивающей "разделение труда" библиотек при обработке изданий (аналога системы OCLC в США).

Из-за плачевного состояния отечественных каналов связи второй вариант в широких масштабах пока реализован быть не может; что же до первого варианта, то наличие в стране Всероссийской книжной палаты (ВКП), казалось бы, создает предпосылки для его реализации, однако на практике отдельной библиотеке воспользоваться информацией ВКП достаточно сложно. В настоящее время не отработана технология заказа и получения библиотеками из ВКП конкретного перечня описаний изданий в электронной форме в приемлемые сроки, поэтому библиотеке надо приобретать значительно больше информации, чем ей требуется, отбирать из полученных массивов нужные описания и довводить в них свою служебную информацию. Это может оказаться существенно дороже и продолжительнее формирования описаний собственными силами.

В этой связи достаточно остро встает вопрос о технологии электронной каталогизации фондов библиотеки и используемом формате представления данных. Несколько лет назад, с началом широкого распространения персональных компьютеров, в печати появились публикации о том, что все без исключения российские библиотеки должны использовать в своей технологии американский формат US-MARC (Mashine Readable Catalogue) и обсуждать в этом направлении нечего.

Практика же показывает, что ввод библиографических описаний в компьютер в "MARC-подобном" формате, когда каждый элемент данных имеет свою метку, и компьютер их предлагает десятками для каждого издания, требует от библиотечного специалиста, в среднем, в три раза больше времени, чем традиционная подготовка комплекта каталожных карточек с помощью пишущей машинки. Необходимо учитывать, что формат US-MARC ориентирован на английский язык, правила которого существенно отличаются от правил русского языка. Кроме того, формат разрабатывался в середине 60-х годов применительно к использованию компьютеров типа IMB-360 и даже более "древних", возможности которых по объему памяти и быстродействию несоизмеримо ниже современных. Это предопределило громоздкость формата, которая в современных условиях неоправданна.

Крупнейшие библиотеки, участвующие в международном обмене библиографическими данными, вынуждены использовать подобный формат, поскольку в мировом библиографическом центре - Библиотеке Конгресса США уже накоплены огромные массивы информации, но даже для целей международного обмена разработан более простой формат UNIMARC. Кроме того, повсеместное распространение стандартных номеров ISBN и ISSN существенно снижает жесткость требований к формату, поскольку они позволяют идентифицировать издание однозначно без каких-либо логических "ухищрений".

Что же касается рядовых библиотек, то даже многие зарубежные, имеющие постоянную электронную связь с мировыми библиотечными центрами, не используют в своей технологии формат US-MARC. Говорить же о необходимости повсеместного использования формата US-MARC в российских библиотеках всех уровней, с нашей точки зрения, ошибочно.

Опыт Библиотеки по естественным наукам (БЕН) РАН показывает возможность использования другого пути - в АС БЕН РАН библиографическое описание вводится по правилам ГОСТа 7.1-84 (с некоторой модификацией) в одно поле. Специальные программные средства распознают основные элементы библиографического описания, являющиеся "входами" прямого доступа при загрузке информации в электронный каталог. Это позволяет не только не увеличивать нагрузку на библиотечных специалистов, но и существенно облегчать их работу, поскольку все добавочные описания формируются автоматически. Пользователю же гораздо комфортнее видеть на экране привычную каталожную карточку, чем описание в формате MARC, разнесенное на несколько экранов.

Не вызывает сомнений, что библиотеки должны уметь обрабатывать файлы, поступающие из ВКП или других центров каталогизации в обменном формате, для импорта информации в свои системы. Поэтому важно решить вопрос о введении в масштабах страны стандарта (или рекомендаций) на такой формат, чтобы каждой библиотеке, если она получает библиографическую информацию, подготовленную в одном из центров, достаточно было иметь один конвертер. К сожалению, на обсуждение этой проблемы (с нашей точки зрения, во многом искусственной) потрачены годы; в настоящее время целый ряд библиографических центров (ВКП, РГБ, ГПНТБ и др.) потратил значительные усилия на разработку своих форматов на базе существующих англоязычных и готов объявить их в качестве национальных обменных форматов. Необходимо в ближайшее время договориться о том, какой формат считать национальным обменным.

При создании АС библиотеки, (так же как и при создании любой АСУ) необходимо пересматривать её организационную структуру, ориентированную на традиционную технологию, по возможности видоизменять систему принятой документации, ликвидировать и модернизировать отдельные формы отчётности. Без этого, приспосабливая автоматизированную технологию к существующим условиям, невозможно обеспечить построение оптимальной системы. Можно привести ряд примеров, "лежащих на поверхности".

При внедрении автоматизированной технологии, когда вся информация о поступлениях литературы хранится в компьютере, отпадает необходимость в ведении книги суммарного учёта, предусмотренной инструкцией по учёту фондов.

Стандартом на библиографическое описание (ГОСТ 7.1-84) предусмотрен обязательный вывод на каталожную карточку данных так, как они приведены на издании (например, "под ред. А. В. Петровой"); библиотеки, формирующие карточки как продукт автоматизированной технологии (отказаться от них могут себе позволить пока очень немногие), вынуждены дублировать ввод информации, чтобы обеспечить возможность поиска фамилий в базе данных в именительном падеже; очевидно, что необходимо допускать на карточке возможность написания всех фамилий в именительном падеже (напр. "редактор А.В. Петрова"), тем более что на понимании смысла библиографического описания это не отражается.

Другой пример касается обмена заказами по МБА. Трехстворчатый стандартный бланк-заказ на литературу по МБА не может быть распечатан на обычном печатающем устройстве. Если автоматизировать процессы заказов по МБА (а это необходимо, что следует из вышеприведенного перечня задач 4-й группы) и использовать стандартные формы заказов, придётся заполнять бланки вручную, что существенно снизит эффективность автоматизации. С другой стороны, унификация, заказав необходима, следовательно, нужно пересматривать стандарт, учитывая не только собственно форму бланка-заказа, но и возможность обмена заказами по каналам связи, в частности, по электронной почте.

При разработке АС БЕН РАН предпринята попытка реализовать прагматический подход, в максимальной степени обеспечивающий сокращение трудозатрат библиотечных специалистов и повышение комфортности работы пользователей с системой. В настоящее время в Библиотеке автоматизировано значительное число технологических операций; для библиотек, входящих в систему БЕН РАН, предлагаются комплексы, охватывающие все стороны библиотечной работы.

Описанию конкретных решений, используемых в АС БЕН РАН, посвящен ряд материалов, представленных в настоящем сборнике.

!2!

 

Л.К. Бобров, Б.С. Елепов

Государственная публичная научно-техническая библиотека СО РАН

Библиотека как центр научно-технической информации

Государственная публичная научно-техническая библиотека Сибирского отделения Академии наук России является крупнейшей библиотекой в Азиатской части Российской федерации. Созданная в 1918 году в Москве, она была в 1958 г. передана в состав организованного в Сибири нового мощного научного центра - Сибирского отделения Академии наук СССР. С этого момента началось интенсивное наращивание фондов первоисточников, расширение тематики комплектования фондов, технологическое и функциональное развитие Библиотеки, её превращение в. региональный центр, координирующий работу широкой сети научных и специальных библиотек Сибири.

Начиная с 70-х годов все большее развитие получают работы в области библиографии, включающие подготовку текущих и ретроспективных указателей литературы, дифференцированное информационное обслуживание руководящих работников и избирательное распределение информации. Исходной информационной базой для проведения данных работ являлись фонды первоисточников, поступающих в Библиотеку. К 1980 году информационно-библиографические задачи превратились в одно из важнейших направлений работы Библиотеки. Это направление в совокупности с развитой системой справочно-библиографического обслуживания фактически положило начало превращению Библиотеки в региональный центр научно-технической информации.

Следующий этап становления Библиотеки как крупного регионального информационного центра связан с использованием (с 1980 года) средств вычислительной техники и баз данных в практике информационных работ Библиотеки. Наряду с процессами комплектования фондов первоисточников начинается закупка машиночитаемых баз данных, представляющих собой аналоги печатных реферативных изданий. При этом Библиотека в силу своего (пока еще неофициального) статуса регионального центра научно-технической информации берет на себя методические функции, функции центра-распределителя машиночитаемой информации, а также осуществляет разработку и внедрение программно-технологических средств, необходимых для поддержания и эксплуатации системы баз, данных в научных учреждениях Сибирского отделения Академии наук.

Работы по автоматизации информационных процессов проводятся в рамках проекта создания Автоматизированной системы научно-технической информации Сибирского отделения РАН (АСНТИ СО РАН), включенного в общегосударственную программу научных исследований по информатике.

Реализация дистанционного доступа к накопленным в АСНТИ СО РАН машиночитаемым базам данных основана на использовании региональной информационно-вычислительной сети, на нижнем уровне которой предполагается подключение персональных ЭВМ. В качестве инструментария конечного пользователя служит программно-технологический комплекс, включающий базовую информационно-поисковую систему и набор дополнительных функциональных сервисных программ.

Кроме обработки машиночитаемых баз данных в рамках проекта АСНТИ СО РАН реализована система телекоммуникационного доступа к удаленным отечественным и зарубежным информационным ресурсам через Национальный центр автоматизированного обмена информацией.

В 1987 г. Библиотека получает официальный статус Центра научно-технической информации Сибирского отделения Академии наук СССР и фактически становится крупнейшим информационным центром от Урала до Дальнего Востока.

К 1990 году в АСНТИ СО РАН обрабатывается свыше 130 машиночитаемых баз данных по различным естественнонаучным тематикам с общим ежегодным объемом около одного миллиона документов. Ретроспективные массивы системы включают свыше 5 миллионов документов за последние 3-7 лет. В качестве коллективных абонентов системы выступает более 40 научно-исследовательских учреждений и промышленных предприятий Сибири.

В то же время опыт эксплуатации АСНТИ СО РАН показал, что традиционные подсистемы избирательного распределения и ретроспективного поиска информации являются необходимыми, но не достаточными компонентами системы. Для повышения эффективности её работы требуется разработка и внедрение новых технологий, способствующих более широкому охвату потребителей информации и расширению сферы информационных услуг при сохранении (или даже сокращении) числа сотрудников, занятых эксплуатацией системы. На наш взгляд для этого необходимо обеспечить свободный доступ учёных и специалистов ко всему тематическому спектру документальных баз данных непосредственно с рабочего места и предоставить достаточно простой и надежный аппарат, позволяющий потребителю информации не только (и не сколько) найти вторичные документы, отвечающие его запросу, но и дающий возможность выявить тенденции данного научного направления, провести их качественный анализ и дать достоверный прогноз на перспективу.

Качественно новый шаг в решении информационных задач связан с появлением (начиная, с конца 80-х годов) персональных ЭВМ на отечественном рынке и их все более активным использованием в практике работы библиотек и информационных органов.

Ориентируясь на персональные ЭВМ, Библиотека начала разработку новых технологий, предусматривающих формирование проблемно-ориентированных и персональных баз данных. Работы данного направления потребовали решения таких важных проблем, как совместимость форматов предоставления данных, согласование средств лингвистического обеспечения, унификация и типизация программно-технологических средств и ряд других.

Однако главной тенденцией, определяющей качественное отличие создаваемых технологий от существующих ранее, является ориентация на аналитическую обработку информации с привлечением методов искусственного интеллекта и элементов экспертных систем. Реализация технологии и программного аппарата аналитической обработки информации - с одной стороны, и максимальное использование накопленной в АСНТИ СО РАН информации для формирования проблемно-ориентированных баз данных - с другой, дают Библиотеке возможность перейти на следующую качественную ступень - стать не только современным информационным Центром, но и Центром анализа информации, решающим задачи анализа и прогнозирования тенденций развития различных направлений науки и техники.

Именно эта задача решается в настоящее время Государственной публичной научно-технической библиотекой Сибирского отделения Российской Академии наук.

!3!

О.А. Лаврёнова

Российская государственная библиотека

Документально-фактографические системы - электронные библиографические издания

Предлагается автоматизированная информационная система (АИС), обеспечивающая подготовку библиографических изданий на машиночитаемых носителях.

Постановка задачи и лингвистическое обеспечение, включая алгоритмы создания базы данных и поиска в ней, разработаны специалистами РГБ. Программное обеспечение МЕКА для IBM PC AT/XT принадлежит фирме ЛАБИС Лтд. (Москва). Его параметры могут быть настроены на разнообразные задачи с целью создания документально-фактографических АИС различного типа.

Электронные библиографические издания - это разновидности документально-фактографических и документальных АИС. В принципе, любой тиражируемый графический банк данных, в том числе - электронный каталог представляет собой электронное библиографическое издание.

В системе МЕКА различаются четыре типа записей, каждый из которых описывается в 4-х текстовых файлах. Изменение этих файлов обычным текстовым редактором (например, ЛЕКСИКОН) влечёт за собой генерацию новых типов записей. Имеются в виду следующие файлы : перечень полей с метками, идентификаторами, индикаторами и названиями; описание структуры каждого поля и, тем самым, макета ввода записей:

максимальная длина, повторяемость, обязательность, наличие справочника; перечень полей, по которым при загрузке формируются "ключи" в индексном файле; описание формата, вывода записей. Отдельно описываются константы вывода БЗ. Состав полей, и любой параметр может быть изменен пользователем при редактировании файлов.

Два типа записей (ВК и TZ) обеспечивают формирование иерархических структур типа тезауруса или классификации с ассоциативными отношениями и методическими указаниями, а два типа записей (BZ и FZ) позволяют вводить документы или факты. При этом записи типа ВК и TZ связываются с определенными полями записей типа BZ и FZ. Кроме того, в одном из полей записи BZ можно указать номер записи FZ, к которой BZ относится.

Алгоритмы поиска, меню и маски также могут строиться пользователем путем редактирования специального текста описания параметров АИС. Можно создать основное поисковое меню и подменю 2-х уровней для каждого пункта, указать необходимость учёта при поиске смысловых связей, тип записей для поиска и перечень поисковых полей, задать связи полей для иерархического и ассоциативного поиска и указать поля, выдаваемые при этом на экран, поставить условие проверки файлов BZ и FZ по тезаурусу или классификации.

В РГБ для создания электронных каталогов (ЭК) и электронных библиографических пособий, указателей записи типа BZ интерпретируются как библиографические записи (БЗ), вводимые в систему в формате типа MARC (русская версия РГБ). Для записей типа FZ подготовлен небольшой формат фактографических записей (ФЗ) по проблемам, темам для ввода различных статей сопровождающих перечни БЗ в библиографических изданиях. Записи типа ВК для таблиц ББК и записи типа TZ для дескрипторов тезауруса имеют форму нормативных (авторитетных) записей. Их формат аналогичен форматам UNIMARK и USMARK - Authorities. В РГБ формируются машиночитаемые таблицы ББК. Иерархический и ассоциативный поиск ведется для БЗ в файле ББК, а для ФЗ - в тезаурусном файле. Для ФЗ можно вывести на экран все связанные с ней БЗ.

Диалоги формирования базы данных и поиска построены с использованием знакомой библиографам-каталогизаторам терминологии и простейших читательских экранов. Поиск возможен по любым полям и их сочетаниям.

Вся база данных или результаты поиска могут быть выведены в отдельный текстовый файл в обычной форме или выгружены в текстовый файл в форматах типа MARC для конвертирования в другие системы.

На основе АИС МЕКА в РГБ создаются тематические библиографические электронные издания по популярной литературе, а также ЭК по рукописным русско-славянским книгам, архивным фондам и, в сотрудничестве с 6-ю другими библиотеками - ЭК русской книги первой четверти 19 века.

Другой тип электронных библиографических изданий - системы, сочетающие различные типы информации. Например, в РГБ формируется база данных ЭК автографов, где 'БЗ связаны с факсимильными изображениями страниц книг с дарственными надписями.

!4!

Н.А. Мякова

Государственная публичная научно-техническая библиотека России

Технологическое и программное обеспечение автоматизированных систем ГПНТБ России

В ГПНТБ России существует многоуровневый комплекс взаимосвязанных автоматизированных систем, действующих на разных видах техники (ЕС ЭВМ, ПЭВМ) в единой программно-технологической среде. На первом уровне - общероссийский автоматизированный банк данных, на втором - электронный каталог ГПНТБ и технологии, обеспечивающие его ведение и использование, на третьем - локальные и специализированные базы данных.

В качестве базового программного обеспечения используется пакет CDS/ISIS - версии для, ЕС ЭВМ и ПЭВМ, имеющие возможность обмена файлами в ISO-2709 между базами данных, работающими под управлением CDS/ISIS/EC' и CDS/ISIS/M. Для обеспечения обмена информацией ЕС ЭВМ

- ПЭВМ, ПЭВМ - ЕС ЭВМ, используется программно-аппаратный комплекс IOLA.

Стандартные функции CDS/ISIS - создание и ведение баз данных, поиск, сортировка, печать, дополнены рядом программ, разработанных в ГПНТБ. Программы имеют модульный вид. Среди них основные - программа выбора повторяющихся полей/подполей; - формально-логический контроль ввода записей; контроль всей базы данных или её части и др.

Автоматизированный общероссийский банк данных формируется на ЕС ЭВМ в среде CDS/ISIS/EC по видовому принципу

- обработка информации о зарубежных периодических изданиях, зарубежных книгах, отечественная малотиражная литература. Теледоступ поддерживается субд КАМА/СУИП. Технология и программно-аппаратная совместимость ЕС ЭВМ и ПЭВМ позволяют вести обработку информации с разных носителей - рабочие листы, магнитные ленты, дискеты. Технология автоматизированных систем ГПНТБ построена на одноразовой обработке входного потока литературы с последующим многоаспектным её использованием.

Обработка ведется по видовому принципу с последующей интеграцией в единый электронный каталог или общероссийский банк данных. В ГПНТБ России разработаны системы обработки и регистрации отечественных и зарубежных периодических изданий, поступающих в ГПНТБ - АРМ библиографа со следующими функциями: - сверка на дублетность, регистрация, каталогизацию и редактирование с учётом поступившего экземпляра; подготовка и печать сопроводительной документации на партию книг; ввод данных лингвистической обработки; отслеживание движения книги по технологическому пути (регистрация дат этапов обработки) ; подготовка и печать каталожных карточек с подсчётом экземплярности; подготовка и печать отчётной документации (акты для бухгалтерии); отбор записей для пополнения общероссийского банка данных.

Автоматизированные системы ГПНТБ по обработке поступающей литературы функционируют в локальной вычислительной сети ПЭВМ NETWARE/NOVELL с топологией, охватывающей рабочими станциями важнейшие технологические участки обработки литературы и обслуживания читателей.

Программно-технологическое обеспечение автоматизированных систем позволяет получать необходимые информационные продукты и услуги: - поиск информации; выпуск изданий в печатном виде; базы данных на машиночитаемых носителях.

 

!5!

Б.Р. Логинов, М.Н. Старкова, В.В. Вьюгин

Государственная центральная научная медицинская библиотека

Результаты использования и внедрения интегрированной библиотечно-информационной системы (ИБИС)

Интегрированная информационно-библиотечная автоматизированная система ИБИС за два года существования получила значительное развитие и имеет ряд внедрений, как среди библиотек России, так и СНГ, причем не только среди библиотек медицинского профиля. Система ИБИС реализована на основе отечественных и международных библиографических стандартов. Она обеспечивает полный замкнутый технологический цикл, то есть автоматизацию всех основных библиотечных процессов. Программный комплекс построен по модульному принципу с высоким уровнем параметризации, что позволяет любой библиотеке выбрать свой вариант конфигурации ИБИС в зависимости от её технических возможностей, функциональных потребностей и степени подготовленности к автоматизации своих процессов. Система по своим возможностям и реализации удобна для работы как новичкам в вопросах автоматизации, так и квалифицированным пользователям.

ИБИС включает девять модулей, обеспечивающих решение следующих процессов:

 

  1. Комплектование библиотечного фонда:
  2. Каталогизация:
  3. Поиск и заказ литературы:
  4. Выдача и прием литературы:
  5. Ведение и использование справочно-поискового аппарата библиотеки:
  6. Информационное обслуживание:
  7. Регистрация читателей:
  8. Справки и отчёты о работе библиотеки:
  9. Обмен данными с электронными каталогами других учреждений.

В течение 5 лет программный комплекс ИБИС проходит постоянную отработку и развитие на основе промышленной эксплуатации в Государственной Центральной научной медицинской библиотеке (ГЦНМБ) г. Москва. К настоящему времени объем электронной базы данных ГЦНМБ составляет 300.000 записей, к которым имеется доступ с 10 пользовательских мест локальной компьютерной "сети для всех пользователей библиотеки. Другая локальная сеть из" 5 рабочих мест и файл-сервера поддерживает всю систему генерации электронного каталога: от процесса комплектования до полной каталогизации, распечатки библиографических карточек для традиционного генерального алфавитного каталога и формирования указателей типа INDEX MEDICUS, полностью заменяющих предметные каталоги. Система ИБИС позволяет не только создавать библиографические базы данных на уровне международных стандартов, но и сопровождать их на уровне международных стандартов. Так, например, после ежегодной модификации тезауруса по медицине и здравоохранению, начинается не только индексирование вновь поступающих документов по новому тезаурусу, но и проводится переиндексирование в пакетном режиме всего электронного каталога по новой версии тезауруса.

Относительно новым для российского информационного рынка видом обслуживания является представление баз данных на оптических дисках типа CD-ROM. В настоящее время ГЦНМБ в сотрудничестве с производителями дисков типа CD-ROM выпустили экспериментальный диск с медицинской базой данных по диссертациям, авторефератам за 1988-1992 года на основе одного из программных модулей системы ИБИС в качестве поискового интерфейса.

Система ИБИС технологически и функционально удовлетворяет и реально используется в 30 научных, вузовских и массовых библиотеках, то есть программный комплекс учитывает особенности комплектования, каталогизации и обслуживания этих типов библиотек.

 

!6!

И.И. Ильина

Российская книжная палата

Система регистрации национальной библиографии России на базе пакета CDS/ISIS/M

1. Общие сведения о Российской книжной палате

Российская книжная палата - центр национальной (государственной) библиографии России. Основные функции Книжной палаты - государственная библиографическая и статистическая регистрация всех изданий, выходящих в стране.

Обо всех видах изданий (книги, ноты, издания изобразительного искусства, картографические издания, сериальные издания, статьи из сериальных изданий и некоторые другие виды изданий) Книжная палата информирует в государственных библиографических указателях универсальной тематики. Эти указатели носят традиционное название - " летописи". Кроме того, выпускаются для каталогов библиотек комплекты каталожных карточек. Ежегодно выпускается также годовой указатель книг - "Ежегодник книги".

Статистическая информация обрабатывается и ежегодно публикуется в ежегодном статистическом сборнике - "Печать Российской Федерации в 19...году".

Издательская деятельность Книжной палаты составляет более 5 тыс. учётно-издательских листов в год при тираже библиографических указателей от 500 до 1500 экз. Суммарные тиражи выпуска каталожных карточек составляют более 100 млн. единиц.

В соответствии с действующим в стране законодательством один экземпляр всех изданий в стране остается на постоянное хранение в Государственном Архиве печати России. В настоящее время в фондах Архива печати собрано около 70 млн. документов.

Российская книжная палата является не только основным в России регистрационным центром в области библиографии, но и крупным научно-исследовательским институтом. Тематику работ составляют проблемы в области библиографии, книжного дела, издательского дела, социологии книги, автоматизации библиографических процессов и другие, связанные с этими проблемами направления работ.

Как центр национальной библиографии России Книжная палата представляет книжное дело Российской Федерации в международных организациях:

• в UNESCO - в организации по стандартизации - ISO,

• в Международной системе регистрации сериальных

изданий - ISDS,

• в Международном указателе переводной

литературы - Index Translationum.

Книжная палата развивает взаимодействие с зарубежными партнерами, в том числе с Библиотекой Конгресса США, имеет профессиональные контакты с национальными библиотеками и информационными центрами многих стран Европы.

2. Автоматизированная технология обработки информации

С начала семидесятых годов в РКП развивается автоматизированная информационная технология и формируется банк данных государственной библиографии. С 1980 г. до начала 1993 г. в банке данных собрано около 1,3 млн. документов. Эти документы - результат научно-библиографической обработки книг, статей из журналов, газет, авторефератов диссертаций и других изданий. Состав библиографических данных соответствует стандарту библиографического описания (ГОСТ 7.1-84). В состав документа входят также предметные рубрики (по правилам централизованной предметизации, применяемым в НКП), индексы Универсальной десятичной классификации, индексы Библиотечно-библиографической классификации (Таблицы для массовых библиотек), индексы Рубрикатора ГАСНТИ.

В составе автоматизированного банка данных государственной библиографии действует несколько технологических линий:

• технология первичной библиографической регистрации изданий и формирование экспресс информации,

технология научно-библиографической обработки изданий (библиографическое описание, систематизация) и подготовка оригинал-.макетов изданий РКП,

• технология сбора информации со всех технологических участков и формирование баз данных,

• технология информационного обслуживания.

Техническое обеспечение

Основу технического обеспечения банка данных составляют персональные компьютеры - PC AT. Информация баз данных собирается на компьютерах PC AT 486 с общим объемом дисковой памяти 3 Гб. Ввод информации выполняется на PC AT 286 и PC AT 386. Формирование оригинал-макетов изданий выполняется на лазерных принтерах.

Программное обеспечение

Программное обеспечение включает программную систему, распространяемую UNESCO - CDS/ISIS/M. В этой программной системе формируются базы данных, выполняется поиск информации и проводится информационное обслуживание. Для ввода информации, контроля, корректуры используется специальное программное обеспечение для персональных компьютеров, разработанное в РКП.

Для различных функциональных задач применяются также следующие программные продукты: Clipper (подсистема статистического учёта), ProCite, Dbase, FoxPro (подсистема планирования выпуска изданий), WORD, Ventura (подсистема подготовки и выпуска изданий).

Информационное обеспечение

Обработка библиографической информации выполняется в соответствии с принятым в стране стандартом - ГОСТ 7.1-84 "Библиографическое описание документа. Общие требования"

В автоматизированной технологии используется формат представления данных, ориентированный на формат типа UNIMARC.

Обмен библиографической информацией с зарубежными информационными системами выполняется в формате UNIMARC. Объем одного документа составляет в среднем 1 Кб.

3. Развитие автоматизированных технологий

В целях развития автоматизированных информационных технологий, создания современного автоматизированного банка данных Книжная палата проводит работы и по перспективным программам:

- программа универсального библиографического учёта (UBCIM), предусматривающая развитие предмашинного формата представления данных и приближение его к составу данных формата UNIMARC,

- программа ретроспективной конверсии (RECON), предусматривающая развитие информационной технологии создания ретроспективных баз данных по фондам традиционных каталогов,

- программа представления данных на электронных носителях, включая CD-ROM.

 

В плане этих программ проводятся разработки;

- представление различных видов информации для библиографических и авторитетных баз данных в формате UNIMARC (в сотрудничестве со специалистами библиотеки Конгресса США), . .

- исследование возможностей технических и программных средств перевода фондов Государственного Генерального каталога Книжной палаты общим объемом более 20 млн. ед. (каталожных карточек) в электронную форму;

- разработка проекта создания баз данных на оптических дисках в сотрудничестве с фирмой Bawker-Saur, А/О Интерост-Диалог и Русским библиографическим обществом.

4. Программная система CDS/ISIS/M

CDS/ISIS/M используется в автоматизированной технологии Российской книжной палатой для формирования и ведения баз библиографических данных с самого первого этапа формирования баз данных - начиная с ЕС-1055М.

При переводе информационной технологии обработки информации и создания баз данных на персональных ЭВМ применяется версия пакета для ПЭВМ. В настоящее время используется версия 3.0.

Применение "готового" программного продукта с набором типовых функций всегда подразумевает проведение его адаптации к конкретным технологическим задачам. Основные доработки CDS/ISIS/M проведены в РКП для выполнения функций справочно-информационного обслуживания, а именно - для создания пользовательского интерфейса, позволяющего пользователю избежать необходимости знания специальных меню и правил работы с пакетом. Доработки CDS/ISIS/M выполнены на языке CDS/ISIS/Pascal, а также - Turbo Pascal.

Основное содержание доработок, выполненных в РКП:

- пользовательский интерфейс, позволяющий "гуманитарному" пользователю свободно работать с базами данных и использовать все технологические возможности пакета. Разработано "меню" Автоматизированного Рабочего Места справочно-библиографической работы. В состав функций меню входят основные технологические операции, поддерживаемые CDS/ISIS/M, включая ввод информации, поиск, оформление результатов поиска, вывод информации из баз данных;

- разработка функций меню, которые обеспечивают выполнение операций поиска, оформления результатов поиска;

при этом пользователю не нужно выполнять все операции, требуемые CDS/ISIS/M, так как все данные формируются программно;

- разработка форматов печати со специальными программами обработки данных, позволяющие формировать библиографические издания в соответствии со стандартами, переносами текста, размещением текста на формате каталожной карточки, включая перенос на вторую и следующие карточки (при этом пользователь не заполняет никаких специальных данных);

- разработка функций меню, обеспечивающих программное заполнение данных для переформатирования.

Доработки CDS/ISIS/M в РКП продолжаются, в том числе проводятся разработки для настройки на выполнение в пакетном режиме. Используется язык макро-определений, позволяющих формировать данные для выполнения основных функций CDS/ISIS программно (например, заполнение параметров в листах печати, сортировки и пр.) При этом расширяются функциональные возможности пользовательского интерфейса.

5. Информационные услуги банка данных

РКП проводит информационное обслуживание на основе банка данных. Основные режимы информационного обслуживания: подготовка информации на дискетах, магнитных лентах, передача информации в режиме "электронная почта" (vvc@rkp.msk.su).

!7!

Natalie Bosworth

University Library of California at Berkeley

Automation at the University of California at Berkeley

The University of California (UC) is comprised of 9 campuses located statewide. The campuses are UC Berkeley, UC Los Angeles, UC Davis, UC Santa Barbara, UC San Diego, and UC Riverside. Within California there are also two coexisting university system besides UC, the California State University system and the private university system, such as Stanford University.

UC Berkeley is the oldest campus of the UC System, and is one of the most famous research institutions in America. Today I will describe in detail the UC Berkeley Library system and its automation.

HISTORY OF THE BERKELEY LIBRARY

Library facilities on the Berkeley campus are collectively known as the University Libraries. The Library system consists of the Main Library, Moffitt Undergraduate Library, tlie Bancroft Library, and twenty-one branch libraries.

The Library's collections and services primarily support the instructional and research programs on the Berkeley campus. As the oldest and largest library in the University of California system, the UC Berkeley Library is a central research facility in California, and is highly regarded by scholars nationwide.

The Library's collections have long since exceeded shelving capacity available in the libraries on campus. Therefore, less frequently used materials (approximately two million volumes) must be housed off campus at the Northern Regional Library Facility in Richmond, California.

The other 21 branch (academic) libraries on the Berkeley campus are: Astronomy/Mathematics/Statistics, Biochemistry, Bio-sciences, Business/Social . Sciences, Center of Chinese Studies, Chemistry, Earth Sciences, Education/Psychology, Engineering, Entomology, Environmental Design, Forest Products, Forestry, Library School, Music, Optometry, Physics, Public Health, Social

Welfare, and Law. The entire library collection consists of over 7 million bound volumes, and we currently receive over 100,000 serial titles.

AUTOMATION AT UC BERKELEY

As mentioned before, Berkeley's collections are housed in over 24 campus libraries, and comprise over 7 million volumes, 100,000 periodical and other serial titles, and millions of items in other formats (manuscripts, pamphlets, maps, pictoral items, audio and visual materials). In general, UC Berkeley has two lines of automation to keep track of this extensive collection. The first line of automation is for patron use. This system aids our 4 million annual users, in locating materials in our collection, and in locating materials that are housed at other college campuses in California. The second line of automation is used only by the staff of the UC Berkeley library system. This automation aids our staff in the receiving of new materials and in maintaining our collection.

The line of automation for patron use is divided into two on-line catalogs lor locating books and journals. Either one can be searched from terminals located in the libraries across campus. Access from the home or office is available via telephone lines using a modem and personal computer.

The first on-line catalog is GLADIS (the General Library Automated and Information System). GLADIS is a catalog specific to the Berkeley Campus. Currently it contains catalog record for books, serials, maps, musical scores, sound recordings, datafiles, manuscripts, and visual items owned by the Library. New catalog records, for both current older materials, are added continuously to its database, and as GLADIS develops, more sophisticated search and display features will become available. Some pre-1977 material not found in GLADIS can be located by using the old card catalog. This card catalog is in the process of being replaced by GLADIS. Patrons use GLADIS to find out which branch library has a particular book or journal, or to find all the books written on a particular subject, and where these books are located on the campus. GLADIS will also 'indicate whether the particular item requested is housed in storage at the Richmond Storage Facility. GLADIS also provides current circulation information, that is, GLADIS lets you know when material is checked out to another

borrower and when it is due. Step-by-step instructions are provided on-line for new users of the GLADIS catalog. Experienced users can type in their entire search request at the first prompt arrow. On-line help is readily available; simply type the command HELP at any time for an explanation of what you have done so far, and what options are available to you.

The second on-line catalog is MELVYL. MELVYL includes holdings for all nine campuses which make up the University of California plus journal holdings for .many other Academic libraries statewide (the California State University, Stanford, the University of Southern California, the Center for Research Libraries, and the Getty Center Library). In addition to location information about books and journals, MELVYL also includes two indexes to periodical articles: CURRENT CONTENTS, which provides access to current periodical literature in every major academic field (a database of over 6,500 scholary journal listings); and MEDLINE, which indexes biomedical journals. MEDVYL also supports searches of computer readable bibliographic databases: ASI, AGRICOLA, ERIC, Historical Abstracts, Predicasts Psychological Abstracts, etc. MELVYL provides keyword title and subject searching and other sophisticated search features which are not available on GLADIS. MELVYL's database which are the most frequently used are: CAT, a catalog of several million books and other library materials; TEN, a subset of the catalog, allowing faster searches for items published in the last ten years; and PE, titles of several hundred thousand periodicals and other serials.

The second line of automation on the UC Berkeley campus can only by accessed by library staff. This system is called INNOPAC.

Today, Berkeley's acquisitions and control will be described.

ACQUISITIONS - ORDER ENTRY. INNOPAC handles all types of orders, as well as gifts and exchanges. Besides new orders for books, INNOPAC can handle standing orders, subscriptions, blanket orders, approvals, depository items, memberships, replacements, prepaid items, etc. Each order record in INNOPAC is automatically linked to a bibliographic record. INNOPAC's bibliographic record can have as many separate order records attached as needed. Our orders are keyed on an INNOPAC terminal. The operator is prompted by INNOPAC for the necessary data for example, author, title, number of copies, fund, vendor, etc. A large amount of this data is defaulted so that it is not necessary to key the same information repeatedly. Each order keyed is automatically checked for duplication. Also checked as each order is keyed is the fund to which the order is to be charged. In the order will cause the fund to exceed a library-specified percentage-of-budget-spent, a message is given to the operator.

ACQUSITIONS - CLAIMING. INNOPAC monitors items to see that they actually arrive in the library within the required period of time. With each vendor the library uses, INNOPAC associates a "normal" delivery time. This is recorded in INNOPAC as "number of days after order placed until first claim, second, etc." Thus, INNOPAC automatically knows when to claim the item. On a periodic basis, a library staff member directs the INNOPAC to examine its order files and produce a list of items that should now be claimed. The staff member reviews this list on-line and decides to either issue the claim or not, cancel the order, or just postpone the decision. Once these decisions have been made, the operator has the system sort and print the claims and cancellations.

CLAIMS FOR SERIALS: For each subscription or standing order, the library indicates, when each issue is expected to arrive. (For regular items, INNOPAC will compute these dates.) The library also specifies a "grace period". If the issue does not arrive within the allowed "grace period", INNOPAC will want to claim the issue. In order to actually issue the claims, the library directs the INNOPAC to scan the serial file on a periodic basis to isolate these late issues. Each title that has a late issue is then displayed on the terminal for a staff member to review and make the actual decision whether or not to issue a claim. Once the decision is made, the library can have INNOPAC sort and print the claim. In addition a staff member can at any time, retrieve a record for any serial and any issue.

SERIALS CHECK-IN (REGISTRATION OF INCOMING MATERIALS) Serials check-in is the registration of all types of serials: periodicals, journals, newspapers, government documents, monographic serials, etc. The first step is to retrieve the record. Records for serials may by retrieved by any access point. Our typical access points are tittle, ISSN, or order number. The retrieval is done by keying in as little of the access point as desired. INNOPAC presents the record using a graphical representation of a "Kardex" card. Each "box" on the card is drawn on the screen and shows the date of each issue, its volume and issue number and the date it was received. Highlighted in the "box-" is the status of the issue, for example, EXPECTED, RECEIVED, AT BINDERY, etc. INNOPAC is designed so that the "box" for the next expected issue is "flashing" so that it stands out. If the flashing box is the one for the issue that has just been received, the check-in is recorded merely by pressing the "c" (for Check-in). INNOPAC will automatically change its status from "expected" to ARRIVED, record today's date in the "box", and advance the flashing to the next "box". There is no need to key the volume and issue number, or other data, because INNOPAC has previously computed and recorded that in the boxes on the card, using the information it has from the title.

The library consistently binds serials to preserve them. The Binding staff prepares a title for binding usually when the last issue of a volume arrives. The staff then prints binding slips on INNOPAC which simultaneously changes the boxes in the Kardex screen from ARRIVED to TO BIND. The binding slips tell the bindery how to prepare these journals in book form.

 

!8!

И.В. Азарова, И.М. Беляева, В.П. Захаров, Л.Г. Левашова, В.П. Леонов

Библиотека академии наук

Система информационного обеспечения работ по консервации и реставрации библиотечных фондов в Библиотеке Российской академии наук

Восстановительные работы в Библиотеке Российской академии наук (БАН) в 1988 г., обострили проблемы, связанные с сохранением (консервацией книг).

Начиная с 1992 г. в Библиотеке Российской академии наук (БАН) разрабатывается комплекс программных и лингвистических средств, обеспечивающих создание комплекса связанных между собой баз данных, которые позволят получать данные о текущем состоянии фондов библиотеки и определять методы консервации, учитывающие экологическую обстановку в хранилищах БАН и текущего состояния фонда.

Превентивная консервация библиотечных материалов представляет собой совокупность мероприятий по обеспечению оптимальных условий хранения и пользования библиотечными фондами, а также различные виды обработки с целью продления их сохранности.

Медицинская аксиома "легче предупредить болезнь, чем её лечить" как нельзя лучше отражает сущность превентивной консервации, частью которой является фазовая консервация. Смысл "фазовой" консервации заключается в обеспечении долгосрочной сохранности поврежденных книг в индивидуальных микроклиматических контейнерах до момента реставрации.

Работы по консервации документов были начаты при участии Библиотеки конгресса США и в настоящее время продолжаются в тесном сотрудничестве с институтом консервации П.Гетти (США).

С момента возникновения проекта фазовой консервации создание автоматизированной базы данных рассматривалось как его неотъемлемая часть.

Эта база необходима для того, чтобы следить за ходом реставрации пострадавших книг. Специалистами БАН была разработана структура записи данных, детально отражающая "фонд Бэра" по составу и физическому состоянию изданий с указанием необходимых мероприятий по консервации. Содержание информационной карты формировалось исходя из необходимых сведений о степени сохранности документа и его историко-культурной значимости.

Встает задача информационного обеспечения проблем превентивной консервации. К ней относятся создание документальных, в том числе полнотекстовых баз данных, описывающих библиотечные фонды, фактографических БД, описывающих состояния книг, экологическое состояние книгохранилищ. Многие из этих БД должны вестись в динамике. Для работы с этими базами необходим мощный и разнообразный инструментарий: информационно-поисковые системы, полнотекстовые и гипертекстовые БД, экспертные системы, основанные на предметной базе знаний, фактографические БД.

Предполагается связать воедино все информационные структуры, создаваемые в рамках программы по превентивной консервации книг в БАН. В результате будет получено интеллектуальная база знаний, которая позволит получать оперативные сведения о состоянии фондов в настоящий момент (в том числе помогая выделять те группы книг, которые требуют первоочередной или срочной обработки) и на основе обработки данных, хранящихся в базе, получать сводки изменения состояния книг, выявлять зависимость состояния книг от экологического состояния хранилищ и применяемых методов консервации и в конечном счёте прогнозировать развитие событий и предупреждать нежелательные последствия. Эта же база знаний должна, в конечном счете, стать основой экспертной системы для всех специалистов, связанных с проблемами сохранности книжных фондов и других библиотечных материалов. Для уникальных книг, у которых высока опасность ухудшения состояния (или которые сильно пострадали во время пожара), будет создаваться база компьютерных копий (изображений) на оптических дисках.

Интеллектуальная база знаний требует комплекса программных и лингвистических средств для обработки и поиска информации, в том числе на естественном языке. Разрабатывается несколько лингвистических подсистем для повышения эффективности информационно-поисковых и интерфейсных систем автоматизированного взаимодействия пользователей с ресурсами базы знаний. В частности, это блок тематического атрибутирования текстов на основе автоматизированного словаря ключевых слов для отбора релевантных статей по проблеме "Превентивная консервация", система анализа текста на естественном языке с целью извлечения из нее фактографической информации, блок семантического анализа содержания документов и логического вывода для составления аналитических справок по базе знаний.

В связи с тем, что большая часть публикаций по теме "Превентивная консервация" находится в зарубежных источниках, предполагается, что информация в базу знаний будет поступать на разных языках (в минимальном случае на двух: русском и английском). Поэтому блоки лингвистического анализа с самого начала ориентированы на обработку двуязычного материала.

 

!9!

Т.И.Агеева, В.В. Игнатьева

Библиотека Московского государственного технического университета

Реализация компьютерной технологии в библиотеке вуза

Один из факторов, влияющих на полноту и оперативность информирования читателей о содержании фондов библиотек - качество обработки поступающих в библиотеку документов.

Совершенствование процесса библиотечной обработки в условиях традиционной технологии позволяет несколько улучшить количественные результаты, не предоставляя принципиально новых решений для раскрытия знаний, хранящихся в фондах библиотек.

Социальное значение компьютеризации выражается в изменении содержания деятельности библиотеки. Внедрение компьютерной технологии в библиотеке МГТУ определило некоторые направления в преобразовании библиотеки.

В 1992 году открыт "Зал знаний" - зал с открытым доступом к последним поступлениям периодических изданий и к электронным базам данных по всем поступлениям в библиотеку за последние четыре года.

Читатели могут осуществить поиск по нескольким признакам в базах данных в различных временных интервалах.

Отобранные читателем библиографические описания могут быть распечатаны на принтере и являются требованием для заказа литературы в библиотеке.

Читатель имеет возможность создать собственную базу данных и переписать её на дискету для работы с нею в кафедральной библиотеке или на собственном компьютере.

Одно из новых направлений работы библиотеки - работа по созданию музея университетской книги на базе фонда редких книг библиотеки МГТУ. В большинстве библиотек фонд редких книг относится к пассивной части фонда. Не является исключением и библиотека МГТУ. Создание электронной базы данных фонда редких книг, организация открытого доступа к этому фонду позволяют раскрыть для читателей возможности изучения уникальной литературы.

Компьютеризация библиотечно-библиографических процессов позволяет повысить качество процессов управления фондом, организации справочно-поискового аппарата, подводит к осуществлению возможности взаимосвязи справочных аппаратов различных библиотек, что создает условия для осуществления новых форм обслуживания читателей.

!10

А.В. Васильев

Библиотека по естественным наукам РАН

Автоматизированный комплекс SoLar

В настоящее время в БЕН РАН функционируют следующие программные модули, входящие в автоматизированную библиотечную систему SoLar :

• модуль предварительного заказа литературы по темпланам издательств;

• модуль для заказа и регистрации поступлений обязательного экземпляра;

• модуль регистрации и распределения по библиотекам ЦБС поступающих в БЕН изданий в соответствии с предварительным заказом или без такового;

• модуль обработки сериальных изданий;

• модули автоматического создания и распечатки на бумаге необходимых учётно-бухгалтерских форм;

• модуль систематизации (ввод индексов УДК);

• модуль ввода библиографического описания;

• модуль формирования оригинал-макетов комплектов карточек для каталога с последующей их распечаткой на лазерном принтере;

• программа автоматического присвоения изданиям уникальных расстановочных шифров в формате, принятом в БЕН РАН;

• справочно-информационный модуль, позволяющий получать исчерпывающую информацию об обработанных изданиях;

• набор сервисных программ для работы с Базой данных (программы копирования, импортирования и экспортирования информации, и т.д.).

Опыт разработки и внедрения автоматизированных библиотечных технологий, накопленный в БЕН РАН, позволяет выделить несколько основных аспектов, которые необходимо учитывать при разработке концепции комплексной автоматизации в библиотеках.

Во-первых, это чисто психологические проблемы адаптации библиотечного персонала к работе на персональных компьютерах. Самые сложные операции (например, научную обработку литературы) выполняют, как правило, наиболее квалифицированные и опытные сотрудники. Данная категория специалистов не имеет, в большинстве своем, опыта работы с вычислительной техникой и, зачастую, имеет предубеждение против её использования. Это объясняется как субъективными, так и объективными факторами.

Во-вторых, это проблема экранных форм отображения информации.

Большинство из существующих программных средств создавались профессиональными программистами, мало знакомыми со спецификой работы библиотечного специалиста. Поэтому принцип построения диалогового интерфейса в большинстве случаев определялся традиционным (для программистов) подходом. В качестве примера можно привести программные средства, предназначенные для ввода библиографического описания произведений печати. В подавляющем большинстве из них реализован принцип ввода информации по отдельным полям описания (форматы типа MARC): Ввод первого автора, ввод второго автора, ввод года издания и т.д. Однако данный подход, кроме очевидных преимуществ (простота поиска информации, хорошая переносимость в другие системы и др.) имеет и ряд не менее очевидных недостатков. Реализованный для облегчения жизни программистов он существенно затрудняет работу профессионального библиотекаря.

В-третьих, библиотечная практика имеет ряд особенностей, затрудняющих внедрение автоматизированных технологий. К ним относится, прежде всего, необходимость создания изрядного количества различных форм учётно-бухгалтерской документации, особый режим обработки некоторых видов изданий, необходимость обработки одного издания большим количеством специалистов и др.

В-четвертых, внедрение автоматизированных технологий требует значительных денежных затрат и не дает мгновенного экономического эффекта.

Все вышеизложенное было учтено при создании автоматизированного программного комплекса SoLar , разработанного и внедренного в БЕН РАН.

Среди ряда проблем, связанных с автоматизацией библиотечной технологии в условиях уникальной ЦБС, каковой является сеть научных библиотек БЕН РАН, можно выделить следующие:

• Географическая удаленность ряда библиотек от Центральной библиотеки ЦБС (ЦБ);

• Различные условия комплектования библиотек, входящих в ЦБС;

• Множественность источников комплектования литературой;

• Многообразие типов и видов поступающих в библиотеку произведений печати;

• Наличие бесплатного обязательного экземпляра;

• Многообразие форм учётно-бухгалтерской отчётности;

• Неподготовленность библиотечного персонала к работе на ПК;

• Недостаточная материально-техническая база библиотек ЦБС;

Кроме того, ныне действующий ГОСТ ("Правила библиографического описания произведений печати") не учитывает особенности компьютерных технологий обработки литературы.

При разработке концепции комплексной автоматизации технологических процессов особое внимание уделялось следующим требованиям к программным продуктам:

• узкоспециализированная настройка программ на решение конкретных технологических задач;

• защищенность программных модулей от несанкционированного или неквалифицированного использования;

• возможность установки на одном ПК, как всего комплекса, так и одного (нескольких) модулей в зависимости от решаемой на данном участке технологической задачи;

• контроль за выполнением конкретной операции (информация о дате выполнения и операторе её проводившем);

• максимальная унификация проводимых операций, независимо от типа и вида обрабатываемой литературы;

• максимальная простота и однотипность интерфейса пользователя. Большинство операций сводятся к выбору решения типа "ДА - НЕТ";

• наличие встроенной системы кратких подсказок;

• исключение возможных ошибок при вводе информации за счёт создания списков элементов (там, где это . возможно) и контроль за вводимыми идентификаторами записей и числовыми значениями;

• coxранение (где это возможно) привычных для библиотекарей форм экранного отображения информации;

• создание всех необходимых форм бухгалтерской отчётности с автоматическим подсчётом количества изданий и их стоимости, а также вывод суммы прописью;

• возможность работы на IBM-совместимых ПК любой (минимальной) конфигурации;

• возможность функционирования системы, как в среде локальной сети, так и без неё;

• автоматическое создание архивных копий для резервного сохранения информации;

Программный комплекс "SoLar " обеспечивает полный цикл обработки литературы с момента предварительного заказа до передачи информации в электронный каталог с автоматическим созданием всех необходимых учётно-бухгалтерских форм в соответствии с условиями комплектования библиотек ЦБС и типом (видом) обрабатываемых изданий.

Эксплуатация комплекса в течение полутора лет показала его работоспособность, надежность, удобство и продемонстрировала ряд выгодных отличий от других существующих систем.

!11

О. В. Кириллова

Объединенный институт геологии, геофизики и минералогии СО РАН

Проблемы интеграции информационных и библиотечных процессов в локальной АИБС

Разработка локальной автоматизированной информационно-библиотечной системы (АИБС) требует интегрированного подхода к рассмотрению всех её составляющих. Применения этого принципа в данном случае необходимо, прежде всего, в силу имеющихся, как правило, ограничений в части технической, программной и организационной (профессиональной) оснащенности библиотек низового звена (институтов, предприятий. и.т.п.), особенно на первом этапе создания ЛАБИС.

Иитегрированность должна предусматриваться как в процессе проработки организационно - функциональной и технологической структур системы, так и в выборе комплекса программных и технических средств. В первом случае интегрированность будет проявляться, с одной стороны, в установлении внешних связей с автоматизированными системами вышестоящих организаций, и, с другой стороны, в установлении всех необходимых связей между выделенными для автоматизации функциями и технологическими процессами. В тоже время сам выбор этих процессов должен предусматривать такой спектр задач, который возможно решить наиболее рациональным путем при минимальном наборе таких составляющих АИБС, как:

1) технические средства - 1, мах 2 компьютера;

2) программные средства - min 1 ППП (субд) + 1 редактор;

лингвистические средства (единые, либо совместимые между собой, форматы, рубрикаторы, классификации).

Правильный выбор указанных средств должен, в первую очередь, повлиять на многофункциональность и многоплановость используемого и создаваемого своими силами информационного обеспечения (система взаимосвязанных по определенным параметрам, либо совместимых баз данных, электронных каталогов и картотек).

Рациональное построение локальной АИБС должно также предусматривать возможности дальнейшего расширения своих функций. Локальность системы не означает её замкнутости в своем ограниченном пространстве. Система не может быть полноценна, если не будет учитывать как " близлежащую" информационную среду (существование возможностей подключения к различного типа локальным сетям и системам), так использовать информационные ресурсы и программные разработки организаций верхнего звена (библиотек, информационных органов), а также возможности удаленных каналов связи.

Информатизация нашего общества в последнее время является настолько динамическим процессом, что невозможно даже при существовании относительно хорошо разработанной и внедренной системы говорить о какой-то стабилизации её функционирования. Видимо процесс этот должен продолжаться, и ускорятся, чтобы хотя бы пусть через достаточно длительный промежуток времени достичь сравнимого с зарубежным уровнем развития.

На примере библиотеки академического института рассматривается вариант решения и перспективы дальнейшего развития локальной автоматизированной информационно-библиотечной системы.

 

!12

И.И. Ильина, В.В. Царьков

Российская книжная палата

Проблемы ретроспективной конверсии фондов Государственного Генерального Каталога книг Российской книжной палаты (краткие сведения)

1. Введение

Развитие автоматизированных информационных технологий, широкое распространение средств вычислительной техники в сфере информатики, накопление больших информационных массивов на электронных носителях и предоставление их в "сервис" различным пользователям, развитие средств и методов обработки текущей библиографической информации позволили информационным центрам взяться за решение задачи, которая до начала восьмидесятых годов оставалась "за бортом" автоматизированных информационных систем, а именно - за перевод в электронную форму традиционно формируемых во всех информационных центрах карточных каталогов. Эта задача получила активное развитие и заняла одно из ведущих мест в деятельности международных информационных организаций, в частности, - IFLA - под названием - "Программа ретроспективной конверсии - RECON".

Работы по ретроспективной конверсии традиционных карточных каталогов присущи, по существу, всем библиотекам и информационным центрам, создающим автоматизированные информационные технологии. Это объясняется необходимостью создания единого информационного фонда в электронной форме, так как только на этой основе возможно обеспечение полноценного информационного обслуживания.

2. Государственный Генеральный каталог

Формируется с 1917 г. и содержит сведения более чем о 30 млн. книг, в том числе Государственного алфавитного каталога насчитывается более 20 млн. единиц хранения (каталожных карточек), в том числе более 4,6 млн. оригинальных каталожных карточек в алфавитном каталоге авторов книг, 2 млн. карточек в каталоге заглавий, 3 млн. карточек в каталоге коллективных авторов, 2 млн. карточек в каталоге наименований серий. Для начала работ по ретроспективной конверсии и формированию электронного ретроспективного фонда банка данных Книжной палаты выбран алфавитный каталог авторов (4,6 млн. карточек).

Создание электронного каталога Книжной палаты является масштабным проектом в области информационных технологий, призванным обеспечить все многообразие функций государственной библиографии. В силу специфичности каталогов Книжной палаты, данные которых представляют собой неструктурированные и непериодизированные библиографические записи, затруднен поэтапный ввод баз данных в эксплуатацию, так как каждая из них будет только частью алфавитного ряда всего каталога. Тем не менее, с 1991 г. разрабатывается проект ретроспективной конверсии каталогов Книжной палаты.

3. Состав задач ретроспективной конверсии

Создание проекта ретроспективной конверсии каталога предусматривает решение следующих задач:

- выбор исходного каталога, подлежащего конверсии на первом этапе,

- выбор технологии ввода информации с каталожных карточек,

- создание информационного и лингвистического обеспечения автоматизированной технологии ретроспективной конверсии,

- разработка программного обеспечения ретроспективной конверсии,

- разработка технологии формирования баз данных на основе, данных ретроспективного конвертирования,

- выбор состава технических средств, расчёт их числа, организация технологического процесса.

4. Содержание работ на первом этапе создания проекта

На первом этапе создания проекта ретроспективной конверсии проведено обследования состава фондов Каталога Книжной палаты, проведены работы по анализу технических и программных средств, используемых в информационных центрах (отечественных и зарубежных) для задач ретроспективной конверсии, проведены экспериментальные работы по сканированию текстов каталожных карточек, их распознаванию и последующей конверсии в формализованную запись для загрузки в базы данных. Опыт работ первого года выявил, что первоочередной задачей для создания проекта ретроспективной конверсии Государственного Генерального Каталога Российской книжной палаты являются следующие:

- анализ данных каталога с целью формирования представительного массива типов' каталожных карточек с различными видами библиографических записей;

- создание представительного массива данных о языках текстов изданий (оригиналов, переводов) и о той форме, в которой сведения о языке приводятся в библиографической записи на каталожной карточке;

- создание представительного массива данных о наименованиях географических объектов, о которых идет речь в издании, и о той форме, в которой они приводятся в каталожной карточке;

- создание представительного массива данных о классификационных системах, используемых для систематизации изданий на каталожных карточках;

- анализ систем библиографического описания изданий, методических материалов, руководств и инструкций с целью определения тенденций изменения состава и формы библиографического описания и библиографической записи;

- разработка алгоритмов для создания программ ретроспективной конверсии на все типы библиографических записей;

- сбор информации и анализ программ распознавания текстов каталожных карточек после сканирования с целью определения оптимального варианта технологии.

5. формирование представительного массива типов каталожных карточек

Представительный массив типов каталожных карточек, составляющих Государственный Генеральный каталог, в том числе Алфавитный каталог книг, необходим для получения полной картины типов и видов библиографических записей и библиографических описаний. Формирование этого массива, который в данной разработке выполняет роль модели "микрокаталога" выполнено по следующим правилам.

Микро-каталог составляют:

По какой из этих групп в модель каталога включены:

Перечисленные признаки позволяют сформировать основную часть модели каталога, которая после анализа всех собранных карточек даст возможность определить тенденции трансформации библиографических описаний и записей и пополнить модель каталога с целью доведения его представительности до 100%.

Первая редакция микро-каталога включает около 1500 тыс. типов каталожных карточек.

Вторая редакция микро-каталога охватит еще большее число вариантов карточек и составит не менее 2000 тыс. типов.

Представительность модели микро-каталога позволит обеспечить надежность разработки алгоритмов для программ ретроспективной конверсии и технологии обработки всего объема информации каталога.

6. Создание представительного массива данных о языках текстов изданий

Создание представительного массива данных о языках текстов изданий (оригиналов или переводов, или текстов резюме и др., используемых в библиографической записи) выполняется с целью получения надежной информации о языках, как обязательном элементе в библиографических базах данных (в соответствии с форматом (UNIMARC и RETROMARC).

Создание массива данных о языках текстов изданий проводится по материалам библиографических указателей - "летописей" с 1917 г. По состоянию на 1 кв. 1993 г. проведены работы с информацией 1917-1936 гг. По материалам летописей выбраны сведения о наименованиях и сокращениях 150 языков народов зарубежных стран. Работа со сведениями о языках текстов изданий позволила определить не только состав языков, но и тенденции публикации изданий на тех или иных языках.

Так в 1921-1925 гг. прослеживается тенденция сокращения числа изданий на так называемых национальных языках, и в то же время достаточно много публикаций на украинском, польском, немецком, английском, французском языках.

В 1928 г. начинаются публикации изданий на национальных языках на кириллической графической основе.

В 1930-1936 гг. прослеживается явный рост числа изданий на национальных языках народов СССР.

7. Создание представительного массива данных о наименованиях географических объектов

Создание представительного массива данных о наименованиях географических объектов, приводимых в библиографической записи, выполняется с целью получения надежной информации о наименованиях географических объектов, как обязательном элементе в библиографических базах данных (в соответствии с форматом UNIMARC и RETROMARC).

По состоянию на 1 кв. 1993 г. собрана информация о переименованных географических объектах. Использованы данные Института геодезии и картографии, журнала "Геодезия и картография", материалы Парламента, справочника Административно-территориальных" делений союзных республик, Энциклопедический словарь.

8. Создание представительного массива данных о классификационных системах, используемых для систематизации изданий на каталожных карточках

Создание представительного массива данных о классификационных системах, используемых в библиографических записях каталога, выполняется с целью получения надежной информации о системах классификации, как обязательном элементе в библиографических базах данных (в соответствии с форматом UNIMARC и RETROMARC).

На основе собранной информации проектируется создание автоматизированных таблиц соответствия различных вариантов классификационных систем.

По состоянию на 1 кв. 1993 г. собрана информация о классификационных системах, используемых при обработке изданий для регистрации на каталожных карточках и в летописях, начиная с 30-х годов.

9. Анализ систем библиографического описания изданий методических материалов, руководств и инструкций

Для определения тенденций изменения состава и формы библиографического описания и библиографической записи и разработки надежных алгоритмов конверсии текста библиографической записи в формализованную запись формата RETROMARC проводится анализ методических материалов, используемых при библиографическом описании.

По состоянию, на 1 кв. 1993 г. собрана информация 200 наименований методических материалов по библиографическому описанию, по которым сформирована справочная база данных.

Предусматривается проведение анализа этих документов и подготовка материалов для разработки программ конверсии.

10. Разработка алгоритмов для создания программ ретроспективной конверсии

Перечисленные работы являются подготовительными для создания полноценного программного обеспечения, а именно программ собственно конверсии - преобразования текста библиографической записи в запись формата базы данных с обязательным составом полей данных и структурой записи.

По состоянию на 1 кв. 1993 г. разработан алгоритм конверсии информации каталожных карточек, составленных в соответствии с ГОСТ 7.1-84.

Проект предусматривает и разработку алгоритмов и программ конверсии на все типы библиографических записей.

11. Опытные работы

Работы с информацией Каталога в течение двух лет, изучение программного обеспечения, разработка информационного обеспечения позволили определить направления работ с информацией начала века. В частности с информацией, включенной в каталог с 1917 г.

В силу того, что качество полиграфического исполнения этих карточек низкое, состав библиографических записей слабо формализован, обработка этой информации автоматизированным способом (сканер и конверсия) практически невозможна. Поэтому выбрана "ручная", технология ввода той информации, последующее полуавтоматическое редактирование записи и преобразование её в формализованную запись базы данных.

 

!13

Т.Н.Соловьева

Библиотека по естественным наукам РАН

Работа по адаптации ДИАЛОГА-М для создания и поддержания электронного каталога.

После ввода в эксплуатацию автоматизированной системы обработки литературы по пути книги для БЕН РАН актуальной становится задача ведения электронного каталога, информация для наполнения которого, формируется в процессе технологической обработки литературы.

К системе поддерживающей электронный каталог предъявляются следующие требования: загрузка и актуализация электронного каталога, поиск и заказ литературы.

Готовое математического обеспечения для решения подобных задач в целом отсутствует, но в то же время известны поисковые системы которые при соответствующей доработки могли бы быть использованы для решения такой задачи. Одна из таких систем ДИАЛОГ-М - диалоговая система накопления и поиска информации.

Это достаточно хорошо разработанный ППП с широкими поисковыми возможностями, являющийся частью семейства "Диалог" и отвечающий основным требованиям задачи по ведению электронного каталога, но требующий при его использовании соответствующих изменений. ДИАЛОГ-М хорошо известен специалистам БЕН РАН. Этот пакет, разработанный в МЦНТИ был выбран и адаптирован специалистами Библиотеки для использования, в качестве ядра, информационной системы для абонентов НИУ РАН на ПК.

Типовая система для абонентов НИУ РАН ИРИ на ПК, внедрена в БЕН РАН в 1992 году. Система разрабатывалась как элемент существующей с 1979 г. в Библиотеке технологии информационного обслуживания учёных научных институтов, входящих в сеть БЕН, но может использоваться и самостоятельно или в составе других систем информационного обслуживания.

Система была внедрена в нескольких институтах РАН и имеет положительные отзывы пользователей.

Подготовленная и сконвертированная в БЕН РАН во входной формат "Диалог-М", информация загружается в систему. Каждый пользователь, которому присвоен код абонента, может провести поиск по собственным запросам. Результаты поиска записываются в файл с именем, соответствующим коду абонента. Файл сохраняется и к нему возможно многократное обращение без повторного проведения поиска. Документы из файла результатов поиска просматриваются абонентом в полном или карточном формате и оцениваются по принятой системе оценок обратной связи. Представляющие интерес документы могут быть отобраны, выведены в отдельный файл, загружены в личную БД или распечатаны в полном или карточном формате весь массив, или часть его, или отдельные документы. При необходимости формируется заказ на копии первоисточников для всех абонентов.

Проанализировав все сказанное выше за основу системы по ведению электронного каталога был взят модернизированный специалистами БЕН ППП ДИАЛОГ-М (Версия ППП 2.0+). Этот пакет отвечает основным требованиям задачи по ведению электронного каталога, (загрузка, актуализация и поиск) но необходимо дополнить пакет программами, обеспечивающими пользователю заказ литературы.

ДИАЛОГ-М включает в себя две самостоятельные части:

первая, из которых обеспечивает создание и корректировку баз данных, вторая - поиск информации. Каждая из них может работать отдельно, либо вместе как единое целое. Такое разбиение системы на две части удобно для поддержания электронного каталога. Первая часть ППП используется для задачи электронного каталога без существенных изменений за исключением сервисных. Таким образом, информация, сформированная в процессе обработки по пути книги, конвертируется в формат ДИАЛОГ-М и загружается в систему в пакетном режиме. Вторая - поисковая, существенно изменена: из системы удалены лишние меню и процедуры, не имеющие отношения к задаче и введены новые, недостающие, процедуры, позволяющие расширить возможности системы и соединить ДИАЛОГ-М с другими библиотечными системами.

Создав, таким образом, электронный каталог в системе ДИАЛОГ-М, пользователю, которому присваивается код абонента, предоставляются следующие возможности: составить запрос, при необходимости просмотрев словарь, и прогнать его в системе; просмотреть результаты поиска в формате, приближенном к библиографической карточке (или любом другом заранее предусмотренном в системе); отметить документы, по которым нужен первоисточник, либо отметить документы, которые надо распечатать. При этом весь спектр поисковых возможностей, предусмотренный ППП ДИАЛОГ-М, сохраняется.

По окончании работы система формирует файл на заказ литературы для данного пользователя, который сохраняется и при необходимости может быть дополнен. Этот файл передается в систему обслуживания читателей, которая, в свою очередь, обрабатывая этот файл, сформирует заказ на литературу по абонементу.

Такую систему можно рекомендовать в библиотеки НИУ РАН, а особенно тем, которые приобрели для решения своих библиотечных задач ДИАЛОГ-М.

!14

А.Ф. Новоженин, С.Р. Баженов

Государственная публичная научно-техническая библиотека СО РАН

Ввод и первичная обработка информации при формировании электронного каталога изданий

Для сокращения времени поиска и получения, интересующих читателя изданий в ГПНТБ СО РАН создается электронный каталог библиотеки на основе ввода массива новых поступлений. В настоящее время введена информация за 2,5 года.

В результате проведения сравнительного анализа различных пакетов прикладных программ (ППП) в качестве базового (типового) ППП для IBM-совместимых ПЭВМ был выбран пакет CDS/ISIS/M, разработанный под эгидой ЮНЕСКО и адаптированный в нашей стране Международным центром научнотехнической информации (МЦНТИ).

Пакет работает под управлением операционной системы MS-DOS (версии 3.2 и выше) и по сравнению с другими программными системами аналогичного назначения CDS/ISIS/M обладает следующими преимуществами:

Система позволяет интегрировать различные проблемноориентированные базы данных в единую взаимосвязанную систему, отвечающую мультибазовой концепции и открытую с точки зрения расширения состава баз данных.

Ввод информации в ГПНТБ СО РАН осуществляется с помощью специальной разработанной программы, работающей автономно и позволяющей просматривать введенные документы, распечатывать их в виде библиографических карточек. Программой - конвертером производится преобразование информации в формат ISO-2709. Затем средствами системы ISIS введенные документы загружаются в БД.

Анализ достоинств и недостатков различных систем ввода информации показал необходимость разработки программы ввода, работающей под управлением системы CDS/ISIS/M и обеспечивающей работу в удобном для пользователя виде.

Комплекс программ ввода информации, разработанной для этой цели в ГПНТБ СО РАН, позволяет подготавливать в интерактивном режиме меню и окна ввода и обеспечивает следующие дополнительные возможности:

Ввод информации осуществляется напрямую в БД одновременно несколькими пользователями в сетевом режиме. При вводе обеспечивается доступ как к записям этой БД (для нахождения дублетов, общих частей многотомного или сериального издания и т.п.), так и к записям других БД (справочников). Внедрение данного комплекса программ позволяет реализовать технологию сквозной обработки поступающих в библиотеку изданий от заказа литературы до её поступления в читальные залы и книгохранение.

В докладе приводится классификация систем ввода и информации. Дается анализ достоинств и недостатков различных систем по сравнению вышеописанной. Описываются технологические особенности формирования электронного каталога, задачи первичной обработки информации в ГПНТБ СО РАН. Раскрывается состав, структура, связи и программная реализация системы ввода и первичной обработки информации ГПНТБ СО РАН.

 

!15

О. Д. Каллистратова

Библиотека по естественным, наукам РАН

Электронный каталог распределенного фонда периодических изданий в ЦБС

Создание и использование электронных каталогов фондов литературы на современном техническом уровне актуально как для оперативного информационного обеспечения научных работников, так и для анализа и повышения эффективности её использования.

Особенно это необходимо в централизованных библиотечных системах (ЦБС), таких как Библиотека, по естественным наукам РАН, которая централизованно комплектует по предварительным заказам основной фонд и фонды сети библиотек НИУ РАН научной литературой, большую часть которой составляют периодические издания (ПИ).

Для формирования электронного каталога распределенного фонда периодических изданий в БЕН РАН на ПК разработана система ДИСКАТ , которая поддерживает все основные операции ведения каталога в режиме диалога, в том числе технологию регистрации сотрудниками библиотек новых поступлений выпусков ПИ и распределения их экземпляров в сеть, требуя минимального ввода информации и автоматически формируя все необходимые документы. При этом в каталоге накапливается информация о томах и номерах поступивших выпусков ПИ и их распределениях по сети с указанием года и номера недели поступления, а также кода источника поступления.

До 1992 года основными источниками поступления зарубежных ПИ были, покупка за валюту и международный книгообмен. Однако экономические трудности в нашей стране в последнее время привели, с одной стороны, к появлению новых каналов централизованного поступления литературы, таких как гуманитарная помощь от издательских фирм и посредников, например, Soros или American Chemical Society, и одновременному расширению сети получателей зарубежной периодической литературы через БЕН РАН из других ведомств помимо РАН. С другой стороны, эти же трудности вызвали частичную де централизацию получения зарубежных ПИ по благотворительным каналам некоторыми библиотеками сети БЕН РАН. Все это потребовало существенной переработки и развития возможностей системы ДИСКАТ .

В результате всех модификаций современный вариант системы ДИСКАТ обеспечивает следующие возможности накопления и использования электронного каталога распределенного фонда ПИ:

Накопление информации происходит в диалоговом режиме. Сначала в базу данных вводятся описания и заказы ПИ. При этом возможна корректировка любых элементов и удаление ненужных данных. В последнем варианте системы введена возможность редактирования пользователями справочных файлов по мере необходимости ввода новых кодов источников поступлений литературы, а также кодов и сигл новых библиотек. Кроме того, значительно расширена сервисная помощь во время работы с системой, в том числе введена возможность использования имеющейся в базе информации в качестве справочной.

При распределении новых поступлений по запросам системы последовательно вводятся ISSN, год, том и номер ПИ, затем код источника поступления и количество поступивших экземпляров. На экран выводятся атрибуты издания, все поступившие номера этого года, данные о количестве заказанных экземпляров и количество поступивших экземпляров данного выпуска, и список библиотек-заказчиц с распределением данного выпуска. После этого предлагается в зависимости от вспомогательной информации в заказе сначала отправить по экземпляру на просмотр, микрофиширование и каталогизацию, закрепив их за желаемыми библиотеками, затем остальные экземпляры распределить по заказчикам. В системе можно распределить не более заказанного количества экземпляров. При распределении в основной фонд дополнительно печатается бланк-заказ на копирование материалов из выпуска для ВНП БЕН РАН. Для изданий, направляемых на каталогизацию или микрофиширование, формируются сопроводительные документы.

Для контроля за получением зарубежной периодической литературы поступающей по благотворительным каналам, издательским фирмам и посредникам требуются отчётные документы о ее распределении. Поэтому в систему введена возможность формирования и вывода, как на печать, так и на дискеты новых форм отчётных документов для различных кодов поступления журналов, в которых должны присутствовать источник поступления, дата и алфавитный список поступивших выпусков ПИ с указанием года издания, тома, номера и списка получателей каждого номера. При формировании документов предусмотрены различные кодировки библиотек-получателей для разных кодов поступлений, так как отчёты иностранным фирмам используют только латинский алфавит и содержат коды библиотек сети БЕН РАН и сиглы прочих библиотек, а списки поступлений по валюте, МКО и т.д. содержат все сиглы.

Одновременно усовершенствовано формирование для библиотек сопроводительных списков новых поступлений ПИ в соответствии с требованиями БЕН к спискам последних поступлений ПИ в основной фонд, которые еженедельно формируются для ВНП БЕН РАН и в двух экземплярах передаются в отдел обслуживания читателей.

В последнее время возникла тенденция к частичной децентрализации получения литературы непосредственно библиотека ми. Поэтому для снижения вероятности дублирования периодической литературы при её распределении в сеть необходимо в общий каталог фондов ПИ вводить информацию о децентрализованных поступлениях журналов в библиотеки НИУ РАН. Эта информация может поступать из библиотек либо в файлах на дискетах, либо на рабочих листах с перенесением на дискеты в БЕН РАН. Ввод такой информации с дискет в общую базу данных фондов ПИ осуществляется в пакетном режиме программой, которая считывает информацию из файлов на дискетах, проверяет наличие всех требуемых разделителей и заносит в общую базу данных с кодом поступления "I" только данные о выпусках журналов, заказанных централизованно и еще не полученных. Введенная информация убирается с дискет. Оставшиеся записи содержат либо неверно сформатированные данные, которые можно исправить и ввести повторно, либо информацию о выпусках изданий, отсутствующих в централизованных заказах либо уже распределенных.

Для оперативного получения справочной информации о наличии ПИ л фондах ЦБС в отделах алфавитных каталогов и международного книгообмена БЕН РАН на ПК функционирует электронный каталог фондов зарубежных ПИ, база данных которого обновляется ежемесячно с копий баз данных, формируемых на ПК в отделе комплектования иностранной литературой.

Доступ к сводному каталогу фондов ПИ реализуется подсистемой СКАТ системы ДИСКАТ . Подсистема СКАТ обеспечивает быстрый просмотр информации либо по отдельным изданиям, либо по алфавиту названий ПИ с любого места в обоих направлениях подряд или по групповому условию, которое пользователь формирует в режиме подменю с объединением условий для разных параметров (фрагмент названия, страна, тематика и т.д.), выбираемых в произвольном порядке с выбором отношений и вводом нужных значений.

Для каждого выбранного издания на экран выдается постоянная информация (полное название, страна издания, ISSN,. периодичность и т.д.) и меню по годам издания, имеющимся в базе. При выборе года издания на экран выдается общее количество заказанных экземпляров, список библиотек, заказавших журнал в данном году и все поступившие в БЕН и сеть выпуски данного ПИ, упорядоченные по томам и номерам.

При неполной экземплярности выпуска за ним в круглых скобках даются сведения о его наличии в библиотеках, указываемые символами "+" и "-" в порядке, соответствующем расположению библиотек в заказе, например:

Physical Review. A. Atomic, Molecular and Optical Physics

USA ISSN 1050-2947 шифр U22847 тематика 30 период

-----------------------------

24 1993 год 17 экз.-БЕНОФ КФТИ ФИАН ИФПР ИФТТ БНЦ КОФ

ИКИ ИОФ ИСАН СИРЭ ИВТ МИТП ИММ ИЭФ

т.47 н.н. 1(+-+- - - - - - - - - - - - - -); 2(+-+ - - - - - - - - - - - - -);

т.47 н.н. 3(++- - - - - - - - - - - - - - -);

т.48 н.н. 1(+- - - - - - - - - - - - - - - -); 2(+- - - - - - - - - - - - - - - );

т.48 н.н. 3(+ - - - - - - - - - - - - - - - -);

------------------------------

По мере накопления электронного каталога фондов ПИ все чаще возникает необходимость выборки из него различной информации для просмотра и анализа, а также для использования в других автоматизированных информационно-поисковых системах. Для этого в рамках системы ДИСКАТ разработаны программы выборки и конвертирования информации в файлы различных форматов. Например, для АС НТИ ЗПИ из каталога фондов зарубежных ПИ выбираются ежегодные данные о новых поступлениях в ЦБС БЕН РАН, которые упорядочиваются и объединяются по номерам в пределах одного тома, конвертируются в формат ввода ISO-2709 системы CDS/ISIS и передаются на дискетах в ГПНТБ России.

На сегодняшний день электронный каталог распределенного фонда ЦБС БЕН РАН содержит информацию о зарубежных периодических изданиях более пяти тысяч наименований начиная с 1990 года издания, поступивших по различным каналам (покупка за валюту, международный книгообмен, благотворительная помощь различных обществ и т.д.) и распределенных в основной фонд и сеть более 300 библиотек НИУ РАН и других ведомств.

Каталог поддерживается системой ДИСКАТ , которая обеспечивает быстрый доступ и экономное размещение информации о распределении по сети поступивших выпусков ПИ вне зависимости от значительных расхождений в периодичности и экземплярности. Система позволяет вводить новые функции при возникновении новых требований к её возможностям и полностью отказаться от ведения традиционных картотек регистрации ПИ, заменив их электронными каталогами.

Использование электронных каталогов распределенных фондов ПИ существенно повышает оперативность, уровень сервиса и качество контроля за поступлением периодических изданий, особенно зарубежных, пользующихся наибольшим спросом у научных сотрудников РАН.

 

!16

В.В. Васильчиков, А.В. Глушановский, Н.Е. Калёнов

Библиотека по естественным наукам РАН

Представление информации в библиографической базе данных и её использование

Традиционно библиографические базы данных (ББД) ориентируются на одну из двух групп пользователей, условно обозначаемых нами "библиографы" и "ученые". К первой группе мы относим тех, кого интересует издание в качестве материального объекта (в том числе его производитель, размеры, цена) и правовые аспекты этого издания (первичная, вторичная, альтернативная, коллективная ответственность и т.п.). "Учёных" издания интересуют в качестве материальных носителей нужной им информации. В ББД, ориентированных на первую группу, подробно расписываются области выходных данных, физических характеристик, примечаний. Примером таких ББД могут служить традиционные библиотечные каталоги. В них можно быстро найти нужную карточку по фамилии автора или первому слову из названия, но для поиска литературы по какому-либо узкому разделу знаний необходимо просмотреть (перебрать !) все карточки соответствующего раздела систематического каталога.

В других ББД (таких как Chemical Abstracts, MEDLINE, Science Citation Index) подробно расписываются содержательные аспекты издания - слова из заглавия и реферата, ключевые слова (авторские, референта), дескрипторы, различные классификационные индексы и значительно меньше внимания уделяется описанию издания как продукции издательско-полиграфического процесса.

Правильная оценка предполагаемого круга пользователей ББД имеет вполне конкретный экономический эффект, так как (для форматов типа ISO-2709 и MARC) чем больше полей в библиографической записи, тем дольше ввод её, выше тре6ования к квалификации тех, кто занят подготовкой и вводом информации (а значит выше и оплата труда) и больше должна быть емкость дисковой памяти.

Нам представляется перспективной разработка Б БД, дробность представление информации, в которых определяется следующими критериями:

• минимизация количества служебной информации,

• близость к стандартному библиографическому описанию,

• возможность программного выделения элементов библиографического описания,

• частота использования элементов библиографических записей в процессе поиска и генерации отчётов.

Следует учитывать и тот факт, что в очень больших библиографических базах данных, особенно при сплошной росписи журналов, значительная часть статей оказывается невостребованной. Поэтому целесообразно часть работы по выделению элементов бибописания перенести со стадии загрузки всех документов в БД на стадию поиска или генерации отчёта только для востребованных документов. Это же верно и при вводе в электронный каталог информации о старых изданиях, ибо, чем старше издание, тем реже спрос на него.

Возможность загрузки ББД документами в формате стандартного библиографического описания наиболее актуальна для создания ретроспективного электронного каталога. При наличии конвертера становится возможным с помощью сканера и соответствующих программ преобразовать в текстовые файлы Ежегодники Книжной палаты и создать полный библиографический указатель всех изданий СССР. Правда, для выполнения этой работы необходимо улучшить программы выделения текста из графического изображения, значительно повысив достоверность распознавания букв и, особенно, цифр (год, номер, выпуск, страницы).

Достоверность введенной информации может быть значительно повышена за счёт использования дополнительных источников - библиографических карточек, массивов ВИНИТИ, различных библиографических указателей. Все несовпадения могут фиксироваться и выдаваться операторам для принятия решений. При вводе переизданий может использоваться информация о предыдущих изданиях. В процессе ввода должны формироваться словари (authority-files фамилий, имен, отчеств, городов, издательств, типографий), используемые для контроля за вводом информации. Другими словами, при считывании информации целесообразно управлять преобразованием графического изображения в текст с учётом ранее введенной информации.

Потенциальные возможности описанного подхода к распознаванию элементов бибописания иллюстрируются на примере разработанного в БЕН РАН конвертера, преобразующего библиографическое описание книг (текстовый файл с записями, соответствующими ГОСТ 7.1-84 ) в файл, соответствующий требованиям формата UNIMARC в редакции ГПНТБ. Программа накладывает на исходный текст бибописания некоторые ограничения, большинство из которых довольно естественны. Например, заголовок бибописания не должен начинаться с красной строки, знаки, предусмотренные ГОСТом для разделения элементов бибописания, должны окружаться пробелами. Должны строго соблюдаться ГОСТы на сокращения слов, ибо сокращения типа "ил.", "Рез.", "Библиогр." используются для идентификации областей и отдельных элементов библиографического описания.

Примеры преобразований форматов.

карточка:

Проблемы экологического мониторинга и моделирования

экосистем

Т. 15. - 1993. - 289 с. : ил. - Рез. работ англ. Библиогр.

в конце работ. - ISBN 5-2S6-OOS56-9.

 

Запись 1 Маркер записи = 00525nam 2200205 i450

Статус записи-новая запись

Коды применения

Тип записи - языковые материалы, печатные

Библиографический уровень - монографический

Код иерархического уровня - иерархическая связь не определена

Длина индикатора - 2

Длина идентификатора подполя - 2

Базовый адрес данных - 00205

Дополнительное определение записи - 17-19

Уровень кодирования - полный уровень

Форма каталогизационного описания - Запись частично в формате ISBD

План справочника 20-23

Длина поля - 4

Длина начальной позиции символов - 5

Длина части, определяемой при применении - 0

001 Идентификатор записи KatBEN00001▲

010 ISBN

▼ a5-2S6-OOS56-9▲

идентификатор = а подполе - 5-286-00856-9

100 Данные общей обработки

▼al9950421dl993 |||y0rusy0102 са▲

Дата ввода записи в файл: 19950421

Тип даты публикации: монография, издаваемая полностью или в течение года

Дата издания 1993

Код целевого назначения |||

Правительственная публикация - неправительственная публикация

Код модифицированной записи 0 - немодифицируемая запись

Язык каталогизации : rus

Правила транслитерации не используются

Наборы символов : 0102

Дополнительные наборы символов :

Графика заглавия : са

101 Язык документа

| ▼arus▼d|||▲

Язык текста: rus Язык резюме: |||

105 Поле кодированных данных: Книга

▼aa|||z 001|| ▲

Коды иллюстраций - а|||

Коды формы содержания - z

Не является изданием, публикуемым от имени конференции

Не юбилейное издание

Указатель имеется

200 Заглавие и сведения об ответственности

1 ▼аПроблемы экологического мониторинга и моделирования экосистем▲ Заглавие является значимым

Основное заглавие: Проблемы экологического мониторинга и моделирования экосистем

210 Публикации, распространение и т.д.

▼dl993▲

Дата издания, распространения: 1993

215 физическая характеристика

▼a289 с▼ сил▲

Обозначение специфического вида материала: 289 с

Другие уточнения физических характеристик: ил

225 Серия

1 ▼vT.15▲ Форма заглавия: нет установленной формы

Обозначение тома: Т.15

300 Общие примечания

▼аРез. работ англ.▲

идентификатор = а подполе - Рез. работ англ.

320 Примечания о наличии в документе библиографии

▼аБиблиогр. в конце работ▲

идентификатор = а подполе - Библиогр. в конце работ

675 УДК

▼а504.064.36:574▲

Индекс УДК: 504.064.36:574

675 УДК

▼a574.001.573▲

Индекс УДК: 574.001.573

801 Источник составлена записи

0▼aSU▼ b60▼c19950421▲

Агентство, первоначально составляющее запись

Страна: SU

Агентство: 60

Дата составления: 19950421

901 ????

▲ ▼ а1001103X

идентификатор = а подполе - 10011ОЗХ

карточка:

Альбом принципиальных схем персональных компьютеров.

-М. : Машиностроение, 1992. - 342 с: : схем. - ISBN 5-217-

02029-6.

 

Запись 2 Маркер записи = 00456nam 2200169 i 450

Статус записи - новая запись

Коды применения

Тип записи - языковые материалы, печатные

Библиографический уровень - монографический

Код иерархического уровня - иерархическая связь не определена

Длина индикатора - 2

Длина идентификатора подполя - 2

Базовый адрес данных - 00169

Дополнительное определение записи - 17-19

Уровень кодирования - полный уровень

Форма каталогизационного описания

Запись частично в формате ISBD

План справочника 20-23

Длина поля - 4

Длина начальной позиции символов - 5

Длина части, определяемой при применении - 0 001 Идентификатор записи KatBEN00002▲

010 ISBD

▼а5-217-02029-6▲

идентификатор = а подполе - 5-217- 02029-6

100 Данные общей обработки

▼a19950421dl992 |||y0rusy0102 са▲

Дата ввода записи и файл: 19950421

Тип даты публикации: монография, издаваемая полностью или в течение года

Дата издания 1992

Код целевого назначения |||

Правительственная публикация - неправительственная публикация

Код модифицированной записи 0 - немодифицируемая запись

Язык каталогизации : rus

Правила транслитерации не используются

Наборы символов : 0102

Дополнительные наборы символов :

Графика заглавия : са

101 Язык документа

| ▼arus▲

Язык текста: rus

102 Страна публикации или производства

▼aSU▼bsu▲

Страна публикации: SU

Место издания: su

105 Поле кодированных данных: Книга

▼аа|||z 000||▲

Коды иллюстраций - а|||

Коды формы содержания - z

Не является изданием, публикуемым от имени конференции

Не юбилейное издание

Указатель отсутствует

200 Заглавие и сведения об ответственности

1▼аАльбом принципиальных схем персональных компьютеров▲

Заглавие является значимым

Основное заглавие: Альбом принципиальных схем персональных компьютеров

210 Публикации, распространение и т.д.

▼сМашиностроение▼d1992▼аМ.▲

Имя издателя, распространителя: Машиностроение

Дата издания, распространения: 1992

Место издания, распространения: М.

215 физическая характеристика

▼а342с▼ссхем▲

Обозначение специфического вида материала: 342 с Другие уточнения физических характеристик: схем

675 УДК

▼а681.322-181.4] .02:621.3.061 ПЭВМ (084)▲

Индекс УДК: 681.322-181.4] .02:621.3.061 ПЭВМ (084)

801 Источник составления записи

0▼aSU▼b60▼cl9950421▲

Агентство, первоначально составляющее запись

Страна: SU

Агентство: 60

Дата составления: 19950421 .

901 ?????

▲▼а1001103X

идентификатор = а подполе - 1001103Х

карточка:

Калинин_Анатолий Сергеевич, Смирнов_Александр Ниолаевич.

Динамические модели рудно-магматических систем на примере

месторождений вольфрама, молибдена и олова юга

Восточной Сибири. - Иркутск : Изд-во Иркут. ун-та, 1993. -

159 с. : ил., карт. - Библиогр.: с.153-158. - ISBN 5-7430-0413-7.

Запись 3

Маркер записи = 00625nam 2200205 i 450

Статус записи - новая запись

Коды применения

Тип записи - языковые материалы, печатные

Библиографический уровень - монографический

Код иерархического уровня - иерархическая связь не определена

Длина индикатора - 2

Длина идентификатора подполя - 2

Базовый адрес данных -- 00205

Дополнительное определение записи - 17-19

Уровень кодирования - полный уровень

форма каталогизационного описания: Запись частично в формате ISBD

План справочника 20-23

Длина поля - 4

Длина начальной позиции символов - 5

Длина части, определяемой при применении - 0

001 Идентификатор записи KatBEN00003▲

010 ISBD

▼а5-7430-0413-7▲

идентификатор = а подполе - 5-7430-0413-7

100 Данные общей обработки

▼ al9950421dl993 |||y0rusy0102 ca▲

Дата ввода записи в файл: 19950421

Тип даты публикации: монография, издаваемая полностью или в течение года

Дата издания 1993

Код целевого назначения |||

Правительственная публикация - неправительственная публикация

Код модифицированной записи 0 - немодифицируемая запись

Язык каталогизации : rus

Правила транслитерации не используются

Наборы символов : 0102

Дополнительные наборы символов :

Графика заглавия : са

101 Язык документа

| ▼ arus▲

Язык текста: rus

102 Страна публикации или производства

▼aSU▼ bsu▲

Страна публикации: SU

Место издания: su

105 Поле кодированных данных: Книга

▼аa|||z 001||▲

Коды иллюстраций - а|||

Коды формы содержания - z

Не является изданием, публикуемым от имени конференции

Не юбилейное издание

Указатель имеется

200 Заглавие и сведения об ответственности

1▼ аДинамические модели рудно-магматических систем на примере

месторождений вольфрама, молибдена и олова юга Восточной Сибири ▲

Заглавие является значимым

Основное заглавие: Динамические модели рудно-магматических систем

на примере месторождений вольфрама, молибдена и олова юга Восточной

Сибири

210 Публикации, распространение и т.д.

▼ сИзд-во Иркут. ун-та▼ d11993▼ аИркутск▲

Имя издателя, распространителя: Изд-во Иркут. ун-та

Дата издания, распространения: 1993,

Место издания, распространения: Иркутск

215 физическая характеристика

▼ а159 с▼ сил., карт▲

Обозначение специфического вида материала: 159 с

Другие уточнения физических характеристик: ил., карт

320 Примечания о наличии в документе библиографии

▼ аБиблиогр. : с. 153-158▲

идентификатор = а подполе - Библиогр. : с. 153-158

675 УДК

▼а553.4.065.001.57(571.5)▲

Индекс УДК: 553.4.065.001.57(571.5)

700 Имя лица-первичная интеллектуальная ответственность

1▼аКалинин▼ bА.С.▲ Имя лица записано под фамилией

Начальный элемент ввода: Калинин

Часть имени, кроме начального элемента ввода: А.С.

701 Имя лица-альтернативная интеллектуальная ответственность

1▼ аСмирнов▼ bА.Н.▲ Имя лица записано под фамилией

Начальный элемент ввода: Смирнов

Часть имени, кроме начального элемента ввода: А.Н.

801 Источник составления записи

0▼aSU▼ b60▼cl9950421▲ Агентство, первоначально составляющее

запись

Страна: SU

Агентство: 60

Дата составления: 19950421

901 ?????

▲ ▼а1001103X

идентификатор = а подполе - 1001103Х

 

 

!17

Е.Б. Грешнов, А.И. Павлов, А.Б. Юдин

Государственная публичная научно-техническая библиотека СО РАН

Локальная вычислительная сеть в библиотеке

Одним из основных обеспечивающих комплексов библиотечной информационной системы является локальная вычислительная сеть (ЛВС) - аппаратно-программный комплекс, объединяющий все сосредоточенные в библиотеке персональные компьютеры (ПК), удаленные ПК вне библиотеки (в отделении библиотеки, в библиотеках сети, в научно-исследовательских учреждениях Сибирского отделения Российской академии наук), связь с которыми может обеспечиваться через модемы по коммутируемым или выделенным телефонным каналам, а, кроме того, возможно, включающий в себя традиционные средства информационных коммуникаций (например, системы телефаксной и телексной связи библиотеки). Такое объединении позволит обеспечить коллективный доступ к единому информационному "полю" на жестких магнитных дисках большого объема и лазерных компакт-дисках, а также коллективное использование дорогостоящего оборудования внешних коммуникаций, дорогостоящего оборудования ввода-вывода информации (лазерных, струйных принтеров, сканеров и т.п.).

В государственной публичной научно-технической библиотеке СО РАН в качестве такого комплекса выбрана и с 1991 г. эксплуатируется локальная сеть (а в будущем ассоциация локальных сетей) фирмы Novell Inc.

Сети фирмы Novell Inc., программную основу которых составляет сетевая операционная система NetWare/386 V.3.11, обеспечивают дисциплину обслуживания пользователей в сети по типу "клиент-сервер> с сосредоточением дорогостоящих коллективных ресурсов общего пользования на специализированных мощных сетевых компьютерах - серверах (файловых серверах, принт-серверах, коммуникационных серверах, серверах соединений и т.п.), с предоставлением доступа к их ресурсам со сравнительно маломощных компьютеров - сетевых рабочих станций.

В сетях Novell NetWare в качестве серверов обычно используются IBM-совместимые персональные компьютеры класса IBM PC/AT-386(486) или IBM PS/2 старших моделей. В качестве рабочих станций в сетях Novell NetWare допустимо использование практически всех распространенных типов ПК - IBM PC/XT, IBM PC/AT, IBM PS/2, IBM PS/1, Macintosh с различными операционными системами - MS-DOS, PC-DOS, DR-DOS, OS-2, OS Macintosh, UNIX.

В настоящее время в ГПНТБ СО РАН эксплуатируются две не связанные локальные сети Novell Netware в следующей в следующей конфигурации:

1) сеть в составе одногофайлового сервера IBM PC/AT- -486DX с операционной системой Netware/386 V.3.11, девяти рабочих станций IBM PC/XT, одной рабочей станции IBM РС/АТ-286, объединенных с использованием сетевых адаптеров типа ARCNet со средой передачи данных - витая телефонная пара; данная сеть эксплуатируется в технологическом процессе обработки входного потока литературы библиотеки;

2) сеть в составе одного файлового сервера IBM PC/AT-386DX с операционной системой Net Ware/386 V.3.11, трех рабочих станций IBM PS/1-386SX, одной рабочей станции IBM РС/АТ-386, объединенных с использованием сетевых адаптеров ' типа ARCNet со средой передачи данных - коаксиальный кабель; данная сеть используется в настоящее время в основном как инструментальный комплекс для разработчиков-программистов.

!18

А. О. Провоторова

Вычислительный центр коллективного пользования РАН

Особенности создания информационной системы "Библиотека ВЦ" на базе локальной вычислительной сети

К информационным системам (ИС) на современном этапе развития средств вычислительной техники и. методов их применения относят автоматизированные системы различного назначения, информационно-поисковые системы (в том числе библиотечные) и др. Свою роль ИС начали полностью выполнять с внедрением технологии, в основе которой - использование распределенных баз данных (РБД).

Концепция РБД основана на логической интеграции ресурсов данных, которые физически распределены по территориально удаленным друг от друга вычислительным системам, связанных в локальную сеть.

Информационная система "Библиотека ВЦ" функционирует на базе:

Входными данными системы являются:

Способ организации РБД системы "Библиотека ВЦ" - частичное дублирование. Данный способ распределения базы данных, выбран в связи с тем, что сеть является неоднородной, т.е. аппаратура, ОС, субд и другие компоненты в узлах сети различны. С другой стороны, выбор частичного дублирования базы данных определяются структурой сети. В качестве главного узла в сети звездообразной структуры выступает МВК "Эльбрус-2". Такие важные характеристики, как высокое быстродействие, возможность хранения большого объема данных обусловили хранение архивных данных на МВК "Эльбрус-2", т.е. главная копия базы данных размещается на главной ЭВМ.

Полное дублирование в данной сети невозможно из-за ограниченного объема памяти периферийных узлов (персональных ЭВМ), следовательно, в узлах пользователей целесообразно хранить копии отдельных частей архивной базы данных. Периферийные узлы взаимодействуют с главной ЭВМ, но не обязательно между собой.

Одной из особенностей системы "Библиотека ВЦ" является то, что каждая из рабочих баз данных содержит на ПЭВМ только те данные, которые запрашивались пользователем в архивной базе данных и которые необходимы ему для дальнейшей работы. Базы данных и соответствующий им набор файлов описаний, сформированные на ПЭВМ по запросам могут изменяться, пополняться, объединяться как это удобно данному пользователю, тогда как архивные базы данных снабжены защитой и являются условно-постоянными.

Таким образом, с точки зрения технологии предпосылкой выбора частично дублированной базы данных явилась производительность имеющегося вычислительного оборудования, что обеспечило следующее распределения данных:

В информационной системе реализован необходимый набор функций библиотекаря и администратора.

 

!19

Т.С. Боровенская, И.Ю. Красильникова, Г.С. Фаевцев

Государственная публичная научно-техническая библиотека СО РАН

Автоматизированная подсистема МБА ГПНТБ СО РАН

В докладе представлена реализация комплекса задач на примере иногороднего МБА ГПНТБ СО РАН, который взаимодействует с библиотеками-абонентами и выступает исполнителем их заказов или посредником при их перенаправлении.

При разработке автоматизированной подсистеме МБА учитывалась имеющаяся технология по обслуживанию иногороднего абонемента.

В подсистеме выделены 3 комплекса задач: "АБОНЕНТ", "ЗАКАЗЧИК", "АДМИНИСТРАТОР".

Комплекс "АБОНЕНТ" предусматривает автоматизацию следующих технологических процессов:

• формирование и ведение картотеки библиотек-абонентов;

• статистическая обработка данных о библиотеках-абонентах;

• ведение корреспонденции.

Картотека библиотек-абонентов включает название, адрес и другие реквизиты, даты перерегистрации, сведения о регионе, типе, отрасли библиотеки-абонента.

 

!20

С.А. Власова

Библиотека по естественным наукам РАН

Развитие системы обслуживания читателей СОЧИ

В Библиотеке по естественным наукам с 1989 г. ведутся исследования по созданию типовой автоматизированной библиотеки НИУ РАН. В рамках этих исследований специалистами БЕН разработана типовая система обслуживания читателей (СОЧИ) на ПК типа IBM PC. СОЧИ обеспечивает автоматизацию обработки информации, необходимой при обслуживании читателей по фондам данной библиотеки и по МБА.

В 1990 году в ряде библиотек РАН была внедрена в промышленную эксплуатацию первая версия системы, которая обеспечила работу с базой данных заказов по МБА и базой данных читателей. Более поздние версии развивались с учётом результатов эксплуатации системы в библиотеках НИУ: для повышения уровня сервиса были внесены изменения во многие программы, а также написан ряд новых программ. Кроме того, система была дополнена программами по созданию и поддержки базы данных библиотек и базы данных заказов по абонементу.

Настоящая версия системы включает 21 программу и обеспечивает одновременную работу с четырьмя взаимосвязанными базами данных: базой данных читателей библиотеки (БДЧ), базой данных заказов по МБА (БД МБА), базой данных заказов по абонементу (БДА), базой данных библиотек (БДБ), с которыми взаимодействует данная библиотека (в т.ч. направляет заказы по МБА),

Записи БДБ содержат все необходимые сведения о библиотеке (сиглу, адрес, наименование и т.д.), а также код библиотеки НИУ в системе МБА в данной библиотеке. При работе с БДБ система позволяет:

• вводить, корректировать и при необходимости удалять данные о библиотеках;

• просматривать записи подряд и осуществлять поиск по их фрагментам.

Записи БДЧ содержат сведения о читателях (Ф.И.О., подразделение, телефон и т.п.) и номера их читательских билетов. СОЧИ предоставляет следующие возможности при работе с БД читателей:

• вводить и корректировать данные о читателях;

• уничтожать запись, относящуюся к какому-либо читателю, если за данным читателем не числятся заказы по МБА и абонементу;

• изменять номера читательских билетов;

• получать статистические данные о читателях по элементам номера читательского билета, их сочетаниям, а также по фрагментам информации о читателе. Записи БД МБА содержат элементы библиографических описаний заказываемых изданий, дату и номер заказа, номер читательского билета заказчика, а также информацию о состоянии заказа.

СОЧИ предоставляет следующие возможности при работе с БД МБА:

• вводить информацию, необходимую для заказа с автоматическим присвоением заказу номера и распечаткой требования;

• вводить ответ на заказ и данные о возврате издания;

• корректировать введенную библиографическую информацию;

• получать данные о задержке обработки заказа и возврата издания и выводить их на печать;

• получать статистические данные о заказах по любому параметру и их сочетаниям.

Записи БДА содержат шифр или инвентарный номер издания, его библиографическое описание и информацию о состоянии заказа. При работе с БДА система позволяет:

• вводить заказ по абонементу;

• ставить заказ на очередь, если требуемое издание выдано, с автоматическим

формированием заказа для очередника при возврате издания;

• вводить информацию о выдаче заказа и о возврате издания;

• получать статистические данные по различным характеристикам;

• получать информацию о задержке возврата изданий и

выводить её на печать.

Система предоставляет возможность выводить записи из БД

МБА и БДА в архивные файлы, а также добавлять новые записи с дискет.

СОЧИ связана с электронным каталогом периодических изданий библиотеки НИУ, разработанным в БЕН. Во время работы с системой обработки периодических изданий (СОИ-С ) читатель может заказать необходимые ему издания, библиографические описания которых будут автоматически введены при работе с программой ввода заказов по абонементу.

В настоящее время система эксплуатируется в ряде библиотек НИУ, входящих в централизованную сеть БЕН.

СОЧИ освобождает сотрудников библиотеки от необходимости ведения традиционных картотек, упрощает процедуру заказа литературы, обеспечивает надежный контроль за выполнением заказов и возвратом изданий, дает возможность проводить автоматизированный анализ спроса литературы.

 

 

!21

С.Р. Баженов, Л.К. Бобров, Н.А. Мазов, С.В. Морозов, А.Ф. Новоженин

Государственная публичная научно-техническая библиотека СО РАН, Институт органической химии СО РАН

Автоматизированная информационно-библиотечная система в области экологической ХИМИИ

С учётом важности и актуальности экологических проблем для Сибирского региона, рассматриваемая информационно-библиотечная система создается в соответствии со специальным Распоряжением Президиума СО РАН временным научным коллективом специалистов Новосибирского института органической химии и ГПНТБ СО РАН. Работы ведутся по трем основным направлениям:

-формирование справочно-информационного фонда специализированной библиотеки по химическим аспектам экологии;

-формирование системы проблемно-ориентированных БД (ПОБД);

-создание и внедрение технологий комплексного использования информационно-библиотечных ресурсов и БД, включая сетевые методы доступа и формально-аналитическую обработку информации.

При формировании фонда специализированной библиотеки упор сделан на фундаментальные, справочные и обзорные источники информации, поскольку информационный поток огромен, и, чтобы ориентироваться в нем, в развитых странах идут по пути издания различных энциклопедий, серий, обзоров, которые пишутся ведущими специалистами и экспертами по проблемам окружающей Среды. Многие международные организации выпускают обобщающие обзоры. Поэтому в первую очередь подбирается и классифицируется именно такая литература.

Следует особо отметить, что одной из основных задач специализированной библиотеки является создание справочноинформационного фонда по официальным и рекомендованным методам анализа приоритетных экотоксикантов, принятым международными и национальными организациями ведущих зарубежных стран.

Источниками формирования ПОБД служат:

- получаемые на магнитных лентах по подписке БД ВИНИТИ ("Химия", "Биология", "Металлургия", "Машиностроение", "Охрана природы и воспроизводство природных ресурсов" и др.);

- зарубежные БД, доступные через сети передачи данных, а также БД, распространяемые на оптических компакт-дисках;

- самостоятельный ввод информации для формирования машиночитаемого каталога изданий по охране окружающей Среды, имеющихся в фонде специализированной библиотеки Института органической химии СО РАН.

Система баз данных по химическим аспектам охраны окружающей среды построена по тематико-видовому принципу разделения информации. В своем полном виде она должна включать следующие проблемно-ориентированные БД: БД обзорной информации (отбираемой из локальных, удаленных и БД на оптических компакт-дисках); БД, содержащая информацию из отечественных машиночитаемых изданий (являющихся аналогами соответствующих реферативных журналов); БД "Охраны природы и воспроизводство природных ресурсов" (аналог соответствующего РЖ ВИНИТИ); БД "Экологические проблемы в металлургии, машиностроении и других областях промышленности и сельского хозяйства"; БД "Химические аспекты охраны окружающей среды"; БД "Отчёты по НИОКР в области охраны окружающей среды зарубежных стран"; БД "Приборы и методы контроля для анализа объектов окружающей среды"; Справочная БД об отечественных и зарубежных информационных системах и базах, содержащих сведения по проблемам окружающей среды ; БД "Пестициды"; БД "Промышленные и сельскохозяйственные отходы"; БД "Питьевая вода"; БД "Приоритетные интоксиканты и загрязнители"; БД "Библиотека по охране окружающей среды"; БД "Национальные и международные программы в области охраны окружающей среды"; БД "Чистые химические технологии"; БД "Национальные и международные организации, занимающиеся вопросами окружающей среды"; БД "Безопасность пищевых

продуктов"; БД "Российские нормативные и законодательные документы, регламентирующие вопросы охраны окружающей среды"; БД "Нормативные документы ведущих зарубежных стран по охране окружающей среды".

Глобальной целью проводимых разработок является создание такой информационно-аналитической системы, которая была бы ориентирована на современный уровень технических решений и охватывала бы полный цикл информационного обеспечения НИОКР по химическим аспектам охраны окружающей среды:

{Информационная потребность}=>{поиск реферативной информации в БД}=>{анализ результатов поиска}=>{ поиск требуемых первоисточников в электронных каталогах и заказ кoпий}=>{aнaлиз первоисточников}=>{ получение данных для прогнозно-аналитической работы}=>{ формирование прогнозно-аналитических материалов }=>{ предоставление информации для анализа вариантов и принятие решения}.

 

!22

Л.Н. Фёдорова

Самарский институт инженеров железнодорожного транспорта

Автоматизированная технология и управление библиотечным фондом

Процессы управления присущи сложным динамическим системам биологического, социального характера, а также созданным человеком.

Управление в библиотеке может быть рассмотрено в двух аспектах: как объект, целью которого является любой из технологических процессов или совокупность их - и как субъект, в роли которого выступает конкретный библиотекарь. С одной стороны, управление, связанное с деятельностью людей, объединенных едиными задачами, должно быть сознательным.

С другой стороны, управление организованной библиотечной структурой, призванной сохранять статику и режим деятельности - также должно быть сознательным. В данном случае, и объект - библиотечная структура, и субъект должны быть взаимосвязаны и целенаправленно реализовывать поставленные задачи.

Одним из элементов функционирования библиотечной структуры служит библиотечный фонд, который является управляющей и управляемой величиной. Поэтому управление библиотечным фондом считаем одним из важнейших процессов управления всей деятельностью библиотеки.

Рассматривая субъективный фактор управления библиотекой, можно сказать, что от профессионального уровня специалистов - библиотекарей, степени их подготовленности зависит грамотное выполнение задач в рамках автоматизированной технологии. Именно автоматизация помогает до минимума свести субъективизм в управлении технологическим циклом в библиотеке.

В настоящее время имеется и накапливается опыт ведения автоматизированных массивов в библиотеках, что влечёт за собой проблему грамотного и оперативного управления библиотечным фондом. Данная деятельность осуществляется на базе различных информсистем, призванных полно и качественно решать вопросы библиотечной технологии. К сожалению, не всегда информсистема способна к реальному применению её в библиотеке. Одной из главных причин является частичное решение управленческих задач информационно-библиотечной технологии, выражающееся в недостаточно точном воплощении обратной аналитической связи или полном отсутствии блока центрального управления, позволяющего регулировать функционирование библиотечной технологии и принимать управленческие решения. Это важно для библиотечного фонда, который взаимосвязан с внешней и внутренней средой посредством функциональных связей и реагирует на качественную основу представленной для внедрения информсистемы, на её способность до тонкостей решить библиотечные проблемы.

Таким образом, управление библиотечным фондом в рамках автоматизированной технологии неразрывно связано с качественной основой информсистем, призванной максимально, с учётом обратной связи, решать задачи информационного обслуживания абонентов.

!23

М.Е. Шварцман

Российская государственная библиотека

Помещения библиотеки как объект автоматизированного учёта

До последнего времени основной интерес разработчиков автоматизированных информационно-библиотечных систем был направлен на создание баз данных о документах, хранящихся в библиотеках.

Кроме документов (книг, рукописей, плакатов и т. п.) в библиотеках имеется большое количество других объектов требующих сложного учёта. В частности такими объектами являются помещения библиотеки, оборудование и т. п.

В Российской государственной библиотеке в настоящее время, в связи с реконструкцией, создалось сложное положение с учётом помещений. Постоянно осуществляется перемещение сотрудников, техники и фондов из помещения в помещение. Большое количество зданий, разбросанность их по Москве, сложные технологические процессы затрудняют оперативный контроль за использованием имеющихся помещений. Также трудно решается вопрос об оптимальном использовании имеющихся площадей.

В связи с вышеизложенным было принято решение о создании автоматизированной системы учёта помещений Российской государственной библиотеки.

Первым вариантом решения задачи было создание простой базы данных помещений, где в качестве характеристик помещения являлись бы: площадь, адрес, стоимость аренды и т.п. Однако в процессе дальнейшего изучения вопроса выяснилось, что такое понимание библиотечного помещения очень упрощенное и мало помогает в решении задачи оптимальной организации технологического процесса.

В дальнейшем мы стали понимать под термином "библиотечное помещение" совокупность комнаты и протекающего в ней технологического процесса. Это существенно осложнило задачу. Стало необходимым учитывать кроме самой комнаты то, что находится в комнате. На основе анализа библиотечных помещений были выделены следующие категории объектов, характеризующих помещение:

- рабочие места;

- фонды;

- каталоги;

- оборудование.

Также была построена иерархическая модель библиотеки, как совокупности помещений:

комплексы здании - корпуса - этажи - помещения

  • рабочие места
  • фонды
  • каталоги
  • оборудование

 

 

На базе вышеуказанных объектов в помещении может, производится или обрабатываться продукт (книга, заказ и т.п.), который должен быть доставлен в другое помещение. То есть необходимо учесть связи с другими помещениями библиотеки. В свою очередь фонды, каталоги, оборудование характеризуются многочисленными признаками (см. табл. 1), которые тоже необходимо учесть для полноценного описания библиотечного помещения.

Табл.1

объект

характеристики

рабочие места

Выполняемая задача, производительность, сменность и т.д.

фонды

объем, вид носителя, вид хранимых документов, назначение и т.д.

каталоги

количество шкафов различных типов, охват документов и т.д.

оборудование

нормативный срок списания, ответственный за эксплуатацию и т.д

Одной из важнейших задач при создании автоматизированной системы учёта помещений Российской государственной библиотеки было определение оптимального набора признаков, чтобы с одной стороны не загромождать базу данных избыточной информацией, а с другой стороны иметь всю необходимую информацию.

В настоящий момент эта работа завершена, - создано техническое задание на БД " Помещения РГБ", где определен набор полей и разработаны все необходимые формы статистического учёта. При создании технического задания разработчики встретились с рядом трудностей как теоретических, так и практических. Для описания всех объектов (оборудование, фонды и т.д.) необходимо было разработать их типологию. Если для фондов и каталогов эта проблема в известной степени проработана библиотековедами и библиографами, то для оборудования и рабочих мест типологию и классификацию пришлось разрабатывать самостоятельно.

Дальнейшие разработки показали, что приведенная выше модель недостаточно адекватно моделирует библиотеку, с одной стороны в одном помещении может находиться несколько фондов, но с другой стороны один фонд может находиться в нескольких помещениях. Также и оборудование : с одной стороны в помещении может находиться несколько единиц различного оборудования, а с другой стороны один вид оборудования (например, подъемник для книг) может проходить через различные помещения. Причем в различных помещениях он может проходить по разному: в центре помещения или в углу, образуя начальную станцию или промежуточную, предоставляя возможность вложения книг или нет и т.д.

В связи с вышеизложенным в модель был добавлен еще один уровень иерархии: "части помещения, занимаемые фондами, каталогами и т.д." Модель приобрела следующий вид:

комплексы - корпуса - этажи - помещения зданий

- рабочие места - часть помещения

- фонды - часть помещения

- каталоги - часть помещения

- оборудование - часть помещения

При этом появляются обратные связи между самым нижнем уровнем иерархии "часть помещения" и уровнем "помещение" для соотнесения части к целому.

Подобная структура создает дополнительные трудности при создании программного обеспечения базы данных, но более точно отражает положение вещей.

Очевидно, что проблема автоматизации учёта помещений актуальна только для больших библиотек, однако во многих библиотеках решаются задачи оптимального размещения всех служб. Для этого, несомненно, может быть использован опыт, накопленный в РГБ по паспортизации помещений.

!24

О.В. Сюнтюренко, В.А. Цветкова

Всеросийский институт научной и технической информации

Актуальные задачи производства новых информационных продуктов на базе современных технологий

В настоящее время производители информационных продуктов вынуждены пересматривать:

• номенклатуру своих продуктов;

• технологию их производства;

•условия предоставления пользователям.

Это вызвано целым рядом причин, в числе которых доминирующую роль играют:

• дорогостоящими,

• неоперативными,

• неадаптивными,

Все это заставляет информационные центры пересмотреть и номенклатуру продукции, и технологические аспекты её производства, и условия взаимодействия с потребителями.

ВИНИТИ, как крупнейший информационный центр-генератор документальных баз данных и Реферативного журнала очень остро ощущает сейчас давление всех факторов и стоит перед необходимостью решать эти проблемы.

1992 год привел к тому, что номенклатура информационных изданий ВИНИТИ была пересмотрена. Прекратили существование выпуски Сигнальной информации, реферативные картотеки, недоизданы, мягко говоря, Итоги науки и техники, задержан выпуск годовых указателей к реферативному журналу. Особую тревогу вызывает состояние с выпуском Итогов науки и техники: по результатам исследования рынка - это наиболее ценное научное издание, финансовое положение таково, что выпуск возможен лишь за счёт спонсоров, поэтому нарушен график выпуска изданий, и нет полной уверенности, что все будет выпущено. Институт делает все возможное, чтобы выполнить свои обязательства перед потребителями.

Причина кроется и в том, что ВИНИТИ является носителем достаточно устаревшей и дорогостоящей технологии, экономически нерациональной, базирующейся на затратной по своей сути технологии. Например, для производства тех же Итогов науки и техники нужны технологии на основе настольных типографий, а они только начинают осваиваться.

Наибольшего внимания требует ситуация с выпуском Реферативного журнала и баз данных. Сегодня из-за различных факторов (качество наполнения, оперативность подготовки, цена и платежеспособность потребителя) подписка на них упала. Это заставляет ВИНИТИ пересмотреть свою концепцию производства и предоставления баз данных. В основе - изменение внутренней технологии производства баз данных в ВИНИТИ, как основного реферативного центра страны в области научной и технической информации, осуществляющего в составе федеральной системы НТИ информационное обслуживание академических организаций, предприятий, частных лиц.

С декабря 1992 г. руководство ВИНИТИ стало предпринимать активные шаги в сторону изменения концепции технологии производства баз данных и Реферативного журнала на основе новой технической базы. Основой технологии является ЭВМ Sequent на базе UNIX. Периферия оснащается ЭВМ типа IBM PC модель 286,386.

Эта перестройка технологии позволит перейти к качественно новому информационному обслуживанию, то есть реально предоставлять потребителям базы данных на дискетах, как в стандартной упаковке, так и в виде:

• проблемно-ориентированных баз данных;

• реальной возможности работы в режиме телекоммуникаций;

• использования электронной почты и сетей передачи данных.

Кроме того, исследование рынка, особенного западного, показало, что для расширения ниши рынка нужно уйти от традиционных бумажных изданий и освоить технологию на CD-ROM, предоставляя на этом носителе, как базы данных, так и Реферативный журнал.

ВИНИТИ начинает эти работы. Безусловно, что для этого нужно дополнительное финансирование, которое, возможно, будет получено в качестве гранта от Российского фонда фундаментальных исследований. Если эта проблема будет решена, то главной задачей станет перевод ретроспективного фонда ВИНИТИ на CD-ROM, включая документальные базы данных и информацию о химических структурных соединениях. Потребитель уже не будет думать, в каком месяце будет предоставлена в диалоге его база данных и с какой глубиной ретроспективы. Это переход на качественно новый уровень обслуживания пользователей.

!25

В.М. Хуторецкий

Институт органической химии РАН

Доступ к современной научно-технической информации через STN International

Рост объема научно-технической информации не оставляет практическому работнику реальной возможности лично знакомиться с первичной литературой, а в более объемистых отраслях знаний, как химия, медицина, биотехнология - даже и со вторичной, т.е. обзорной и реферативной. Для ретроспективного поиска сейчас используется третичная литература, т.е. индексы к реферативным журналам. Применение машинного поиска позволяет резко смягчить проблему поиска необходимой информации.

Технология прохождения информации от её создателя - автора к её читателю - пользователю представлена на схеме:

Telecom

primary literature - producer - vendor <-----> broker - user

Остановлюсь на конкретном примере взаимодействия одного из крупнейших вендоров мира в области научно-технической информации The Scientific and Technical Information Network (STN International) и Академии наук, выступающей в качестве не только коллектива пользователей, но и брокеров, т.е. посредников.

STN International - представляет собой объединение Chemical Abstracts Service, безусловного лидера в производстве разнообразной химической информации, и Fachinformationszentrum в Карлсруэ, специализирующегося на создании БД в области физики, математики, энергетики. Третий партнер, японский центр научно-технической информации, пока менее заметен и предоставляет доступ к японской литературе, зареферированной на английском языке. Как и другие вендоры мира, STN покупает право распространения целого ряда чужих БД с тем, чтобы предоставить своим клиентам максимум информации на едином командном языке. Всего в STN сейчас около 140 БД и это количество ежегодно растет. Все три учредителя и STN в целом являются not-for-profit organizations.

Благодаря этому STN, в отличие от чисто коммерческих фирм, имеет налоговые льготы и государственные дотации, что дает ей возможность предоставить целый ряд льгот, способствующих преодолению проблем снабжения российских пользователей современной научно-технической информацией.

Какие у нас обычно называют проблемы, когда заходит речь о доступе к зарубежной научной информации:

• Плохая связь

• Отсутствие твердой валюты.

Связь. Конечно, диалоговый доступ осуществить труднее и дороже, чем электронную почту. И это существенно, если Вы собираетесь лично проводить поиск. Но ведь это сомнительное удовольствие. Во всем мире, т.е. в развитом, цивилизованном мире, 85% online поисков из года в год проводят не сами пользователи, а брокеры. И это уже забота брокера организовать диалоговую связь, пользователь свой результат может получить по почте, если очень надо - по электронной почте. Почему брокер, а не сам? Парадокс - через брокера дешевле, поскольку у него не только связь налажена, его основное умение - провести поиск cost effective, с минимальными затратами. Если вы проводите поиск три-четыре раза в год, то проще и дешевле подробно обсудить с брокером задачу и оплатить его услуги по поиску, чем рисковать своей валютой и делать все самому.

STN, естественно, оплачивается валютой. Поэтому трудность вторая - валюта. Один аспект, специфический наш, - покупка валюты за рубли, решаем, были бы рубли. Другой, отсутствие денег вообще, тоже, как ни странно, решаем. Политика STN в предстоящем освоение нашего рынка определилась - это предоставление максимально возможных льгот, но с сохранением некоторого обязательного минимума оплаты, т.е. принципа, что информация не должна быть бесплатной. В результате STN объявила, что на те базы, которые она делает сама, а это целый ряд научных дисциплин и, я бы сказал, самых интересных баз данных, цены снижены, по сравнению с мировыми, в 5 раз. На многие бд, правда, тоже не на все, не вошедшие в STN-овский список, существуют значительные скидки для учебных и/или исследовательских институтов. В эти базы данных входят такие как Бейльштейн и Гмелин по химии, Inspec по физике, электротехнике и компьютерным наукам и т.п.

Я еще остановлюсь на ценах отдельно, но обычно приводимые аргументы о недоступности для нас западной информации кажутся, не хочу сказать несущественными, но вполне преодолимыми. В чем же тогда причины слабого использования зарубежных баз данных сегодня? На мой взгляд, это:

Первое и самое страшное - привычка к бесплатному доступу к информации, нежелание платить за услуги. Если применительно к программным продуктам такая привычка, при всех отрицательных, имеет и свои положительные стороны, скажем широкое знакомство с морем бесплатных программ, то применительно к научно-технической информации она создает только неинформированность, привычку жить со старым, зачастую еще студенческим, багажом всю жизнь.

Другая уродливая сторона того же явления - начальник, готовый дать деньги на компьютер, на CD-ROM reader, но не покупку информации, только на нечто вещественное, что останется в руках для отчётности.

Второе - Практическое отсутствие кадров с развитым вкусом к мгновенному получению самой современной информации, обусловленное отсутствием конкуренции. В лучшем случае традиционному ручному поиску учат в некоторых престижных химических ВУЗах, как Менделеевский институт или химфак МГУ, при этом упоминают о машинном. Физиков, даже в Физтехе, вообще не учат, как искать информацию, я уж не говорю о машинной. Наш центр уже учит студентов, аспирантов и даже одаренных школьников. STN предоставила центру права бесплатного использования своих БД для целей демонстрации и обучения пользователей. Поэтому если Вы хотите научиться сами или научить своих студентов - приходите. Это умение очень важно для понимания возможностей метода, даже если Вы не собираетесь лично сидеть за терминалом и проводить поиск.

Наконец слабая информированность о возможностях машинного поиска, недостаток рекламы. Этот недостаток я как могу, восполняю сейчас, поскольку реклама в средствах массовой информации стоит очень дорого.

В заключение хочу отдельно остановится на сравнении цен на традиционный и машинный поиск. Сложность такого сравнения состоит не только в том, что невозможно объективно вычислить некоторое отношение польза : цена и предпочесть тот способ, у которого это отношение выше. Дело еще и в том, что при сравнении ручного и машинного поиска содержание библиотек традиционно не включают в цену. Однако в солидной центральной библиотеке расходы на подписку только на зарубежные журналы составляют свыше десяти миллионов дол ларов. И если их никак не включать в расходы пользователя, сопоставляя только затраты времени (зарплаты) на ручной поиск и все расходы на машинный, то им трудно тягаться. Однако всюду и везде кто-то платит и за библиотеки, и за inhouse systems, т.е. за БД, принадлежащие пользователю и постоянно доступные его сотрудникам (это обычно БД на оптических компакт-дисках), и за интерактивный поиск в теледоступе. И если государство, научные общества или благотворительные фонды оплачивают содержание библиотек, да и самих научных учреждений целиком, то вполне естественно, если они же оплатят (целиком или частично) машинный поиск. Что и происходит во всем мире. Интерактивный поиск информации, впрочем, как и любой другой, стоит довольно дорого. Его составные части в некоем упрощенном и усредненном представлении для библиографических баз данных можно выразить как:

Z=ah+bw+cr

где Z - цена информации в одном сеансе поиска

h - время работы с БД (в часах)

w - количество слов (терминов) в запросе

r - количество документов (ссылок), выведенных на экран

a,b,c - коэффициенты из Price List

Кроме цены информации в стоимость сеанса поиска (S )

входят:

S = Z[(1-d) +T+B]

где d-скидка

Т - телекоммуникационные расходы

В - услуги посредника, специалиста по поиску.

По порядку величины Т=0,15 и В=0,1

Какова реальная ситуация с машинным поиском сегодня? Я уже упоминал, что STN на многие очень важные БД дает d=0,8. Кроме того, известно, что фонд Сороса оплатит телекоммуникационные расходы по доступу к сети Internet, тогда и Т будет равно 0. Достигнуты положительные результаты в переговорах о дальнейших очень существенных скидках за счёт того же фонда и в оплате информации, и услуг посредника. Вполне возможно, что в результате мы придём к формуле S = 0,05 Z. Тогда, даже очень серьезные и дорогие поиски будут пользователю стоить 6-7 долларов в пересчёте с рублевого курса.

!26

О.Н. Путилина

Государственная публичная научно-техническая библиотека России

Обслуживание пользователей отечественной и зарубежной деловой информацией

Современная политическая и экономическая ситуация в стране привела к некоторому изменению традиционного тематического спроса. Появился устойчивый интерес к так называемой "business information" или деловой информации. Для решения задачи доступа потребителей к этому виду литературы в ГПНТБ России создан Кабинет деловой информации - специализированный офис, основной целью которого является обеспечение потребителей экономической, технической, коньюктурно-коммерческой, юридической и т.п. информацией. При комплектовании фонда используются как традиционные виды изданий, так и не традиционные - базы данных, электронные справочники, методические руководства и т.д., содержащие информацию об отечественных и зарубежных производителях товаров и услуг.

Для объединения усилий работников библиотек, центров информации, возможно, коммерческих структур, специализирующихся в библиотечно-информационном обслуживании деловой информацией при Ассоциации научных и научно-технических библиотек создан Комитет деловой информации. Одним из направлений деятельности Комитета предполагается разработка концепции в области формирования и использования информационных ресурсов деловой информации, поиск новых путей сотрудничества, в том числе с организациями, владеющими малодоступными источниками (например, статистической информацией), выход на международные компьютерные сети.

!27

Н.А. Мазов, Л.К.Бобров

Государственная публичная научно-техническая библиотека СО РАН

Постобработка результатов поисков в базах данных на компактных оптических дисках

С середины восьмидесятых годов заметно наметилась тенденция развития документальных баз данных (БД) на компактных оптических дисках (КОД). В настоящее время для пользователей, как за рубежом, так и у нас в стране доступны сотни изданий БД на КОД.

Наряду со всеми положительными моментами использования информационных массивов на КОД следует отметить, что отсутствие стандартов на типовую информационно-поисковую систему (ИПС) для персональных ЭВМ и организацию физического хранения БД на КОД различных производителей ставит перед пользователем дополнительные проблемы по ведению и эксплуатации сразу нескольких ИПС для БД.

Опыт использования БД на КОД в региональной автоматизированной системе научно-технической информации (АСНТИ) СО РАН еще нельзя считать исчерпывающим, однако на его основе уже могут быть сделаны некоторые принципиальные выводы:

• положительное отношение пользователей к новому виду информационных услуг (обработка запросов по текущим поступлениям, и особенно, обслуживание в ретроспективном режиме);

• приобретение и эксплуатация БД на КОД требуют в настоящее время существенных финансовых затрат.

Принимая во внимание последнее обстоятельство, можно заключить, что с помощью БД на КОД должны решаться значимые информационные задачи (такие, как, например, информационное обеспечение крупных научных программ). В решении данных задач важное место занимают процессы формирования проблемно-ориентированных баз данных (ПОБД), как объекта последующего информационного анализа.

Однако формирование ПОБД на основе обработки разнородных информационных массивов требует решения сложных задач сопряжения различных форматов представления данных и согласования компонент лингвистического обеспечения.

Для решения этих задач в ГПНТБ СО РАН создан программно-технологический комплекс, включающий:

• систему программ- конвертеров, учитывающих разнообразие существующих логических и физических структур представления данных на КОД и приводящих информацию к единому формату (ISO-2709);

• блок формирования и ведения проблемно-ориентированных БД;

• типовую ИПС, построенную на базе пакета прикладных программ CDS/ISIS-Mikro;

• меню-ориентированную подсистему ведения и использования рубрикаторов;

• систему обнаружения и исправления орфографических ошибок;

• блок статистической обработки документов ПОБД. Перечисленные компоненты комплекса являются функционально независимыми, что позволяет в решении конкретных задач применять их как в совокупности, так и раздельно.

Таким образом, постобработка результатов поиска в БД на КОД включает преобразование форматов, создание рубрикатора ПОБД, формирование и обработку созданной ПОБД для целей информационного анализа.

 

!28

В.М. Тютюнник, А.И.Смирнов, С.А. Луканцов, Г.Ю. Жабин

Международный информационный Нобелевский центр

Проблемы совместимости большого количества баз данных при многоаспектном поиске.

Базы данных по Нобелевским премиям и лауреатам

Международный информационный Нобелевский центр (МИНЦ) создан в Тамбове, Россия, с целью концентрации колоссальной по объему и значению, но разрозненной информации о жизни и деятельности лауреатов Нобелевских премий, А.Нобеля и Учреждений Нобеля, а также для создания в едином центре условий международного пользования наследием выдающихся представителей наиболее перспективных направлений в науке, экономике, литературе и политике мира [1].

МИНЦ является: 1) информационной организацией, осуществляющей поиск, накопление, переработку и распространение нобелевской информации; 2) научным центром, предназначенным для проведения фундаментальных исследований в различных областях знаний международными усилиями. Наше собственное научное направление - нобелевская информатика и бионаукометрия (биобиблиометрия, биоинформетрия), объединяемые ныне термином "нобелистика".

Деятельность МИНЦ развивается по различным направлениям, одно из которых - пополнение Международного банка данных и знаний "А.Нобель и Нобелевские премии. Лауреаты Нобелевских премий по физике, химии, физиологии или медицине, литературе, мира, экономике", содержащего серию проблемно-ориентированных баз данных (БД), обращение к которым дает возможность пользователю проводить многоаспектный поиск и получать любую информацию о А.Нобеле, Нобелевских премиях, о жизни и деятельности каждого из 627 (1901-1992 гг.) нобелевских лауреатов, и др. [2,3].

Необходимость решения проблем совместимости большого количества БД привела к созданию новой "библиотечно-музейно-архивно-информационной технологии" (БМАИТ) с нетрадиционным подходом к обслуживанию с помощью фондов МИНЦ: специально разработанные способы кодирования и индексирования всех документов как единой системы позволяют максимально долго не допускать потребителя к документам на бумажных носителях, последовательно удовлетворяя его фактографические, библиографические, аналитические и комплексные запросы по нобелевской тематике путем использования накопленной в БМАИТ систематизированной информации и результатов её библиометрической, наукометрической и информетрической обработки.

субд NDB (Nobel's Data Bases) состоит в настоящее время из 20 БД (одна - служебная для поиска по ключевому слову ;

19 - проблемно-ориентированные) и 21 управляющей программы (20 - для ввода данных, одна - управляющая одновременно всеми БД). Управляющая программа имеет графический (VGA + mouse) и сетевой интерфейсы. Язык программирования - Turbo C++, Borland C++, Turbo Assembler Borland, язык интерфейса - русский и английский, информация вводится на языке оригинала (кроме японского, китайского, арабского и подобных начертаний). Общий объем информации - около 350 МБ.

Все БД в составе субд имеют распределенную структуру:

DBF-стандарт, индексный файл, группа текстовых файлов. В приведенном примере (рис.1) текст Txt общим объемом 100КБ содержит сведения о деятельности Учреждений А.Нобеля (Нобелевский Фонд, Нобелевские комитеты, Нобелевские институты, Королевская Шведская академия наук, Шведская академия, Каролинский медико-хирургический институт, Государственный банк Швеции и др.) и нобелевских организаций (фирмы, концерны, заводы и т.п.) по форме: адрес и другие координаты учреждения или организации, фамилии и должности руководства, библиографические описания источников информации, ключевые слова и реферат по основным направлениям деятельности.

Все текстовые файлы хранятся в архивированном виде. Архивирование и разархивирование осуществляется оболочкой. DBF-стандарты всех БД минимизированы по длинам полей, чтобы увеличить скорость поиска через перекрестные ссылки. Таким образом, поиск осуществляется не по тексту (фамилия, ключевое слово, название и т.п.), а по индексной ссылке на него. Такая структура информации позволяет хранить максимальное количество Tht в сжатом виде и минимальное количество данных в виде DBF-стандартов. Все ненужные связи между БД при каждом конкретном поиске маскируются.

В зависимости от типа и вида запроса (меню содержит около 50 вариантов) реализовано два способа работы с БД : 1) одноаспектный запрос / поиск (непосредственное обращение к информации, которая содержится в одной из БД); 2) многоаспектный запрос/ поиск (одновременное обращение к нескольким / всем БД через группу стандартных запросов). Рассмотрим пример сложного многоаспектного запроса/ поиска. Необходимо получить списки литературы с портретами и формулировками Нобелевского комитета о нобелевских лауреатах по физике, которые получили премии после 1970 г. и проживали в Германии. Алгоритм поиска выглядит следующим образом (рис.2). Из БД 16 отбираются нобелевские лауреаты по физике после 1970 г., которые фильтруются с помощью БД2 по слову "Германия" и ранжируются по городам присуждения Нобелевской премии. Из БД5 отбирается та литература, которая содержит информацию о выбранных лауреатах, и фильтруется с помощью БД8 и БД9 по признакам "портрет" и "формулировка". Тексты списков литературы разархивируются по мере анализа.

4

Рис.1. Структура БДЗ "Учреждения А.Нобеля. Нобелевские фирмы.". 1 - поле наименования учреждения или фирмы на языке оригинала; 2 - поле языка; 3 - поле ссылки на текст; 4 - поле текста.

Рис.2. Схема реализации многоаспектного запроса/поиска

ЛИТЕРАТУРА

1. Тютюнник В.М. Международный Информационный Нобелевский Центр (г. Тамбов, СССР): Проспект: Информ. материалы -Тамбов,1991.-14 с.

2. Тютюннчк В.М. Альфред Нобель и Нобелевские премии: Биобиблиогр. указ.-2-е изд.-Тамбов, 1991.-94 с.

3. Тютюнник В.М. Взаимосвязи информатики и науковедения: Анализ данных и модели.-Тамбов, 1989.-44 с.

 

!29

Н.А. Курганская

Институт сердечно-сосудистой хирургии им. А.Н. Бакулева

Методика исследовадия медицинских периодических изданий на базе данных MEDLINE

Проблема поиска и сбора информации по комплексным проблемам остается актуальной и в наши дни. Развитие электронно-вычислительной техники и внедрение её в библиотечно-информационное обслуживание способствует быстрейшему решению данной проблемы.

Целью нашего исследования было изучение истории развития периодических изданий для выявления тенденций динамики их развития, выявления ядерных журналов, установления степени рассеяния публикаций. Для осуществления исследования была разработана оптимальная методика сбора информации по кардиохирургии.

В области медицины в мире создано около 70 баз данных на компактных оптических дисках (КОД). Одной из самых популярных и широко используемых БД является созданная в 1964 году под названием MEDLARS (MEDical Literature Analysis and Retrieval System - Система анализа и поиска медицинской литературы) в Национальной медицинской библиотеке США. В 1971 году данная система была усовершенствована, и в связи с переводом её в режим работы "on-line", переименована в MEDLINE. Объем БД в 1990 году составил около 8 млн. документов. Базу ежегодно дополняют 300000 новых библиографических описаний статей из 3200 журналов, публикуемых в 71 стране мира. С 1975 года 60% библиографических описаний статей имеют рефераты. С 1981 года в БД стали вводиться данные об отдельных монографиях. MEDLINE включает информацию из INDEX MEDICUS, INDEX TO DENTAL LITERATURE и INTERNATIONAL NURSING INDEX. Из 7 выпускаемых вариантов КОД MEDLINE, нами был использован КОД MEDLINE Cambridge Scientific Abstracts. Данная БД располагает данными по клинической и экспериментальной медицине, анатомии,

различным патологиям - направлениями, которые включают литературу по кардиохирургии.

Создание собственных тематических баз данных для количественного анализа потока осуществлялось в Институте автоматизированных систем на IBM-совместимом компьютере PC-XT. Поиск проводился с использованием пакета прикладных программ "Compact Cambrige". Поиск по ключевым словам общих рубрик позволяет выявить лишь небольшой процент информации. Для более полного сбора информации рекомендуется использовать MeSH - контролируемый словарь БД MEDLINE. Поиск вёлся по основным дескрипторам, охватывающим кардиохирургическую тематику: А7 Anatomy - Caddiovascular System, C14 - Disease - Cardiovascular, E4 - Procedures and Technics - Surgical.

Из опыта нашей работы с Mesh было выявлено, что документы, относящиеся к главной рубрике, не включают в себя все документы, относящиеся к подрубрикам и для получения полного комплекта документов необходимо проводить поиск по каждой из подрубрик, иначе потери информации составляют до 30%.

Как было установлено, полный охват кардиохирургической тематики достигается включением 92 рубрик.

Обработка данных с дискет осуществлялась с помощью пакета "Q & А" фирмы Symantec Corporation, США. В собранном массиве данных просчитывалось количество журналов и опубликованных в них статей, статьи в журналах группировались по научным направлениям кардиохирургии и эти данные заносились в файл - картотеку периодических изданий. Набор полей был следующим: порядковый номер журнала, код ISSN, название журнала, год основания, страна, язык, периодичность, издательство, фактор воздействия, тематическая направленность журнала, количество документов по различным направлениям кардиохирургии. Внесенную в файл информацию можно анализировать по любому параметру. Данные можно представлять в виде списков по возрастающей или убывающей величине отдельных показателей, что позволяет, выявить ядерные журналы не только для всей тематики, но и для отдельного научного направления. Журналы можно распределять по годам создания, выявлять динамику роста их количества, а также количества публикаций по отдельным направлениям и определять тенденции их развития. Журналы можно также ранжировать по фактору воздействия, группировать по принадлежности к издательствам, странам, языкам и т.д.

Разработанная методика сбора информации по кардиохирургии в БД MEDLINE позволяет с максимальной полнотой и значительной экономией времени и средств проводить сбор материала. Эта же методика приемлема и для поиска в SCI.

Созданная картотека ведущих журналов по проблеме позволяет анализировать тенденции развития периодических изданий по кардиохирургии в мире.

Полученные результаты исследования могут быть использованы для повышения качества издаваемых в нашей стране медицинских журналов.

!30

Л.В. Лавренко, Н.А. Мазов

Государственная публичная научно-техническая библиотека СО РАН

Статистическая обработка ПОБД на ПЭВМ

С появлением современной вычислительной техники и широким набором программных средств на ПЭВМ встает необходимость разработки и внедрения в информационную практику новых информационных технологий, которые способствовали бы совершенствованию методов представления и обработки информации.

Опыт эксплуатации АСНТИ СО РАН показывает, что наряду с обслуживанием пользователей по созданию проблемно-ориентированных баз данных (ПОБД) на ПЭВМ, необходимо представление таких программных средств, которые бы позволяли не только эксплуатировать ПОБД, но и дали бы возможность оперативно получить данные по количественному составу ПОБД. Это в свою очередь позволило бы проследить существование тенденций развития того или иного научного направления существенно сократить сроки создания прогнозно-аналитических материалов.

В рамках эксплуатируемой в АСНТИ СО РАН информационно-библиографической системы под управлением CDS/ISIS/M авторами была сделана попытка решения задачи получения статистической информации по различным формальным признакам ПОБД.

Целесообразной формой реализации этой задачи явилось создание диалоговой программы, работающей в среде CDS/ISIS/M.

При разработки программы выдвигались следующие требования:

• возможность встраивания программы в стандартное меню системы ISIS/M;

• работа в режиме диалога;

• ориентация на пользователя-непрограммиста;

• простота освоения и эксплуатация программ;

• независимость от структуры ПОБД под управлением CDS/ISIS/M;

возможность сохранения в файл получаемых статистических данных.

В настоящей версии программы, предназначенной для получения количественной оценки ПОБД по любому полю реализованы следующие функции:

• смена ПОБД в процессе работы;

• возможность выполнения статистической обработки ПОБД в диапазоне записей, целиком, по прерыванию от клавиатуры, по ранее выполненному запросу;

• возможность обработки по значению поля, подполя, части поля, ограниченного указываемым количеством символов;

• возможность получения ранговых списков значения поля и соответствующих гистограмм в ПОБД по возрастанию, убыванию, в виде ядерных зон рассеяния по Бредфорду;

• возможность сохранения визуальной информации в файл для дальнейшего использования;

• возможность получения подсказки в процессе работы.

Поскольку работа программы основана на реальной ПОБД под управлением CDS/ISIS/M, то предполагается, что пользователь знаком со структурой ПОБД и наполнением полей.

Программа начинает работу с вывода на экран терминала окна, в котором пользователю предлагается заполнить (изменить) необходимые структуры или оставить значения по умолчанию.

В случае затруднений, пользователь может воспользоваться подсказкой, нажав клавишу F1 или прервать обработку, нажав клавишу Esc.

По заполнению всех необходимых полей программа начинает статистическую обработку ПОБД, о чем выводится соответствующее сообщение в окне на экране терминала.

По окончании статистической обработки программа выводит на экран терминала два окна, в одном из которых показываются количественные характеристики, а в другом гистограмма распределения поля в ПОБД.

Пользователь может просмотреть полную информацию, прокрутив окно вверх или вниз и при необходимости вывести результаты обработки в файл для дальнейшего использования.

При необходимости пользователь может просмотреть результаты в виде убывающего и возрастающего значения количества появления поля или отобразить результаты в виде ядерных зон по закону Бредфорда.

В настоящее время программа находится в опытно-промышленной эксплуатации при функционировании АСНТИ СО РАН.

!31

Л.Н. Голенок, Л.Л. Мотова

Самарский государственный институт искусств и культуры

Использование пакетов прикладных программ в подготовке библиотекарей-технологов

Библиотеки Самарской области обладают значительным интеллектуальным потенциалом (фонд краеведческих изданий, труды учёных крупнейших вузов и научных организаций), однако, в условиях традиционной технологии библиотеки не справляются с задачей оперативного и полного информирования читателей, и вынуждены ограничивать доступ к информации административными мерами.

Обострилась потребность в создании сводных каталогов, поскольку рост цен на книги, периодику, реферативную информацию в самое ближайшее время увеличит лакуны в фондах библиотек региона.

Стремясь решить названные проблемы, библиотеки области начали так называемую "инициативную" автоматизацию на основе ППП двух организаций - МГТУ и НПО Информсистема. Этим обусловлено открытие в Самарском институте искусств и культуры специализации "библиотекарь-технолог" и перепрофилирование библиотечного факультета в факультет Библиотековедения и информатики.

Квалификационные требования, обеспечиваемые учебным планом, формируют социально престижные профессиональные качества библиотекаря:

- аналитика, способного стать посредником между инженерами-программистами и библиотекой;

- администратора банка данных, организатора коллективного доступа к базам, данных;

- информационного менеджера, определяющего информационную политику библиотеки.

Финансовые трудности программного обеспечения учебного процесса преодолеваются усилиями профессиональных сообществ, заинтересованных в подготовке квалифицированных библиотекарей-технологов АБС.

Заключение "Протокола о намерениях создания Регионального центра библиотечной компьютерной сети" с МГТУ им

Н.Э.Баумана самарскими вузами - аэрокосмическим институтом инженеров транспорта, Самарской акционерной организацией ПКБ АСУ - обеспечило студентов базами учебной и производственной практики в условиях реальных компьютерных технологий.

Разработчики библиотечных компьютерных технологий - участники республиканских конференций передали институту бесплатно пакеты программ или дали демонстрационные версии.

Каждый из имеющихся в нашем распоряжении программных продуктов обладает ценностью при организации учебного процесса.

АРМ "Обработка" БКС 3.3 МГТУ им. Н.Э. Баумана позволяет оценить, насколько изменился труд библиотечных специалистов отдела обработки, особенно на этапе параллельного существования в библиотеке двух технологий. Разработка Челябинского технического университета показывает, как организовать трудоемкий процесс суммарного учёта в автоматизированной библиотечной технологии. Программные комплексы БЕН РАН раскрывают возможности автоматизированного режима МБА и ведения сводного каталога периодических изданий библиотечной сети.

Демонстрационные версии МГУ и НПО "Информсистема" позволяют уточнить ряд вопросов, связанных с понятием формат библиографической записи.

Изучение студентами различных подходов к автоматизации библиотечной технологии побуждает их к творческому овладению своей специальностью технолога АБС и позволит в будущем успешно сотрудничать в профессиональном обществе ученых, разработчиков, пользователей ППП.

В заключении обращаем внимание разработчиков, что использование их программных продуктов в учебном процессе - это реклама, результаты которой будут все ощутимее с каждым выпуском наших специалистов.

!32

Т.С. Черкасова, В.В. Цуркан

НИИ нормальной физиологии им.П.К.Анохина РАМН, Московский государственный институт культуры

Некоторые особенности процесса взаимодействия пользователей с библиографическими базами данных

Научно-технический прогресс ведет к интенсификации информационных процессов во всех сферах социальной жизни, предъявляет высокие требования к полноте, качеству и оперативности получения информации, стимулирует развитие новых подходов к её обработке, хранению и предоставлению потребителям. В этих условиях особенно резко возрастают требования к оперативности и точности информационно-библиографического обеспечения специалистов различных профессий. Только высокое качество и комфортность информационно-библиoграфичecкoro обслуживания смогут повысить интерес специалистов к пользованию автоматизированными библиотечными и информационно-библиографическими системами.

Создание библиографических баз данных открывает новые перспективы для совершенствования библиотечно-библиографических процессов, а их эксплуатация дает большие возможности для повышения эффективности информационно-библиографического обслуживания, что значительно снижает трудоемкость библиотечно-библиографических процессов и, в частности, библиографического поиска, повышая его оперативность. В связи с этим становится актуальной проблема взаимодействия пользователей с базами данных, независимо от масштабов и области их применения. Успех этого процесса сдерживается такими факторами, как недостаток знаний, умений, навыков, т.е. значительной неподготовленностью пользователей к работе с базами данных. Частота и, в итоге, эффективность обращения к базам данных конечными пользователями в значительной мере зависит от уровня их библиотечно-библиографической подготовки. Разработка проблемы обучения конечных пользователей и её решение, построенное на знаниях библиотечно-библиографической, информационной деятельности, на методологии системного подхода, позволит в значительной степени повысить уровень информационно-библиографического обеспечения пользователей.

На сегодняшний день библиографические базы данных используются конечными пользователями недостаточно активно по следующим причинам: слабое внимание со стороны специалистов по информатике и библиографии к проблемам обучения конечных пользователей и созданию новых видов библиотечно-библиографических услуг; склонность специалистов к использованию традиционных библиотечно-библиографических методов обслуживания и, в особенности, поиска информации; пользователи слабо ориентируются в существующих машиночитаемых библиографических ресурсах, они недостаточно подготовлены к библиографическому поиску в условиях работы с БД; недостаточная информация конечных пользователей о возможностях и преимуществах существующей автоматизированной библиотечно-информационной системы; отсутствие научного подхода к решению проблемы обучения, отвечающего требованиям конечных пользователей.

Таким образом, необходим научный подход к разработке и решению данной проблемы, учитывающий профессиональные интересы и запросы, что может быть достигнуто за счёт вовлечения пользователей в процесс взаимодействия с конкретной системой, за счёт познания правил и методов логической организации массивов информации, библиотечно-библиографических записей в них и их состава.

Изучение общих закономерностей обучения выявило три компонента этого процесса: знания, умения пользователей и навыки работы с базой данных. Предлагаемый нами подход к решению проблемы обучения включает изучение приемов, применяемых для составления поискового образа документа, поискового образа запроса, поискового предписания.

Опыт работы с зарубежными библиографическими базами данных на компактных оптических дисках, а также выполнение роли посредника между системой и пользователями показали необходимость передачи библиотечно-библиографических знаний пользователям и разработки порядка, перечня, содержания тем обучения. Данное решение проблемы обучения пользователей включает следующий порядок основных тем:

- Основы библиографирования. Особенности построения библиографических баз данных. Поисковый образ документа.

- Библиографическое описание документа и его элементы. Формат записи библиографических данных. Предметные рубрики. Создание машинного словаря.

- Информационные потребности. Запрос и его виды. Поисковый образ запроса.

- Лингвистические средства. Информационно-поисковые языки, их состав и структура. Поисковое предписание.

- Практические занятия с данной системой. Количество часов обучения определяется уровнем подготовки пользователей, а также особенностями восприятия ими библиотечно-библиографического материала.

Таким образом, анализ принципов, заложенных в основу существующих систем обучения, выявил необходимость переноса акцента обучения от непосредственного взаимодействия человека с ЭВМ на структурно-функциональные особенности библиографических баз данных.

!33

Е.Н. Пименов

Библиотека академии наук

Об оценки документальных систем

Теория оценки документальных АИПС в настоящее время несовершенна, и по образному выражению Д. Г. Лахути эти вопросы находятся на инфантильной стадии разработанности. Критерии технической эффективности - точность и полнота результатов информационного поиска - не всегда, как показывает опыт, служат в достаточной степени объективной и достоверной оценкой фактических результатов работы системы. Например, за формально хорошим параметром точности (свыше 73%) в рассматриваемом ниже АИПС по огнеупорным изделиям и материалам обнаружилось, как показало обследование, аномально большое количество шумовой, явно не нужной пользователям информации.

Основные претензии к качеству информации, предоставляемой данной системой, были связаны, как представляется, с недостаточной пертинентностью поисков, обусловленной следующими основными причинами.

Излишняя декомпозиция запросов, когда при обслуживании в режиме ИРИ информационная потребность пользователя раскрывалась в виде серии из 7-10 очень конкретных запросов о частных аспектах исследования. При большой глубине индексирования рефератов (около 15 терминов на один документ) это естественным образом приводило к неоднократной выдаче информации на разные запросы из серии. На релевантность информационного поиска повторная выдача информации никак не влияла.

Обслуживание по чрезмерно широким запросам, когда на один ретроспективный запрос абонент получал 1-2 тыс. документов. Хотя непосредственно "в дело шла" только малая часть информации формальная точность оценивалась как высокая.

Другие причины снижения пертинентности. Несогласованность разных форм информационного обслуживания. В системе, помимо режима ИРИ, какое-то время работала служба ТОР - тематического обеспечения разработок. Отсутствие согласованности между ними приводило к тому, что одни и те же документы поступали к пользователям (тоже в декомпонированном виде) по разным каналам обслуживания.

Вся информация, направляемая в отдел 5-7 индивидуальным абонентам ИРИ, просматривалась заведующим, и он сам распределял её между своими сотрудниками. Естественное тематическое пересечение документов в 5-7 выдачах ИРИ субъективно воспринимается данным пользователем, как неоправданное дублирование информации. Релевантность оставалась высокой.

Абонент умер, уволился, сменил тему исследования. Обслуживание в режиме ИРИ, тем не менее, продолжается безадресно, "в никуда".

Из всего выше сказанного вытекает, что причинами многих претензий относительно "шума" в документальных АИПС могут являться не только, и, может быть, даже не столько недостатки в используемых технических, математических и лингвистических средствах (ППП, индексирование, тезаурус), сколько особенности постановки работы в подсистеме информационного обслуживания. Возможно, что есть основания различать и раздельно оценивать два уровня или плана оценок типа точности/полноты: релевантность и полноту результатов документального поиска (эти два показателя едва ли должны превышать обычные 70%) и такие же характеристики применительно к информационному обслуживанию пользователей.

Есть основания полагать, что понятие "пертинентность" - это точность последнего плана, то есть точность информационного обслуживания. Особенность данного термина в том, что в отличие от "релевантности", соотносимой с "полнотой", нет понятия и термина, оппозитивных (бинарная оппозиция) пертинентности: импертинентность? - неблагозвучно, адекватность/неадекватность? - слишком абстрактные понятия. Тем не менее потребность в них, видимо, ощущается, а содержание "импертинентности-неадеквантности" в общем виде охарактеризовано выше.

 

!34

С.Р. Баженов, Л.О. Медведко

Государственная публичная научно-техническая библиотека СО РАН

Банки данных по проблеме "Цеолиты, их свойства и применение"

ГПНТБ СО РАН совместно с институтом минералогии и петрографии СО РАН разработаны банки данных:

- "Цеолиты, их свойства и применение" (содержатся документы по природным и синтетическим цеолитам с 1986 г. по 1992 г.);

- "Природные цеолиты" (содержатся документы с 1965 г. по 1992 г.).

Названные банки данных и текущий указатель литературы "Цеолиты, их свойства и применение" (издается ГПНТБ СО РАН с 1987 г.) являются базой для информационно-библиографического сопровождения государственной программы "Цеолиты России".

В качестве основы для поиска информации по проблеме "Цеолиты, их свойства и применение" при формировании банков данных был использован рубрикатор текущего указателя, в котором отражена комплексность и межотраслевая направленность исследований цеолитов и их применения в разных областях.

Для первого банка данных были выбраны несколько исходных баз данных - БД ВИНИТИ и зарубежные базы "Agris", "Georef", "CAB", "NTIS", "Lifescience", "Poltox" по химии, геологии, биологии, охране окружающей среды и сельскому хозяйству.

Далее были проведены следующие виды работ:

- уточнены информационные запросы и отлажены поисковые предписания;

- проведены поиски в локальных и удаленных базах данных по отлаженным запросам;

- исследованы варианты и построены системы отбора данных, организации массивов, структур массивов, информационной технологии;

- сформированы текстовые массивы данных, сгенерирована информационно-поисковая система на основе ППП CDS/ISIS-М;

- разработаны программы-конверторы из форматов исходных БД во входной формат ППП CDS/ISIS-M;

- разработаны структуры базы данных, бланки ввода информации и форматы вывода.

Обеспечена возможность поиска по любому полю или части поля, например: по авторам, любым рубрикам, ключевым словам, терминам из заглавия, рефератам, годам и т.д. Выдача результатов поиска возможна в виде библиографического указателя, пристатейного списка и т.п.

Документы в этом банке данных включают:

- полные библиографические описания научных статей, книг, трудов конференций, отчётов патентов и других документов;

- рефераты;

- ключевые слова;

- рубрики ГАСНТИ и ВИНИТИ;

- коды разделов указателя "Цеолиты, их свойства и применение".

БД реализован на персональном компьютере, совместимом с IBM PC под управлением пакета CDS/ISIS/M, версия 3.0. Пакет дополнен средствами дружественного интерфейса пользователя и развитой системой подсказок при работе в любом режиме.

Пакет работает под управлением операционной системы MS-DOS (версий 3.2 и выше).

Во втором банке по цеолитам, в отличие от первого, массив документов формировался как на основе отбора информации из печатных вторичных источников, так и машиночитаемых изданий ВИНИТИ. В качестве первых были использованы реферативные журналы ВИНИТИ, ретроспективный указатель "Природные цеолиты" Института физической и органической химии им. П. К. Меликишвили.

В докладе рассмотрены особенности, сходство и отличие разработанных БД. Указаны проблемы, возникшие при формировании этих БД, и пути их решения.

!35

Л.Н. Фёдорова, Н.М. Шиндряева

Самарский институт инженеров железнодорожного транспорта

Использование формата МАРК в процессе внедрения отечественных автоматизированных информационно-библиотечных систем (на примере НТБ СамИИТ)

С 1989 г. в НТБ Самарского института инженеров железнодорожного транспорта внедряется автоматизированная информационно-библиотечная система (АИБС), при разработке которой были изучены возможности АИБС "МАРК", созданной НПП "Информ-система" и оперирующей с документами, представленными в русифицированном варианте формата USMARK. После осуществления настройки из множества полей формата МАРК в НТБ СамИИТ были выделены следующие для перевода в машиночитаемую форму информации о книгах:

• контрольный номер,

• дата корректировки,

• ISBN,

• создатель записи,

• код языка,

• индекс УДК,

• шифр хранения документа,

• индекс ББК,

• индекс ГАСНТИ,

• индивидуальный автор,

• коллективный автор,

• область заглавия и сведений об ответственности,

• область издания,

• область выходных данных,

• область количественной характеристики,

• область серии,

• примечания,

• библиография,

• аннотация,

• предметные рубрики,

• ключевые слова,

• другие индивидуальные авторы,

• другие коллективные авторы.

Названия полей в предложенном выше перечне даны в полном соответствии с ГОСТом 7.1-84 "Библиографическое описание документа. Общие требования и правила составления"

С другой стороны в единый формат МАРК НТБ СамИИТ были введены новые поля по двум основным причинам:

- данный формат охватывает более широкий набор видов документов, чем предложен в АИБС "МАРК" НПП "Информ-система". Кроме совпадающих в двух системах видов документов (книг, сериальных изданий и статей) в НТБ СамИИТ еще учитываются нормативно-технические и технические документы, депонированные научные работы, неопубликованные документы (отчёты о НИР, диссертации), рецензии и библиографические ссылки. Например, было добавлено поле "область специфических сведений" для нормативно-технических и технических документов, а также неопубликованных документов;

поля "область нумерации" и "ISSN" - для сериальных изданий. Доработки потребовали и некоторые подполя. Например, для депонированных научных работ в поле "область выходных данных" необходимо ввести дополнительные подполя "местонахождение организации-депонента" и "дата депонирования".

- потребовалось значительно расширить параметры поиска информации в БД и в первую очередь за счёт отражающих специфику деятельности вуза. Так, для преподавателей и студентов любого вуза интерес представляет возможность поиска информации в БД по кафедрам и факультетам. Соответственно такие поля были введены в формат.

Таким образом, русифицированный формат МАРК НПП "Информ-система" потребовал значительной дальнейшей доработки в НТБ СамИИТ в соответствии с потребностями в библиографической информации в вузе.

!36

А. А. Шпаков

Московское общество испытателей природы МГУ им. М.В.Ломоносова

Поисковая информология как основа компьютерных тематических поисковых баз данных библиотек XXI века

Ежегодный ущерб России от неинформированности людей составляет десятки миллиардов рублей, знания дают прибыль. В этом велика роль библиотек, архивов и музеев, являющихся документальной базой данных (ДБД) государства.

На каждое полное библиографическое описание документа (БОД) выдается один, затребованный документ (Д) - поштучный поиск. Библиографические ИПС (БИПС) картотечного или компьютерного типа хорошо выполняют свою задачу. Алфавитным авторско-заглавным каталогам всё равно, что представляют собой адреса Д (коды УДК, ББК или инвентарный номер) и в каком порядке Д расположены или сгруппированы в фондах - были бы адреса и сами Д в хранилищах.

Неполные БОД, одиночные и группы терминов являются тематическими запросами (ТЗ) и неполными тематическими поисковыми признаками Д (ТППД), которые, как правило, принадлежат многим Д. Тематическая ИПС (ТИПС) по одному ТЗ должна выявить соответствующие БОД и по ним сделать тематическую подборку Д (ТПД). Но это часто не происходит из-за отсутствия теории ТИПС. Поэтому полиматические по существу Д, ДБД, ИПС и. т.п. давно и безуспешно пытаются втиснуть в монодисциплинарную концепцию Дьюи, которую, как ненужный придаток, мог терпеть здоровый и независимый (старший) от него организм БИПС. Но ТИПС сразу же выявили несостоятельность этой концепции: эмпирические библиотечные и другие классификации неудовлетворительны как основа ИПЯ [1], систематические картотеки оказались ненужными [2], унитермная организация тематических поисковых баз данных (ТПБД) ТИПС существенно ограничивает размер

ДБД или число используемых в ТПБД лексических единиц (ЛЕ) ИПЯ, поиски по ТЗ сложны, длительны и дороги.

Поисковая информология основывается на концепции универсальности (ку), является теорией ТИПС, доказала на практике возможность быть основой решения проблемы ТЗ и базируется на новом направлении философии об универсальных и других аспектах взаимопревращения всех форм материи, теории субъективной информации и учении об универсальном классифицировании [3-10]. Для глобального решения проблемы ТЗ необходимо реализовать проект "Цицерон": создание полной Универсальной Классификации (УК) ТППД, универсального тематического ИПЯ (УТИПЯ) на базе УК [6-9]. КУ исходит из того, что любые объекты (О), явления (Я), законы (З), науки (Н) и практики (П) универсальны и поэтому полидисциплинарны: ЛЕ "атом" присуща и всем Н, расположенным выше физики. Тем более универсальны, полидисциплинарны и политематичны любые Д, ДБД, коллекции О и т.л., в которых сведения фрагментированы и смешаны. Общность знаний, обусловленная материальным единством всех О, Я, 3, Н и П, выявляется при помощи неполной УК и реализуется на основе УТИПЯ и ТИПС в виде ТПД. При доменной организации ТПБД, ТПД отыскиваются при любой упорядоченности Д в фондах или ДБД. Концепция неопределенности [3] утверждает, что создатели ТИПС не могут предугадать, по каким ТППД будут вестись поиски. Поэтому в ТПБД необходимо представлять все ТППД. Число ТППД (X) рассчитывается по формуле Кардано: Х = 2n , где n - число написанных и определяемых по УК подразумеваемых О, Я, 3, Н и П в документах. В среднем n равно 100, Х - 10! При шифровании смыслов 100 слов возникает возможность найти полные и точные ТПД по любым ТППД. Информативность (число потенциальных ТПД) ТИПС можно довести до 10 и выше, полноту и точность автоматически найденных ТПД увеличить в десятки раз, число используемых в ТПБД ЛЕ УТИ-ПЯ - безмерно.

Сведения БИПС и ТИПС при помощи ЭВМ и телекоммуникаций могут достичь каждого человека в любое время и месте, стать прибылью.

ЛИТЕРАТУРА

1. Soergel D. Adv. in knowledge organization. V.I. Frankfurt/Main, p.276, 1990.

2. Востриков А.Н. Библиотековедение и библиография за рубежом. М.: ГБЛ, с.36-52, 1989.

3. Шпаков А.А. Информационно-поисковая система "Биомед" на перфокартах: теория и метод разработки. М.: МЗ РСФСР, 52 с., 1980.

4. Шпаков А.А. Информационно-поисковая система "Биомед". М.: МЗ РСФСР, 4 с., 1980.

5. Шпаков А.А. Электромагнитные поля в биосфере. Т. 2-й. М.: Наука, с.312-340, вкладка (УК), 1984.

6. Шпаков А.А. Европа говорит с Европой. М.: МЦНТИ, с.110-115, 1990.

7. Шпаков А.А. Применение новых компьютерных технологий в образовании. М.: Наука, с.133-134, 1991.

8. Шпаков А.А. Состояние и проблемы развития национальных сетей и систем научно-технической информации. М.: ВИНИТИ, с.158-159, 1991.

9. Шпаков А.А. Современные проблемы изучения и сохранения биосферы. Т.2-Й. СПб.: Гидрометеоиздат, с.420-427, 1992.

10. Shpackov А.А. J. Amer. Soc. Inform. Sci., V.43, N 10, p.678-681, 1992.