!1!

Я.Я.ДОКТОРОВ, Н.Е.КАЛЕНОВ

ТЕХНОЛОГИЧЕСКАЯ БИБЛИОТЕЧНАЯ

СИСТЕМА НА ПЭВМ

Для современных персональных ЭВМ (ПЭВМ) в настоящее время существует множество различных систем управлений базами данных (СУБД), являющихся универсальным средством для ведения в обработки больших массивов информации. Но универсальность СУБД на практике зачастую превращается в трудность ее освоения для неподготовленных пользователей с одной стороны, а с другой, - любая универсальность, какая бы она ни была, не может охватить всевозможные реальные ситуации. Кроме того, стремление к универсальности приводит к потере эффективности при работе с конкретными базами данных. Поэтому оправданным является такой подход, когда различные авторы в разработках своих систем ориентируются на конкретную предметную область. Подобный подход реализован в Библиотеке по естественным наукам АН СССР (БЕН АН СССР).

Во многих задачах библиотечной технологии, связанных с комплектованием и каталогизацией литературы, необходима обработка элементов данных переменной длины, в то же время не требуется возможности поиска по различным признакам, достаточно выбора по одному ключу доступа - уникальному идентификатору издания (например, номеру ISBN или ISSN ).

В качестве основы для решения технологических библиотечных задач предлагается специализированная диалоговая система, разработанная применительно к ПЭВМ типа IBM PC. Основным входным форматом данных при этом является формат, аналогичный ISO-2709. Система ориентирована на малоподготовленного пользователя, но она открыта и для пользователя-программиста, разрабатывающего прикладные библиотечные системы. Для этого имеются исходные тексты на языке "СИ" всех необходимых процедур для манипуляции с записями переменной длины.

Предлагаемая система обладает следующими функциональными возможностями:

 

!2!

В.А.ГЛУХОВ, М.Н.СМИРНОВА

РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННО-БИБЛИОТЕЧНОЙ СИСТЕМЫ ПО ОБЩЕСТВЕННЫМ НАУКАМ В ИНИОН

В Институте научной информации по с общественным наукам АН СССР (ИНИОН АН СССР) разрабатывается Автоматизированная информационно-библиотечная система по общественным наукам (АИБС ОН).

Задачей АИБС ОН является автоматизация основных библиотечных процессов - комплектования фондов, обработки новых поступлений, хранения библиотечного фонда, обслуживания читателей первичными документами и их копиями, организации и ведения справочно-библиографического аппарата; учета литературы, контроля за ее сохранностью и использованием, сбора, обработки и использования статистических данных. Наряду с реализацией указанных задач АИБС ОН принимает участие в выполнении некоторых информационно-библиографических функций во взаимодействии с Автоматизированной информационной системой по общественным наукам (АИСОН) - таких, как подготовка и выпуск информационных изданий, выпуск карточек для каталогов и картотек, обеспечение "второго контура", ввод данных в базы данных ИНИОН.

На первом этапе развития АИБС ОН осуществляется:

На втором этапе на основе подсистем АИБС ОН будет начата работа по созданию ретроспективного электронного каталога, решению проблемы содержательных аспектов библиотечной работы (анализ потребностей в первичных документах, полноты и качества комплектования научных фондов, анализ их использования, обращаемости фондов и др.), а также по решению проблем взаимодействия локальных библиотечных сервисных служб (абонементные пункты обслуживания, МБА и др.) с основной системой.

АИБС ОН выполняет следующие функции:

АИБС ОН состоит из функциональных подсистем: комплектования сериальных изданий и комплектования книг, обработки, контроля и управления, хранения и библиотечного обслуживания, обслуживания копиями документов ("второй контур"), подготовки и выпуска изданий. Все функциональные подсистемы работают в режиме единого технологического цикла.

Новая информационно-библиотечная технология строится на следующих принципах:

Автоматизация библиотечных функций рассматривается в интеграции с подсистемами АИСОН, действующими в режиме промышленной эксплуатации и решающими задачи составления и ввода библиографических описаний (БО) книг и статей, выпуска карточек на книги и статьи для традиционных каталогов, издания текущих библиографических указателей, справочно-информационного обслуживания абонентов системы и др. При этом в действующие подсистемы АИСОН вносятся необходимые изменения, расширяющие или уточняющие их функции (расширяется набор элементов библиографической записи, изменяется технология ввода данных, контроля и т.д.).

АИБС ОН реализуется на мини-ЭВМ Ньюллет-Паккард (хранение и обработка общих для функциональных подсистем массивов) и на сопряженных с ней персональных ЭВМ типа IBM PC (хранение и обработка локальных массивов, взаимодействие с центральной ЭВМ в режиме обмена данных).

 

!3!

Г.М.ЗИНИНА, И.В.КОЧКИНА.

ИСПОЛЬЗОВАНИЕ ПЕРСОНАЛЬНЫХ ЭВМ ПРИ РАЗРАБОТКЕ АИБС ВГБИЛ

Программой "максимум" применения электронно-вычислительной техники в библиотеке является создание интегрированной автоматизированной информационной системы, обеспечивающей доступ ко всем информационным массивам. Существует два пути в достижении этой цели:


"сверху" - проектирование всей системы и ее поэтапная реализация;
и "снизу" - создание АРМ библиотечных специалистов, и последовательное объединение их в локальные сети, решающие задачи автоматизации все более крупных технологических этапов.

При создании АИБС ВГБИЛ был выбран второй путь. Разработка АИБС начата с автоматизации отдельных функций сотрудников отдела международного книгообмена. Выбор отдела международного книгообмена обусловлен тем, что процессы, происходящие при книгообмене, аналогичны функциям библиотеки в целом, а именно: заказ литературы, регистрация новых поступлений, ведение инвентарной книги, списание литературы, ведение каталога и др. С другой стороны, относительная автономность процессов МКО; сравнительно небольшие объемы информационных потоков позволили приступить к автоматизации функций МКО, имея ограниченные технические ресурсы.

В пусковой комплекс АИБС ВГБИЛ включены следующие задачи подсистемы "Комплектование фондов":

Наиболее существенные проблемы, возникающие при разработке программного обеспечения, появляются как следствие:

Мы старались обойти эти проблемы за счет создания рабочей группы, тесно сотрудничающей на всех этапах разработки системы от постановки задач до ввода в эксплуатацию.

В результате того, что над постановкой задач работали не только сотрудники отдела автоматизации, но и сотрудники библиотечных отделов, задачи формулировались с максимальной конкретизацией и учитывали множество "мелочей", видных только профессионалу-библиотекарю. Программирование ведется с использованием средств СУБД Ребус (аналог dBase-III Plus), что значительно сокращает сроки разработки и облегчает взаимодействие с библиотечными специалистами на этапе программирования. Пилот-проект, создаваемый программистом, максимально удовлетворяет требованиям, зафиксированным на этапе постановки задачи. В дальнейшем работа над совершенствованием и доводкой программного обеспечения ведется совместно с библиотечными специалистами. Им предлагается пронаблюдать (а лучше - самим попробовать) работу первоначальных вариантов программ и высказать свои замечания и пожелания. В большинстве случаев необходимые изменения вносятся в программы тут же, в течение нескольких минут. Новый вариант опять подвергается совместной проверке и обсуждению. В результате нескольких сеансов такой работы библиотекаря и программиста вырабатывается вполне законченный вариант программы, и для программиста остается лишь оптимизация ее работы и другие специфические операции, которые он выполняет уже без участия библиотечного специалиста.

Второй вопрос - о документации. О конкретности постановок задач уже было сказано выше. Что касается программной и другой проектной документации, то ее количество может быть сведено к минимуму вследствие практического слияния "в одном лице" (группы программистов и библиотекарей) постановщиков, разработчиков и пользователей. Практически отсутствуют инструкции для пользователей, так как программное обеспечение разрабатывается с максимальным соблюдением принципа "дружественности интерфейса". Всю необходимую в процессе работы информацию и подсказки пользователь видит на экране дисплея.

Взаимодействие пользователя с машиной строится на основе принципа выбора необходимых функций из предлагаемого на экране меню.

Например, основное меню задачи "Определение сводных потребностей партнеров МКО на литературу обменного фонда" выглядит так:

ВОЗМОЖНЫ СЛЕДУЮЩИЕ РЕЖИМЫ РАБОТЫ

1 - ВВОД ИНФОРМАЦИИ

2 - РЕДАКТИРОВАНИЕ

3 - РАЗМЕТКА СПИСКОВ

4- ПЕЧАТЬ

5 - УДАЛЕНИЕ

6 - ВЫХОД ИЗ ЗАДАЧИ

ВЫБЕРИТЕ РЕЖИМ:

 

При выборе режима ввода информации (цифра 1) на экране появляется макет записи, которую предлагается заполнить. При вводе информации осуществляется контроль на соответствие характеристикам полей записи. Предусмотрена возможность коррекции ранее введенной информации.

Поиск записей в файлах данных может осуществляться по одному или нескольким известным полям. Для задания параметров поиска пользователю предлагается макет с полями для ввода известных библиографических данных в качестве поисковых признаков.

 

!4!

М.В.ЛЕВНЕР, А.В.ГЛУШАНОВСКИЙ

БАЗЫ ДАННЫХ НА КОПАКТ-ДИСКАХ И ИХ ИСПОЛЬЗОВАНИЕ

В БИБЛИОТЕКАХ

Данное сообщение посвящено анализу возможности использования в информационно-библиотечных службах очень активно развивающихся в последнее время баз данных (БД) на оптических носителях, использующих луч лазера для записи и чтения информации. Создаются так называемые оптические информационные системы, включающие технические устройства для записи, считывания и обработки информации с оптических носителей, программное обеспечение и сами информационные БД, записанные на различных типах оптических дисков. В зависимости от возможностей использования оптических носителей для записи и считывания информации различают три вида оптических дисков:

1. ОROM (Optical Real Only Memory). Диски этого вида предназначены только для считывания и обработки, однократно записанной на диск информации. Наибольшее распространение среди оптических носителей этого класса получили оптические компакт-диски СD-ROM (Compact Disc - Real Only Memory), известные также под названием OROS (Optical Real Only Storage).

2.WORM (Write Once Read Мanу), известные также под названием WOOD (Write Once Optical Discs). При работе с дисками этого вида пользователю предоставляется возможность непосредственной записи информации на диск, однако, без возможности стирания записанной информации. Хотя физическое использование дисков этого вида очень сходно с CD - ROM иих стоимость примерно вчетверо выше.

3. WMRA (Write Many Read Always), предусматривающие возможность записи, стирания и считывания информации. Устройства для работы с такого рода дисками находятся в стадии разработки и их поступление на рынок ожидается не ранее 1990 года.

Информация на оптических дисках хранится в цифровой форме и может отражать данные в виде текстов, графиков, таблиц, рисунков, структур. Информационная технология, основанная на создании и использовании БД на оптических дисках с записью данных в цифровом виде, является в настоящее время последним достижением мировой науки и техники в этой области.

Наибольшее применение в настоящее время находят компакт-диски (сd - rom ), обладающие целым рядом достоинств. Это, во-первых, их большая информационная емкость порядка 550 мегабайт (при диаметре диска 120 мм и толщине 1,2 мм). Для сравнения: емкость одного оптического компакт-диска достаточна для записи 275000 страниц машинописного текста или информации с 1500 флоппи-дисков с двойной плотностью записи. Во-вторых, долговечность хранения информации, сохранность данных при воздействии электромагнитных палей. Важным достоинством компакт-дисков является быстрота доступа к информации на них. Из технических характеристик следует, что доступ к необходимой информации на CD - RОМ обеспечивается за время, не превышающее 1 секунды, и найденная информация передается в компьютер для обработки со скоростью 150 килобайт в секунду. Очень важным является то, что формат записи данных на CD - ROM вполне стандартизован совместными усилиями компаний, являющихся пионерами в освоении этого нового вида информационной технологии (Philips, Sony, High Sierra Group).

Недостатками же являются высокая пока еще стоимость оборудования для работы с CD - ROM и для записи информации на них, а также невозможность замены данных на диске или внесения пользователем своих данных на диск.

Новая информационная технология, связанная с применением оптических компакт-дисков, получает распространение в самых различных областях человеческой деятельности. В настоящее время пользователями информации на CD-ROM являются многие информационные и библиотечные органы, учебные и медицинские учреждения, банковские, юридические, социологические, сервисные службы, промышленные корпорации и издательства. Причем области приложения очень различны. На оптических компакт-дисках имеются обучающие и тренирующие программы, энциклопедии, словари, библиотечные каталоги, телефонные справочники, различного рода руководства, деловая и коммерческая информация, карты, диаграммы, статистические данные, а также множество библиографических и полнотекстовых БД. С момента первого объявление в декабре 1985 года на 9-ой международной информационной встрече в Лондоне по системам теледоступа о создании нового типа информационно-поисковых систем, базирующихся на CD-ROM технологии, разработки в этой области продвинулись весьма внушительно. Только за 1988 год количество БД на CD-ROM удвоилось. В выпускаемом каталоге коммерческих БД на CD-ROM на начало 1989 года насчитывается 390 доступных пользователям БД. Сейчас получение информации на CD-ROM рассматривается рядом специалистов как альтернатива информационному поиску в режиме online. Сравнительный анализ возможностей, предоставляемых доступом к БД через CD-ROM и в режиме online , показывает, что каждая из этих информационных технологий имеет свои достоинства недостатки, и полностью заменить друг друга они не могут. Однако в странах со слаборазвитой сетью телекоммуникаций для доступа к внешним БД в режиме online и для организаций со стесненным бюджетом для поиска информации в режиме теледоступа БД на CD-ROM могут явиться весьма эффективной альтернативой. Библиотеки и информационные центры, приобретая БД на CD-ROM (актуализируемые распространителями в основном ежемесячно или ежеквартально), способны осуществлять информационное обслуживание своих абонентов с использованием информации с компакт-дисков. Тем более что развитие БД на сd-rom идет в направлении отражения на компакт-дисках практически всей информации, доступной в настоящее время в режиме on-line.

В связи с большой информационной емкостью CD-ROM существенно увеличилось количество полнотекстовых БД на этом виде носителей информации, а также БД с глубокой ретроспективой. Анализ структуры информационного потока на cd-rom показывает, что если в 1987 году на БД с библиографической информацией, справочными данными и рефератами приходилось по 30% информационного продукта на компакт-дисках, а на полнотекстовые БД только 10%, то к началу 1989 года на полнотекстовые и фактографические БД приходится уже по 30% информационного продукта.

Кроме того, БД на CD-ROM имеют значительно более широкие возможности отображения информации, чем БД на магнитных носителях. В частности, в БД на CD-ROM могут быть введены рисунки, графики, диаграммы, схемы, фотографии, что может существенно повысить качество БД по различным техническим дисциплинам, медицине, биологии, пополнить иллюстративным материалом патентную информацию.

Появление БД на CD-ROM открывает новые перспективы для библиотек разного уровня. Дело в том, что помимо их более низкой стоимости по сравнению с БД на магнитных лентах или в режиме on -line производители БД на CD-ROM все программное обеспечение для поиска и обработки информации в конкретной базе поставляют как неотъемлемую часть на тех же компакт-дисках, что и информацию. Поэтому пользователь, имеющий персональный компьютер и устройство считывания информации с CD-ROM, приобретя БД на CD-ROM, получает полностью готовую к использованию информационно-поисковую систему. Связывая же персональные ЭВМ в локальные сети, можно обеспечить доступ к БД на CD-ROM большому количеству пользователей.

Сознание перспективности новой информационной технологии с применением компакт-дисков определили необходимость приобретения Библиотекой по естественным наукам АН СССР БД на новых видах носителей. Библиотекой приобретена БД Science Citation Index за I986-I988 годы на CD-ROM . Проведенные с этой БД эксперименты по информационному обслуживанию ученых различных специальностей (биологов, механиков, математиков) показали, что благодаря уникальным поисковым возможностям и хорошему отбору документов БД представляет значительный интерес практически для любого специалиста. Поиск информации проводился по тематическим запросам, охватывающим круг научных интересов исследователя или небольшой группы исследователей. В ходе поиска с помощью специальных методов, возможных в БД SCI, не только выявлялись работы, содержащие требуемый набор ключевых слов, но выявлялся также круг авторов, работавших в данной области, анализировались их работы и работы, связанные с ними по цитируемым источникам. Время отработки одного тематического запроса по 3-х годовой БД составляет от 3-х до 10 часов. Результат поиска представляет собой выборку от нескольких десятков до более чем 100 документов, значительная часть которых не только неизвестны абоненту ранее, но часто относятся к неизвестным ему группам ученых и аспектам исследований.

Указанные БД предполагается использовать разнопланово: как для информационного обеспечения ученых АН СССР, так и для проведения научных исследований, связанных с проблемами структурирования науки, выявлением тенденций развития науки с целью обеспечения информационной поддержки научных менеджеров. Для этих целей будут анализироваться, приобретаться и обрабатываться и другие БД на компакт-дисках.

 

 

 

!5!

М.Ф.МЕНЯЕВ

БИБЛИТЕЧНО-ИНФОРМАЦИОННАЯ СИСТЕМА НА БАЗЕ ПЕРСОНАЛЬНОЙ ЭВМ

Многолетние исследования в области построения информационных систем привели к разработке библиотечно-информационной системы "Library Super System", первая очередь которой используется в библиотеке МГТУ им. Н.Э.Баумана.

Система представляет собой совокупность модулей (автоматизированных рабочих мест - АРМов), выполненных по единой программной технологии, и обеспечивает в интерактивном режиме выполнение технологических операций библиотеки.

Модуль "Библиотекарь" (АРМ-"Библиотекарь") обеспечивает обработку информации о новых поступлениях в библиотеку. В процессе работы выполняются следующие функции:

Модуль обеспечивает создание архивных файлов на дискетах, обеспечивая дублирование введенной информации и картотек. Одновременно эта операция позволяет разгрузить винчестер ПЭВМ от записей о новых поступлениях.

Работа в режиме "файл" модуля позволяет формировать дискету новыми поступлениями для передачи ее в информационную систему библиотеки или непосредственно на кафедру вуза. В первом случае дискета с новыми поступлениями обрабатывается в модуле "Информ -тор".

AРM "Библиотекарь" выдает информационные листы о новых поступлениях в режиме ИРИ и ДОР как в виде твердых копий, так и на дискетах, что позволяет вести отдельные базы данных по соответствующим направлениям.В процессе работы на AРM "Библиотекарь" оператор (библиотекарь) имеет возможность редактировать ранее сделанные записи о поступлениях. Выполнение этой функции связано с процессами описания литературы, изменения места хранения книг и т.п. Функция редактирования успешно применяется и для ведения ретроспективного поиска информации. Поиск информации может осуществляться по индексу УДК, автору, заголовку, авторскому знаку, предметной рубрике.

Важной характеристикой библиотечно-информационной системы является ее высокая устойчивость к воздействию технологического процесса. Рассматриваемая система снабжена системой защита от неправильного использования клавиатуры, имеет дружественную подсказку, а также обеспечена встроенными переключателями, которые сводят все управлений системой к перемещению по экрану контрастного окна на текст требуемой функции с помощью клавиш-стрелок клавиатуры.

Модули системы (AРМы) оформлены в виде отдельных программных модулей, не требующих поддержки какой-либо СУБД. Кроме системных модулей в системе размещаются базы данных в dBASE-формате.

Система ориентирована на работу в составе ПЭВМ, имеющей оперативную память более 300 Кбайт, два накопителя на магнитных дисках (один из которых желательно в виде винчестера). Для выдачи твердой копий необходим принтер. Система работает под управлением ДОС ПЭВМ.

В процессе испытаний и эксплуатации системы показана ее легкая адаптация к библиотечной технологии. Работа в системе не требует длительной специальной подготовки персонала библиотеки.

 

!6!

Т.И.АГЕЕВА, Н.В.ИВАНОВСКАЯ

ТЕХНОЛОГИЧЕСКИЕ ПРОБЛЕМЫ КОМПЬЮТЕРИЗАЦИИ БИБЛИОТЕЧНЫХ ПРОЦЕССОВ

Решение проблемы эффективного информационного обеспечения учебного и научного процессов в вузе возможно только при компьютеризации библиотечной технологии.

В МГТУ им. Н.Э.Баумана разработана и внедряется автоматизированная библиотечно-информационная система.

Первый этап создания автоматизированной системы - разработка АРМ "Библиотекарь". В настоящее время проходит опытная эксплуатация первой очереди системы на ПЭВМ. Выполняются следующие виды работ: введение в базу данных информации о книгах, печатание каталожных карточек, печатание книжных формуляров, печатание, инвентарной книги, создание картотеки без инвентарного учета, ведение картотеки периодической литературы и др.

Система обеспечивает поиск книг в базе данных по известным библиографическим данным.

На основе изучения классификационных схем, используемых в ГСНТИ, создан рубрикатор, отражающий информационные потребности читателей, обслуживаемых библиотекой МГТУ им. Н.Э. Баумана.

Компьютеризация изменила, традиционные библиотечные процессы и привела к необходимости изменения программы занятий по повышению квалификации сотрудников, внедрению новых форм работы, изменению информационных отношений между подразделениями библиотеки, разработке соответствующих нормативных документов.

Опытная эксплуатация системы показала преимущества в сложности компьютеризации библиотечной технологии.

 

!7!

Г.Т. ШАТИРИШВИЛИ

АВТОМАТИЗИРОВАННОЕ РАБОЧЕЕ МЕСТО (АРМ) БИБЛИОГРАФА НА ГРУЗИНСКОМ ЯЗЫКЕ НА ПЭВМ РОБОТРОН 1715

В ГрузНИИНТИ разработан автоматизированный технологический процесс, обеспечивающий выполнение операции по ведению служебных картотек и справочников.

Технологический процесс реализован в виде автоматизированного рабочего места, предназначенного для сотрудников отделов обработки литературы и каталогизации.

АРМ библиографа обеспечивает составление библиографического описания документов в соответствии с ГОСТ-7.1-84, редактирование библиографических описаний, создание всех видов каталогов и картотек в машиночитаемом виде. Здесь не требуется заполнение предмашинного формата, так как диалог ведется в режиме меню.

АРМ библиографа дает возможность осуществить библиографический поиск произведений печати в режиме диалогов по их заголовку, автору, теме, наименованию издательства, месту и дате издания, индексу классификатора, который применяется в данной библиотеке. Результатом поиска может быть библиографическое описание документа с указанием места хранения.

Машинная технология реализована средствами экранного интерфейса СУБД РЕБУС, работающей на ПЭВМ РОБОТРОН 1715 (CM I904) под управлением операционной системы SCP с использованием созданного грузинского алфавита на ПЭВМ. Микропрограммное управление выделено конструктивно в виде отдельного съемного блока, соединяемого с платой с помощью разъема. На плате установлены 5 м/с ППЗУ. Разработанная программа грузинской символики размещена в ППЗУ и установлена на этом блоке. Дисплей управляется с центрального блока, где расположены два знакогенератора с латинской и русской символикой соответственно. Грузинская символика установлена на дополнительном ППЗУ.

В состав программного обеспечения АРМ входит текстовый редактор, дающий возможность библиотекарю работать в форматированном экране: на экране терминала высвечивается форма каталожной карточки, которая разделена на поля в соответствии с ГОСТом. Библиотекарь должен заполнить эти поля по привычной схеме. Параллельно создается электронная копия этой карточки, которая записывается на гибким диске и которую впоследствии можно напечатать.

Текущая БД хранится на 2 ГМД (в двух экземплярах). Первый (рабочий) находится в постоянном оперативном доступе. Второй (копия рабочего экземпляра) отражает состояние БД на момент, предшествующий последней загрузке БД.

Для овладения технологией работы на АРМ не требуется знаний операционной системы SCP и команд монитора.

Загрузка пользователем ОС SCP приводит к запуску стартового файла и выходу в пользовательское технологическое меню. Команды меню и действия пользователя в соответствии с подсказками, в конечном счете, приводят к вхождению в соответствующий режим работы с необходимой пользователю БД.

Запуск системы приводит к загрузке ОС SCP, тестированию системного и рабочего ГМД, загрузке технологического меню. Выбор режима ввода корректировки и удаления записей приводит к загрузке необходимых программ и переводу БД в состояние редактирования.

Ведение БД в режиме редактирования происходит в диалоге. На экран выводятся сообщения - подсказки, регламентирующие последовательность ввода информации.

Работа пользователя с БД в режиме поиска осуществляется в соответствии c технологическими инструкциями по поиску и руководством пользователя по экранному интерфейсу СУБД.

 

!8!

М.Е.ШВАРЦМАН

АВТОМАТИЗАЦИЯ МЕЖБИБЛИОТЕЧНОГО АБОНЕМЕНТА В ГОСУДАРСТВЕННОЙ БИБЛИОТЕКЕ СССР им. В.И.ЛЕНИНА

Межбиблиотечный абонемент в Государственной библиотеке СССР им. В.И.Ленина (ГБЛ) был автоматизирован в 1979 году. Первое время система работала на ЭВМ М-4030, затем было разработано программное обеспечение для CM-I420 и операционной системы ДИАМС-2.

При разработке автоматизированной системы (АС) была сохранена технология традиционного МБА. В отделе абонемента установлены автоматизированные рабочие места (АРМ) для библиотекарей. В режиме диалога вводится информация о поступивших, посланных и выполненных заказах. Ведутся справочные массивы абонентов, статистики и т.п. Система является локальной, то есть, не связана ни с какими другими подсистемами АС ГБЛ.

На основе введенной информации решаются следующие задачи:

Исходя из опыта эксплуатации попробуем проанализировать, что дала автоматизация МБА. Много времени экономится на подготовке писем, адресов абонентов. Стал возможным сбор статистики в различных аспектах (вручную это было бы просто невозможно). Сейчас за год выпускается около 30 отчетных и статистических форм, причем их число и состав из года в год меняется. В нашей АС были запрограммированы все формы, но разработчикам аналогичных систем можно порекомендовать создавать комплекс программ, генерирующих любую заданную таблицу по параметрам, и задавать эти параметры в начале каждого года набор таблиц на этот год. В результате работы АС стал надежнее и проще контроль за сроками.

Однако надо отметить, что, решая ряд задач для библиотекарей, АС практически ничего не изменила для абонентов. Скорость и качество обслуживания в АС МБА остались прежними.

Недостатком системы является также ее замкнутость. Сейчас невозможно принимать заказы в машиночитаемой форме, так как в СССР нет единого формата записи заказов по МБА в машиночитаемой форме (в настоящее время существует только проект международного формата ISO). Даже получив заказ по телетайпу мы вынуждены снова его вводить в ЭВМ.

Достоинства и недостатки нашей системы представляются типичными и связаны с невозможностью на существующей технической и информационной базе создать лучшую систему.

Для существенного улучшения работы МБА автоматизированная система должна быть ориентирована в первую очередь на абонента, на более быстрое и качественное его обслуживание. Для решения этой задачи библиотеки должны иметь электронные сводные каталоги (ЭК), каналы связи, телефаксимильную связь.

В настоящее время в ГБЛ ведется разработка Автоматизированной информационно-библиотечной сети Министерства культуры СССР (АИБС МК). Центры этой сети будут располагать электронным каталогом, связываться по выделенным или коммутируемым каналам связи.

Автоматизированный МБА ГБЛ в рамках этой сети будет создаваться на базе персональной ЭВМ " Vectra ". Это будет типовая разработка с максимальным набором задач, параметрически настраиваемая. Из такой системы любой заинтересованный центр МБА сможет вычленить часть задач, необходимых для решения в данном центре. Предполагается следующая технология.

По сети передачи данных (СПД) абонент связывается с ЭК ГБЛ и производит поиск. Сведения о найденном издании передаются на персональную ЭВМ, в АС МБА в виде заказа. Такая технология должна обеспечить оперативное размещение заказа и исключить его перенаправление. В первую очередь АИБС МК должно войти только 10 центров. Поэтому ожидаются различные потоки заказов: по СПД, по телетайпу, традиционные бланки-заказы.

Для успешной реализации разрабатываемой системы необходимо решить ряд вопросов, зависящих не только от ГБЛ:

Кроме того, необходимо улучшение работы почты, так как возможно, что длительные сроки почтовых пересылок во многом обесценят сокращение сроков в центрах МБА.

 

!9!

Л.В.УЖИНСКАЯ

АВТОМАТИЗАЦИЯ ВАЛЮТНОГО ЗАКАЗА ИНОСТРАННЫХ КНИГ В РАМКАХ АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ БИБЛИОТЕЧНОЙ СИСТЕМЫ ПО ОБЩЕСТВЕННЫМ НАУКАМ (АИБСОН)

Процесс валютного заказа трудоемкий, содержит много рутинных и дублирующих операций. Несовершенство существующей системы валютного заказа приводит:

При решении задачи автоматизации необходимо предусмотреть исключение из процесса рутинных и дублирующих операций: однократность формирования записи о заказе и многократность ее использования (при формировании выходной документации для заказа, регистрации полученных книг и др.); минимизацию ввода информации и возможность автоматизированного формирования данных ; доступность для пользователей данных о заказе: автоматизированный контроль за сроками формирования заказа; сбор статистической информации; автоматизированное формирование выходной документации и др.

В рамках разработанной автоматизированной технологии процесс валютного заказа разбивается на конечное число операций, из которых формируется маршрут валютного заказа. Для каждой операции дается плановый срок выполнения (в днях).

Началом отсчета является дата регистрации первичных носителей сведений о книгах - национальных библиографий, информационных каталогов, проспектов, реклам (НБ, ИК, П, Р). При автоматизированной регистрации НБ, ИК, П, Р автоматически формируется так называемый "паспорт документа", содержащий плановый график их обработки (в том числе плановый график формирования валютного заказа.), который автоматически рассчитывается по дате регистрации НБ, ИК, П, Р и плановым срокам выполнения операций. По мере обработки НБ, ИК, П, Р (в том числе операций валютного заказа) формируется фактически график выполнения операций, при автоматизированном сравнении которого с плановым легко вычисляются величины задержек. Накопленные в паспорте документов данные позволят выявить причины и величины задержек, рассчитать пропускную способность и загрузку обрабатывающих подразделений и разработать предложения по устранению выявленных недостатков, а также автоматизировать диспетчерскую службу института.

Носителями информации о заказываемых книгах являются: НБ, ИК, П, Р, записи в базе данных валютных заказов, карточки заказа, списки, фишки, листы заказов.

Для реализации автоматизированного валютного заказа предусмотрена организация базы данных заказа и вспомогательных электронных картотек: стран-поставщиков, партнеров, валюты, заказчиков и массива статистики, а также использование данных электронной картотеки сериальных изданий (ЭКСИ), базы данных регистрации (БДР), электронной картотеки маршрутов и графиков обработки (ЭКМГ), организованных для решения задач автоматизированной регистрации СИ, контроля и управления внутренними потоками обрабатываемых документов и др.

База данных заказа содержит записи, состоящие из фрагментов:

При формировании новых записей о заказываемых книгах в БД заказа предусмотрена автоматизированная проверка на дублетность по ISBN , свертке автора и заглавия.

Вспомогательные электронные картотеки выполняют функции автоматического индексирования данных о странах и партнерах-поставщиках, пересчета валюты в инвалютные рубли, контроля за расходованием валюты заказчиками института, а также различные справочные функции.

Разработанная система ориентирована на использовании сети ЭВМ в составе персональных ЭВМ и ЭВМ Хьюлетт-Паккард. Система реализуется в виде совокупности автоматизированных рабочих мест (АРМ) с поддержанием соответствующих функций.

 

 

!10

Н.Е.КАЛЕНОВ, О.Д. КАЛЛИСТРАТОВА

АВТОМАТИЗАЦИЯ РЕГИСТРАЦИИ ПОСТУПЛЕНИЙ И РАСПРЕДЕЛЕНИЯ ЖУРНАЛОВ НА БАЗЕ ПЭВМ

К числу наиболее трудоемких технологических процессов в Библиотеке по естественным наукам АН СССР относятся регистрации поступлений зарубежных научных журналов, их распределение по библиотекам сети в соответствии с заказом и рекламирование. Трудоемкость этих процессов обусловлена большим количеством заказываемых журналов (более четырех тысяч наименований и около 12 тысяч комплектов) и значительным числом библиотек (около 200), в которые они должны быть распределены. При этом журналы поступают из различных источников комплектования (покупка за валюту через в/о "Международная книга", международный книгообмен, подписка через Союзпечать); некоторые наименования должны предварительно направляться на микрофиширование или в определенные научные центры для демонстрации на выставках; для отдельных выпусков журналов может потребоваться библиографическое описание с подготовкой и рассылкой в библиотеки-получатели полных комплектов каталожных карточек; журналы, направляемые в фонды центральной библиотеки (ЦБ), должны сопровождаться бланками-заказами специальной формы на копирование и т.д.

В рамках II очереди АС НАУКА, принятой в промышленную эксплуатацию в 1985 году, автоматизирован процесс заказа сериальных изданий (СИ) на ЭВМ ЕС-1022, основой для которого служит постоянно актуализируемая база данных СИ, которая содержит всю необходимую для заказа информацию. Однако технические возможности EС-1022 недостаточны для автоматизации процесса регистрации и распределения СИ по библиотекам сети. Появление в БЕН АН СССР персональных ЭВМ типа IBM PC, совместимых с ЭВМ ЕС на уровне магнитных лент, создало реальную возможность автоматизации данного процесса.

В настоящее время в БЕН АН СССР на базе IBM PC разработана система автоматизированной регистрации, контроля и распределения поступлении СИ - "СЕРИАЛ-М". В системе реализован развитый диалог с пользователем в режиме меню и подсказок и формально-логический контроль вводимой информации. Система использует базу данных заказа СИ, формируемую на ЭВМ ЕС и переносимую с МЛ ЕС ЭВМ на IBM PC, с помощью стандартных утилит и программ, разработанных в АС НАУКА.

Регистрация СИ осуществляется по значениям ISSN либо шифров БЕН, отражаемых в ежегодно выпускаемых указателях подписки. В процессе регистрации СИ выдается информация об издании, запрашиваются данные о поступившем выпуске, выдаются предложения на дополнительную обработку и в диалоге ведется распределение по сиглам библиотек-заказчиц с подготовкой всей необходимой документации, предусмотренной технологией БЕН. Система позволяет автоматически просматривать поступления СИ, а также выявлять необходимость рекламирования журнала, заказанного за валюту, при задержке поступления очередного выпуска или недостаточной экземплярности.

В настоящее время система находится в стадии опытной эксплуатации. Ее внедрение позволит сотрудникам БЕН отказаться от ведения традиционных регистрационных картотек и существенно облегчит выполнение ряда технических процедур.

 

!11

И.Л.МИХАЛЬКО, А.В.КИРЮХИН

ОБРАБОТКА ЛИТЕРАТУТЫ С ОРИГИНАЛЬНОЙ ГРАФИКОЙ В АИС

Институт научной информации по общественным наукам (ИНИОН) АН СССР является головным центром в системе информации по общественным наукам. Опираясь на отраслевые и региональные информационные органы, информационные подразделения отдельных учреждений и ведомств, ИНИОН осуществляет сбор, обработку, хранение и распространение информации по основным направлениям общественных наук. В автоматизированную систему информации ИНИОН поступает ежегодно на обработку литература в количестве 200-220 тыс. единиц. Сюда входят советские (20 тыс.) и зарубежные (23 тыс.) книги и наиболее важные в научном отношении статьи из более чем 4500 иностранных и 1500 отечественных сериальных изданий, получаемых ИНИОН.

Анализ документов, проведенный в ИНИОН, показал, что в институте обрабатывается (или предполагается обработка) литературы на 54-х языках народов мира. Почти все они являются языками, использующими диакритические знаки и различные специальные символы, что создает большие трудности как при вводе информации на таких языках (в процессе обработки литературы), так и при их хранении и обработке в ЭВМ. Это требует специальных таблиц кодировок, так как существующие программные средства не позволяют выводить на экран терминала и принтерные устройства, диакритические знаки.

Вместе с тем, появление ПЭВМ и принтеров с программно загружаемыми шрифтами дало возможность работы с такой литературой на качественно новом уровне, позволяющем выводить диакритические, знаки и спецсимволы в оригинальном начертании, как на экран ПЭВМ, так и на принтер. Это даст возможность сократить количество ошибок при вводе такой информации), о обеспечивается принципиально новой технологией ввода), а также упростит машинное представление данных и уменьшит объем занимаемой памяти.

В процессе разработки данной системы все множество знаков разбито на 2 больших подмножества: языки, базирующиеся на кириллическом алфавите, и языки, базирующиеся на латинском алфавите (что составило 22 и 32 языка соответственно). Диакритические знаки и специальные символы (имеются в виду "нестандартные" буквы) также составили 2 группы знаков. Алфавитное множество данной языковой группы содержит порядка 350-ти знаков. Была разработана новая система их ввода с клавиатуры ПЭВМ, использующая ряд функциональных клавиш. Основные знаки латинского и кириллического алфавитов располагаются на клавиатуре стандартным образом, диакриты вводятся при помощи функциональных клавиш, а дополнительные знаки - при помощи клавиш с цифрами и спецзнаками в кириллическом регистре.

Диакритические знаки вводятся последовательно - сначала диакрит, затем знак, к которому он добавляется. Экранный драйвер обеспечивает при этом отображение, диакритического знака в своем оригинальном начертании.

Это даст возможность отказаться, от традиционной кодировки диакритических знаков при вводе и сократит в 2 раза количество нажимаемых клавиш клавиатуры.

Вместе с тем, непосредственный ввод с клавиатуры такого количества знаков, а также их отображение на экране ПЭВМ и при помощи принтеров невозможно обеспечить стандартными программными средствами. Поэтому была разработана система кодировки данного набора знаков и спецдрайверов для их ввода с клавиатуры и вывода на экран и печать.

Таким образом, рассматриваемая система может применяться в библиотеках, имеющих ПЭВМ, для автоматизированной обработки литературы на оригинальных языках (народов СССР и зарубежных стран) и дает возможность:

 

!12

Е.Б.ГРЕШНОВ

КОМПЬЮТЕРНОЕ РАБОЧЕЕ МЕСТО ДОКУМЕНТАЛЬНО-ИНФОРМАЦИОННОГО ЭКСПЕРТА

В последнее время все большую актуальность приобретает анализ научно-технической информации, который является основным звеном в подготовке управленческих решений, в исследовании закономерностей и тенденций проблематики предметных областей, в оценке приоритетов развития тематических направлений и т.п. Но аналитические обзоры и справки, прогнозы и проекты развития имеют устойчивый спрос у потребителей только в том случае, если подобная "продукция" имеет соответствующее качество. А качество такого рода продукции обычно определяется достоверностью и полнотой необходимых сведений, надежностью и эффективностью сделанных выводов, которые непосредственно зависят от применяемой технологии информационного анализа.

В докладе изложены новые подходы к пониманию процесса аналитической переработки информации, к созданию новой информационной технологии, включающей в себя процессы формирования и управления проблемно-ориентированными базами данных, новые методы и средства обработки различных типов информации (библиографической, фактографической, концептуальной и др.), нетрадиционные методики интерпретации и формы представления результатов обработки. Описывается модель документально-информационного потока, как концептуальная основа для создания рабочего места эксперта. Сформулированы основные функции и требования к персональному компьютерному рабочему месту эксперта как к элементу интегрированной компьютерной системы ГПНТБ СО АН СССР по обработке, анализу и оценке документально-информациенных потоков.

Литература

I. Нестеров А.В. Информатика в библиотеке // Создание и интеграция документальных и фактографических ИПС: Межвед. сб. научных трудов. - Новосибирск: ГПНТБ СО АН СССР, 1988. - С. 20-40.

 

!13

Я.Я.ДОКТОРОВ

ПЕРЕНОС ДАННЫХ С МЛ EС ЭВМ В ФОРМАТ СУБД "DABASE III pluse"

С появлением современных персональных ЭВМ (ПЭВМ) с их достаточно мощным математическим обеспечением и прикладных систем, предназначенных для обработки больших массивов информации, появляется реальная возможность применения ПЭВМ для автоматизации ряда трудоемких задач библиотечной технологии. При этом использование ранее накопленных баз данных (БД) на ЕС ЭВМ в системе АС НАУКА, эксплуатируемой в БЕН АН СССР, представляется нам более целесообразным, чем создавать новые БД на ПЭВМ.

Но использование на ПЭВМ ранее созданных БД на ЕС ЭВМ требует согласования форматов представления данных на них и перекодировки данных из кодов DCOI в коды ASCII или, другими словами, "перекачки" данных с магнитных носителей ЕС ЭВМ на магнитные носители ПЭВМ.

В настоящее время в БЕН АН СССР для реализации указанной задачи за основу принята следующая технологическая цепочка:

Для решения первой из указанных задач ПЭВМ укомплектована магнитофоном серии ТD 1050/I750, в матобеспечение которого входит прикладная система, позволяющая обрабатывать МЛ ЕС ЭВМ и переносить информацию на магнитные диски ПЭВМ..

Для решения двух последних задач разработаны программы на языке "СИ"; обе программы предназначены для работы подготовленного пользователя (например, для администратора БД). Хотя программы и снабжены соответствующими подсказками на каждом этапе работы пользователя, для эффективной работы от пользователя требуется знание, как форматов переносимых данных, так и формата МЛ ЕС ЭВМ.

Программа перекодировки "COIDCOI " позволяет проводить перекодировку символьной информации как из кода КОИ-8, так и из DCOI в коды ASCII. (Таблица кодировки КОИ-8 соответствует информации на МЛ, подготовленной на ПЭВМ ИСКРА-226 в формате ЕС ЭВМ).

Программа конвертор "CONV-88" предназначена для переноса ранее перекодированного файла (см. предыдущую программу) в формат СУБД "DBASE III plus ". Программа рассчитана на работу пользователя, имеющего хотя бы вводный опыт работы с системой " DBASE III plus".

Технологическая эксплуатация указанных программ в БЕН АН СССР показала их эффективность и вполне удовлетворительную надежность.

 

!14

Т. НАГОВИЦЫНА

ОБРАБОТКА ИНДИВИДУАЛЬНЫХ ЗАПРОСОВ ПОТРЕБИТЕЛЕЙ В ЛОКАЛЬНОЙ ДИАЛОГОВОЙ АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ НИИ

В НИИ второй год функционирует локальная автоматизированная информационно-поисковая система (ИПС). Каждые два месяца из отраслевого центра информации поступает база данных (БД) на магнитных лентах (МЛ). БД - документальная, типа БКР (библиографическое описание + ключевые слова + текст реферата). Поиск производится с использованием ППП CDS/ISIS/EC , приобретенным в МЦНТИ /I/. Диалог осуществляется под управлением СУТ KAMA /2/.

Общение с ИПС осуществляется через терминал с клавиатурой -дисплей - с помощью языка команд.

Поисковый образ запроса (ПОЗ) набирается на экране дисплея. Результат поиска - количество найденных документов - появляются на экране. Можно сразу посмотреть реферат найденных документов, оценить их релевантность, изменить запрос, вновь ознакомиться с результатами поиска.

Поступающая новая информация на МЛ дает возможность работникам отдела научно-технической информации осуществлять обслуживание специалистов в режиме ИРИ. Также производится накопление информации и через несколько лет можно будет производить ретроспективный поиск информации.

ИПС имеет 100 абонентов со 120 запросами. Количество абонентов в принципе может быть значительно увеличено, но пока это трудно из-за дефицита машинного времени, дисплеев.

В отраслевом центре разработаны типовые запросы (профили) в режиме ИРИ. Вначале пробовали работать по ним, но при БД в 6-8 тысяч документов на некоторые запросы выходило по 300- 400 документов, что свидетельствовало об информационном шуме. Было решено самостоятельно составлять ПОЗ. Вначале с использованием анкетирования, интервьюирования тщательно выясняются информационные потребности специалистов. Используется информационно-поисковый тезаурус документографической информационной базы - словарь лексических единиц (ЛЕ) дескрипторного информационно-поискового языка. Тезаурус состоит из 2-х частей - алфавитно-иерархического указателя ЛЕ и алфавитного перечня всех ЛЕ тезауруса.

У заказчика выясняется как можно больше терминов, выражающих информационную потребность, синонимов терминова. Используя команду ТEXT, можно произвести поиск документов только на русском или английском языке, выбрать из БД только патенты или описания изобретений.

Текст запроса составляется из ключевых слов или начал ключевых слов. Ключевые слова или их начала соединяются логическими операциями: И, ИЛИ, НЕТ. Чтобы явно задать порядок выполнения логических операций, можно использовать круглые скобки.

При работе с ИПС выявлено, что самое важное, творческое дело - составление ПОЗ. Чтобы научиться этому, необходим опыт работы, умение "почувствовать" систему. Нужно отметить, что проблемы, возникающие при поиске, не зависят от вида используемой ВТ: ЕС, СМ или ПЭВМ. Первая ошибка неискушенного пользователя - составление узкого запроса, например поиск устройства с конкретными характеристиками. В этом случае возможна нулевая выдача. Целесообразней вести поиск класса нужных устройств и по количеству и содержанию найденных документов менять стратегию поиска, вводить или убирать ключевые слова. По просьбе заказчиков формат печати выбран по размеру стандартной библиографической карточки (некоторые специалисты ведут свои картотеки).

Для пользователей подготовлена инструкция. При обучении пользователей диалогу с ЭВМ учитывается их психология, готовность работы с ВТ. Условно пользователей можно разделить на три группы.

Представители первой, самой многочисленной группы, поработав вместе с работниками ОНТИ с ИПС, почувствовав ее возможности, получив нужную, удовлетворившую их информацию, просят работников ОНТИ проводить поиск в режиме ИРИ по отработанному совместно запросу. Представители второй группы, имеющие большой опыт работы с ВТ, поставившие дисплей в своей рабочей комнате, ведут поиск самостоятельно. Представители третьей группы, не имеющие опыта работы с ВТ, обычно в возрасте за 40лет, не хотят работать с дисплеем, но с большим желанием получают распечатку рефератов на рабочем месте.

В планах работников ОНТИ и НТБ - использование ПЭВМ. Разработан макет элементов библиографического описания документов, которые нужно будет вводить в ПЭВМ /З/.

Предполагается использовать ПЭВМ при комплектовании, подписке, составлении писем, отчетов. Работа тормозится из-за отсутствия ПЭВМ в ОНТИ, но есть планы получить ПЭВМ в ближайшие год - два.

Литература

1. Пакет прикладных программ CDS/ISIS /EC/: Метод. мат. и документация по пакетам прикладных программ. - М.: МЦНТИ, 1980.-Вып. 22.

2. Горностаев Ю.М., Зиновьев С.Э., Ястжембски С. Применение системы телеуправления KAMA в автоматизированных системах научно-технической информации: Метод. мат. и документация по пакетам прикладных программ. - М.: МЦНТИ, 1980. - Вып. 8.

3. Использование микроЭВМ для автоматизации библиотечно-информационных процессов: (Методические рекомендации). - М.: ГПНТБ, 1988. - Вып. I.

 

 

!15

Р.С.НИГМАНУЛЛИН, А.А. СМЕТАННИКОВ

АВТОМАТИЗАЦИЯ СОСТАВЛЕНИЯ И КОРРЕКЦИИ ЗАПРОСА В ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ

Существуют известные трудности при обращении к базам данных, держащим рефераты или полнотекстовые документы с ненормированной (неизвестной) лексикой. Обращение к таким базам данных с помощью посредников представляется паллиативом. Более удобным средством является интеллектуальная система, способная помочь пользователю получить те и только те документы, которые удовлетворяют его информационную потребность (пертинентные документы).

Один из вариантов такой система предлагается в докладе. На первом этапе контакта с базой данных система предлагает пользователю:

ПП представляет собой булевое выражение, в котором допускается усечение терминов, как справа, так и слева, а также возможности проверки логических условий в форматных полях документа. Просмотр первого результата поиска позволяет выявить отдельные пертинетные и непертинентные документы.

Далее процедура коррекции строится в соответствии с "весовой  логикой" и при этом вычисляется разность множеств терминов из текстов пертинентных и непертинентных документов и автоматически составляется ПП, в котором каждый термин характеризуется весовым коэффициентом (вещественное число со знаком), равным log Р1 (Ti) / P2 (Ti), где Р1(Ti) и Р2(Ti) частоты терминов Ti во множествах пертинентных и непертинентных документах. Этот весовой коэффициент показывает количество информации, которое содержит термин Т в пользу гипотезы о пертинентности документа. Все выдаваемые документы упорядочиваются по убывании суммы весовых коэффициентов, характеризующих документы Wk= log Р1(Ti) k/ Р2(Ti) k , (Сумма от i=1 до N, где N - число терминов в К-ом документе. В ПП указывается Wo - ограничитель выдачи документов по порогу или максимальное число выдаваемых пользователю документов. Затем выданные документы просматриваются вновь и отмечаются пертинентные и непертинентные документы, при этом автоматически уточняются оценки log Р1(Ti) / Р2(Ti), проводится процедура поиска и т.д. Разработанные программные средства действуют в рамках ППП SM 88/9 и показывают хорошие результаты особенно при формировании проблемно-ориентированных баз данных, когда пользователь уже имеет множество пертинентных документов, что позволяет не начинать поиск с нуля.

 

!16

В.Н.ПОПОВ

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДОКУМЕНТАЛЬНЫХ ИПС НА БАЗЕ ПЭВМ

В статье рассматриваются функциональные возможности пакета прикладных программ, разрабатываемого в НПО "Центрпрограммсистем". Рабочее название пакета - ППП "Справочник". Этот пакет, в частности может быть использован в небольших библиографических ИПС.

  1. Назначение пакета прикладных программ (ППП)

ППП "Справочник" ориентирован на документальные ИПС, база данных (БД) которых включает порядка 30 тыс. документов.

Одной из основных областей применения пакета является создание на его основе персональных ИПС, т.е. таких систем, в которых потребитель информации сам осуществляет отбор документов и их ввод в БД, а также индексирование документов и запросов. Более того, потребитель информации, выбирает структуру ИПЯ (с учетом накладываемых ППП ограничений) и его лексику. Иначе говоря, в таких системах между потребителем информации и ИПС отсутствует посредники: индексатор, программист, оператор и т.д.

2. База данных

С точки зрения пользователя база данных (БД) состоит из справочников, каждый из которых включает некоторое множество статей.

Для удобства поиска информации в справочнике множество его статей может быть подразделено на разделы, а те, в свою очередь, на подразделы. Таким образом, БД имеет иерархическую структуру, элементами которой могут являться:

Статья, в общем случае, включает два структурных элемента: заголовок и текст статьи. В частном случае, текст статьи может отсутствовать, т.е. статья может быть представлена только заголовком. Заголовок статьи и ее текст являются наименьшими структурными единицами, манипулирование которыми обеспечивается средствами управления данными ППП.

3. Информационно-поисковый язык

В состав ИПЯ, поддерживаемого в ППП, входят рубрикаторы справочников и меню.

Рубрикатор справочника - это словарь, лексическими единицами которого являются названия разделов и подразделов справочника. Меню представляет собой простой дескрипторный словарь, т.е. в связи с конкретным меню предполагается некоторое множество понятий предметной области, одно из которых является родовым, а остальные связаны с ним отношением "род - вид". Каждому рассматриваемому видовому понятию ставится в соответствие, дескриптор. Совокупность таких дескрипторов и образует меню. Родовое же понятие, как правило, находит отражение в названии меню. Несколько примеров меню:

Пример I.

Дескрипторы меню "Цвет" - красный, синий, зеленый и т.д.

Пример 2.

Дескрипторами меню "Тип ЭВМ" могут быть: большие ЭВМ, мини-ЭВМ, микроЭВМ.

Пример 3.

Дескрипторы меню "Язык" - русский, немецкий, английский и т.д.

Для БД, в общем случае, определяется множество меню. С отдельным же справочником связываются лишь некоторые из меню этого множества.

Следует отметить, что для отдельного справочника может иметь место или рубрикатор, или меню, или рубрикатор и меню одновременно.

4. Поиск информации

Поиск информации в БД осуществляется в два этапа:

Первый этап, в общем случае, включает следующие операции:

Описание нужной информации осуществляется в процессе диалога, инициируемого программой. Диалог, в общем случае, включает несколько шагов. На каждом шаге пользователю необходимо выбрать один или несколько дескрипторов из меню.

На втором этапе на экран выводится список, элементами которого являются заголовки статей. Причем в списке представлены лишь те статьи, которые удовлетворяют запросу пользователя. Если при просмотре заголовков пользователя заинтересовала какая-либо статья, то имеется возможность просмотреть текст этой статьи. После завершения просмотра текста статьи осуществляется возврат к списку статей.

5. Создание и обслуживание справочника

Для размещения справочников используются гибкие или твердые МД. Если используются гибкие МД, то справочник может быть многотомным. Под томом здесь имеется в виду часть справочника, размещаемая на одном МД.

При вводе статьи в справочник пользователю сначала предлагается ввести заголовок статьи.

После ввода заголовка пользователь может ввести текст статьи и (или) описать (индексировать) статью, используя меню. Описание статьи есть процедура обратная по отношению к описанию информационного запроса. В данном случае пользователь для статьи указывает соответствующие ее содержанию раздел и подраздел справочника, а также дескриптор в каждом из связанных со справочником меню.

Под редактированием статьи понимается выполнение одной или нескольких из следующих операций:

- редактирование заголовка;

- редактирование текста статьи;

- редактирование описания статьи.

Редактирование статьи начинается с ее поиска (см. выше). После того, как пользователь нашел и указал редактируемую статью, он может выполнить перечисленные выше операции.

6. Условия эксплуатации

Для эксплуатации ППП необходима ПЭВМ, совместимая с ПЭВМ IBM PC, и операционная система MS DOS версии 3.10.

7. Ограничения

Область применения ППП "Справочник" определяется следующими ограничениями:

Примечание. Для перечисленных параметров приведены их максимальные значения.

 

!17

В.А. МОРОЗОВ, Л.Н. ХРОМОВ

ИСПОЛЬЗОВАНИЕ ЭКСПЕРТНОЙ СЛУЖБЫ ПРИ ТЕМАТИЧЕСКОМ ИНФОРМАЦИОННОМ ОБЕСПЕЧЕНИИ ОТРАСЛЕВОГО УРОВНЯ "ГОСКОМПРИРОДА"

Переход на условия хозяйственного расчета, сопровождается пересмотром классических функций отраслевых центров информации. В условиях рыночных производственных отношений невозможно делить предприятия по ранее принятому принципу подчинения на головные и вспомогательные. Товарно-денежные отношения однозначно обусловливают работу и тех и других предприятии и определяют информационные потоки между ними.

Исследования информационных потоков, выполнение на ПЭВМ типа PS/2 модель 80, показали, что в I988-I989 гг. наибольшей популярностью стали пользоваться разовые заявки на тематический поиск экологических нормативов и чистых технологий "под ключ" (73%). Примерно 42% разовых заявок сопровождаются ограничениями временного порядка (срочно). 56% разовых заявок на подборки имеют четко ориентированный тематический характер (атмосфера, вода, земля, недра) и жесткие временные рамки.

Для включения информационной службы в цепочку обеспечения жизненного цикла "экологической" продукции использовались методы информационного маркетинга с привлечением экспертов-специалистов разработчиков конкретных НИОКР по экологии (I, 2 ) . Эксперты привлекаются к сопровождению процесса планирования и практического осуществления комплектования и использования 40 баз данных по экологии, содержащих сведения о концепциях развития, ценообразования, стимулирования производства и распределения идей, товаров и услуг в области экологии в целях формирования обменных отношении, обеспечивающих удовлетворение общественных и индивидуальных потребностей покупателей информационного продукта. Немаловажное значение здесь играет фактор достоверности и информации и гарантий поставщика продукта (3 ).

На основе экспертных оценок в ВНИИЦ "Экология" была создана новая единая технологическая линия обработки потока справочных данных по экологии. Расчеты и первые месяцы работы с базами данных в 7 тыс. единиц хранения по новой технологии показали, что такой подход позволит превратить службу информационного маркетинга из убыточной в рентабельную.

В конце каждого квартала определяются параметры рентабельности трех составляющих звеньев и службы тематического информационного обеспечения: использование источника, работа эксперта-аналитика, работа абонента-пользователя.

Литература:

  1. Хромов Л.Н., Плотников Н.И. Источники и документы. НТИ. Целевая классификация //Техника средств связи. - 1989. - № 3. -с. 10-17. / ЦООНТИ "ЭКОС" МПСС.
  2. Хромов Л.Н., Плотников Н.И. Новизна НТИ // Средства связи. -1989. - № 4. - С. 30-35. / ЦОOHTИ "ЭКОС" МПСС.
  3. Хромов Л.Н., Плотников Н.И. Достоверность информации (проблемы, методика, критерии) // Средства связи. - 1989. - № 2. - С. 41-46 / ЦООНТИ "ЭКОС" МПСС.
  4. Рубрикатор баз данных Государственной экологической Информационной системы (ГЭИС).- М.: Издание ВНИИЦ "ЭКОЛОГИЯ", 1989.

 

!18

А. ТАМБЕК

ГЕНЕРАЦИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА МИКРОЭВМ "РОБОТРОН 1715"

Важным аспектом современной информационной технологии является использование микроЭВМ для создания различного рода локальных информационных систем. Однако в общем случае применение готовых пакетов для обработки текстов и данных требует существенных затрат на специальную подготовку пользователей (обучение на курсах, изучение специальной литературы и т.д.). Решением поставленной задачи могло бы быть создание: дружелюбного интерфейса между пакетами и пользователями-непрограммистами.

В настоящее время на 8-ми битовых микроЭВМ наиболее широко используется пакет РЕБУС (его зарубежный аналог - dBase II), на базе которого чаще всего разрабатываются локальные информационные системы, с которыми пользователь-непрограммист взаимодействует через меню и основными режимами которых являются:

Были проанализированы два варианта реализации этой идеи для "Роботрон 1715":

1. Создать программы, генерирующие как базу данных, так и подпрограммы, необходимые для работы с конкретной базой данных. Такие подпрограммы были бы быстродействующими и оптимальными, так как они были бы разработаны для конкретной базы и в них отсутствовали бы лишние функции. Недостатком этого варианта, является то, что такие программы необходимо генерировать для каждой базы отдельно, и они занимают много дисковой памяти.

2. В основу второго варианта положена идея создания программ, независимых от конкретной базы данных, а также программы, инициализирующей систему перед работой с конкретной базой. С помощью меню пользователь может выбрать подходящий для себя род деятельности. Преимущества этого варианта:

Недостатком этого варианта является некоторая потеря быстродействия, что не имеет решающего значения для пользователя, т.к. время реакции системы не превышает 4-5 секунд.

Для реализации системы был выбран второй вариант.

В настоящий момент реализована система:

В системе реализованы следующие режимы работы:

Система реализована на микроЭВМ "Роботрон 1715" с использованием операционной системы SCP и системы обработки данных РЕБУС и языка программирования Turbo Pascal.

 

!19

И.А. Сабадыш

ДОСТУП К МИНИ-ЭВМ СМ 4 ЧЕРЕЗ КОММУТИРУЕМЫЕ ЛИНИИ СВЯЗИ

Одной из основных задач отдела информатики ГПНТБ СО АН СССР является организация широкого терминального доступа к активным библиотечным ресурсам, т.е. к метаинформации, содержащейся в электронных картотеках и каталогах. В данное время ГПНТБ СО АН СССР ведет работы по созданию аппаратно-программного компьютерного комплекса, который позволит удаленным пользователям обращаться к библиотечным базам данных, с помощью коммутируемых телефонных каналов связи. Удаленному абоненту для этой целя необходимо иметь модем, микро-ЭВМ типа ДВК с платой последовательного интерфейса, и программные средства, разработанные в ГПНТБ СО АН СССР. Данный комплекс подключается к обычному телефону городской телефонной сети.

Наличие подобного комплекса позволяет пользователям иметь в организации полную копию электронной картотеки ГПНТБ СО АН СССР, содержащую библиотечные базы данных, т.е. специалисты организаций на рабочем месте могут получить информацию обо всех новых поступлениях в базы данных и формировать свои проблемно ориентированные базы данных, а также работать в терминальном режиме с базами данных библиотеки. Удаленный доступ абонентов к библиотечным базам данных может осуществляться и по выделенным телефонным каналам связи. В этом случае абонент получает высокоскоростной доступ к библиотечной информации и может работать в интерактивном режиме.

Связь по коммутируемым линиям связи обеспечивается при помощи модемов "Модем та сбор", доработанных для возможности принимать и передавать цифровую информацию по стандартному интерфейсу "токовая петля 20 ма". "Модем та сбор" обеспечивает дуплексную передачу последовательных данных асинхронным способом по коммутируемым каналам тональной частоты с двухпроводным окончанием. Модем позволяет вести обмен информации со скоростью 300 бод по коммутируемым каналам городской телефонной сети с любым способом установления соединения на расстоянии между абонентами до 100 километров и пяти переприемах по низкой частоте (через аппаратуру уплотнения телефонной сети).

В здании ГПНТБ СО АН СССР модем установлен в машинном зале сектора компьютерных средств и соединен линией связи с мини-ЭВМ "Электроника IOO/25". Модем работает в автоматическом режиме, т.е. канал связи устанавливается по сигналу вызова, пришедшему из городской телефонной сети. При установлении канала связи для передачи информации из мини-ЭВМ к абоненту используется I канал модема (несущая частота 1350 Гц), а для приема сигналов от абонента используется 2 канал модема (несущая частота 450 Гц). Для передачи сигналов используется частотная модуляция. Если в течение 4-х минут после установления соединения канала связи несущая частота от модема абонента не появляется на входе модема или сигнал несущей частоты сильно ослаблен из-за помех в линии связи (сигнал несущей частоты меньше минус 43 децибела), то происходит автоматическое разъединение канала связи и отключение модема от городской телефонной сети. При этом в городскую телефонную сеть выдается сигнал "отбоя". Обрыв канала связи также может произойти в случае, если несущая на входе модема появилась, но информации от абонента нет в течение некоторого времени. Обмен информацией между мини-ЭВМ и ЭВМ абонента выполняется блоками данных. Блок может содержать от 1 до 256 байт. Для обеспечения контроля передаваемой информации каждый блок дополняется контрольной суммой, передаваемой в линию вместе с данными. На приемном конце линия для принимаемых из линии данных подсчитывается контрольная сумма и сравнивается с контрольной суммой принятой из линии связи. При несовпадении контрольных сумм в передающую ЭВМ выдается запрос на повторение передачи сбойного блока данных. Количество повторений передачи одного блока 8 раз. При восьмикратной неудачной попытке передачи блока ЭВМ, участвующие в обмене, фиксируют неисправность канала связи с соответствующим визуальным отображением этой информации на устройствах вывода информации. В случае совпадения контрольных сумм принимающая ЭВМ передает подтверждение принятого блока и переходит на ожидание нового блока данных. Конец передаваемой информации фиксируется по блоку специального формата - "конец файла". Таким образом, на уровне передачи блочных данных протокол обмена полностью синхронный.

По окончанию сеанса работы с мини-ЭВМ абонент выключает свой модем и по прошествию соответствующего промежутка времени отключается и модем на противоположном конце линии связи.

 

!20

А.Ф.КИСЕЛЕВ, А.А.ОРЛОВ

ИНСТРУМЕНТАЛЬНОЕ СРЕДСТВО ДЛЯ СОЗДАНИЯ БИБЛИОГРАФИЧЕСКИХ СИСТЕМ НА ПЭВМ

В статье рассматривается программа ЛИНГВИСТ, являющаяся инструментальным средством, предназначенным для создания на персональных ЭВМ (ПЭВМ) документально-фактографических информационно-поисквых систем, в частности библиографических систем, ориентированных на непрограммирующих пользователей.

В библиографических системах пользователь имеет дело с разнотипной информацией довольно сложной структуры, представляемой в виде документов, включающих фактографические и содержательные реквизиты. Фактографические реквизиты принимают значения из определенного, как правило, заранее классифицированного перечня понятий, а значениями содержательных реквизитов являются произвольные тексты русского языка.

Библиографическая система для конкретного пользователя создается путем настройки программы ЛИНГВИСТ. Программа позволяет разработать пакет прикладной системы пользователя в течение 1-2 дней и быстро приступить к его тестированию.

Программа обеспечивает:

По сравнению с существующими аналогами ЛИНГВИСТ обеспечивает большую гибкость при описании документов различной структуры, высокую производительность при разработке приложений, возможность содержательной обработки текстовой информации и разнообразные способы интеграция с другими системами или программами.

Характеристики базы данных (БД).

Количество файлов БД не ограничено. Файлы БД имеют страничную организацию. Размер страницы файла от 64 байт до 16 Кбайт. Максимальное количество страниц в файле 65535. Максимальный размер записи в файле БД - 8 страниц, но не более 32 Кбайт. Максимальная длина текста одного атрибута БД - 32 Кбайта. Файл БД может содержать до 255 поисковых атрибутов.

Программа ЛИНГВИСТ использовалась для создания ряда информационных систем на ПЭВМ. Перечислим некоторые из них:

Программа ЛИНГВИСТ функционирует под управлением операционной системы АЛЬФА ДОС (MS DOS версии 3.0 и выше) на ПЭВМ типа ЕC 1841, PC XT/AT. Для работы системы требуется в зависимости от полноты используемых функции от 200 до 400 Кбайт оперативной памяти. Программное обеспечение реализовано на языке программирования СИ и частично на языке Ассемблер.

!21

И.B. ВЕТРОВ

ОПЫТ СОЗДАНИЯ СПЕЦИАЛИЗИРОВАННОЙ СИСТЕМЫ

УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ

Для использования информации, накапливаемой в базах данных, необходимы соответствующие программные средства - системы управления базами данных (СУБД). Применяемые на персональных компьютерах универсальные СУБД обычно являются либо слишком трудными в освоении для неподготовленных пользователей, либо не позволяют оперировать достаточно сложными структурами данных. Кроме того, стремление к универсальности обычно приводит к потере эффективности при работе с конкретной базой данных. Удовлетворить всем этим требованиям можно только путем создания специализированных СУБД, ориентированных на конкретную предметную область.

Для работы с базами данных нуклеотидных последовательностей на персональных компьютерах типа IBM PC предлагается специализированная СУБД "Sequery". В качестве основного входного формата данных она использует дистрибутивный формат базы данных ГЕНЭКСПРЕСС. СУБД ориентирована на пользователя-непрограммиста и предоставляет ему доступ ко всей информации, хранящейся в базе данных.

В качестве основных функций предлагаемой СУБД можно перечислить следующие:

Данная СУБД может быть использована как самостоятельно, так и совместно с пакетами прикладных программ для анализа генетической информации.

 

!22

Г.М. СУБОЧ, Е.И. ГОЛОВАНОВ, Ю.A. СПРИЖИЦКИЙ

СИСТЕМА ЛИСТ ДЛЯ СОЗДАНИЯ ВЫБОРОК ЗАПИСЕЙ ПО

КАТАЛОГАМ БАЗ ДАННЫХ

Система ЛИСТ предназначена для создания выборок из баз данных, представляющих собой совокупность поименованных записей. Выборка осуществляется путем работы с отсортированными каталогами в интерактивном режиме с помощью многооконного интерфейса.

Помимо каталогов система включает программу инсталляции и основную программу LIST . Программа LIST работает с каталогами двух типов:

1) имя_записи описание;

2) ключевое_слово имя_записи[ ; имя_записи]...

В каталогах обоих типов, если описание или список имен записей не помещается на одной строке, то он может продолжаться в последующих строках, но только не с первой позиции строки.

Программа LIST позволяет осуществлять просмотр каталогов, дает возможность быстрого поиска произвольного контекста и перемещения в соответствующее место каталога. Причем, заданный контекст отыскивается как в именах записей, так и в описаниях и в ключевых словах. Пользователь может помечать ключевое слово или некий интервал ключевых слов в процессе просмотра каталога. Все имена записей, соответствующие отмеченным ключевым словам или описаниям, попадают в искомую выборку. Выборка записывается в виде текста, в каждой строке которого содержится одно имя записи. При этом имена отсортировываются по алфавиту, а дубли отбрасываются.

Один из блоков программы позволяет осуществлять логические операции над уже созданными списками-выборками. Таким образом, можно объединять выборки, а также реализовывать другие довольно сложные запросы.

Программа LIST легко осваивается, имеет подсказки и рассчитана на конечного пользователя, не имеющего никакой специальной подготовки. Она работает на IBM PC совместимых компьютерах любой конфигурации, имеющих 512 Kb ОЗУ.

 

 

 

!23

Г.А.ПРОСКУРЯКОВ, А.Н.РАЙКОВ, В.Н.ТРИФОНОВ

АВТОМАТИЗИРОВАННОЕ ПРИСВОЕНИЕ ИНДЕКСОВ УДК НА МИКРОЭВМ

Известные методы автоматизации процессов присвоения индексов УДК (тематического рубрицирования) занимают определенное место в реализации информационно-библиотечных процессов. Однако, несмотря на наличие конструктивных теоретических результатов исследований в этой проблемной области, прогресс в решении вопросов внедрения средств автоматизации тематического рубрицирования остается более чем скромным. Основными причинами такого состояния вопроса, независимо от класса используемых ЭВМ, по нашему мнению, являются:

Представляется целесообразным дальнейшие исследования в области разработки методов тематического рубрицирования проводить с большим акцентированием внимания на создании перспективных средств обработки данных, например оптических процессоров (I).

Литература

I. Позднеев С.А., Райков А.Н. Архитектура оптической ИПС о динамической настройкой на предметную область // Сб. тезисов всес. семинара "Автоматизация проектирования оптических систем". - Л., 1988. - С. 82-83.

 

!24

B.С. СЕРГЕЕВ

СОВЕРШЕНСТВОВАНИЕ ПОЛИГРАММНОГО МЕТОДА КОНТРОЛЯ ТЕКСТОВОЙ ИНФОРМАЦИИ, ВВОДИМОЙ В ПЕРСОНАЛЬНУЮ ЭВМ

Предлагается полиграммный метод орфографического автоматического контроля с периодическим использованием трех последовательных проверок буквенных сочетаний в словах текстовой информации - сочетаний длиной в два, три и четыре знака.

При проверке буквенных сочетаний длиной в два знака используется массив признаков разрешения фиксированного размера. Массив содержит разрешения и запрещения буквенных сочетаний, а также адреса блоков памяти в массиве признаков разрешения буквенных сочетаний длиной в три знака.

При проверке буквенных сочетаний длиной в три знака используется массив фиксированной длины, зависящей от количества подготовленных для контроля признаков разрешения буквенных сочетаний в два знака.

Массив содержит признаки разрешения и запрещения буквенных сочетаний в три знака, а также адреса блоков памяти в массиве признаков разрешения буквенных сочетаний длиной в четыре знака.

При проверке буквенных сочетании длиной в четыре знака также используется массив переменной длины, зависящей от количества подготовленных для контроля признаков разрешения буквенных сочетаний в три знака. Массив содержит признаки разрешения и запрещения буквенных сочетаний в четыре знака.

Разработан макет программы контроля для ПЭВМ, ЕС 1841, который в сумме с размерами массивов признаков разрешения занимает около 45 Кбайт оперативной памяти.

В результате оценки возможностей полиграммного метода контроля, использующего контролируемые буквенные сочетания длиной в три знака с пятью массивами признаков разрешения, предлагаемый метод позволяет более чем в три раза уменьшить вероятность пропуска ошибок в текстовой информации, вводимой в персональную ЭВМ.

 

!25

В.А.БЕНСМАН, И.П.ЛИНИЧЕНКО

ПОДХОДЫ К АВТОМАТИЗАЦИИ ВЕДЕНИЯ ФОНДА НОРМАТИВНО-ТЕХНИЧЕСКИХ ДОКУМЕНТОВ

Отличительными чертами справочно-информационного фонда (СИФ) по стандартизации продукции АПК, созданного в Краснодарском филиале ВНИИ стандартизации (I979г.), являются политематичность и видовое разнообразие входного потока документов. К особенностям структуры фонда также следует отнести тот факт, что "ядерной зоной" СИФ, т.е. научно-информационным потенциалом, на базе которого в основном организуется справочно-информационное обеспечение специалистов, являются отечественные нормативно-технические документы, стандарты СЭВ, международные стандарты ИСО, иностранные стандарты. Укомплектованию фонда этими видами документов отведено приоритетное значение (49,8% от общего объема фонда).

Состав и структура документов, включаемых в СИФ, обусловлены проведением в филиале исследований, связанных с анализом научно-технического уровня НТД, действующих в АПК, и с разработкой предложений по оптимизации содержащихся в этих НТД показателей качества с учетом достижений международной и зарубежной стандартизации. Практика ведения и актуализации данного фонда, насчитывающего 27,5 тыс. наименований, в ручном режиме привела к ряду негативных явлений, выразившихся в несовершенстве проведения информационного поиска, низком коэффициенте обеспеченности информацией, неоперативном редактировании справочно-поискового аппарата.

В связи с этим с 1986 г. в филиале проводятся исследования по созданию автоматизированной системы экспертизы и оценки научно-технического уровня НТД по стандартизации агропромышленного комплекса (асэнтд-АПК) с двумя информационными подсистемами: базой данных "Документ" и базой данных "Факт". Создание этих систем позволит предоставить пользователю в ответ на запрос библиографические данные о нормативно-техническом документе (или его копию), а в дальнейшем - извлеченную из документов информацию фактографического характера.

В настоящее время на базе ПЭВМ решена задача по учету фонда НТД, отражающая сведения о накоплении и выдаче оперативных данных о количестве и структуре нормативно-технических документов по стандартизации в АПК, имеющихся в фонде. Разработан рубрикатор научно-технической информации по стандартизации в АПК, являющийся информационно-поисковым языком, который лег в основу лингвистического обеспечения информационных подсистем АСЭНТД-АПК.

 

!26

Л.Ю.БУРУНОВ

ДРАЙВЕР ОПОЗНАНИЯ

I. ВВЕДЕНИЕ

Как известно из (I) основное внимание в настоящее время уделяется созданию в функционированию АБД на много миллионов единиц информации как в системе органов НТИ, так и в работе библиотечных систем (2). По мере развития (I) регулярной сети каналов телекоммуникаций возможность работы со многими АБД и библиотечными системами увеличится резко во много раз у пользователя. Причем последний и является целью работы систем и АБД. Однако вне сферы внимания разработчиков и исследователей оказывается именно пользователь (абонент). И либо абонент изучался с психологической стороны (3), либо широко известное - "определение потребностей" в системе ИРИ.

Практически во всех автоматизированных библиотечно-библиографических и информационно-поисковых системах, предназначенных для пользователя всесоюзного, регионального и отраслевого уровня, имеются самостоятельные подсистемы: "Абонент" и "Анализ читательского спроса". Т.е. наряду с "электронным каталогом" имеется "электронный учет читателей".

Работая практически и многократно на "электронном каталоге" можно заметить относительно большое время поиска библиографических данных. И это - в режиме прямого доступа в самой библиотеке. А в режиме теледоступа это время, разумеется, значительно больше.

В процессе работы с "электронной" библиотекой складывается каждый раз ситуация, когда она не "узнает" постоянного абонента. И таким образом абонент каждый свой поиск библиографической информации начинает как бы заново.

Нами предлагается создание "электронного" драйвера опознания абонента. Драйвер опознания представляет собой микропрограмму записи данных о поиске и массив "тупиков знаний" (тупик знаний - зона постоянного обращения / заказа абонента к каталогу).

2. ОБЩИЕ СВЕДЕНИЯ

Драйвер опознания абонента есть составная часть библиотечного и информационного обслуживания на ЭВМ.

Суть этого метода в следующем: на заведенный файл абонента записываются каждый раз сведения о заказе литературы и методом обучения определяется его интеллектуально-профессиональный интерес / потребность в каких-то областях знаний.

Массив "тупиков знаний" мы обозначили как массив IIAA (Intellible Image Adress Abonents - определенное изображение адреса абонента). В наиболее общем виде драйвер опознания представляет собой массив кодов УДК, ББК и ISSN, проходя через который заказ абонента накладывается на его читательский номер и этим определяет стратегию поиска библиографической информации. Особенность работы с драйвером состоит в условии постоянного обращения к "электронному каталогу". В случае первого обращения (0) драйвер пуст и поиск идет обычным путем. Но уже по завершении его данные заказа заносятся в драйвер, образуя 1-ый "тупик знаний" абонента. Число тупиков равно = n, но не должно быть больше разделов УДК, ББК и ISSN. При совпадении их они накладываются на i -тый "тупик знаний", но не образуют новый "тупик" абонента. Другой особенностью работы с драйвером является автоматическое отсечение случайных или редких обращений/заказов абонента. Из опыта работы мы знаем, что абонент может заказать литературу не только из области своих постоянных профессиональных интересов, но и попытаться выяснить что-то для себя в других отраслях знаний. Как быть в этом случае? Ведь таким образом нарастет информационный шум в его массиве IIAA. А с другой стороны, он может начать изучать новую сферу знаний. Как быть в этом случае? Нами предлагается алгоритм снятия посторонних и случайных шумов путем использования формулы Цапфа о полустарении информации. В массиве IIAA имеются сведения о "дате заказа литературы". В микропрограмме драйвера эти сведения обычным таймером ЭВМ определяет необходимую часть отсечения. В перспектива по мере накопления опыта работы с драйвером опознания можно определить и величины регулярности обращений/ заказов для "призов". "Призом" может быть распечатка новых поступлений, выдача указателей по i-ым "тупикам звании" данного j -го абонента или другие "любезности" системы.

3. АЛГОРИТМ

Нами предлагается драйвер опознания абонента:

где 0 - сумма i-ых "тупиков" знаний абонента, Т - кортеж разделов рубрикатора j -го абонента.

Иначе говоря, рассматриваемый кортеж разделов j -го абонента представляет собой прямоугольную матрицу, в клетках которой записываются значения (коды УДК, ББК и ISSN) i -ых "тупиков знании" абонента.

В практических ситуациях Т всегда конечны, но возможны ситуации в процессе создания кортежей разделов рубрикатора, когда потребуется отсечение "лишних" разделов.

4. ВЫВОДЫ

Как видно из вышеизложенного, предлагаемый драйвер опознания абонента легко "врезать" в эксплуатируемые автоматизированные информационно-поисковые и библиотечно-библиографические системы. Включение драйвера опознания в проектируемые системы не требуют никаких изменений в проектах. Более того, описание драйвера, представленное в данной работе на языке BASIC, легко перевести на не менее популярные сейчас ПАСКАЛЬ и Си, на которых еще эффективнее можно модернизировать описанный метод. Иначе говоря, мы имеем машинонезависимый принцип узнавания абонентов поисковых систем. Социально-психологический аспект: "часто прихожу - быстрее получаю", "регулярно посещаешь - быстрее получаешь".

Драйвер опознавания абонента физически возможно вызвать с магнитных носителей в оперативную память на стадии формирования заказа / обращения.

В проектируемых и эксплуатируемых автоматизированных библиотечных системах и информационно-поисковых системах ставится вопрос о благоприятных, психологически комфортных условиях работы.

Особо следует поставить вопрос о дружественности системы к пользователю-абоненту библиотеки/системы.

Литература

1. Сумароков Л.Н. Перестройка и система НТИ // НТИ. Сер. I. -1987. - N 9-10. - С. 2-5.

2. Тараканов К.В., Коровякина И.Д., Цуркан В.В. Информатика. - М. Книга, 1986. - С. 256-272.

3. Мириманова М.С. Уровни рефлексии при взаимодействии пользователя с инфосредой // Тез. докл. на 10-ой науч. конф. б-ки ТГУ.

Тарту, 1986. - С. 14-15.

 

!27

A.B. НECTEPOB

СМЫСЛОВОЙ КЛЮЧ ДОКУМЕНТА ДЛЯ БЫСТРОГО АДРЕСНОГО ПОИСКА

Рассмотрим метод индексирования документа и запроса на документ для случая, когда известны все атрибуты библиографического описания документа (БОД). В качестве фрагментов поискового смыслового ключа выберем четыре поля: автор (первый), заглавие (основное), заглавие сборника, журнала и т.д. и время издания. Эти поля выбраны не случайно. Документ в общем случае является квантом каких-либо данных, отчужденных от источника этих данных, поэтому к основным элементам поискового ключа относятся атрибуты источника и этого кванта.

Данный ключ назван смысловым потому, что его может составить читатель по смыслу, заложенному в БОД. Первое поле формируется из символов, взятых из ФИО автора (первого), и содержит 5 знаков, три первых из них составлены из первых букв фамилии, а два остальных знака из первых букв имени и отчества. Следующий шестой знак выделяется на первую букву заглавия, а седьмой - на первую букву заглавия сборника, журнала, конференции и т.п. И, наконец, восьмой знак служит для указания даты путем фиксации последней цифры года издания.

Смысловой ключ для ПОД формируется автоматически компьютером из фрагментов БОД, которое вводится либо в ручную при первичном вводе БОД, либо из фрагментов БОД, расположенных на магнитных лентах, какого-либо информационного центра. Смысловой ключ для ПОЗ формируется вручную читателями с помощью клавиатуры дисплея. Рассмотрим правила, с помощью которых формируется смысловой ключ.

1. Если отсутствует какой-либо основной элемент БОД, то в первый знак соответствующего поля ставится знак *.

2. Если первое слово из основною элемента содержит менее трех букв, то оставшиеся знаки ключа дополняются символами из второго и т.д. слов основного элемента БОД. В общем случае общее количество букв должно быть равно пяти.

3. Если общее количество букв в ключе менее пяти, оставшиеся позиции ключа заполняются * .

4. Если в документе нет автора, а есть редактор, то на место ФИО автора ставят ФИО редактора.

5. Если в ключе имеется * в поле ФИО и одном из других полей, то он составляется из букв нескольких слов по следующему правилу:

если поле содержит пять и более слов, то выбираются первые буквы, а 89оставшиеся позиции до 5 заполняются вторыми и т.д. буквами из последнего слова, например журнал "Советское радио" будет представлено "СРАДИ".

6. Если в ключе имеется * в поле ФИО и в поле заглавие, то вместо этих * надо ставить номер сборника (журнала).

7. Если нет поля сборник, то есть в нем *, то вместо * можно ставить код вида документа.

Смысловой ключ можно использовать не только для поиска шифра хранения документа. Рассмотрим более подробно аспекты использования смыслового ключа: их три. Первый - пользовательский. Смысловой ключ используется читателем для поиска шифра хранения документа. Второй - технологический. В данном случае смысловой ключ используется библиотекарем-технологом, который набирает этот ключ на клавиатуре компьютера с целью проверки на дублетность обрабатываемого документа, то есть проверки на нахождение данного ключа в базе данных, что соответствует наличию документа в библиотеке и электронного БОД в памяти компьютера. Если набранный ключ имеется в базе данных, то БОД, соответствующее данному ключу, можно вызвать на экран дисплея компьютера и, если оно соответствует документу, не вводить повторно данное БОД в память компьютера. Третий - научный. В этом случае смысловой ключ используется для библиографических исследований, связанных с анализом связей документов через цитирование. Например, список литературы можно не вводить в память компьютера, а вводить только смысловые ключи и указывать на связь цитируемых смысловых ключей со смысловым ключом документа, в котором эта цитируемая литература используется для создания массива связанности данных ключей, по которому можно анализировать связи между документами.

Рассмотрим теперь смысловой ключ с точки зрения уникальности. Желательно, чтобы он был абсолютно уникальным, однако это потребует избыточных разрядов в ключе, что приведет к увеличению общей длины ключа со всеми негативными последствиями. Из практической работы можно сделать выводы, что длина ключа не должна превышать 8 символов, а повторяемость ключа не должна быть более одного на 50 000.

 

!28

М.Н. СМИРНОВА, И.Я. ГОСИН

СТАНДАРТИЗАЦИЯ БИБЛИОГРАФИЧЕСКОЙ ЗАПИСИ КАК УСЛОВИЕ ФУНКЦИОНИРОВАНИЯ АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ

(На примере АИСОН, АИБС ОН И АИС МИСОН)

I. Основной единицей информационно-библиотечных процессов является библиографическая запись (БЗ). Набор элементов БЗ в виде формата отражает различные аспекты обработки документа. В зависимости от реализуемых функций АИСОН набор элементов БЗ делится на фрагменты. Каждая библиотечно-информационная система решает при своем образовании вопросы выбора предмашинного формата и набора элементов БЗ индивидуально, тем более что действующие нормативно-методические документы (НМД) дают возможность выбрать альтернативные, а в некоторых случаях даже антагонистические решения. Отсутствие стандартизации структуры БЗ усложняет информационные контакты на уровне БЗ.

Единственным стандартизованным и в то же время обязательным фрагментом БЗ в любой библиотечно-информационной системе является библиографическое описание (БО) документа. Именно БО в первую очередь определяет информационный потенциал такой системы, степень ее открытости и уровень качества библиографической продукции, отражает ее технологическую политику. Поэтому проблемы стандартизации БЗ мы рассматриваем на примере стандартизации БО.

2. Проблемы стандартизации и унификации БО (разница между стандартизацией и унификацией библиографического описания состоит, по нашему мнению, в том, что стандартизация предполагает наличие одинаковых требований и правил составления библиографического описания конкретного документа, порождающих идентичные библиографические описания этого документа (без вариантов), а унификация предполагает наличие нескольких типовых вариантов правил, порождающих аналогичные библиографические описания, которые возможно свести к единой форме) возникают на следующих технологических стадиях: разработка НМД системы, технические задания для разработки программ, внедрение автоматизированных операций формально-логического контроля (ФЛК), проверка документов и БО на дублетность, разработка подсистем управления качеством информационной продукции и др.

В ГАСНТИ возможно использовать и БО, стандартизованное по оригинальным правилам, однако применение оригинальных правил имеет следствием технологическую и эксплуатационную изоляцию, делает невозможной или чрезмерно трудоемкой и дорогой работу в сетевом режиме и предполагает обязательное конвертирование информации, если более или менее сопоставимо ее содержание. (Примером может служить 60 патентных документов).

3. Стандартизация БО включает:

4. В стандартах СИБИД стандартизовано применение УРЗ и набор элементов БО в машиночитаемых формах для основных видов документов. На стадии унификации находится структура библиографического описания (последовательность приведения элементов библиографического описания) и форма приведения сведений в каждом элементе, а также содержание (наполнение) некоторых элементов (например, в области нумерации). Предстоит стандартизовать правила включения библиографического описания в библиографических записях и правила включения записи в библиографические массивы различной структуры и назначения, а также правила взаимодействия систем при генерировании или использовании библиографической информации.

5. Решение этих проблем тормозит наличие разных, значительно отличающихся сложившихся технологий обработки различных видов документов и выпуска информационных изданий, разнообразные технические возможности. Гарантией решения этих проблем является необходимость организации комплексных информационных массивов (в том числе для разработки новой техники). Пользователь должен иметь возможность объединять в комплексные массивы сведения, полученные из разных баз данных, а также из различных информационных изданий (библиографических ссылок) для организации локальных массивов на персональных компьютерах.

Унификация БО различных видов документов является обязательным условием разработки унифицированной технологии их автоматизированной обработки, поскольку БО есть не что иное, как унифицированная входная-выходная форма, имеющая первостепенное значение для формирования информационной среды.

Для унификации технологии обработки различных видов документов целесообразно, на наш взгляд, во всех случаях использовать функциональный подход не только к структуре библиографического описания, но и к структуре библиографической записи, неотъемлемой частью которого оно является.

6. В основу информационной технологии АИСОН положен принцип одноразовой обработки документа с последующим многократным использованием результатов этой обработки. БЗ, включающая фрагменты БО, содержательной обработки и служебной информации, наращивается последовательно на соответствующих технологических операциях по пути обработки документа. Так, при обработке текущих поступлений, базовое БО документа составляют и вводят в базу данных один раз. Базовым библиографическим описанием мы называем библиографическое описание документа, составленное в процессе одноразовой обработки входного документопотока для включения в базу данных библиотечно-информационной системы в целях последующего многократного использования. На основе базового библиографического описания могут быть составлены меньшие (а в отдельных случаях и большие) по набору элементов модификации для использования в определенных видах изданий (например, в ретроспективном или текущем указателе литературы, реферативном журнале и т.д.) или в определенном массиве (база данных, каталог, картотека и др.).

Затем на выходах системы БО используют в разных модификациях БЗ, предназначенных: для библиотечных каталогов и библиографических картотек, основного ряда текущих и ретроспективных указателей литературы, для вспомогательных указателей использованных источников, именных указателей библиографических ссылок и списков в реферативных журналах и сборниках, отраслевых и региональных библиографических баз данных, магнито-ленточной службы, службы ИРИ и др.

Необходимо сказать, что определенная модификация БО конкретного документа, предназначенная, например, для использования в периодических библиографических изданиях, может быть использована в нескольких БЗ, имеющих разные фрагменты содержательной обработки (аннотации, ключевые слова и дескрипторы).

БО сериальных изданий, введенное в базу данных "Электронная картотека сериальных изданий" (ЭКСИ), используется также при аналитической росписи документа для включения в БЗ сведений об издании, в котором опубликована статья или другая составная часть документа.

7. Нормативно-методические документы АИСОН по БО определяют логику БЗ, ввода и вывода БЗ. Соответственно были проанализированы, сближены и унифицированы между собой Инструкция по составлению БО, предмашинный формат БЗ и форматы вывода. При этом выявились досадные несоответствия между содержанием и определением элементов в стандартах по БО в стандартах СИБИД. К сожалению, отсутствуют стандарты на содержание и структуру логической БЗ, а также на предмашинный формат.

Достаточно сложным и пока нерешенным представляется вопрос об унификации содержания элементов, а также привязка конкретных правил составления БО к определенным уровням документа-объекта (например, правила определения отличительного заглавия сериального задания по отношению к вариантам заглавий объекта описания).

Нашей ближайшей и основной стратегической задачей должно быть участие в разработке и применение международных стандартов ИСО в качестве стандартов СЭВ и СССР или разработка максимально согласованного с ними стандарта СЭВ на библиографическое описание всех видов документов.

Это будет способствовать быстрейшему внедрению и эффективному использованию средств вычислительной техники в целях обеспечения массового доступа потребителей к документальной информации, расширению и резкому повышению эффективности международного обмена библиографической информацией, облегчит развитие международных экономических, политических, научных, технических, технологических и культурных связей, позволит, в частности, быстрее развивать практическую работу по созданию совместных международных библиотечно-информационных баз данных.

 

!29

А.Н. РАЙКОВ

О СХОДИМОСТИ ДОКУМЕНТАЛЬНОГО ПОИСКА В МИКРОЭВМ

Известная практика оценки качества документального поиска на основе традиционно используемых критериев полноты и точности поиска не всегда определяет необходимый уровень доверия пользователей библиотечных информационно-поисковых систем, реализуемых на микроЭВМ. Это вызвано, прежде всего, интегральным характером критериев, отсутствием конструктивной возможности ситуационной оценки качества и направленности ведения документального поиска. Использование для повышения качества документального поиска в микроЭВМ известных стратегий поиска с обратной связью по релевантности, методов проектирования экспертных систем, методов кластерного анализа, как показывает практика, позволяет снабдить пользователя интуитивно построенным механизмом, контролирующим определенную направленность поиска в каждой конкретной поисковой ситуации, однако его применение наталкивается на существенные объемно-временные ограничения микроЭВМ.

В настоящей работе предлагается подойти к оценке направленности документального поиска более строго, определив обобщенную систем условий представления структур используемых в процессе поиска данных, обеспечивающих сходимость реализации диалоговой стратегии документального поиска к некоторому пределу, характеризующемуся максимально возможными показателями качества поиска для данной поисковой ситуации. В основу предлагаемого подхода положено оперативное моделирование процесса документального поиска, позволяющее представить его в виде решения некорректно поставленной задачи на дискретном топологическом пространстве. Определена ограниченность возможности использования традиционных методов решения некорректных задач применительно к рассматриваемой проблемной области в связи с конечностью интерпретирующих процесс документального поиска пространств. Показана возможность достижения требуемой сходимости в рамках использования традиционного математического подхода введением некоторой метрики. Существенным преимуществом в этом плане обладает поиск с использованием неконтролируемого контекстного индексирования документов и запросов.

 

!30

Л.Ф. КОНОНОВ

ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ ПЭВМ В ИНФОРМАЦИОННО-БИБЛИОТЕЧНЫХ ПРОЦЕССАХ В ПРЕДСТАВЛЕНИИ НИЗОВОЙ СЛУЖБЫ НТИ

На предприятиях и организациях бытуют мнения о недопустимости даже поднимать вопросы автоматизации информационно-библиотечных процессов, не говоря уже о невозможности пробиться по этим вопросам в программы развития АСУ, САПР и т.д.

Одна из причин этого явления лежит в некомпетентности, низком уровне знаний информационно-библиотечных работников по этим вопросам, неуменье ими поставить, сформулировать задачи, выдать четкие задания разработчиками систем автоматизации. Для решения этой проблемы необходимо, чтобы при ведущих библиотеках или в кооперативах, вузах страны на хозрасчетной основе были организованы курсы, школы повышения квалификации в этой области, где помимо повышения квалификации, они могли бы получить справочные материалы, образцы технических заданий и других документов, ориентирующих в поставке задач, выдаче заданий, приемке работ.

Журналы по НТИ и библиотечной работе должны начать публиковать типизированные для систематизации объявления с предложениями по услугам различных организаций в области автоматизации информационно-библиотечных работ, их компьютеризации.

К сожалению, абсолютное большинство предложений, высказанных в решениях предыдущих семинаров, не были реализованы: например, предложение, высказанное на семинаре 1987 г. по созданию показательных служб, полигонов для демонстрации, обучения сферам применения персональных компьютеров, машинных технологий в информационно-библиотечных процессах. Сейчас можно обратиться к библиотекам, органам НТИ, кооперативам, чтобы они по своей инициативе на хозрасчетной основе реализовали это предложение.

!31

А.С. ГУРОВ

СПРАВОЧНО-БИБЛИОГРАФИЧЕСКИЕ И ФАКТОГРАФИЧЕСКИЕ БАНКИ ДАННЫХ ПО МЕТАЛЛУРГИИ И МЕТАЛЛОПРОДУКЦИИ

Центральный научно-исследовательский институт информации и технико-экономических исследований черной металлургии широко использует в справочно-информационной практике автоматизированные документальные, фактографические, проблемно-ориентированные и др. банки данных. Комплекс автоматизированных банков данных включает документально-реферативную базу данных по металлургии, фактографическую базу данных по выполняемым в отрасли НИР и ОКР, фактографические банки данных по современным технологиям, оборудованию, аналогам проектируемых объектов, производственным проблемам и т.п.

Институтом решается задача объединения отраслевых банков данных в сети (on-line ) на базе системы удаленного теледоступа "Теле-ЕС", проводятся работы по реализации теледоступа к зарубежным банкам данных. Для информационного обеспечения специалистов по проблемам металлургии в отрасли широко используются базы данных сети Международного Центра НТИ, а также зарубежные БД: СОМРЕNDЕХ, МЕТАDЕХ, MDI/I, CERAB, USPATENTS, WPI, IМРADOK, СOR-ROSION, МETALS DATABASE и др.

Оригинальные информационно-поисковые системы (фактографические и справочно-библиографические) разработаны на языке запросов СУВД deBASE III Plus и реализованы на персональных ЭВМ типа IBM PC XT/AT с RAM не менее 512 Кб, жестким диском с объемом памяти не менее 20 Мб.

Фактографические банки данных реализуются на IBM - совместных микроЭВМ с использованием системы управления базами данных РЕБУС, включают следующие основные разделы металлургии: горное производство, обогащение и агломерация руд черных металлов, доменное производство, производство стали, производство ферросплавов, порошковая металлургия, прокатное производство (включая оборудование 1У передела).

Кроме того, создаются разделы по характеристикам энергосберегающего оборудования и оборудования для охраны окружающей среды, переработки отходов металлургического производства.

Информационное обеспечение руководства и специалистов отрасли на основе фактографической информации позволит существенно сократить трудозатраты проектировщиков, повысить уровень технических заданий на проектирование и качество самих проектов.

Справочно-библиографические ИПС позволяют автоматизировать работу информационного и библиотечного работника, координировать выполненные переводы, вести электронный каталог новых поступлений и т.п.

 

!32

Е.Л.ВИНОГРАДОВА, Ю.С.ОРГАНЩУК

ВОЗМОЖНОСТИ СОПРЯЖЕНИЯ МИКРОГРАФИЧЕСКОГО КОМПЛЕКСА И АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЫ В БИБЛИОТЕКЕ

Создание и ведение в библиотеке фонда изданий на микроносителях - одно из перспективных направлений улучшения информационного обслуживания пользователей и повышения эффективности управления библиотекой. Использование микрокопий первоисточников помогает библиотеке пополнить свой фонд, улучшить обслуживание читателей, обеспечивает сохранность фондов и создает условия для уменьшения площадей хранения.

Микрокопии первоисточников все шире входят в практику информационно-библиотечной работы. Очень часто в ответ на запрос по МБА библиотеки стали получать микрокопии изданий. Наблюдается ярко выраженная тенденция возрастания фонда зарубежных изданий, поступающих в нашу страну только в виде микрокопий первоисточников. Для редких, ценных изданий, имеющихся в библиотеке, создаются страховые фонды на микроносителях. Количество первоисточников, пользующихся особенно большим спросом у читателей, увеличивается их микрокопиями. Там, где пользуются спросом и хранятся архивы газетных материалов, рационально перевести их на микроносители, обеспечив тем самым сокращение площадей хранения и сохранность фондов.

Нет необходимости оснащения каждой библиотеки дорогостоящей микрофильмирующей техникой, так как микрокопии первоисточников можно получить или заказать в крупнейших библиотеках или информационных центрах, однако каждая научная библиотека в наши дни должна быть оснащена аппаратурой для работы с микрокопиями документов.

В связи с этим особо встает вопрос о создании в библиотеке системы хранения и поиска микрокопий первоисточников. В практике работы информационно-библиотечных центров хорошо зарекомендовали себя различные устройства хранения и автоматизированного поиска информации на микрофишах - аппараты фирмы Пентакта (ГДР); устройствство "Гигант", производства ВНР; аппараты типа ПФМ 2-II производства СССР и другие. Но наибольшего эффекта в организации и ведении фонда микрофиш и удобства его использования, по нашему мнению, можно достичь при стыковке микрографического комплекса и ЭВМ, когда в единую технологическую цепочку связываются такие операции, как поиск первоисточника, получение его на микроносителе, просмотр или чтение его на экране и выдача твердой копии документа. Если в библиотеке действует автоматизированная информационно-поисковая система, то на эту систему можно возложить функцию поиска микрофиш, оставив функции хранения, чтения и копирования за микрографическим комплексом. Поиск документа в этом случае будет осуществляться по следующей схеме: пользователь формулирует запрос к системе с клавиатуры ЭВМ; в соответствии с этим запросом происходит поиск в базе данных по любому элементу описания документа или по сочетанию этих элементов ; в результате поиска на экране ЭВМ появится краткая справочная информация о найденных документах, если результаты поиска удовлетворяют пользователя, он дает указание системе обратиться в архив микрофиш; после этого система проводит автоматический отбор микрофиш запрашиваемых документов и представляет их текст на экране просмотрового аппарата; затем происходит чтение и копирование первичного документа.

В зависимости от тематического наполнения микрографического комплекса и математического обеспечения ЭВМ на основе рассмотренной технологии предоставляется возможность создавать автоматизированные рабочие места - AРM библиотечного работника, АРМ информационного работника, АРМ научного сотрудника.

Кроме того, при создании автоматизированной информационно-библиотечной системы указанная технология обеспечивает условия для решения известной проблемы соединения в рамках автоматизированной системы ретроспективного фонда поступлений прошлых лет, отраженного в традиционном каталоге библиотеки, и фонда новых поступлений, накапливаемого в электронном каталоге ЭВМ. Именно использование микрофиш и технологии их поиска в ретроспективном каталоге (архиве микрофиш) совмещает ретроспективный фонд с фондом поступлений, предоставляя их в рамках автоматизированной системы как единый фонд, доступный пользователю. При этом нет необходимости какой-либо дополнительной содержательной обработки существующего каталога поступлений прошлых лет, поскольку достаточно микрофильмировать его в том виде, как он организован.

Рассмотренная автоматизированная система может быть реализована на персональных или мини-ЭВМ. Поиск документов можно проводить и с использованием телекоммуникационного режима работы с удаленной ЭВМ. В качестве микрографического комплекса может быть использовано устройство типа ПФМ 2-11, серийно выпускаемое отечественной промышленностью. Это устройство предназначено для хранения и адресного автоматизированного поиска микрофильмированной информации на микрофишах. По своим основным техническим характеристикам это устройство удовлетворяет требованиям работы в составе микрографической информационно-поисковой системы при соответствующей доработке интерфейса с ЭВМ.

 

 

!33

А..В. НЕСТЕРОВ, Б.С. ЕЛЕПОВ

КОМПЬЮТЕРНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В БИБЛИОТЕКАХ:

ВОЗМОЖНОСТИ ОЦЕНКИ И СРАВНЕНИЯ

В последнее время резко возросло значение компьютерных информационных технологий, и в библиотеках в частности. На основе персональных компьютеров стали быстро появляться самые разнообразные пакеты прикладных программ (ППП), с помощью которых реализуются информационные технологии по созданию, ведению, хранению, передаче, поиску, анализу, редактированию, печати и т.п. компьютерных записей.

Бурно развиваются системы управления базами данных (СУБД), предназначенные для манипуляции в пространстве и времени с объектографическими и фактографическими данными, информационно-поисковые системы (ИПС), предназначенные для манипуляции документографическими и библиографическими данными. Наряду с этими системами развиваются информационные системы, в основе которых лежит взаимодействие документов или их частей. В частности, это система типа системы Гарфилда (I), построенной на учете связей документов через цитирование, и система типа гипертекста.

Одним из первых, кто указал на необходимость создание связей между любыми двумя блоками информации в системе был В. Буш в 1945 (2). Он описал инструмент, который назывался Memex.

В начале 60-х годов появился ряд работ, связанных с именами Д.Энгельбарта, Т. Нельсона и Э. Ван Лама, породившие несколько проектов соответственно NLS/Augment, Hanadu, FRESS . Из этих направлений появились продукты нескольких фирм Ксерокс - Note-Cards, Тектроникс -Neptun, , Оул Интернешил - JuiDe , Эппл - Hyper-Cards, а также проекты Брауновского университета - Интермедиа, Гарвардского -PERSEUS и Южно-Каролинокого - проект Джефферсона.

Сейчас существует свыше 20 различных вариантов гипертекста, сам же этот термин ввел Т. Нельсон. С появлением гипертекста связано понятие гиперсферы, которая связывает различные сферы, такие как: графика, видео, речь, музыка. Под гипертекстом понимается такая форма организации текстового материала, при которой его смысловые единицы представлены не в обычной линейной последовательности, а как система связей между ними (3). Компьютерная гипертекстовая технология обеспечивает "поддержку" этих связей, другими словами, облегчает пользователю формирование произвольной сети связей.

Из анализа тенденций в развитии информационных технологий (3) делается вывод о том, что те информационные технологии, которые делали упор на индивидуальный характер человеческой активности, оказались наиболее перспективными.

Поощряемая обществом индивидуальная активность все больше приобретает форму новаторства. Отмечается (3), что в информатике развитие получают технологии, основанные на принципе поддержки человеческой деятельности. Здесь речь идет не о высвобождении человека для творческой работы, а об усилении возможностей человека в самой этой неформализуемой творческой работе.

В этом плане гипертекстовая технология выражается как система поддержки связей. Авторы (3) отмечают, что ориентация на новизну и новаторство в научно-технической и экономической деятельности перемещает в центр внимания идею продукта, а не его производственную реализацию. Указывается, что идею можно продать, она в определенной степени отчуждаема, а, следовательно, должна иметь собственную форму существования. Наиболее распространенным способом описания идеи является текст на естественном языке. Для удобства работы с идеей (выявить недостатки, доработать, развить) необходим гибкий аппарат, позволяющий рассматривать идею с различных позиций, искать взаимосвязи. Для этих целей подходит технология гипертекста.

Наличие большого количества различных компьютерных информационных технологий ставит перед потребителем этих технологий вопросы, связанные с выбором конкретного варианта для удовлетворения своих нужд и сравнения различных вариантов между собой.

Если же информационная технология выбирается для библиотеки, то проблема выбора еще более осложняется тем, что в СССР основные усилия разработчиков по созданию автоматизированных информационных систем были направлены на создание АСНТИ, а не автоматизированных библиотечно-информационных систем (АБИС).

B.C. Розов (4) отмечает, что "Существующий ныне полный разрыв между системой НТИ и системой библиотек, с одной стороны, и системой производства знаний и их распространения,с другой, представляется настолько искусственным, что при его сохранении вряд ли удастся реализовать... процесс производства знаний как важнейшего результата НТП".

Таким образом, возникает задача сравнения и оценки различных компьютерных систем, с помощью которых потребители могут манипулировать компьютерными записями. Это можно сделать на основе показателей, характеризующих работу этих систем.

Указать полный набор показателей (АБИС) достаточно трудная задача, так как аналогичные системы не имеют таких наборов, причем разные АБИС обладают разными системами выходных показателей.

Чаще всего выходными показателями служат величины, характеризующие основной рабочий процесс в системе и показывающие, как она выполняет то, ради чего создана. Основные требования к выходным показателям состоят в том, чтобы они принимали численные значения. Кроме того, перечень выходных характеристик должен соответствовать перечню технических требований к системе.

При определении набора выходных показателей АБИС будем пользоваться системным подходом, где под системным подходом понимается такой подход к созданию больших систем, когда разбивка задачи на ряд мелких задач или решение задачи за один подход не приводит к достижению цели (5).

Одним из основных аспектов системного подхода является определение трех основных вопросов:

Целью АБИС НТИ ГПНТБ СО АН СССР в соответствии с (7) является повышение качества и оперативности библиотечно-информационного обслуживания научных исследований, разработок и работ СО АН СССР и других промышленных и непромышленных предприятий и организаций региона Сибири и Дальнего Востока.

Кроме того, АБИС позволяет поднять эффективность работы библиотечных работников и управленческого аппарата, а также получить гибкую, малооперапионную библиотечную технологию, что резко повысит производительность труда библиотекарей-технологов, и, наконец, будет создано электронное хранилище информации о документах, находящихся в ГПНТБ СО АН СССР и ее сети.

Разработчики (7) рассматривали АБИС не только как систему, предоставляющую услуги, но и как информационную технологию и конкретный продукт. В связи с отставанием СССР в развитии АБИС от других развитых стран, большое значение имеют конкретные подцели таких систем. США является одним из лидеров в области создания и внедрения библиотечных компьютерных систем. В 1987 г. в США было 3300 общедоступных банков данных и знаний (8). У нас, их практически нет, хотя имеются специализированные банки, доступные ограниченному числу специалистов.

Количество персональных ЭВМ в США достигло 35 млн. штук и почти половина американских семей имеет компьютер, который можно подключить в единую коммуникационную сеть. Страны Западной Европы завершают ее создание в 1990 г. В США затраты на все виды информационных технологий составляют почти 8 тыс. дол. на одного информационного работника.

Появление новых структурных изменений в обществе обусловлено тремя ее характеристиками: возрастающим объемом информации, увеличивающейся сложностью информации и усиливающейся турбулентностью, которая растет за счет быстрых изменений условий окружающей среда, уменьшения роли расстояния в качестве буфера, а также увеличения числа событий в единицу времени.

Информационная технология не только влияет, но и должна влиять на структуру организации. Поэтому отмечается (8), что необходима стратегия прорыва, которая заключается в создании общедоступных баз данных и знаний. А это проще всего сделать на основе библиотек.

На данном этапе АБИС в библиотеке рассматривается как автоматизированная документально-информационная система (АДИС), если она базируется на локальных компьютерных средствах (10), и как компьютерная система коммуникаций НТИ (КСК НТИ) (интегрированная, общедоступная), если она базируется кроме локальных на внешних коммуникационных средствах, а также на технологии глубокой обработки данных (II).

Целью такой компьютерной документально-информационной системы научно-технической коммуникации является предоставление читателям всех категорий (ученые, специалисты с высшим образованием, учащиеся, рабочие, служащие и т.д.) возможность осуществлять коммуникации трех видов: личные, документальные и электронные. Каждые из этих трех видов коммуникации равноправны и дополняют друг друга.

Эффективность этих коммуникаций зависит от возможностей данной системы в глубокой переработке данных документально-информационного потока (ДИП), поступающего в библиотеку.

Здесь под глубокой переработкой данных ДИП подразумевается такая обработка данных, которая позволяет извлекать из данных информацию и знания.

Для извлечения из данных ДИП информации, они должки быть активными, то есть, представлены в виде доступном компьютерной обработке.

Извлечение информации из данных осуществляется целеустремленным индивидом или системой в том случае, когда на основе этих данных происходит выполнение каких-либо процессов, поэтому электронный процесс коммуникации требует наличия средств обращения, поиска, извлечения, анализа активных данных, то есть активных компьютерных средств. Таким образом, современная передача информации подразумевает передачу не только данных, но и технологий обработки этих данных, в отличии от традиционной передачи данных в обычных коммуникациях, где технология извлечения информации фактически определяется только человеком, потребляющем эту информацию.

Однако передача такой электронной технологии, хотя и позволяет передавать информацию, не дает возможности передавать знания, так как электронная коммуникация в этом случае ориентируется только на средства извлечения информации из данных.

Наивысшая ступень электронной коммуникации подразумевает наличие средства извлечения знаний из данных, то есть средств глубокой переработки данных. Например, одним из таких средств может стать средство, позволяющее алгоритмическими методами получать данные, которые не имеются явно в БД, или содержит методы, позволяющие не только воспринимать извлекаемую информацию, но и генерировать новые данные, которые, естественно, отсутствуют в БД.

Таким образом, в электронной коммуникации одним из важнейших вопросов является вопрос передачи знаний, то есть технологии извлечения знаний из передаваемых данных.

Компьютерная документально-информационная система научно-

технической коммуникации СО АН СССР, базирующаяся на аналогичной системе ГПНТБ СО АН СССР, строится как открытая локальная децентрализованная, интегральная и общедоступная система, способная для электронной коммуникации не только данных, но и информации и знаний, то есть основным продуктом ее деятельности должны быть компьютерные средства извлечения знаний, информации и данных в активной форме.

Данная система является: локальной, то есть имеющей оболочку, ограничивающую ее сферу на уровне СО АН СССР (региональном, отраслевом), и открытой, то есть имеющей коммуникационные линии связи с другими подобными системами и всесоюзными центрами. С внутренней стороны данная система является децентрализованной, то есть, построена по принципу автономных компьютерных рабочих мест, и интегральной, так как все эти рабочие места объединены локальной сетью компьютеров и замкнуты на центральную ЭВМ для решения библиотечных и информационных задач.

Оценка информационной технологии связана с оценкой научно-технического потенциала, как производителей, так и потребителей этой технологии. Один из комплексных подходов к оценке научно-технического потенциала описан в (16), который заключается в создании проблемно-ориентированных оценок, базирующихся на анализе сведений о соответствии тех или иных свойств научного потенциала условиям решения определенного класса задач или проблем.

Система оценок включает следующие:

  1. Кадровая
  2. Материально-техническая
  3. Информационно-методологическая
  4. Организационная.

В ней выделяются следующие измеряемые характеристики:

  1. Лидер (Л)
  2. Специалисты (С)
  3. Оборудование (0)
  4. Производственная база (Б)
  5. Методы (М)
  6. Собственные результаты (Р)
  7. Связи с партнерами (П)
  8. Связи с заказчиками (3).

Обобщенный результат измерений этих характеристик называется релевантностью (соответствием), которое изменяется от 0 (отсутствие соответствия) до I. Последнее в случае, если задача уже была однажды решена.

Каждая правильно поставленная задача должна давать два вида результатов: прирост новых знаний и усиление проблемно-ориентированных свойств привлеченного к этой работе научно-технического потенциала.

Поэтому при приобретении новой информационной технологии необходимо учитывать возможность ее освоения, так как при низком научно-техническом потенциале заказчика она может быть не воспринята.

Если рассматривать компьютерную информационную технологию как продукт, обладающий жизненным циклом, то с ним имеют дело три категории людей: поставщики технологии, потребители технологии и потребители продуктов этой технологии. В первой категории можно выделить разработчиков, изготовителей, продавцов, во второй - эксплуатационщиков-технологов, управленцев, обслуживающий персонал и, наконец, в третьей - потребителей, состоящих из двух категорий - читателей и аналитиков. Последние анализируют в комплексе все показатели, имеющие отношение к информационным технологиям. Аналитические показатели образуются как составная группа из семи основных групп показателей.

В зависимости от того, кто рассматривает информационную технологию, можно сформировать восемь групп показателей, определяющих ее.

Структуру групп показателей можно представить в виде схемы I.

0. Аналитик

1. Автор (разработчик)

4. Управляющий

2. Изготовитель

5. Эксплуатационщик- технолог

7. Читатель (потребитель)

3. Продавец

6. Обслуживание (обеспечение)

Производители технологии

Потребители технологии

Потребители

продуктов и услуг

технологии

 

Схема I.

В свою очередь, каждая группа показателей может быть характеризована с трех сторон, в зависимости от аспекта рассмотрения. К ним можно отнести: функциональный, структурный, доменный (элементный). Функциональный аспект подразумевает следующую классификацию:

основная функция, побочная функция (антифункция), внутренняя функция. Структурный аспект подразумевает рассмотрение структуры продукта по следующим показателям: макроструктура, микроструктура, архитектура. Доменный аспект подразумевает рассмотрение элементного состава продукта с определенной степенью погрешности.

При окончательной оценке информационной технологии вся собранная информация о ней должна быть сконцентрирована у одного человека, который фактически и принимает решение по поводу технологии. Здесь возникает вопрос, в каком виде необходимо представить эту информацию и какое максимальное количество показателей нужно сконцентрировать?

В (17) утверждается, что устройство из N элементов, состоящее из структуры в n иерархических уровней, описывается следующим уравнением:

n=c+ln(N+1)=ln(exp(c)(N+1)) (1),

где C=0,577 (постоянная Эйлера).

Среднее количество информации технического устройства - w

определяется следующим выражением

w= exp(n-1) (2).

Информационную емкость устройства можно определить с помощью следующей формулы

m=2 Ц w (3).

Информационные возможности человека ограничены, они определяются следующими предельными значениями: n=7,6 ; w=735;

m=54. Это значит, что человек может сконструировать устройство, состоящее из 735 неодинаковых по форме исходных элементов, между которыми установлены связи не более чем по 54 существенным параметрам.

На наш взгляд, общее количество показателей информационной технологии не должно превышать 56, причем все они должны быть представлены в виде геометрических фигур (картинок), на каждой картинке не должно быть более 8 показателей, а всего таких картин должно быть не более 7. В частности, одним из изображений на картинке может быть восьмилучевая фигура, на каждом из лучей которой отложено значение какого-нибудь из показателей. Рассмотрим, какие виды показателей должны входить в номенклатуру из 56-ти показателей.

В таблице I представлено распределение номенклатуры показателей технологии по видам, где произведена классификация этих показателей на показатели собственно технологии и показатели продуктов и услуг технологии.

Таблица I

Распределение показателей информационной технологии по видам

 

 

 

Показатели технологии

Показатели продуктов и услуг технологии

Всего

I

Функциональные

16

8

24

2

Структурные

8

8

16

3

Доменные

8

8

16

 

Итого

32

24

56

Из таблицы I видно, что функциональные показатели (24) преобладают по сравнений со структурными (16) и доменными (16), т.е. из трех аспектов выделен как главный - функциональный. С другой стороны, все показатели были разделены на показатели технологии (32) и показатели продуктов и услуг технологии (24), то есть, выделены 24 показателя, имеющие отношение к конечному результату технологии, однако преобладают показатели, непосредственно описывающие технологию.

Теперь рассмотрим некоторые показатели технологии на номенклатуру показателей. В таблице I не приведен полный перечень всех видов данных показателей, а также их конкретные наименования и размерность, а только определены главные, на наш взгляд, виды показателей. В конкретном случае при сравнении или выборе информационной технологии можно остановиться на определенных показателях и их количестве, однако желательно сохранять соотношения видов показателей для комплексной оценки технологии.

Группа потребительских показателей включает в себя функциональные показатели, характеризующие удовлетворение потребности продуктом ; структурные показатели, характеризующие удовлетворение качеством продукта; доменные показатели, характеризующие удовлетворение элементным составом продукта. В частности, к этой группе показателей можно отнести прагматические, эргономические и экологические показатели.

Группа показателей эксплуатации информационной технологии состоит из трех подгрупп: показателей технологических, связанных с процедурными показателями ; показателей системных, отражающих управленческие возможности технологии, и диалектических показателей, отражающих возможности модификации технологии силами обслуживающего персонала.

Группа показателей, характеризующая уровень разработки, производства и поставки (сопровождения) состоит из трех подгрупп: показателей, отражающих уровень разработки по отношению к мировому; показателей, отражающих возможности конкретного производителя продукта и показателей, отражающих возможности конкретного поставщика. В частности, к ним можно отнести показатели надежности, долговечности, безотказности, ремонтопригодности, сохранности, точности и т.п.

Выделим среди всех показателей группу показателей, характеризующих эксплуатацию технологии. С функциональной точки зрения можно выделить: прагматические показатели, характеризующие основные по назначению показатели технологии (системы); экологические показатели, характеризующие вредное влияние технологии ; системные показатели, характеризующие устойчивость к внешним и внутренним возмущающим воздействиям, то есть управляемость технологией.

К функциональным со стороны обслуживающего персонала можно отнести диалектические показатели, характеризующие возможность модификации системы. Со сторона работников, работающих в технологии (системе), то есть "технологов", можно выделить процедурные показатели, характеризующие основные эксплуатационные показатели, а также инструментальные показатели, характеризующие предельные возможности системы, как инструмента для выполнения поставленных задач.

Со структурной точки зрения можно выделить архитектурные показатели: экономические, характеризующие затраты на приобретение и эксплуатацию; эффективностные, характеризующие эффективность работы системы.

К доменным показателям можно отнести показатели, характеризующие количество каких-либо элементов, входящих в состав системы, например, количество операций, циклов, фаз в технологии, количество элементов в системе, количество математических методов и компьютерных рабочих мест, используемых в технологии и т.п. Конкретные количественные и качественные показатели некоторых фрагментов АДИС ГПНТБ СО АН СССР приведены в (II).

Теперь рассмотрим проблемы, связанные с жизненным циклом компьютерной информационной технологии.

Цикл жизни продукта есть период времени, в течение которого выполняются работы, связанные с обеспечением разработки, выпуска и эксплуатации продукта, то есть обеспечивающие достижение целей поддержки продукта. Таким образом, поддержка цикла жизни продукта есть обеспечение разработки, выпуска и эксплуатации. Выделяют среду поддержки цикла жизни, в которую входит совокупность инструментов, имеющих технологию и организацию использования, и обеспечивающих достижение целей поддержки для различных фаз цикла жизни продукта (12).

Под технологией поддержки понимается совокупность процедур для организации поддержки, с помощью которых используются средства и методы для обеспечения этой цели. Под организацией поддержки понимается система распределения труда между людьми по отношению к фазам поддержки и используемым средствам и методам, а также планирования и контроля работ и управления ими. Под инструментами понимаются используемые средства и методы, то есть обеспечение предназначенное для исполнения конкретных функций поддержки, а под фазами поддержки - отдельные, связанные между собой, процедуры в технологии.

В среде поддержки цикла жизни продукта выделяют окружение, то есть такие сферы, которые обеспечивают отдельные фазы развития цикла жизни продукта. Окружение поддержки создает поддержку для выполнения процедур во время одной из фаз развития цикла жизни продукта.

Среда поддержки создает поддержку для всех фаз развития цикла жизни продукта. Особенность цикла заключается в его замкнутости, то есть к трем основным фазам: разработка, производство и эксплуатация необходимо добавить развитие.

Итак, можно выделить три вида поддержки: инструменты, которые могут работать самостоятельно или входить в окружение или сферу, окружение поддержки и сферы поддержки, которые объединены в средства поддержки.

К окружению поддержки относят спецификацию, проектирование, изготовление, тестирование, сопровождение. Среды поддержки основываются на цикле жизни продукта, методах и средствах искусственного интеллекта.

В (13) предлагается семь видов проверки разрабатываемых систем: тестирование, верификация, демонстрация, проверка на соответствие требованиям, проверка на правильность, проверка на приемлемость, проверка на жизнеспособность.

Существует две точки зрения на эти проверки, со стороны разработчиков и пользователей, а также четыре этапа проверки: реальные условия, маркетинг, технический опыт и обслуживание. Указывается, что наиболее аффективными являются способы параллельной проверки и разработки, однако, как правило, разработка ведется "сверху - вниз", а проверка "снизу - вверх". Это обусловливает конфликт между специалистами, которые разрабатывают, то есть отвечающих за эффективность системы, и специалистами, которые отвечают за понятность и совместимость системы (пользователи, оценивающие систему).

Итак, были рассмотрены различные аспекты показателей компьютерных информационных технологий, но осталась еще одна сторона данной проблемы: библиотека, приобретая такую технологию, получает инструмент по созданию информационных продуктов, что приводит к возникновению вопросов, связанных с производством и сбытом этих продуктов.

В информационном производстве информационный продукт можно рассматривать как предмет труда и как средство труда (информационная технология) (14), в материальном производстве информационный продукт рассматривается как средство труда. Материальный продукт может рассматриваться во всех производствах в обоих качествах.

Г.Т. Артамонов указывает, что особенностью информационного продукта является отсутствие амортизируемости, и он не уничтожается при потребления, как материальный продукт. И еще информационный продукт может быть использован одновременно в разных актах производства и потребления и в разных местах (14).

Ю.A. Шрейдер (15) отмечает, что информированность в сфере производства есть страховка от потерь, связанных с отсутствием общественно-необходимого уровня информированности, а в сфере фундаментальных наук - гарантия включенности в мировой процесс научной деятельности. Поэтому потребительская стоимость информационного продукта нелинейно увеличивается с ростом обеспечиваемой полноты информирования. Он указывает на ошибочное мнение, что информационные продукты нужны для того, чтобы заменить собственные разработки или найти неожиданное решение. Если это происходит, то редко. Реально эти продукты нужны для обеспечения пользователям возможности функционировать на мировом уровне, то есть искать решения на перспективных направлениях. Потребительская стоимость информационного продукта складывается из двух компонентов: реально используемых сведений, экономящих трудозатраты на исследования или производство (эта экономия может проявиться в повышении качества продукта или повышении спроса на него), и обеспечиваемого информационного комфорта (в сильной степени зависящего от качества информационных услуг - регулярности, отсутствия шумов и т.п.). Второй компонент вообще не имеет оценки. Поэтому, отмечает Ю.А. Шрейдер, все исследования экономической эффективности информации не имеют научного смысла, а служат для оправдания системы управления в сфере информации.

В связи с тем, что Библиотека может производить информационный продукт, возникает вопрос рынка сбыта этого продукта. Особенностью данной проблемы является наличие крупных информационных центров международного, всесоюзного, отраслевого, видового, республиканского, регионального, областного уровня и, наконец, отделов НТИ предприятий и организаций. Эта мощная организационная структура практически не оставляет шансов успешно распространять информационные продукты-библиотеки. Тем не менее, если найти специфику библиотечных БД, то есть атрибуты, по которым отличаются библиотечные базы данных от библиографических, то библиотеки могут найти свои "экологические" ниши, не занятые продуктами этих центров.

Концепции библиотечной политики по отношению к рынкам распределения библиотечного продукта можно сформулировать следующим обазом.

1. Конкуренция с крупными информационными центрами бессмысленна, поэтому распространение печатных продуктов из лент ВИНИТИ или других центров является дублированием работы ВИНИТИ, хотя для определенных регионов и ведомств, таких как СО АН СССР широко используется, однако данные продукты не найдут рынка распространения при переходе на самофинансирование и хозрасчет и будут убыточны библиотеке. Данное направление отражает ведомственный подход к проблеме.

2. Крупные библиотеки располагают уникальными фондами так называемой "серой" литературы, малотиражной, ведомственной, случайной, коньюктурной и, наконец, региональной, которая не имеет широкого распространения в центрах НТИ и более мелких библиотеках, поэтому крупные библиотеки должны направить свои усилия на создание продуктов, раскрывающих эти фонды, то есть на выбор профиля и тематики, пользующейся спросом в библиотеке. Для ГПНТБ СО АН СССР это регион Сибири.

3. Следующей по важности концепцией является концепция глубокой переработки данных в библиотеке. Библиотека может привлекать к работе со своими фондами экспертов, но для этого ей необходимо иметь компьютерные рабочие места документально-информационных экспертов.

4. Концепция перехода от анонимного пользователя к конкретному заключается в выборе конкретных профилей, где принятие решения сильно зависит от информации и поэтому представители этих профилей готовы заплатить за данную информацию.

5. Концепция рекламы тривиальна.

6. Концепция необратимости развития продукта требует вовремя отказываться от производства невыгодных в экономическом отношении продуктов. Данная концепция не должна сужать спектра продуктов за счет устранения некоторых экономически невыгодных продуктов, но сулящих в перспективе экономическую целесообразность.

Итак, в работе были затронуты некоторые основные аспекты компьютерных информационных технологий, используемых в библиотечной и информационной работе, базирующихся на СУБД, ИПС, методе цитирования и гипертекста. Было отмечено, что дальнейшее развитие данных технологий в СССР немыслимо без создания интегрированных (в смысле библиотечных и информационных процессов) и общедоступных компьютерных систем коммуникации информации, расположенных в крупных библиотеках и научных центрах. Для оценки и выбора варианта реализации такой технологии в конкретной библиотеке была предложена система выходных показателей, особенностью которой является ее комплексность, учитывающая функциональный, структурный и элементный (доменный) аспекты данных технологий. Компьютерные документально-информационные технологии рассматриваются с трех сторон: со стороны разработчиков и производителей, создающих эти технологии как продукты ; со стороны библиотечно-информационных работников, производящих с помощью этих технологий информационные услуги и продукты, и со стороны потребителей этих услуг и продуктов. И, наконец, были представлены основные концепции библиотечной политики по отношению к библиотечно-информационным продуктам, услугам и рынкам их сбыта.

Литература:

  1. Garfield E. Science Citation Index - Philadelphia - 1983 - 230p.
  2. Smith К. E. Hypertext-linking to the future// Оn line .- 1988.- №3. -
  3. P. 32 - 46.
  4. 3. Гиляревский P.С., Субботин М.М. О возможности оценивать перспективность новых информационных технологий (на примере гипертекстовой технологии) // НТИ. Сер. I. - 1988. - № I. - С. 2-5.
  5. 4. Розов B.C. Информация или документация? // Вопр. изобретательства. - 1988. -№11. - С. 40-43.
  6. Гуз Г.Х., Маккол Р.Э. Системотехника. - М.: Сов. Радио. - 1962.
  7. 283 с.
  8. Инмон У., Фридман Л. Методология экспертной оценки проектных решений для систем с базами данных. - М.: Финансы и статистика, 1986. - 280 с.
  9. Елепов Б.C., Нестеров А.В. Автоматизированная библиотечно-информационная система ГПНТБ СО АН СССР. Ч. I. - Новосибирск, 1988. - 25 с. - (Преп. 88-I / ГПНТБ СО АН СССР).
  10. Ракитов А.И. Проблема проблем // НТР. - 1988. - № 12. - С. 2.
  11. Информационная технология и организационная структура Экспресс-Информация. - Информатика. - 1988. - № 31. - С. 5-8.
  12. Елепов Б.С., Нестеров А.В. Автоматизированная документально-информационная система обработки, хранения и анализа НТИ ГПНТБ СО АН СССР. Ч.2. - Новосибирск, 1988. - 24 с. - (Преп. 88-9 / ГПНТБ СО АН СССР).
  13. Елепов Б.C., Нестеров А.В. Интегрированная система коммуникации НТИ ГПНТБ СО АН СССР. Ч. 3. - Новосибирск, 1989. - 28 с. - (Пpeпр. 89-6 / ГПНТБ СО АН СССР).
  14. Мельников И.А., Раабе А.С., Тамм Б.Г. Инструментарии машинной поддержки цикла жизни программного обеспечения (обзор западных средств) // Прикладная информатика. - М.: Финансы и статистика, 1988. - Вып. 14. - С. 16-41.
  15. Rouse W.B. On meaningful menus for measurement disentangling evaluative issues in system design// Inf. Process. and Manag. -1987. - 23. - N 6. - P. 593 - 604.
  16. Артамонов Г.Т. Информационное производство с позиции политэкономии.// Всесоюз. конф. "Актуальные проблемы развития и внедрения новых информационных технологий": Тез. докл. - М., 1988. - С. 17-20.
  17. Шрейдер Ю.А. Особенности информационного продукта как товара // Всесоюз. конф. "Актуальные проблемы развития и внедрения новых информационных технологий: Тез. докл. - М., 1988. - С. 27-32.
  18. Добров Г.М. Измерение и моделирование проблемно-ориентированных качеств научно-технического потенциала // Вопросы информационной теории и практики. - 1986. - № 56. - С. 4-18.
  19. Спицнадель В.Н. Утверждая приоритет: Оценка современной техники и производства. - Л.: Лениздат, 1988. - 143 с.

 

 

!34

В.З.ДРЕЙЗИС, В.И.КУРСКИХ, Р.А.ЧЕРНЫХАЕВА

КОМПЬЮТЕРНАЯ ТЕХНОЛОГИЯ ГПНТБ СО АН СССР: ОПЫТ И ПЕРСПЕКТИВЫ

Продолжая работы по внедрении автоматизированной документально-информационной системы ГПНТБ СО АН СССР (I) и по созданию электронного каталога (задание 03.05.17 программы 0.80.18 ГКНТ СССР), отдел автоматизация библиотеки разработал ряд компьютерных технологий для различных видов изданий, обеспечивающих одноразовый ввод данных, автоматизированное получение каталожных карточек, загрузку библиографической информации в базы данных (БД) и картотеки и ее последующее использование.

В числе первых была создана технология ведения БД "Автореферат", содержащая библиографические записи (БЗ) авторефератов диссертаций, предъявляемых к защите. Эти издания пользуются спросом академических, отраслевых и учебных институтов, научно-производственных объединений. БЗ автореферата имеет "жесткий" формат с позиции ГОСТа 7.1-84 "Библиографическое описание документа", лучше других поддается формально-логическому программному контролю, и поэтому ввод БЗ могут вести специалисты, не имеющие высокой квалификации. Каждые 50 экземпляров авторефератов, объединенные одним листом государственной регистрации, поступают на обработку достаточно ритмично, в среднем по 500 в неделю, и поэтому могут быть отнесены к технологичному виду изданий с точки зрения библиотечной обработки.

Любая компьютерная технология в большой степени зависит от состава технических средств автоматизации, на базе которой она строится. Поэтому естественными выглядят те изменения, которые происходили с технологией "Автореферат" (2) с начала ее эксплуатации в I987 году (опытная эксплуатация проводилась во второй половине 1986 г.).

Первоначально БЗ авторефератов вводились на магнитные ленты устройств ЕС 9004. С магнитных лент информация переписывалась с перекодированием на диски СМ ЭВМ. Там программой формально-логического контроля БЗ проверялись на соответствие требованиям ГОСТа 7.1-84 для разделителей областей и подобластей описания, а затем редактировались с использованием штатного системного экранного редактора ТЕД. Каталожные карточки (листинги) печатались в отделе автоматизации и передавались в типографию для тиражирования.

После подключения мультиплексора информация стала вводиться непосредственно в ЭВМ МЕРА-125 с двух терминалов (тот же ТЕД) под контролем процессора косвенно-командных файлов в формате печатаемой на листинге библиографической записи (Приложение I).

Значительные изменения технология претерпела после приобретения нескольких микроЭВМ типа ДВК и разработки ряда пакетов прикладных программ (ППП).

ППП "Мода" (автор - с.н.с. Грешнов Е.Б.) обеспечивает двусторонний обмен (файлами между СМ ЭВМ и микроЭВМ типа ДВК с сохранением или изменением стандартных структур файлов операционных систем ОС РВ и ОС ДВК (РТ II, РАФОС, ФОДОС). Физическая связь устройств обеспечивается четырехпроводной линией и платой последовательного интерфейса, устанавливаемой на микро-ЭВМ.

ППП "Картотека-СМ" и "Картотека-ДВК" (автор - с.н.с. Недодиров B.C.) - электронные картотеки (ЭК) СМ ЭВМ (3) и ДВК состоят из двух основных программ:

Hа обоих типах ЭВМ используется одинаковая структура данных. Пользователям предоставляется достаточно широкий набор команд редактирования данных, "вырезки", "наклеивания" и замены контекста, просмотра "длинных" документов, оригинальная идентификация полей переменной длины, компактное размещение на магнитных дисках, восстановление данных после сбоя, различные функции. Программа поиска предоставляет пользователю возможность отобрать в отдельный файл картотечной структуры документы, релевантные запросу. Отбор может проводиться из одного или сразу из нескольких файлов по вводимому или по ранее подготовленному запросу. На ДВК обеспечивается ведение многотомных картотек и поиск из многотомных файлов. Поиску подлежит любой контекст (слово, предложение или их части) документа или любого его поля, а также дизъюнкция (конъюнкция) или отрицание любых контекстов.

Программно-аппаратные изменения резко изменили и технологию "Автореферат". Схематически она приведена в приложении 3. Ввод информации осуществляется библиотечным работником отдела каталогизации с интеллектуальных терминалов - модернизированных комплексов ДВК-2, работающих в локальном режиме. Здесь же печатаются листинги с каталожными карточками (КК) авторефератов. Один раз в день по инициативе пользователей ДВК осуществляется обмен данными с СМ ЭВМ, которыми затем дополняются:

Ввод и редактирование данных осуществляется в формате ЭК при работе программы ввода и корректировки ППП "Картотека-ДВК". Сравнивая входные форматы данных (приложение. I, 2), ясно видим преимущества последнего. Главный из них - экономичность, поскольку не вводятся разделители областей и подобластей БЗ и программно формируются номера полей, первые три пробела строк-продолжений и содержимое поля I. Отпадает необходимость формально-логического контроля данных и резко сокращается время на редактирование. Ничего не теряет и даже выигрывает формат БЗ на каталожной карточке (приложение 2), поскольку программа печати сама "управляет" переносом слов и размещением индекса библиотечно-библиографической классификации.

По аналогичной технологии с использованием электронных картотек и ППП "Мода" с 1990 г. будут обрабатываться издания так называемых временных коллективов. Они включают в себя материалы конференций, симпозиумов и других научно-технических мероприятий, БЗ которых, в отличие от жесткого формата авторефератов диссертаций, требуют полного библиографического описания по ГОСТу 7.1-84 с набором сведений о добавочных описаниях.

При получении большого количества изданий временных коллективов возникает проблема унификации и стандартизации комплекса материалов одного и того же коллектива в алфавитном каталоге, так как при выпуске подобных материалов издающими организациями не выдерживаются некоторые атрибуты БЗ, например единое наименование конкретного коллектива. Прямым следствием научно-технического развития является не только количественный рост коллективов и их печатной продукции, но и те качественные изменения, которые происходят в характере деятельности коллективов и в их публикациях. Правильная формулировка заголовка описания публикаций различных коллективов является важнейшим условием, позволяющим различать коллективы, имеющие тождественные или сходные наименования, обеспечить рациональную группировку описаний в алфавитном каталоге и поиск в нем как конкретных изданий, так и всех публикаций одного и того же коллектива, либо коллективов, похожих по названию и по характеру деятельности.

С расширением алфавитных каталогов, изменением методик составления библиографического описания и принятием новых государственных стандартов по библиографическому описанию документов вряд ли удастся избежать всех трудностей по поиску в традиционных карточных каталогах материалов временных коллективов. Таким образом, можно отметить ряд недостатков рассматриваемых каталогов:

Все это затрудняет отбор материалов конкретного коллектива (особенно описанных под заглавием), например, с нашей точки зрения, формальное добавочное описание на возглавляющий коллектив, который лишь в силу традиции помещается в издании на первое место в надзаголовочных данных, и, как правило, не является истинным автором тезисов, трудов или других публикаций.

Создание электронной базы или картотеки материалов временных коллективов позволит решить проблемы оперативного поиска необходимой информации, несмотря на перечисленные трудности, играющие существенную роль при работе с традиционными карточными каталогами.

Параллельно с одноразовым вводом информации решен вопрос вывода на стандартные устройства ЭВМ листингов с полным комплектом каталожных карточек.

В приложении 4 приведен фрагмент такого листинга для библиографической записи, действительный ввод которой в ЭВМ осуществлялся в Формате ППП "Картотека-ДВК" по аналогии с входным форматом авторефератов.

Появление в стране персональных ЭВМ (ПЭЯМ) IBM PC XT/AT, их скромных отечественных аналогов ЕС 1840 (1841, 1842) и др. открывает новые возможности для развития компьютерных библиотечных технологий.

Первой технологией, построенной на базе ПЭВМ, будет "Иностранная книга". Здесь и далее широкое применение найдут как собственные оригинальные программные разработки, так и используемые с соблюдением авторских прав зарубежные программные средства (ПС).

Подключение ПЭВМ к существующей локальной сети ГПНТБ СО АН СССР обеспечивается с помощью ППП "Мода-1", позволяющим осуществлять обмен данными между СМ ЭВМ и ПЭВМ по аналогии с ранее рассмотренным ППП "Мода". Ведется разработка программ ввода и корректировки данных, которые, заимствуя вое лучшее от электронных картотек для СМ ЭВМ и ДВК, будут использовать широкие графические возможности ПЭВМ и позволят иметь различные выходные форматы.

Первым из зарубежных ПС является полученная библиотекой от ЮНЕСКО и самостоятельно адаптированная на русский язык последняя версия информационно-поисковой системы АЙСИС/М. Обладая широкими функциональными возможностями, система обеспечивает пользователя гибкими средствами ввода-вывода данных, мощным поисковым аппаратом, оставаясь всегда понятной и даже элегантной. Используемая версия позволяет применять язык Паскаль для расширения возможностей системы. ГПНТБ СО АН СССР, например, заинтересована в организации санкционированного доступа к страницам рабочих листов, используемых для ввода данных, в расширении возможностей формирования выходных данных (для получения каталожных карточек). Экспорт и импорт данных осуществляется в стандартном формате ИСО 2709 и может широко использоваться для обмена информацией с отечественным и зарубежными системами.

С появлением формата ИСО 8211-85 планируется на его основе построить единый выходной формат ГПНТБ СО АН СССР, работа над которым была ранее приостановлена, и обеспечить конвертирование данных различного вида (МЕКОФ, ИСО 2709, картотека и др.) в его структуру.

Авторы сознают, что их публикация местами неоднородна, местами излишне детализирована, поэтому готовы принять любую критику в свой адрес. Рассказывая о некоторых работах по автоматизации библиотечной технологии, мы хотели отойти от общих положений компьютеризации библиотек и показать, как это бывает в действительности. Мы представляем пути решения задач компьютеризации библиотек. Однако остаточный принцип финансирования (есть, конечно, и счастливые исключения), разрозненность сил и многое другое принуждали нас не всегда рационально действовать, часто менять планы, приноравливаться к ситуации, перестраиваться на ходу.

И только сейчас появились надежды на стабильную техническую политику в области компьютеризации и действительное признание государством необходимости информатизации общества, что позволяет с оптимизмом смотреть в будущее.

Литература

  1. Елепов Б.C., Нестеров А.В. Автоматизированная библиотечно-информационная система ГПНТБ СО АН СССР (ч. I). - Новосибирск.
  2. I988. - 20 с. - (Препр./ГПНТБ СО АН СССР; 88-1).
  3. Курских В.И., Буякова М.А., Черныхаева Р.А. Разработка и эксплуатация технологии создания и ведения собственных библиотечных баз данных // Создание и интеграция документалымх и фактографических ИПС. - Новосибирск, I988. - С. 70-8I.
  4. Нестеров Л.В., Недодиров B.C. Электронная библиографическая картотека // Создание и интеграция документальных и фактогра-фических ИПС. - Новосибирск. 1988. - С. 65-70.

 

Приложение I

Фрагмент входного формата (ТЕД)

 

* А88 - 16701

СИЛОНОВ.ВАЛЕНТИН МИХАЙЛОВИЧ.

МЕЖАТОМНЫЕ КОРРЕЛЯЦИИ В TBEPДЫХ

РАСТВОРАХ МЕТАЛЛОВ: АВТОРЕФ. ДИС. ...

Д-РА ФИЗ.-МАТ.НАУК.(01.04.07)/МГУ ИМ. М.В. ЛОМОНОСОВА.

ФИЗ.ФАК.-М.,1989.-35 С.

К 204.013.83

* А88 - 16702

ЯРЕМЕНКО. ВАЛЕНТИНА НИКИФОРОВНА.

ГИСТОХИМИЯ БИОПОЛИМЕРОВ ЖЕЛУДКА

МЛЕКОПИТАЮЩИХ В ПРЕНАТАЛЬНОМ И РАННЕМ

ПОСТНАТАЛЬНОМ ОНТОГЕНЕЗЕ: АВТОРЕФ.ДИС.

... КАНД.БИОЛ.НАУК. (16.00.02)/МОСК.

ВЕТ.АКАД.ИМ. К.Л.СКРЯБИНА.-М..1989.-

19 С.

Е 932.3+

Е 633.723.93

* А88 - 16703

ЧИКАЛИН. НИКОЛАЙ АЛЕКСЕЕВИЧ.

ПРАВОВОЙ РЕЖИМ ОТДЕЛЬНЫХ ВИДОВ

ЖИЛЩНОГО ФОНДА В СЕЛЬСКОЙ МЕСТНОСТИ:

АВТОРЕФ.ДИС. ...КАНД.ЮРИД.НАУК.(12.00.03)/

ВСЕСОЮЗ.ЮРИД. ЗАОЧ.ИН-Т.-М.1989.-19 С.

Х 623.211.33

Фрагмент листинга с КК

 

А88- СИЛОНОВ. ВАЛЕНТИН МИХАИЛОВИЧ.

16701 МЕЖАТОМНЫЕ КОРРЕЛЯЦИИ

В ТВЕРДЫХ РАСТВОРАХ МЕТАЛЛОВ:

АВТОРЕФ. ДИС. ... Д-РА ФИЗ.-МАТ.НАУК.

(01.04.07)/МГУ ИМ. М.В. ЛОМОНОСОВА.

ФИЗ.ФАК.-М.,1989.-35 С.

К 204.013.83

 

А88- ЧИКАЛИН. НИКОЛАИ АЛЕКСЕЕВИЧ.

16701 ПРАВОВОЙ РЕЖИМ ОТДЕЛЬНЫХ

ВИДОВ ЖИЛИЩНОГО ФОНДА В СЕЛЬСКОЙ

МЕСТОСТИ: АВТОРЕФ.ДИС. ...КАНД.ЮРИД.

НАУК.(12.00.03)/ ВСЕСОЮЗ.ЮРИД. ЗАОЧ.ИН-Т.-М.,1989.-19С.

Х 623.211.33

 

 

 

 

 

!35

А.И.ПАВЛОВ

КОМПЬЮТЕРНАЯ СРЕДА ГПНТБ СО АН СССР

Отличительной чертой современного общественного развития является стремительное возрастание объемов и значимости информации, ее усиливающееся влияние на все области человеческой деятельности. По данным ЮНЕСКО (I) более половины занятого населения развитых стран принимает участие в процессах производства информации. При этих высочайших темпах роста информационного потока непрерывно увеличивается отставание традиционных информационных технологий.

Изменение сложившейся ситуации возможно лишь с качественно новым подходом к решению данной проблемы. Это давно стало очевидным и понятным положением, более того практически все знают пути преодоления этого кризиса: разработка и внедрение новых методов обработки информации, широкое использование вычислительной техники, современных средств коммуникации и т.п., но, следуя этим путем, необходимо сконцентрировать усилия и средства на наиболее важном направлении.

Разработка технологий и технических средств неразрывно связана с потреблением информации, наибольшая часть которой должна попадать к разработчику через библиотечную сеть, при этом следует отметить, что разработчики информационных технологий и технических средств, реализующих эти процессы, в частности специалисты по вы числительной технике и средствам связи, нуждаются в этом не меньше других. Недостаток же информации приводит к недопустимо медленному развитию информационных технологий и, как следствие, тормозит развитие других областей науки и техники. Поэтому именно библиотечно-информационные технологии являются там стратегическим направлением или тем звеном, которое должно первым претерпеть качественные изменения и тем самым создать благоприятные условия для всех потребителей научно-технической информации (НТИ).

Понимая проблему именно таким образом и руководствуясь системным подходом к ее решению, в ГПНТБ СО АН СССР около двух лет тому назад был начат процесс создания автоматизированной документально-информационной системы (АДИС). Существуют множество подходов и направлений создания и улучшения системы человек - библиотека. Не претендуя на исчерпывающую полноту, эти предложения могут быть сведены к трем в достаточной степени автономным путям развития АДИС (I). Первое - перевод всей информации на магнитные или аналогичные виды носителей (безбумажная технология), второе - создание максимально простого информационно-поискового аппарата (алгоритмы, интерфейс и т.п.) и третье - интеллектуальная первичная обработка информации или создание баз знаний.

Отметим, что при достаточно малом взаимном влиянии друг на друга все эти направления подразумевают общую основу - компьютерную среду. Поэтому одной из первичных задач в ГПНТБ СО АН явилось формирование компьютерной среды как основы, на которой базируется решение остальных проблем создания АДИС. Закладываемый на этом этапе фундамент должен учитывать как техническую, так и идеологическую стороны вопроса, при этом идеология является определяющей по отношению к технической части, так как создаваемый скелет будущего организма АДИС должен в полной мере отвечать функциональным требованиям, предъявляемым к системе в целом.

Поскольку ГПНТБ является головной организацией в сети библиотек СО АН СССР, то принципиальной позицией стало стремление концентрированно, как в капле воды, отразить все разнообразие компьютерных средств, применяемых в научно-исследовательских учреждениях СО АН. Эта концепция приводит к осознанному созданию в библиотеке разнородного парка компьютерной техники, такое направление позволит наиболее полно удовлетворять потребности абонентов в научно-технической информации. Возможно, что идеология универсального комплекса потеряет свою актуальность с созданием компьютерных сетей коллективного пользования, однако темпы развития таких средств коммуникации, а так же их стоимость не удовлетворяют потребителей НТИ, а читатель или абонент уже сейчас желает получать программный продукт или другие информационные услуги в том формате или на том носителе, который в достаточной степени соответствует парку ЭВМ, находящемуся в распоряжении потребителя. То есть компьютерный фундамент должен иметь средства, позволяющие конвертировать данные в широком диапазоне вариантов используемой вычислительной техники и магнитных носителей, находящихся в ее составе.

Второе требование к компьютерной среде библиотеки может быть сформулировано следующим образом: являясь объектом с более чем ограниченными собственными ресурсами и значительными потребностями в плане объемов внешней памяти для хранения информации, библиотека должна располагать возможностями крупного ВЦ. В таких условиях рентабельнее иметь канал связи, чем содержать свой мощный ВЦ.

Третий тезис соответствует перспективе развития компьютерной среды библиотеки. Так как последняя является накопителем и генератором информации для коллективного пользования, то естественно доступ к библиотечной информации должен быть достаточно прост для широкого круга абонентов, а сама библиотека должна обладать возможностью наиболее свободного обращения к информационным ресурсам любого ранга (региональный, союзный, мировой). Исходя из этих требований к идеологическому построению АДИС, в ГПНТБ СО АН СССР создана и развивается компьютерная среда, имеющая три подсистемы, каждая из которых отражает то или иное из высказанных положений.

Внутри библиотеки функционирует двухуровневая информационно-вычислительная система, которая отвечает первому из сформулированных требований. Верхний уровень занимает ЭВМ с достаточно развитой периферией и средней производительностью. Роль центральной ЭВМ отведена вычислительному комплексу на базе процессора CM- I420 с расширенным набором периферийных устройств. В частности, комплекс включает три вида накопителей на жестких магнитных дисках (НМД): на сменных дисках, на сменных пакетах и накопители типа "винчестер" общим объемом дисковой памяти около 180 Мбайт. Кроме этих устройств внешней памяти комплекс имеет два накопителя на гибких магнитных дисках и два накопителя на магнитной ленте. Процессор СМ-1420 обладает повышенным быстродействием по сравнению с базовой моделью СM- 4, оперативная память ЭВМ имеет объем 4 Мбайта.

Кроме устройств внешней памяти комплекс включает в себя восемь терминальных каналов и стандартный мультиплексор передачи данных на шестнадцать каналов. Все терминальные линии выполнены в стандарте интерфейса "токовая петля", что позволяет размещать терминальные устройства в любом месте библиотеки и легко изменять конфигурацию периферийного оборудования.

Второй уровень вычислительной среды выполнен в двух вариантах: радикальном и кольцевом. Радикальное подключение реализовано непосредственным подключением терминальных устройств через мультиплексор, а кольцевая структура поддерживается с помощью промышленной станции локальной сети "Эстафета-02". Как радикальная, так и кольцевая структура кроме обычных дисплеев включает в свой состав набор терминалов класса микроЭВМ, в частности: ДВК-2, ДВК-3, ЕС-1840, "Электроника-85". Все периферийные микроЭВМ могут программно эмулировать терминал, то есть иметь непосредственный доступ к операционной системе и ресурсам ЭВМ верхнего уровня, а также имеется программная поддержка, обеспечивающая файловый обмен с центральной мини-ЭВМ, при этом микроЭВМ работают в своей операционной среде.

Реализация локальной вычислительной среды на таком комплексе технических средств дает возможность предоставления информационных услуг более чем в десяти вариантах, причем сюда входят как различные типы и виды магнитных носителей (диски, магнитные ленты, дискеты разного диаметра), так и различные форматы записи информации на эти носители. Работы в этом направлении интенсивно продолжаются: расширяется спектр устройств и, соответственно, количество вариантов представления информации.

Кроме универсальности предоставления информации абонентам такая структура обеспечивает децентрализацию, то есть частичную независимость от ЭВМ верхнего уровня. Поскольку персональные ЭВМ, находящиеся на втором уровне, имеют в своем составе индивидуальные устройства внешней памяти, то выход из строя центральной машины не приводит к нарушению технологического процесса. Это в достаточной степени отвечает первому из предъявляемых требований к созданию компьютерной основы для построения АДИС. В подсистеме может решаться большинство внутренних технологических задач, внешний же обмен в этом случае ведется посредством магнитных носителей. Понятно, что такой способ информационной коммуникации не всегда в полной мере может удовлетворить потребности абонента, так как низкая оперативность в ряде случаев существенно снижает эффективность информации.

Острота этой проблемы может быть частично снята при реализации второго принципа построения системы - использование мощностей крупного ВЦ. Для этой цели библиотека располагает еще одной мини-ЭВМ СM-4, оснащенной оборудованием для связи через модем с ВЦ СО АН СССР, территориально расположенным в Академгородке. Эта связь осуществляется по выделенному каналу посредством периферийного центра обработки информации (ПЦО). В результате функционирования такой подсистемы библиотека имеет доступ к ЕС ЭВМ с 200 мегабайтными НМД, что, во-первых, расширяет ресурсы внешней памяти, а, во-вторых, позволяет вести информационный обмен с большинством НИУ, имеющих аналогичные ПЦО и каналы доступа к данной ЭВМ. Это направление также развивается; вводится в эксплуатацию дополнительная ЭВМ EС-I055 и продолжается оснащение ПЦО НИУ СО АН СССР, в связи, с чем возрастает количество абонентов библиотеки.

Как отражение третьего принципа в идеологии построения АДИС выступает еще одна часть компьютерного фундамента: это выделенный канал связи с ВНИИПАС, обеспечивающий доступ к международным информационным ресурсам, что, несомненно, обогащает фонд НТИ библиотеки, однако такое дорогое "удовольствие" должно быть более рентабельным. Для этого планируется внедрение такого доступа по коммутируемым телефонным каналам, причем необходимо стремиться к двустороннему обмену информацией, когда все абоненты сети получают доступ к НТИ ГПНТБ, а использование дорогостоящих каналов связи идет на кооперативных началах.

Три подсистемы, формирующие основу построения АДИС, не лишены недостатков, основным из которых является то, что все они не связаны в единое целое посредством каналов связи. В настоящее время обмен информацией между подсистемами осуществляется с помощью магнитных носителей, что естественно снижает технологичность системы, однако эта проблема решается, и в будущем фундамент будет "скреплен" сетью на уровне мини-ЭВМ.

В качестве программного обеспечения АДИС в ГПНТБ СО АН СССР используется ряд отечественных и зарубежных информационно-поисковых систем (ИПС), обеспечивающих различные уровни коммутации НТИ. На машинах класса ЕС обеспечение ведется под ИПС АЙСИС и ДИАЛОГ-2, распространяемых ЮНЕСКО, из отечественных - используется АСОД (2). На мини-ЭВМ работает ИПС АСПИД. Для персональных ЭВМ внедряется МИКРОАЙСИС, также распространяемый ЮНЕСКО. Эти системы работают на обеспечение технологий и обслуживание абонентов. Кроме того, в ГПНТБ СО функционирует программный комплекс "Зарплата" - разработка института "Информприбор", комплекс работает на СМ ЭВМ под управлением СУБД "ФОБРИН".

Помимо использования разработок сторонних организаций, созданный компьютерный фундамент дает свои первые плоды в виде собственных программных продуктов. Один из них - электронная картотека (ЭК) "Подписка", которая представляет собой пакет прикладных программ (ППП) для ведения базы данных (БД) изданий "Союзпечати". Он позволяет автоматизировать процесс подписки на периодические издания и поддерживать работы с БД репертуара "Союзпечати".

Следующий программный продукт - "Картотека-СМ", который также как и "Подписка" реализован в ОС РВ на СM-I420 (СМ-4). Данный ППП предназначен для создания и ведения библиографических картотек.

На ДВК реализованы две ЭК: одна из них позволяет осуществлять заказы по тематическим планам издательств для библиотечной сети, а другая - распределение книг по заказам с печатанием сопроводительных актов на рассылку.

Кроме отдельных задач в ГПНТБ СО АН СССР разработана и внедрена документально-информационная технология создания собственных баз и ведения ЭК (2). В частности, создана и накапливается БД "Автореферат", которая содержит информацию об авторефератах диссертаций, защищенных в СССР с 1986 года.

Процесс перевода библиотечных технологий и обслуживания абонентов на основе компьютерного фундамента делает свои первые шаги. Естественно то, что на этом этапе система имеет ряд недостатков, связанных с ограниченностью ресурсов библиотеки и рядом других проблем объективного характера. Несмотря на эти трудности, создание АДИС будет продолжаться в выбранном на начальном этапе направлении. Ближайшие пути развития системы должны содержать в себе построение локальной сети верхнего уровня и подключение внутрибиблиотечной компьютерной среды к коллективным каналам связи. Такая структура качественно отразится на технологии коммутации НТИ как внутри библиотеки, так и в плане внешних связей более высокого уровня.

 

Литература

Свиреденко С.С. Современные информационные технологии. - М.:

Радио и связь, 1989. - 304с.

Елепов Б.С. , Нестеров А.В. Автоматизированная библиотечно-информационная система ГПНТБ СО АН СССР. Ч. 3. - Новосибирск,

1989. - 32 с.

 

 

!36

А.В. НЕСТЕРОВ

КОМПЬЮТЕРНОЕ СРЕДСТВО БИБЛИОМЕТРИЧЕСКОГО АНАЛИЗА В БИБЛИОТЕКЕ

Впервые термин библиометрия ввел А. Притчард в 1969 г. (I). Под библиометрией подразумевается количественный анализ процессов документальной коммуникации. Программное обеспечение для такого анализа представлено ППП Института научной информации США.

Основатель этого института Гарфилд в своей работе "Количественный анализ библиографической информации" определил библиометрию, как метод количественных исследований документов, существующих в виде материальных объектов или библиографических единиц, а также заменителей того и другого. Вроде бы данное определение не включает закон Ципфа, однако оно отделяет библиометрию от наукометрии, которая оценивает количественно научную продуктивность в целом (15). Выделяют три основных направления в библиометрическом анализе:

1. Анализ данных по источникам, то есть числа публикаций, числа авторов, время издания, стоимость.

2. Изучение социтирования.

3. Анализ данных по проблеме индексирования, социологии науки и научной политики.

Результатом такой работы является метаинформация, которая очень полезна трем категориям пользователей:

  1. библиотечным и информационным работникам;
  2. руководителям научных исследований;
  3. экспертам, анализирующим документально-информационный поток.

Существуют другие точки зрения, например, высказанные С.Д. Хайтун (8), Ю.В. Грановским (9) и др.

Г.В. Вайят (4) считает, что одной из характерных особенностей развития науки середины XX века является самопознание науки, выразившееся в образовании науковедения. Его цель - изучение различных процессов и отношений, характерных для науки наших дней, а также практическое использование этого изучения. Новая информация усваивается лишь тогда, когда она без особого труда укладывается в общепринятые представления. Информация не признается в качестве таковой, пока она не превращается в знание.

Библиометрические методы используются для разнообразных целей: выбор стратегии научных исследований, определение наиболее перспективных научных направлений, изучение научных коммуникаций, оценка научного потенциала.

Среди библиографических показателей выделяются: количество публикаций, библиографических ссылок и некоторые показатели патентного анализа.

При библиографическом анализе учитываются следующие аспекты: нелинейная зависимость от предметных областей, сравнимость на межнациональном уровне, временной интервал (5-10 лет), охват теоретических и практических работ, учет экономической стороны вопроса.

Одним из основных методов библиометрии является метод цитирования. Мотивация процесса цитирования субъективна (5). Известны два подхода при анализе мотивов. Один из них выделяет четыре класса мотивов: концептуально-операционные (теоретический подход - метод исследования), основные - второстепенные, эволюционные - дискуссионные, подтверждение - отрицание.

Другой подход трактует мотивы как традиции, знаки вежливости, поддержки связей в научных и издательских областях.

Одной из сложных проблем в информатике, библиометрии и науковедении является проблема целевой функции. Во многих докладах на конференции по информатике и науковедению (6) высказывались мысли о том, что специалисты по информатике и науковедению могли бы и могут делать выводы о производительности, ценности, перспективности отдельных ученых, коллективов ученых, организаций и научных направлений. Аналогичная картина наблюдается за рубежом. Имеются публикации о возможности прогнозировать будущих нобелевских лауреатов, издаются атласы фронтов наук, оживилась дискуссия по поводу гипотезы Ортеги (7).

Методы информатики позволяют делать количественные и качественные оценки некоторых документальных характеристик, связанных с публикуемой информацией, однако выводы, сделанные на основе этих данных, могут иметь различный аспект.

Информационный аналитик должен брать на себя моральную ответственность за выводы только в области своей науки, то есть он может выявлять элементный состав, объяснять внутренние и внешние связи, но не браться за вынесение каких-либо оценок в других областях деятельности. В противном случае мы можем наблюдать нарушение научной этики и проявление некомпетентности. В работе (8) приводятся этика информатики, состоящая из двух постулатов: I) никто не может быть привлечен к ответственности за рамками своей компетентности ; 2) понятие "этика" употребляется, в первую очередь, в эндогенном смысле.

Информация может быть ложной, неполной и неточной, поэтому на ряду с основной функцией коммуникационной системы необходимо включать антифункцию, которая является опасной для людей, потребляющих информацию. Сама информация, даже будучи истинной, может представлять опасность, так как она может быть не снабжена юзи-информацией, то есть информацией об ее использовании и о возможных опасностях.

Существует еще несколько взглядов, сформулированных в виде научных направлений, теорий и методов. В частности, А.В. Соколов отмечает, что термин информатика и информация многозначны и предполагает, что огромное многообразие трактовок не является субъективным, а отражает закономерное развитие науки и делает вывод о становлении и развитии системы информационно-коммуникационных наук (9). Автор выделяет из всех коммуникаций (транспортных, энергетических и т.п.) только информационные. Объекты познания (практическая деятельность людей, фрагмент реальной действительности) включаются в систему научного знания в виде образцов, абстракций, описаний и понятий. Под предметом познаний выступает сторона (аспект, грань) объекта, субъективно выбранная для исследования методами данной дисциплины.

Автор (9) предлагает ввести критерий отграничения, позволяющий провести границу между предметами различных учений, изучающих один и тот же объект. Он выделяет три типа информации: биологическая, социальная, техническая (искусственная). Три типа наук, которые изучают информационные процессы в биологической, социальной и технической сферах, образуют семь типов учений, связанных с сочетанием этих сфер. Особым типом сочетания является наука, которая изучает все эти сферы одновременно. Автор назвал ее меганаукой об информационной коммуникации в соответствии с работой (10).

А.В.Соколов выделяет документально-коммуникационные системы как частный случай информационно-коммуникационных систем, а затем утверждает, что документ есть производная от информации. Примером обобщающей концепции социально-коммуникационных дисциплин может служить концепция информационных наук Б.С. Брукса (11). Одной из концепций общей меганауки является информология (12), а также теория информационных процессов (13).

Среди подобных работ особое место занимает работа Б.М. Кедрова (14), где он отмечает, что "Классификация наук означает связь наук, выраженную в их расположении в определенном последовательном ряду или системе согласно некоторым общим принципам. Поэтому проблема классификации наук является одной из наиболее важных и общих проблем современной науки".

Проблема классификации наук, научных направлений, тематик, рубрик и т.п. встает не только в наукометрии, но и в библиометрии, где она выглядит, как проблема классификации вообще человеческой деятельности, зафиксированной в документах.

Одна из основных задач документальной классификации в библиометрии заключается в дифференциации научных направлений или в разложении в документальный спектр человеческой деятельности, развитие которой характеризуется всеобщим законом дифференциации направлений и интеграцией результатов этих направлений деятельности людей.

В данной работе сделана попытка сформулировать количественный метод библиометрии, связанный с классификацией документальных рубрик, отражающих человеческую деятельность.

Классификацией наук, сфер деятельности люди стали заниматься давно. Известно множество таких классификаций (18). Однако все они базируются на логической основе без применения количественных методов.

Будем считать, что все науки или, в общем случае, сферы деятельности человека можно разделить на три группы: общественные, или науки о поведении человека (о целеустремленных системах) как главенствующие, так как само деление наук выполняет общественные функции, затем науки о природе (о самоорганизующих системах) и, наконец, формальные (абстрактные) науки. Научная деятельность отличается от деятельности в какой-либо сфере свойством научности, которое имеет большое количество толкований, поэтому под деятельностью будем понимать целеустремленную деятельность индивида или системы в смысле Р. Акоффа (17), а деление наук будем производить как деление сфер деятельности индивида.

Противопоставим деятельность человека деятельности природы, подразумевая под деятельностью природы ее развитие как самоорганизующейся материи, тогда абстрактная деятельность человека окажется нейтральной. Самой абстрактной деятельностью является математика, поэтому расположим математику в центре оси, на которой будем откладывать в виде точек сферы деятельности человека.

Формальный аппарат размещения конкретной науки по оси заключается в следующем. Будем считать, что в математике все опубликованные документы имеют математические или в общем случае количественные методы, тогда отношение количества документов, содержащих такие методы Ni к общему количеству документов Nj будет равно I, так как Ni = Nj. В самом простом понимании любая математическая работа посвящена количественным методам и поэтому должна содержать формулы, таблицы, графики, либо какие-то другие средства изображения математических и логических зависимостей в виде схем, знаков и символов. Если взять логарифм данного отношения, то тогда математика на оси займет точку с координатой ноль. Все остальные науки будут представлены в виде точек или отрезков, если сфера деятельности вообще не имеет количественных методов, например журналистика. Точка на оси определяется описанным выше методом, то есть логарифмом отношения документов, обладающих какими-либо формальными свойствами, характеризующими использование количественных методов, например наличие формул или их количества на общее количество страниц в документе, к общему количеству документов, или логарифмом обратного отношения (рис. I):

M=logNi / Nj

Вторым формальным атрибутом, по которому можно оценивать документ на заданной оси (оси деятельности), является наличие использования компьютерных средств (микропроцессорных средств, программно-управляемых средств и т.п.), которые являются носителями математических (количественных) методов в различных сферах человеческой деятельности - Kj.

Возможен случай, когда сфера деятельности не имеет ни одного документа с математическими методами или компьютерными средствами, тогда эти сферы деятельности попадают в крайний левый или крайний правый отрезок, а в самих отрезках дифференциацию сфер деятельности можно проводить следующим формальным образом, например по количеству публикаций в год или от общего к конкретному.

Данный аппарат классификации сфер деятельности является формальным и показывает, насколько математизированы или компьютеризированы сферы деятельности, то есть их наукоемкость, однако он не отражает интеграционный характер результатов сфер деятельности.

Для отражения этого аспекта человеческой деятельности можно использовать аппарат связности документов между собой с помощью библиографических ссылок и других методов. В частности, каждая из сфер деятельности (точка на оси) связана с другими сферами (точками) количеством цитируемых связей. Наиболее развит этот аппарат у Гарфилда. Можно выбрать наиболее сильные связи какой-то точки с другими точками, например с семью точками, и отложить количество связей по восьми осям на диаграмме, как это показано на рис. 2.

По осям диаграммы откладываются количество связей между исходной (первой) точкой и семью наиболее сильно связанными точками. Если связь между первой и второй точками, например 10 единиц, то на первой и второй осях откладываются радиусы 10 единиц и эти точки соединяются окружностью соответствующего радиуса. Затем подсчитывается суммарное количество связей по каждой оси и откладывается соответствующая сумма на соответствующей оси. Или можно взять среднюю арифметическую величину, либо какую-нибудь другую.

В результате этих операций получается восьмигранник, центр тяжести (точка А на рис. 2) которого смещен относительно координатного центра в сторону одной или двух осей. Это смещение показывает, какая из сфер деятельности преобладает по количеству связей. Это свойство можно использовать для выделения кластера документов,

который может представлять сферу деятельности. Наименование кластера представляет собой фронт направлений в данной сфере деятельности.

Подсчет Мj, Кj, Nj, координат точки А, например с месячным циклом, позволяет строить спектр сфер по оси деятельности и спектр фронтов направлений по сферам деятельности и проводить количественный библиометрический анализ документально-информационных потоков в динамике с месячным тактом. Теперь рассмотрим, как можно изобразить с помощью компьютерных средств результаты библиометрического анализа.

Для отражения информации об объекте на экране компьютера можно воспользоваться системным подходом, то есть рассмотреть изображение объекта в виде точки на экране в трех аспектах: элементном, структурном и функциональном. Под функциональным аспектом будем понимать движение точки в каком-либо пространстве атрибутов объекта. Здесь можно выделить три типа: статистическое движение, то есть движение каких-либо атрибутов при неподвижной точке на экране, например изменение яркости точки; динамическое движение, то есть движение точки на экране; и структурное движение, то есть при неподвижной точке на экране происходит изменение структуры объекта, например вращательное, волновое движение, изменение цвета точки. На структурном уровне движение можно разбить на три вида: движение типа превращения, например мигание точки, движение во времени и в пространстве, которое, в свою очередь, делится на три пространственных координатных движения. Схема классификации приведена на рис. 3.

Рис. З

Таким образом, можно выделить семь атрибутов отображения объекта, которые можно использовать для отражения объекта на экране компьютера, в частности три геометрических координаты (точки в пространстве атрибутов), две структурные координаты точки (мигание и перемещение во времени), и две функциональные координаты точки (яркость и цветность).

В данном случае, когда мы рассматриваем документальную коммуникационную систему, состоящую из источников, среды и приемников, необходимо выбрать семь атрибутов, наилучшим образом отражающих данную систему. Естественно, что для разных целей сочетание этих семи атрибутов может быть различно, но можно определить эти сочетания, причем их может быть семь типов, которые представлены в табл. I.

Таблица I

 

Источник

Среда

Приемник

I

+

 

 

 

2

 

+

 

3

 

 

 

+

4

+

+

 

5

+

 

+

6

 

+

+

7

+

+

+

Табл. I

Наиболее полное сочетание является седьмым типом, однако по количеству атрибутов, описывающих один из элементов коммуникационной системы, данные типы делятся на виды, количество которых может быть определено количеством сочетаний из семи атрибутов по трем элементам коммуникационной системы таким образом, чтобы в каждом сочетании обязательно присутствовал хотя бы один атрибут, описывающий один из трех элементов. Если нас интересует в большей степени источник, то можно взять пять атрибутов, относящихся к источнику, или к источнику и среде, или к источнику, среде и приемнику и по одному атрибуту, описывавшему среду и приемник по отдельности или совместно. Среди атрибутов объекта можно выделить атрибуты, описывающие совместные или универсальные свойства объекта или элементов объекта, например время.

Для библиотечных применений можно взять за данные следующие атрибуты: три атрибута, описывающие документальный источник, один - время, два, описывающие документальную коммуникационную среду и один, описывающий приемник, всего семь.

Рассмотрим более конкретно эти атрибуты. В качестве источника возьмем документальную рубрику. К атрибутам, описывающим документальные рубрики, можно отнести интенсивность использования количественных методов и компьютерных средств в рубрике, а также интенсивность публикаций в документальной рубрике.

В качестве документальной коммуникационной среды возьмем весь спектр документальных рубрик, а за атрибуты, описывающие эту среду, возьмем интенсивность библиографических связей документальной рубрики с другими рубриками и экстенсивность этих связей и, наконец, один атрибут, описывающий интенсивность использования читателями документальной рубрики.

Выберем в качестве атрибутов, характеризующих рубрику, интенсивность использования количественных методов, например, в простейшем случае, логарифм отношения количества документов, в которых есть наличие формул к общему количеству документов; следующим атрибутом является интенсивность использования компьютерных средств, выраженная отношением количества документов, в которых описаны компьютерные средства к общему количеству документов и, наконец, интенсивность публикаций в документальной рубрике, выраженная через отношение количества документов, вышедших за какой-то промежуток времени, к общему количеству документов.

Следующим атрибутом объекта является интенсивность библиографических связей рубрики с другими рубриками, которая выражается в виде отношения количества библиографических связей данной рубрики к общему количеству библиографических связей между восьмью наиболее связанными рубриками, причем, рубрике с максимальным количеством связей присваивается, например, красный цвет, а остальным рубрикам присваиваются цвета в соответствии с цветовым спектром. Еще одним атрибутом является экстенсивность библиографических связей, выражаемая через отношение количества всех библиографических связей к общему количеству документов в рубрике.

Атрибут, который характеризует приемник документальной коммуникационной системы, определим как отношение количества используемых читателями документов из рубрики к общему количеству документов в рубрике. Последним атрибутом, является время.

Итак, на экране компьютера в изометрии по трем осям координат откладываются значения трех атрибутов: атрибуты, характеризующие используемые количественные методы, компьютерные средства рубрик и экстенсивную характеристику связанности рубрики с другими рубриками. Полученная точка на экране обладает яркостью и цветностью, которые зависят от температуры рубрики и интенсивности библиографических связей рубрики с другими рубриками и, наконец, данная точка на экране может мигать, частота мигания этой точки зависит от интенсивности использования читателями документов из данной рубрики. Указанная точка на экране компьютера может перемещаться на экране в зависимости от времени. Естественно, что все остальные атрибуты также могут меняться в зависимости от времени. Схематически изображение объекта на экране компьютера можно представить на рис. 4, где N - количество документов в рубрике; М - количество документов, обладающих атрибутом - наличие количественных методов; К - количество документов с атрибутом - используемые компьютерные средства; S - количество библиографических ссылок рубрики с другими семью наиболее сильно связанными рубриками; Δ N - количество документов, поступивших в рубрику за время Δ t; F - количество документов, использованных читателями; t↓1, t↓2 - значения времени.

В общем, виде совокупность рубрик будет представлена в виде совокупности точек или точечной поверхности, которая осуществляет волновое движение во времени. Связь между рубриками отображается посредством связи точек, наиболее связанные точки будут иметь одинаковый цвет, а интенсивность связи будет определяться цветовым спектром. Для наиболее интенсивной связи будет использоваться красный цвет.

Документальный поток, поступающий в библиотеку, обрабатывается с недельным циклом, поэтому документально-информационный эксперт может наблюдать целостную "картинку" на экране с недельной динамикой, например, за предыдущий месяц, и обнаружить какие-либо изменения в ней. Если с точки зрения эксперта эти изменения существенны, то он может выявить, в какой j-й рубрике или подрубрике они произошли, а далее определить, за счет каких документов эти изменения произошли. Анализ текстов выявленных документов определяет окончательный диагноз этих изменений и устанавливает важность этих документов, их вес, ценность в рубрике с помощью какой-либо формальной системы.

ГПНТБ СО АН СССР (отдел автоматизированных систем обработки и анализа НТИ) ведет работы по созданию компьютерного рабочего места документально-информационного эксперта, реализованного на основе пакета прикладных программ "Эксперт" (ЕС 1840) на языке Паскаль (примерно 6000 операторов), в котором одним из фрагментов является вышеописанный модифицированный метод.

Данная реализация этого подхода к библиометрическому анализу в библиотеке создает предпосылки для организации в ней института экспертов, а также практическую возможность глубокой обработки данных документально-информационного потока силами документально-информационных работников на персональных компьютерах, включенных в интегрированную компьютерную систему коммуникации НТИ ГПНТБ СО АН СССР (16).

Литература

  1. Вurton Н.D. Use of virtual information for bibliometric analysis// Inf. Process and manag.- 1988. - 24. - N 1. - P. 39-41.
  2. Хайтун С.Д. Наукометрия: состояние и перспективы. - М.: Наука, 1983.
  3. Грановский Ю.В. Наукометричеокий анализ информационных потоков
  4. в химии. - М.: Наука, 1980. - 141 с.
  5. Вайятт Г.В. Когда информация становится знанием // Коммуникация в современной науке. - М., 1976. - С. 374-390.
  6. Использование библиометрических и других наукометрическнх показателей для анализа научной продуктивности // ЭИ. Информатика. - 1988. - № 21. - С. 6-16.
  7. Информатика и науковедение: Тез. докл. - Тамбов, 1988. - 437 с.
  8. 7. Проверка гипотезы Ортеги: факты и артефакты //ЭИ. - Информатика. - 1988. - № 18. - С. 7-8.
  9. Существует ли этика информатики? // РЖ. - Информатика. - 1988.-№ 6. - С. 13. - Реф. 6И83.
  10. Соколов А.В. Система информационно-коммуникационных наук // НТИ. Сер. 2. - 1985. - № 4. - С. 1-9.
  11. Копнин П.В. Гносеологические и логические основы науки. - М.:
  12. Мысль, 1974. - 588 с.
  13. Брукс Б.С. Теоретическая информатика во втором этапе механизации процессов информационного поиска // Теоретические проблемы информатики. - М.: МФД, 1979. - С. 12-25.
  14. Сидоров В.И. Наука об информации и ее проблемы // Международный форум по информации и документалистике. - 1983. - 8. -№ I. - С. 17-21.
  15. Куликовский Л.Ф. и др. Элементы теории информационных процессов. - Куйбышев, 1976. - 31 с.
  16. Кедров Б.М. Классификация наук. - М.: Изд. ВПШ и АОН при ЦК
  17. КПСС, I96I. - 471 с.
  18. Broadus R.N. Toward a definition of bibliometrics // Scientometrics, 1987. - 12. - N 5-6. - P. 373-379.
  19. Нестеров А.В. Информатика в Библиотеке // Создание и интеграция документальных и фактографических ИПС. - Новосибирск, 1988. - С. 20-40 / ГПНТБ СО АН СССР.
  20. Акофф Р., Эмери Ф. О целеустремленных системах. - М.: Сов. Радио, 1974. - 272 с.
  21. Бернал Дж. Наука в истории общества. - М.: Изд. Иностранной литературы, 1956. - 724 с.

 

!37

О.С.АЛЕКСАНДРОВА, В.В.ТЮРИКОВ

ВЗАИМОДЕЙСТВИЕ НЕПОДГОТОВЛЕННОГО ПОЛЬЗОВАТЕЛЯ С БАЗАМИ ДАННЫХ (ИЗ ОПЫТА РАБОТЫ ВЫЧИСЛИТЕЛЬНОГО ЦЕНТРА КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ СО АН СССР)

Сетевой режим работы отдельных информационных центров системы АСНТИ в сравнении с привычным локальным режимом взаимодействия с ЭВМ обеспечивает ряд преимуществ, среди которых следует отметить следующие:

В то же время, использование сетей в АСНТИ требует создания системы взаимодействия, ориентированной на неподготовленного пользователя, т.е. пользователя, профессионально не связанного с программированием и работой ЭВМ.

В настоящей статье рассматривается программный интерфейс взаимодействия пользователей с БД АСНТИ СО АН СССР через Вычислительный центр коллективного пользования (ВЦКП) (I), функционирующий в Сибирском отделении.

В настоящее время активно проводятся работы по созданию автоматизированных систем-посредников (АСП), позволяющих с помощью "дружественного" интерфейса использовать различные БД через сети ЭВМ.

Перед АСП ставится задача комплексной автоматизации процедур подготовки исходных данных, необходимых для формирования запросов и проведения поиска информации в выбранных БД.

Работы по созданию АСП проводятся для интерактивных систем поиска в удаленных БД (2). Постановка и формализация задачи информационного поиска предполагает создание структурированных наборов данных, включающих терминологическую базу пользователя на языке документов в БД, а также списки ограничений на поиск, отражающие лингвистические возможности информационно-поисковой системы (ИПС). Для этого разрабатываются алгоритмы автоматизированного построения терминологической базы пользователя на основе анализа текстов на естественном языке.

Для проведения поиска АСП осуществляет трансляцию подготовленной на 1-м этапе структурированной информации на информационно-поисковый язык (ИПЯ) используемой ИПС. Разрабатываются методы автоматизированного формирования запросов и автоматизации реализации стратегии поиска с использованием реакции БД. Можно упомянуть методы, разрабатываемые во Всесоюзном научно-исследовательское институте прикладных автоматизированных систем (ВНИИПАС) Ю.Р.Пантелеевым, основанные на обратной связи по релевантности. Или алгоритм взаимодействия пользователей с БД, используемый в системе АФОРИЗ в ЛИТНИИНТИ (авторы А.Г.Будрявичюс и Г.А.Ляшкус), согласно которому такое взаимодействие осуществляется посредством динамической процедуры принятия решений о стратегия поиска в БД.

Основной режим работы разрабатываемых систем - диалог на основе динамических меню, в которых список альтернативных действий соответствует текущей задаче с использованием развитых средств помощи. В качестве базовых технических средств для реализации "дружественных" интерфейсов все чаще используются персональные ЭВМ (ПЭВМ).

Постановка задачи информационного поиска с помощью существующего пакета прикладных программ (ППП), включает выделение множества терминов и отношений между ними в виде логических и позиционных операторов ИПЯ, и сводится к следующим операциям:

Термины связываются на основе парадигматических отношений (род-вид, ассоциация, синонимия). Практически почти всегда двух-трех понятий оказывается достаточно для обеспечения удовлетворительных характеристик поиска.

Логика построения описываемого интерфейса соответствует принятому процессу составления ПП. Его функциональные возможности и особенности реализации ориентированы на технологии ведения информационного поиска в условиях использования имеющихся технических и программных средств.

ВЦКП СО АН СССР использует пакетный режим прохождения задач на базовой ЭВМ, т.е. той ЭВМ, в которой сосредоточены основные информационные и вычислительные ресурсы системы. Сам этот пакет на обработку БД готовится на ЭВМ, к которой подключен терминал пользователя и которая играет роль периферийного центра обработки информации (ПЦО). Пакет оформляется в соответствии со стандартными требованиями операционной системы базовой ЭВМ и через систему передачи данных направляется в базовую ЭВМ для выполнения. В качестве базовой ЭВМ используется ЕС-1055 с 200 Мб - накопителями на магнитных дисках. В качестве периферийной ЭВМ - СМ-4, обеспечивающая диалоговую работу пользователя при подготовке данных в режиме разделения времени. В качестве программного обеспечения поиска используется разработанный А.А. Сметанниковым ППП СM-87, сходный по формату входных данных и ИПЯ (3) с широко используемым до недавнего времени в практике АСНТИ ППП АСОД.

Таким образом, пользователь АСНТИ для общения с различными БД системы должен хотя бы минимально знать язык управления заданиями базовой ЭВМ и систему команд периферийной ЭВМ, язык запросов эксплуатируемой ИПС и владеть еще рядом процедур, обеспечивающих безошибочное составление заданий на поиск релевантных документов.

Описываемый интерфейс упрощает и облегчает процесс взаимодействия неподготовленного пользователя с ИПС через сеть ВЦКП СССР. Простота взаимодействия пользователя с системой достигается за счет широкого использования меню-техники и организации вопросно-ответной структуры диалога (приложение I).

Технологический цикл получения информации из БД включает следующие операции, которые должны быть обеспечены автоматизированным интерфейсом:

Сценарий отражает формализованное описание постановки задачи поиска и включает терминологии предметной области и выбираемые пользователем ограничения. Сценарий затем преобразуется в формализованный запрос (ПП), по которому проводится поиск в БД (приложения 2, 3).

Оба эти процесса (выбор стратегии поиска и формулирование ПП) являются наиболее сложной частью технологии автоматизированного документального поиска (4, 5). В описываемом интерфейсе сложность их снижается тем, что пользователю предлагается на выбор тот или иной формат ПП со сценарием описания постановки задачи, трансформируемым затем в формализованный запрос на языке ИПС (приложения 4, 5).

После выбора пользователем из меню наиболее удобного формата ПП в ходе диалога реализуется процедура формирования сценария.

Под форматом понимается канонизированная структура ПП, обеспечивающая определенный вид поиска в БД. Виды поиска могут быть различными: по ключевым словам с логическими отношениями между ними, по элементам библиографического описания (БО) (например, по фамилии автора первоисточника, по индексу рубрикатора, по наименованию журнала и т.п.), по их комбинации.

При составлении сценария пользователю предоставляется возможность семантическую часть ПП (ключевые слова, элементы БО) сформулировать на естественном языке. А операторы, устанавливающие логические отношения между лексическими единицами, так же как и другие операторы языка запросов, проставляются автоматически в соответствии с выбранным форматом ПП.

Набор форматов охватывает все наиболее часто используемые на практике конструкции языка запросов и обеспечивает адекватность использования языковых средств действующей ИПС при обращении к БД, что является основным условием успеха поиска. Кроме того, вложенный в каждый формат фильтр-сценарий, освобождает пользователя от необходимости знать особенности структуры хранения информации в различных БД и их лексического своеобразия.

В системе реализованы различные виды контроля (программный, семантическая, ситуационная корректировка), которые позволяют пользователю гибко вносить необходимые коррективы. При формировании пакета на поиск производится контроль имени БД на наличие его среди имен доступных в данный момент БД. Системой поддерживается автоматическое обновление информации о доступных БД на тех ПЦО, на которых установлен описываемый интерфейс.

К существеньым ограничениям интерфейса следует отнести необходимость разбиения разветвленных логических конструкций ПП на простые составные, что замедляет формулировку ПП.

Однако представляется, что этот недостаток окупается обучающим свойством системы, облегчающим переход пользователя-новичка к самостоятельной работе в сетевом режиме.

Описанная система взаимодействия реализована на языке косвенных командных файлов ОС RSX-IIM. Отдельные программные блоки написаны на языке Ассемблер.

Система легко адаптируема к различиям ИПС. В случае перехода ACHТИ на работу под управлением другой ИПС необходимо произвести соответствующие замены конструкций ПП в программных модулях, ответственных за формирование файлов запросов.

Реализованная система является практическим инструментом, который облегчает знакомство конечного пользователя с технологией информационного поиска, повышает надежность его работа с БД в условиях сети, обеспечивает оперативное получение необходимой информации в удобной для пользователя форме.

Описанный интерфейс является развитием предпринятой ранее попытки реализации подобного подхода с помощью системы ДИЗА (6).

Практический опыт работы с интерфейсом подтверждает возможность его удовлетворительного использования в сетевом режиме эксплуатации.

В заключение подчеркнем, что вследствие недостатка внешней дисковой памяти поиск через описанный интерфейс в условиях функционирования АСНТИ СО АН СССР возможен только в режиме текущего оповещения.

Ретроспективный поиск проводится с магнитных лент. К нему целесообразно приступать только после того, как отлажена система текущего оповещение. Программа ретроспективного поиска является дополнением к описанному интерфейсу и реализует алгоритм формирования пакета на поиск в базах данных, расположенных на магнитных лентах, с внесением необходимых в каждом конкретном случае спецификаций этих баз.

Схема взаимодействия пользователя с документальными базами данных по описанной технологии приведена в приложении 6.

Приложение I

Уровни меню

АСНТИ СО АН СССР

1 СПРАВОЧНАЯ ИНФОРНАЦИЯ

2 СОСТАВЛЕНИЕ ЗАПРОСА НА ПОИСК В БАЗЕ ДАННЫХ

3 ПОЛУЧЕНИЕ РЕЗУЛЬТАТА

4 ЗАВЕРШЕНИЕ РАБОТЫ С АСНТИ

 

СПИСОК СПРАВОЧНЫХ ФУНКЦИИ:

1 ПРОСМОТР ИНСТРУКЦИИ ПО РАБОТЕ С СИСТЕМОЙ В РЕЖИМЕ ВЦКП

2 ПРОСМОТР ОПИСАНИЯ СУЩЕСТВУЮЩИХ БАЗ ДАННЫХ

3 ПРОСМОТР СОСТАВА ДОСТУПНЫХ В НАСТОЯЩЕЕ ВРЕМЯ БАЗ ДАННЫХ

4 ЗАВЕРШЕНИЕ РАБОТЫ СО СПРАВОЧНЫМИ ФУНКЦИЯМИ

 

РАБОЧИЕ ФУНКЦИИ СИСТЕМЫ:

? ПОКАЗАТЬ ПЕРЕЧЕНЬ РАБОЧИХ ФУНКЦИИ

0 ФОРМИРОВАТЬ НОВЫЙ СЦЕНАРИЙ

1 ПОКАЗАТЬ КАТАЛОГ СЦЕНАРИЕВ

2 ПОКАЗАТЬ КАТАЛОГ ЗАПРОСОВ

3 УДАЛИТЬ СЦЕНАРИИ С ЗАДАННЫМ ИМЕНЕМ

4 УДАЛИТЬ ЗАПРОС С ЗАДАННЫМ ИМЕНЕМ

5 ОБ"ЕДИНИТЬ НЕСКОЛЬКО СЦЕНАРИЕВ В ОДИН

7 КОРРЕКТИРОВАТЬ ( ПРОСМОТРЕТЬ ) СЦЕНАРИИ

8 КОРРЕКТИРОВАТЬ ( ПРОСМОТРЕТЬ ) ЗАПРОС

9 ФОРМИРОВАТЬ ЗАПРОС НА ОСНОВЕ СЦЕНАРИЯ

10 ПЕРЕДАТЬ ЗАПРОС НА ВЫПОЛНЕНИЕ

11 СОЗДАТЬ "ПАСПОРТ"

I2 ЗАВЕРШИТЬ РАБОТУ С РАБОЧИМИ ФУНКЦИЯМИ

 

ФУНКЦИИ, СВЯЗАННЫЕ С ПОЛУЧЕНИЕМ РЕЗУЛЬТАТА

1 ПОЛУЧИТЬ РЕЗУЛЬТАТ

2 ПРОСМОТРЕТЬ РЕЗУЛЬТАТ НА ТЕРМИНАЛЕ

3 РАСПЕЧАТАТЬ РЕЗУЛЬТАТ

4 ПОКАЗАТЬ КАТАЛОГ РЕЗУЛЬТАТОВ

5 УДАЛИТЬ РЕЗУЛЬТАТ

6 ЗАДАТЬ ОПОВЕЩЕНИЕ

7 ОТМЕНИТЬ ОПОВЕЩЕНИЕ

8 ЗАВЕРШИТЬ РАРОТУ ПО ПОЛУЧЕНИЮ РЕЗУЛЬТАТА

 

Приложение 2

Пример сценария, соответствующего ему поискового предписания и заглавной части пакета задания (для БД, отличных от БД "Физика")

БАЗА!ДАННЫХ НЕФИЗИКА

ЗАГ!СТРОКА ВОДНЫЕ РАСТВОРЫ ХЛОРИДА ЛИТИЯ

ФОРМАТ Р

ТЕРМИН ВОДН.Р-РЫ

ТЕРМИН ЛИТИЙ ХЛОРИД

СОСТ!ЗАПРОС НЕТ

 

//VCSM6502 JOB (6502,6502,5,,,9),'АЛЕКСАНДРОВА',MSGCLASS=V,

// REGION=350K,MSGLEVEL=(0,0),CLASS=J

/*SETUP ASNTI,CHEM01

// EXEC PSKSM,PR=6502,BD=CH2488,NPCO=09

//PP.SYSUT1 DD *,DCB=BLKSIZE=80

TITLE 650210 ВОДНЫЕ РАСТВОРЫ ХЛОРИДА ЛИТИЯ;

@1 ВОДНЫЕ & P & РЫ(+4);

@2 ЛИТИЙ & ХЛОРИД(+3);

@R @1 & @2

//

Приложение 3

Пример сценария, соответствующего ему поискового предписания и заглавной части пакета задания (для БД "Физика")

БАЗА!ДАННЫХ ФИЗИКА

ЗАГ!СТРОКА ПЛАЗМЕННОЕ ОСАЖДЕНИЕ ДЛЯ И-ТА ТЕПЛОФИЗИКИ

ФОРМАТ IF

СЛОВА CHEMICAL DEPOSITION

РУБРИКА FTMC

РУБРИКА FTHA

РУБРИКА FTMA

РУБРИКА XRHW

ОТНОШЕНИЕ И

СОСТ!ЗАПРОС НЕТ

ЗАГ!СТРОКА ПЛАЗМЕННОЕ ОСАЖДЕНИЕ

ФОРМАТ IF

СЛОВА PLASMA DEPOSITION

РУБРИКИ LTHA

ОТНОШЕНИЕ ИЛИ

СОСТ!ЗАПРОС НЕТ

 

//VCSM6502 JOB (6502,6502,5,,,9),'АЛЕКСАНДРОВА',MSGCLASS=V,

// REOION=350K,MSGLEVEL=(0,0),CLASS=J

/*SETUP ASNT,CHEM01

// EXEC PSKSM,PR=6502,DB=FI1288,NPCO=09

//PP.SYSUT1 DD *,DCB=BLKSIZE=80

TITLE 650210 ПЛАЗМЕННОЕ ОСАЖДЕНИЕ ДЛЯ И -ТА ТЕПЛОФИЗИКИ;

@S CHEMICAL & DEPOSITION;

@R РБШ PAR FTMC, FTHA, FTMA, XRHW;

@Z @S & @R;

TITLE 650211 ПЛАЗМЕННОЕ ОСАЖДЕНИЕ;

@S PLASMA & DEPOSITION;

@R LTHA;

//

Приложение 4

Форматы поисковых предписаний

Под форматом понимаем структуру поискового предписания ( пп ) , обеспечивающего определенный вид поиска в базе данных.

ФОРМАТЫ ПОИСКОВОГО ПРЕДПИСАНИЯ ( ПП ) ДЛЯ БД "НЕФИЗИКА"

О ПОИСК ПО ОДНОЙ ГРУППЕ ТЕРМИНОВ, О? -СПРАВКА;

I ПОИСК ПО РАЗЛИЧНЫМ ГРУППАМ ТЕРМИНОВ ( ДЛЯ ОТДЕЛЬНЫХ СЛОВ ), I? - СПРАВКА;

Р ПОИСК ПО РАЗЛИЧНЫМ ГРУППАМ ТЕРМИНОВ ( ДЛЯ СЛОВОСОЧЕТАНИЙ), Р? - СПРАВКА;

А ПОИСК ПО ФАМИЛИИ АВТОРА ПЕРВОИСТОЧНИКА, А? - СПРАВКА;

J ПОИСК ПО НАЗВАНИЮ ЖУРНАЛА, J? - СПРАВКА;

RО ПОИСК ПО ОДНОЙ ЛОГИЧЕСКОЙ ГРУППЕ ШИФРОВ РУБРИКАТОРА ВИНИТИ, RO? - СПРАВКА;

D ПОИСК ПО ДЕСКРИПТОРАМ, D? - СПРАВКА;

L СВОБОДНОЕ ФОРМУЛИРОВАНИЕ ПОИСКОВОГО ПРЕДПИСАНИЯ НА ЯЗЫКЕ ЗАПРОСОВ СИСТЕМЫ, L? - СПРАВКА.

 

 

ФОРМАТЫ ПОИСКОВЫХ ПРЕДПИСАНИЙ (ПП) ДЛЯ БД "ФИЗИКА"

OF ПОИСК ПО ОДНОЙ ГРУППЕ ТЕРМИНОВ, OF? - СПРАВКА;

IF ПОИСК ПО РАЗЛИЧНЫМ ГРУППАМ ТЕРМИНОВ ( ДЛЯ ОТДЕЛЬНЫХ СЛОВ ),IF? - СПРАВКА;

А ПОИСК ПО ФАМИЛИИ АВТОРА ПЕРВОИСТОЧНИКА, А? - СПРАВКА;

J ПОИСК ПО НАЗВАНИЮ ЖУРНАЛА, J? - СПРАВКА;

FO ПОИСК В БД "ФИЗИКА" ПО РУБРИКАЦИОННЫМ ШИФРАМ, ПРИНАДЛЕЖАЩИМ К ОДНОЙ ЛОГИЧЕСКОЙ ГРУППЕ ИДЕНТИФИЦИРУЕМЫХ ИМИ ПОНЯТИИ. FO? - СПРАВКА;

FP ПОИСК В БД "ФИЗИКА" ПО РУБРИКАЦИОННЫМ ШИФРАМ , ПРИНАДЛЕЖАЩИМ К ОДНОЙ ЛОГИЧЕСКОЙ ГРУППЕ ИДЕНТИФИЦИРУЕМЫХ ИМИ ПОНЯТИЙ, FP? - СПРАВКА;

L СВОБОДНОЕ ФОРМУЛИРОВАНИЕ ПОИСКОВОГО ПРЕДПИСАНИЯ НА ЯЗЫКЕ ЗАПРОСОВ СИСТЕМЫ, L? - СПРАВКА.

 

Приложение 5

Примеры справок, разъясняющие использование форматов

Формат "Р"

Выбранный вами формат обеспечивает выдачу документов, которые содержат все перечисленные терминологические словосочетания одновременно (логическое отношение "И").

Сложные конструкци пп при использовании данного формата разбивайте на простые, в совокупности эквивалентные сложному пп

Пример:

пп типа [(а, в) и (с,d)] разбиваем на 4 пп: [(а) и (с)],

[ (а) и (d)], [(в) и (с)], [(в) и (d)]

Возможное дублирование донутентов по этим составным запросам устраняется программой печати системы

_п_0_м_н_и_т_е_!

Чтобы учесть все возможные словоформы в тексте документа можно делать право - и/или левостороннее усечение по корневой основе

Примр двустороннего усечения - * фтор*

Пример

- вы называете три терминологических словосочетания:

(водн. р-ры) и (литий хлорид) и (теплопроводность), т.к. в результате поиска в бд хотите получить документы, в которых все три словосочетания присутствуют одновременно.

Все термины указаны в нормализованной форме, следовательно, результатом поиска будут документы, в которых эти термины вероятнее всего присутствуют как дескрипторы

Формат "D"

Выбранный вами формат позволяет проводить поиск по дескрипторам. Дескрипторами называются термины или словосочетания, с помощью которых индексируется основное содержание документа. Т.е. дескрипторы классифицируют документ по существу рассматриваемых в нем вопросов. иными словами, дескрипторы составляют поисковый образ документа. они перечисляются в документе БД после заглавия и реферата

_п_0_м_н_и_т_е_!

Дескрипторы представлены в документе в нормализованном виде, т.е. всегда в именительном падеже

Рекомендуется переходить к поиску по дескрипторам после того, как проведен приблизительный поиск по всему тексту документа (т.е. по терминам, входящим в лексикон вашей проблемы), ориентированный на полноту выборки необходимые дескрипторы определяются при просмотре документов, полученных в результате такого поиска

В одном поисковом предписании вы можете назвать не более 4-х слов (отдельных терминов или терминологических словосочетаний).

 

 

Приложение 6

Схема взаимодействия пользователя с документальными базами данных через описываемый интерфейс (пцо - периферийный центр обработки, бвк - базовый вычислительный комплекс)

Литература

1. 0 программе работ по созданию сети информационно-вычислительных систем (центров) в Сибирском отделении СО АН СССР / Алексеев А.С., Елепов Б.С., Котов Б.Е., Метляев Ю.В. - Новосибирск:

ВЦ СО АН СССР. 1987. (Препринт № 734).

2. Проблема создания автоматизированной системы-посредника для информационного поиска в удаленных базах данных. - М., 1987. (Сб. науч. тр. / ВНИИ прикладных автоматизированных систем;

Вып. 4).

3. Александрова О.С., Бобров Л.К. Использование вычислительных средств коллективного пользования в АСНТИ СО АН СССР // Распределенные автоматизированные библиотечно-информационные системы и сети. - Новосибирск, 1986. - С. 96-101.

4. Маклейн Д.Д. Методические рекомендации по формированию поисковых предписаний и поисковых массивов в ИПС, использующих базу данных БК "Химия" и ППП АСОД (вариант 1-81). - Москва: ВИНИТИ, 1981.

5. Янко Т.Е. О некоторых соответствиях единиц естественного языка единицам языка запросов информационно-поисковой системы / НТИ. Сер. 2. Информационные процессы и системы. - 1987. - № 5.

6. Александрова О.С., Новиков А.А. Взаимодействие пользователя с библиографическими БД в сети ЭВМ // Вопросы информационной технологии 1-й очереди ГАСНТИ: Teз. докл. ХУI Bсеcoюз. науч. семинара "Систем. исслед. ГАСНТИ", г. Ярославль. - М., 1987.

 

 

!38

В.И. ТАНЦЕРЕВ

ЭЛЕКТРОННЫЕ ФАКТОГРАФИЧЕСКИЕ КАРТОТЕКИ ГПНТБ СО АН СССР

Самыми распространенными объектами предметной области "Библиотека" являются всевозможные фактографические картотеки. Большинство задач автоматизации библиотечных процессов сводится к созданию электронных фактографических картотек и средств работы с этими картотеками. В фактографических электронных картотеках, в отличие от документальных, отсутствует информационный поиск, но зато возможен быстрый доступ по ключам, а также возможность ввода/корректировки карточек в реальном масштабе времени.

Автоматизация, то есть создание электронных картотек, во многих случаях дает положительный эффект. Можно выделить два случая, когда достигается значительное сокращение трудоемкости при работе с картотеками.

Имеется значительное количество малоизменчивых картотек, изменения в которые вносятся однократно, обычно с периодичностью в один год, а затем информация из таких картотек печатается во многих экземплярах. К таким картотекам можно отнести следующие картотеки ГПНТБ СО АН СССР:

Основные затраты при автоматизации таких картотек приходятся на первоначальный ввод информации.

К другому типу можно отнести картотеки, в которые изменения вносятся постоянно. К таким картотекам можно отнести картотеку читателей ГПНТБ СО АН СССР, картотеку поступлений отечественной периодической литературы и др. Автоматизация таких картотек предъявляет повышенные требования, к технологическому и программному обеспечению. Так, если в традиционную картотеку внести изменения будет гораздо удобнее, чем в ее электронный аналог, то можно смело утверждать, что такая автоматизация не целесообразна. При автоматизации интенсивно изменяющихся картотек значительных затрат потребует не только первоначальный ввод информации, но и ведение картотеки, то есть введение в нее новой информации. Эффект от внедрения электронной картотеки будет достигаться за счет оперативного получения справочной и интегрированной информации. Решение об автоматизации подобной картотеки необходимо принимать в зависимости от того, насколько часто возникает задача получения информации и насколько она трудоемка. В ГПНТБ СО АН СССР автоматизированы все перечисленные выше картотеки.

Одной из основных задач при автоматизации библиотечных процессов является обеспечение "дружественности" программных средств. "Дружественность" программных средств предполагает комфортабельность интерфейса "пользователь - ЭВМ", высокую степень зашиты от некорректных действий пользователя, а также защиту от сбоев программы и оборудования.

Ниже описываются программные средства задач "Подписка на издания, распространяемые агенством "Союзпечать", "Регистрация поступающих периодических изданий", "Регистрация читателей", "Подписка на иностранные периодические издания". При разработке программ особое внимание обращалось на придание им свойств "дружественности".

Особенностью задачи "Подписка" являются жесткие сроки проведения подписки многими библиотеками на одной информационной базе. Поэтому обеспечение высокой скорости и технологичности автоматизированной подписки является необходимым условием успешного решения этой задачи.

Электронная фактографическая картотека в задаче "Подписка" - это каталоги "Союзпечати", дополненные сведения о подписке библиотек сети (региона). Документ этой картотеки состоит из следующих полей: индекс, заглавие, цена, а также 33 поля (в данной реализации) "Количество экземпляров подписки" - по одному полю на каждую библиотеку сети (региона). Вспомогательной картотекой "Подписки" является картотека сведений о библиотеках, проводящих автоматизированную подписку в данной системе.

Выходными документами для библиотеки, проводящей автоматизированную подписку, является несколько экземпляров заявки в "Союзпечать", а также распечатанные доставочные и абонементные карточки.

Каждый пользователь до собственно подписки проверяет (вводит) сведения о своей библиотеке. Диалоговая программа DLIB последовательно высвечивает на экран заготовки шапки и концовки заявки, абонементной и доставочной карточек. Пользователь при помощи клавиш управления курсором может внести свои данные или изменить представленные ему формы.

Подписка осуществляется последовательно каждой библиотекой с помощью программы DPODP . Пользователь, вызвав программу, сообщает свою сиглу и затем набирает индекс изданий. По заданному индексу на экране высвечивается индекс, заглавие, а также сиглы и количество экземпляров для всех библиотек, подписавшихся на это издание. Пользователь может откорректировать (ввести) заглавие и цену издания, а также количество экземпляров своей подписки на это издание, затем набирает следующий индекс и так далее. При эксплуатации "Подписки" нет ответственного за содержание каталогов "Союзпечати", изменения отражаются в картотеке общими усилиями подписчиков, каждый вносит изменения в репертуар подписки своей библиотеки. Скорость подписки во неоткорректированной картотеке пользователем средней квалификации - примерно 100 изданий в час.

Окончив диалоговый сеанс подписки, пользователь может получить так называемую предварительную заявку с подведенной итоговой стоимостью подписки. После проверки можно снова программой DPODP откорректировать свою подписку, распечатать предварительную заявку и т.д. Окончательно определив свой репертуар подписки, пользователь соответствующими программами подсистемы распечатывает нужное количество экземпляров заявки в "Союзпечать", абонементные и доставочные карточки.

Основная программа DPODP является модификацией файлового редактора FED (I). Пользователь может откорректировать любое доступное ему поле, набрав краткий (I символ) индентификатор

этого поля. В отличив от FED пользователь с помощью DPODP может откорректировать количество экземпляров подписки только своей библиотеки, набрав символ "П".

Автоматизированная подписка на одной информационной базе проводилась в течение нескольких лет ГПНТБ СО АН и библиотеками НИУ Новосибирского научного центра (ННЦ) и некоторыми другими библиотеками. Опыт эксплуатации показал "дружественность" и эффективность программных средств этой подсистемы.

Такую же технологию подписки предлагается использовать в задаче подписки на иностранные периодические издания. Разработано программное обеспечение этой задачи, и в 1990 году планируется проведение автоматизированной подписки. В качестве выходных форм взяты образцы листа заказа и индивидуальной фишки из (2). При разработке автоматизированной иностранной подписки возникла следующая проблема. Издания, распространяемые "Союзпечатью", идентифицируются своими индексами. Таких идентификаторов, не считая ISSN , у иностранных изданий нет. Но ISSN может быть неизвестен комплектатору на момент подписки. В связи с этим принято решение о введении внутреннего "плавающего" идентификатора периодического издания. Издания, на которые была подписка в предыдущий год, идентифицируются своими порядковыми номерами в картотеке иностранной периодической литературы, выписанной для ГПНТБ и библиотек НИУ СО АН СССР. На основе этой картотеки печатается соответствующий указатель, который рассылается всем библиотекам. Новые издания идентифицируются своими номерами в списке новых изданий, также рассылаемом подразделениям ГПНТБ и библиотекам НИУ СО АН СССР.

В задаче регистрации периодических изданий основным объектом является картотека поступающих изданий. На каждое издание заведена карточка, в которой указываются даты поступлений выпусков (номеров), откуда они поступили ("Союзпечать", "Книжная палата", по ведомственной подписке, докомплектование), а также в какое подразделение библиотеки они направляются.

При создании картотеки в начале года исходной является картотека за предыдущий год, откорректированная с помощью специальной программы и учитывающая результаты подписки на текущий год. Таким образом, в начале года создается заготовка электронной картотеки, которая заполняется и корректируется по мере поступления периодических изданий.

Документ такой картотеки состоит в общем случае из 70-ти полей, 60 из которых могут иметь длину 80 байт. В связи с этим в данной задаче реализована многоэкранная работа с картотекой. Диалоговая работа с картотекой, также как и в "Подписке", реализована с помощью модифицированной программы FED. Модификация касалась допустимого размера документа, а также некоторых элементов диалога.

На программные средства данной задачи возложено отслеживание лакун, а также различные статистические данные: сколько изданий поступило, сколько стоит, куда направлено, сколько закомплектовано и т.д.

Все программы печати выходных форы запрашивают период, по которому требуется выдать нужные сведения.

В задаче регистрации читателей в картотеку занесены в закодированном виде сведения о читателях и фиксируется дата записи/регистрации их в библиотеке. Особенностью данной задачи является большой объем картотеки (в настоящее время около 60 тыс. записей) . В связи с этим диалоговая программа дополнена специальными программами сжатия информации при помещении ее в картотеку. Paзмер сжатой записи равен 25 байт, а всей картотеки - 4000 блоков по 512 байт. Другой модификацией для данной задачи является упрощение метода доступа: регистрационные карточки читателей номеруются последовательно и помещаются в записи с соответствующими номерами.

Наличие электронной картотеки "Читатели" позволяет выдавать всевозможные таблицы, содержащие сведения о составе читателей ГПНТБ СО АН СССР, причинах их записи в библиотеку, количестве и составе записавшихся в различные периоды времени и т.д.

Кроме упомянутых выше электронных картотек в ГПНТБ СО АН внедрены и активно используются картотеки авторефератов, международного книгообмена, конференций и некоторые другие. Можно сказать, что электронные картотеки вошли как эффективный инструмент в производственную деятельность, и без них уже немыслима нормальная работа библиотеки.

Электронные картотеки ГПНТБ СО АН СССР реализованы в основном на ЭВМ СМ-4. В настоящее время внутренний рынок быстро насыщается персональными ЭВМ (ПЭВМ). Начинает получать ПЭВМ и ГПНТБ СО АН. ПЭВМ более всего подходит для создания автоматизированных рабочих мест библиотечных работников, в частности для создания электронных картотек. При внедрении ПЭВМ в библиотеке встает проблема выбора базового программного обеспечения. Чаще всего в качестве инструментальных средств выбираются системы управления базами данных общего назначения: FOXBASE, RBASE, DBASE и т.д.

Отметим следующие недостатки, препятствующие эффективному использованию этих средств в библиотечных приложениях: допускаются только записи фиксированной длины, отсутствуют средства информационного поиска, отсутствуют специализированные средства ввода/вывода документов.

Другим распространенным инструментом является SDS - ISIS -микро-разработки ЮНЕСКО. Этот пакет ориентирован на создание информационно-поисковых систем, и поэтому его использование затруднено для работы с интенсивно изменяющимися картотеками. В частности, при корректировке записи в базе данных откорректированная запись заносится на новое место, а дисковая память освобождается только при реорганизации базы данных.

Наиболее предпочтительными для библиотечных приложений представляется использование ИРИС (Инструмент для Разработчика Информационных Систем) разработки ИНТЕРКВАДРО. ИРИС является документально-ориентированной системой обработки информации и обладает характерными чертами, как СУБД, так и ИПС, что особенно важно при автоматизации различных библиографических картотек.

Литература

  1. Танцерев В.И. Программное обеспечение ввода и корректировки документов в библиотечных задачах // Создание и интеграция документальных и фактографических ИПС. - Новосибирск, 1988. -С. 82-87.

2. Каленов Н.Е., Красикова О.А. Автоматизация процессов заказа зарубежных периодических изданий в Библиотеке по естественным наукам АН СССР // Совершенствование комплектования книжных фондов. - М., 1987. - С. 87-93.

 

 

 

 

 

 

!39

Л.В. АРТАМОНОВА

ЭЛЕКТРОННАЯ КАРТОТЕКА ТРУДОВ СОТРУДНИКОВ ГПНТБ СО АН СССР

Государственная публичная научно-техническая библиотека Сибирского отделения Академии наук (ГПНТБ СО) СССР является не только крупнейшим библиотечным, но и научным центром, сотрудники которого проводят исследования в различных областях знания: библиографоведения, патентоведения, информатики и т.д. Возникшая задача организации электронной картотеки трудов сотрудников библиотеки является типичной для любого научного учреждения. Естественно, что существует много программных пакетов, реализующих поставленную задачу. Картотека "Труды сотрудников ГПНТБ" организована на базе пакета прикладных программ (ППП) "Электронная картотека" для ЭВМ СМ-4, разработанного в отделе автоматизированных систем ГПНТБ СО АН СССР (I, 2). Уже накоплен достаточный опыт по использованию ППП "Картотека" при организации базы данных из однотипных документов: например, база данных авторефератов. Задача организации электронной картотеки трудов сотрудников требует работы с разнотипными документами.

Создание такой картотеки совместно с сотрудниками отдела научной и методической работы ГПНТБ предусматривало следующие цели:

Формат документа в картотеке

Каждый документ картотеки определяется схемой, состоящей из набора полей (форматов). Каждое поле имеет свой номер и, при необходимости, название. При разработке формата документа (то есть при задании тех или иных полей) в ППП "Картотека" целесообразно учитывать следующие моменты:

1. Для сокращения времени на поиск предпочтительно выделять в отдельные поля информацию, необходимую при поиске документа. Заметим, что для картотеки "Труды сотрудников" этот довод не существенен, так как объем массива документов небольшой (для института в среднем он составляет не больше тысячи документов, время поиска - несколько секунд).

2. Для сокращения времени на сортировку предпочтительно выделять в отдельные поля информацию, участвующую в этом процессе (например, год издания).

3. Разделение информации на поля соответственно частям библиографического описания (БО) позволяет удобно строить выходную форму БО как совокупность полей формата и разделителей.

Исходя из вышеизложенного, в описываемой базе данных принят следующий формат:

I. Номер документа

номером является целое число (1-99999), автоматически присваиваемое документу при вводе в картотеку. Документы хранятся в последовательном файле, поэтому номера расположены в возрастающем порядке (документ с меньшим номером не может располагаться за документом с большим номером).

2. Вид документа

предусмотрены следующие виды документов:

КН - книга

УК - указатель

ГМ - газетный материал

СТ - статья из сборника, журнала

РЦ - рецензия

МК - материалы конф. и тезисы докладов

АР - автореферат диссертации

ПР - препринт

СБ - сборник

В дальнейшем предусматривается возможность введений дополнительных типов документов: депонированная рукопись, авторское свидетельство и др.

3. Заголовок библиографического описания

4. Заглавие

5. Сведения, относящиеся к заглавию

6. Сведения об ответственности

7. Источник

8. Выходные данные

9. Номер выпуска (для журналов и сборников) или дата (для газетного материала)

10. Страницы

11. Остальное описание

12. Аннотация

13. ББК

14. Шифр хранения

15. Смысловой ключ

служит для идентификации документа, пока не используется

16. Статус документа ("печ" или "маш")

17. Международный шифр

Пример

Гузнер И.А., Маслова А.Н. Лидер библиотечной науки // Наука в Сибири. - 1988. - 16 июня. С. 4.

Обзор научной деятельности ГПНТБ СО АН СССP

Формат документа:

  1. 25

2. ГM

3. Гузнер И.Л., Маслова А.Н.

4. Лидер библиотечной науки

7. Наука в Сибири

8. 1988

9. 16 ИЮНЯ

I0. 4

12. ОБЗОР НАУЧНОЙ ДЕЯТЕЛЬНОСТИ ГПНТБ СО АН СССР

В процессе работы возникла необходимость зафиксировать формат библиографического описания для какого-либо вида документа. Так, например, для статьи из сборника, изданного в ГПНТБ, принят следующий формат учреждения (ГПНТБ СО АН СССР):

ГУЗНЕР И.А. ЕКАТЕРИНБУРГСКАЯ ШКОЛЬНАЯ БИБЛИОТЕКА В СВЕТЕ ПРОСВЕТИТЕЛЬСКОЙ КОНЦЕПЦИИ В.Н.ТАТИЩЕВА // РУССКАЯ КНИГА В ДОРЕВОЛЮЦИОННОЙ СИБИРИ: ГОС. И ЧАСТ. Б-КИ. НАУЧ. ТР. / ГПНТБ СО АН СССР. - НОВОСИБИРСК, 1987. - С. 38-52.

То есть обязательно указывается место издания сборника. Основные возможности

ППП "Картотека" позволяет определить формат ввода-хранения документов для конкретной базы данных, ввод и редактирование (программа WWOD), поиск документа в соответствии с заданным условием по любым полям (программа poisk ). Для получения необходимых выходных форм информации разработаны специальные программы вывода:

- SPIST Программа выдачи на экран терминала.

SPIST запрашивает в диалоге имя файла, в котором подготовлены нужные документа, а также режим вывода (с номером или нет) и осуществляет страничный вывод документов на экран терминала.

- SPISP Программа выдачи документов на печать.

SPISP запрашивает имя файла, режим вывода (с номером или нет), ФИО автора, если необходим титульный лист, и осуществляет вывод библиографического списка на печатное устройство

- KART Программа выдачи каталожных карточек на печать.

KART запрашивает в диалоге имя файла и режим вывода, осуществляет вывод документов из указанного файла на устройство печати в виде каталожных карточек (8 карточек на лист).

- VAK Программа выдачи документов в виде списка научных трудов для ВАК. VAK запрашивает имя файла, ФИО сотрудника и выводит таблицу с документами на устройство печати.

При работе программ печати вывод информации может быть осуществлен на любое свободное устройство (например, как на LPI, так и на LPO).

Технология работы

1. По мере поступления документов (15-20 в месяц) библиотечный работник осуществляет ввод данного набора.

2. Проверка введенных документов, корректировка.

3. Печать каталожных карточек, подшивка в папку - бумажный эквивалент картотеки, карточки расположены упорядоченно по их номерам, то есть так, какова их физическая последовательность в файле.

4. Печать карточек для каталогов. Библиотечные работники считают целесообразным на начальном этапе внедрения компьютерной технологии продолжать вести свои традиционные каталоги. Поэтому для всех вновь поступивших документов печатается необходимое количество карточек (программа KART ), которые затем расставляются в соответствующие каталоги.

5. По желанию сотрудников библиотеки работники ОНИМРа добавляют в электронную картотеку документы, которые могут не входить в фонд ГПНТБ, либо были созданы в период, когда данный человек работал в другом учреждении и т.д. Для этого заинтересованный сотрудник приносит дополнительный список своих трудов, а библиотечные работники помещают указанные документы в картотеку. По желанию сотрудника ему могут быть выданы любые из перечисленных форм печати списков своих трудов в течение 2-3 дней.

6. Копирование файла с документами на магнитную ленту (I раз в месяц), осуществляется программистом.

Условия эксплуатации и ресурсы

Для функционирования картотеки трудов сотрудников необходимо:

1. ЭВМ типа СМ-4, снабженная операционной системой RSX-IIM. 4.2.

2. Дисковая память для хранения программ - 243,5 кб.

3. Дисковая память для хранения одного документа не превышает 0,5 кб (переменная величина).

4. Магнитная лента для копирования.

5. Устройство печати Д-180.

6. Терминал СМ-7209, желательно на рабочем месте библиотечного работника.

7. Инструкция пользователя.

Условия передачи

Описанный пакет программ может быть передан любой организации,

представившей гарантийное письмо или заключившей хоздоговор с отделом автоматизированных систем ГПНТБ СО АН.

Прогноз развития

Предполагается в дальнейшем:

Литература

1. Елепов Б.С., Нестеров А.В. Интегрированная компьютерная система коммуникации НТИ ГПНТБ СО АН СССР. - Новосибирск, 1989. -43 с. - (Препр. / ГПНТБ СО АН СССР 89-3).

2. Нестеров А.В., Недодиров B.C. Электронная библиографическая картотека // Создание и интеграция фактографических и документальных ИПС. - Новосибирск, 1988. - С. 65-70.

 

!40

Е.И.СКИРГАЙЛО, М.Н. КАЮШИНА, М.Н. ЖАБИНА

ОПЫТ ОРГАНИЗАЦИИ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ИЗБИРАТЕЛЬНОГО РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ В БИБЛИОТЕКЕ ХИМИЧЕСКОЙ ЛИТЕРАТРЫ АН СССР

Одним из основных направлений деятельности Библиотеки химической литературы АН СССР - структурного подразделения Библиотеки по естественным наукам АН СССР (БЕН АН СССР) является обеспечение ученых достоверной и полной информацией о новейших достижениях отечественной и зарубежной химической науки. Хорошо организованное и четко налаженное информационно-библиографическое обслуживание позволяет обеспечить потребителей количественно меньшей и качественно более ценной информацией, необходимой в процессах научного исследования (т.е. ускорить сбор, поиск, переработку и использование информации).

Появление ряда новых технических возможностей для накопления и переработки больших объемов информации стало рассматриваться как кардинальное решение информационных проблем науки. Разрабатываемые сегодня автоматизированные системы должны обеспечить оперативный и избирательный поиск требуемой информации в различных местах ее сбора и хранения. Кооперация научных библиотек и органов информации позволяет не только обеспечить ученых и специалистов научно-технической информацией, но и предоставить ее в нужные сроки и в удобной для потребителя форме.

Наиболее рациональной формой доведения текущей информации до потребителя является система ИРИ (избирательное распространение информации), которая позволяет регулярно предоставлять абонентам сведения о новой литературе в соответствии с их запросами при постоянно действующей обратной связи. Однако в последние годы появились высказывания ученых о преимуществе тех или иных информационных систем, в частности о преимуществе диалогового ретро-поиска перед системой ИРИ.

Специалисты Библиотеки химической литературы, АН СССР, основываясь на многолетней практике работы с АИПС, считает, что ИРИ должно являться составной частью всей системы информационного обеспечения науки и выполнять присущие только этому виду обслуживания функции.

Существует мнение, что всякое адресное распределение информации является системой ИРИ. Между тем последним присущи следующие особенности:

1. Максимальная полнота информации, поступающей в систему ИРИ, и, напротив, выход ее к абоненту, согласно постоянно действующим запросам, в свернутом виде (т.е. система должна охватывать по конкретной тематике все источники, благодаря чему абонент может быть уверен, что в соответствии с его запросами получит полную информацию и будет освобожден от дополнительных ее поисков).

2. Краткость и лаконичность направляемых абоненту сообщений, несущих информацию о материалах, содержащихся в первоисточнике (т.е. абонент должен затрачивать минимальное время на ознакомление с информацией, но иметь возможность при этом сделать вывод о полезности первоисточника для работы и принять решение о его затребовании) .

3. Гарантированное обеспечение абонентов первоисточниками в короткие сроки по сообщениям, получившим оценку "нужен первоисточник" (конечный, но очень важный этап в технологической цепочке работы системы ИРИ).

4. Оперативность доведения информации (т.е. максимальное сокращение времени от момента появления документа до сообщения о нем абоненту системы ИРИ).

5. Надежно организованная обратная связь, обеспечивающая непрерывный контроль за работой всей системы (для устранения обнаруженных неисправностей).

Исходя из вышеназванных требований авторы рассматривают систему избирательного распространения информации, функционирующую в Библиотеке химической литературы АН СССР.

На первом этапе организации этой работы была создана система ИРИ на основе фонда Библиотеки химической литературы АН СССР. Однако стремительный рост числа научных журналов и постоянное увеличение цен на международном рынке в той или иной степени влияют на деятельность библиотек. Все чаще приходится отказываться от необходимых изданий. В конечном итоге система ручного ИРИ перестала удовлетворять ученых-химиков.

Поэтому с 1981 г. библиотека перешла на текущее информирование в рамках автоматизированной системы (АС) "Наука", разработанной в БЕН АН СССР и позволяющей использовать магнитные ленты ВИНИТИ. Вся система имеет двойной контур: первый - обеспечение ученых-абонентов вторичной информацией по тематическим постоянно действующим запросам, второй - предоставление необходимых им первоисточников по талонам обратной связи ИРИ.

БЕН АН СССР - наиболее крупный получатель магнитных лент ВИНИТИ по естественным наукам. В БЕН магнитные ленты конвертируются из ГКФ в формат ИПС АСОД, каждому документу в данном выпуске баз данных присваивается внутрисистемный номер, указывается пароль и сроки возврата обратной связи. Таким образом, библиотеки АН СССР получают магнитные ленты, информационный массив которых соответствует тематике запросов НИУ. В свою очередь библиотеки АН СССР, являясь абонентами АС "Наука", осуществляют ИРИ на специально отобранном для них массиве.

Библиотека химической литературы получает из БЕН БД, которые включают практически все основные документы по химии, за счет чего достигается полнота охвата информации на входе системы. Полнота и точность информации, выдаваемой абоненту по его запросу, зависит от ряда показателей.

Эффективное информационное обслуживание может осуществляться только на основе глубокого знания реальных информационных потребностей ученых. Научные библиотеки НИИ непосредственно связаны с потребителями информации, благодаря чему имеют возможность наиболее точно формулировать запрос специалиста и динамически его корректировать с помощью обратной связи.

От того, насколько правильно составлен запрос и оптимально выбрана стратегия поиска, зависят полнота и точность выдаваемой по нему информации.

Для оценки работы системы избирательного распространения информации в 1978 г. Библиотекой химической литературы был проведен анализ полноты и точности поиска в базе данных ВИНИТИ по химии.

За точность поиска принималась количественная характеристика, определяемая отношением между числом выданных релевантных документов, т.е. документов, отвечающих запросу, и числом всех документов, выданных в ответ на информационный запрос.

Полнота поиска определялась как количественная характеристика, выраженная отношением между числом выданных релевантных документов на данный информационный запрос и общим числом релевантных документов, содержащихся в поисковом массиве.

Чтобы определить полноту и точность поиска необходимо было опраделить релевантные документы, содержащиеся во всем поисковом массиве. Естественно, что это могло быть сделано только на массиве информации, адекватном базе данных ВИНИТИ, т.е. на массиве РЖ Химия.

Зная наполнение контрольной БД (выпуск магнитных лент "Химия") и полный перечень релевантных документов контрольного абонента в этой БД, составляется поисковое предписание (выполняющее роль постоянно действующего запроса), которое обеспечивает абсолютную полноту и точность. Однако поиск по такому запросу в новой БД может дать либо нулевую, либо неполную выдачу. Поэтому при отладке запроса на контрольной БД необходимо добиваться полноты при некотором уровне информационного шума. Это достигалось за счет "загрубления" запроса, путем расширения, как логической функции, так и списка ключевых слов.

Библиотекой химической литературы был проведен анализ полноты и точности поиска по системе ИРИ. Анализ проводился по 10 контрольным запросам на протяжении полугода (12 выпусков магнитных лент). По каждой выдаче на анализируемый запрос в каждом выпуске магнитных лент выводился коэффициент полноты и точности.

Средний коэффициент полноты по 12 выпускам магнитных лент равен 95-98%. Средний коэффициент точности - 35-77%. Столь большое колебание в величине этого коэффициента объясняется широтой интересов абонента. Чем шире содержание запроса, тем больше шума.

Но первоочередное значение для ученых института имеет достижение максимально возможной полноты, а это, как известно, сопряжено с повышением информационного шума. Достаточно высокий процент полноты свидетельствует об эффективности системы.

Однако анализ результатов поиска показал, что встречаются единичные документы, отмеченные как релевантные в РЖ Химия, но не вышедшие из БД на запрос (хотя ключевые слова из названия статьи были включены в запрос). Это можно объяснить следующими причинами:

Несмотря на отмеченные недостатки, в целом полученные объективные данные позволяют положительно оценить систему текущего информационно-библиографического обслуживания ученых-химиков.

Однако с точки зрения оперативности, система значительно уступает традиционным методам текущего информирования. Поступление в библиотеку БД по химии отстает от поступления первоисточников. Библиотека химической литературы располагает достаточным фондом профильной литературы, поэтому ученые имеют возможность знакомиться с основными журналами по тематике своих исследований на выставке новых поступлений значительно раньше, чем получают информацию из БД ВИНИТИ.

Еще одной проблемой, создающей трудности в работе с БД ВИНИТИ, является неритмичность их поступлений. По данным специалистов БЕН АН СССР максимум выдачи документов приходится на январь и на июнь-июль, что создает перегрузку системы, затрудняет обработку информации и доведение ее до абонентов.

Тем не менее, большинство ученых, начавших работу с системой, продолжают пользоваться ею, отмечая, что она имеет ряд преимуществ. Например, регулярное пользование системой помогает обнаружить новые источники информации и новых авторов, работающих по данной теме. Кроме того, полнота и регулярность информации позволяют ученому быть в курсе работ по интересующему направлению.

Абоненты очень высоко ценят также возможность оперативного получения через систему ИРИ первоисточников (или копий) заинтересовавших их документов (при минимальных затратах на оформление заказа). В АС "Наука" предусмотрен заказ первоисточников по специальному внутрисистемному номеру, присвоенному каждому документу. Для абонента заказ сводится к отметке одной из оценок обратной связи, для библиотеки НИУ - к передаче в БЕН АН СССР на перфокартах (или магнитных носителях) списка кодов абонентов и номеров заказанных документов, отсутствующих в ее фонде.

Обработка данных обратной связи, поступающих от абонентов, позволяет не только корректировать запросы и заказывать копии первоисточников, но и оценивать качество комплектования фондов Библиотеки химической литературы АН СССР.

Подводя итоги, следует сказать, что использование БД ВИНИТИ для организации ИРИ - важный и полезный канал информирования ученых о достижениях мировой науки, но решение вышеуказанных проблем значительно повысит эффективность системы.

Литература

  1. Скиргайло Е.И., Каюшина М.Н. Опыт организации информационно-библиографического обслуживания ученых в Библиотеке химической литературы АН СССР // Интенсификация информационно-библиотечного обеспечения фундаментальных научных исследований на современном этапе: Сб. трудов / БЕН АН СССР. - М., 1988. - С.107-112.
  2. Васильчиков В.В., Глушановский А.В., Каленов Н.Е. Опыт работы с базами данных ВИНИТИ // НТИ. Сер. I. - 1988. - № 5. - С.10-13.

 

!42