ПРОБЛЕМЫ ОРГАНИЗАЦИИ ТРУДА И УПРАВЛЕНИЯ БИБЛИОТЕЧНО-БИБЛИОГРАФИЧЕСКИМИ ПРОЦЕССАМИ

Ю.А.СПРИЖИЦКИЙ, Е.И.ГОЛОВАНОВ, А.А.АЛЕКСАНДРОВ

МАТОБЕСПЕЧЕНИЕ ДЛЯ ПОДДЕРЖАНИЯ БАЗЫ ДАННЫХ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ НА ПЭКВМ ИСКРА-226

База данных нуклеотидных последовательпостей (БДНП)

Основу записи БДНП составляет нуклеотидная последователъность, записываемая в виде непрерывной цепочки символов А, Т, G, С (обозначающих четыре нуклеотида, из которых состоят природные молекулы ДНК) и символа N (неизвестный нуклеотид). Каждая запись БДНП наряду с нуклеотидной последовательностью содержит ее формализованное описание. Описание разделяется на отдельные поля, каждое из которых содержит следующую специфическую информацию о последовательности:

ID - уникальный идентификатор, краткое имя, тип, форма и длина;

** - служебный, закрытый для пользователя комментарий;

DТ - дата ввода или редактирования информации;

DE - развернутое описание последовательности;

KW - ключевые слова;

OS - видовая и подвидовая спецификация организма-источника ДНК;

ОС - классификация организма-источника ДНК;

HS - видовая и подвидовая спецификация организма-хозяина;

НС - классификация организма-хозяина;

RN, RА, RT, RL - полная ссылка на библиографический источник;

СС - неформализованный комментарий для пользователя;

VR - вариации, мутации, неопределенности на последовательности;

FT - таблица функциональных особенностей;

SQ - нуклеотидный состав,

ID, **, DT, DE и т.д. - метки соответствующих полей.

 

Ввод и редактирование полей

 

Ввод и редактирование записей в БДНП реализуется на ПКЭВМ ИСКРА-226 с помощью следующих специализированных программ.

Программа SFQU позволяет вводить и в интерактивном режиме проверять правильность ввода последовательности, постоянно контролируя на дисплее участки по 35 нуклеотидов в обе стороны от редактируемого места, проводить перенумерацию последовательности, инвертировать ее, собирать новую последовательность из фрагментов ранее введенных последовательностей и т. д. Последовательность записывается на гибкий или жесткий диск в специальный файл.

Программа DESC представляет собой специализированный диалоговый редактор для ввода описаний последовательности. Порядок, форма и внешнее оформление возникающих на дисплее вопросов полностью соответствует таковым в стандартных формулярах БДНП, откуда вводится информация. Программа автоматически компонует информацию в требуемом формате, контролирует наличие вводимых ключевых слов (поле KW) и названий организмов (поля OS, HS) в соответствующих тезаурусах, загружаемых вместе с программой с диска, по названию организма формирует поля OC, HC (классификация). Вместо ключевого слова или названия организма достаточно ввести только первые буквы, полностью его определяющие, после чего программа предоставляет возможность согласиться

 

 

Все это позволяет облегчить работу оператору, а также избежать ошибок в форматах полей, в строго фиксированных написаниях ключевых слов и таксономической классификации организмов. Описание записывается на гибкий или жесткий диск в текстовый файл.

Программа COMBI предназначена для редактора. Она позволяет создать запись БДНП из введенных ранее и записанных в отдельный файлы последовательности и ее описания. Перед записью на диск предоставляется возможность отредактировать информацию с помощью стандартного текстового редактора, включенного в программу.

 

Обмен данными

Пополнение центральной базы данных, хранящейся на ЕС ЭВМ, а также обмен с другими базами осуществляется на ПКЭВМ ИСКРА-226 посредством магнитной ленты. Программа TAPE позволяет переносить данные с ленты на диск и обратно. Перенос может осуществляться как в диалоговом, так и в пакетном режиме. Возможны следующие варианты переноса:

  • прямое копирование записей БДНП без переформатизации;
  • переформатизация из формата Европейского банка нуклеотидных последовательностей (Гейдельберг) в формат Всесоюзного банка;
  • переформатизация из формата Всесоюзного банка нуклеотидных последовательностей в формат, удобный для работы в СУБД ПОИСК 1.2, используемой в ВИНИТИ для предоставления возможности работы с базами данных в режиме теледоступа.

Поиск и каталогизация

Имеются две возможности осуществлять поиск в БДНП на ПКЭВМ ИСКРА-226:

  • в режиме теледоступа с базой данных ВИНИТИ (СУБД ПОИСК 1.2);
  • с помощью специализированной ИПС LOCUS, разработанной для работы с БДНП на ИСКРА-226. Система реализована на жестком диске. Она позволяет осуществлять поиск по 15 параметрам, как в отдельности, так и в любой их логической комбинации. В системе предусмотрена возможность каталогизации по идентификаторам, ключевым словам и библиографическим ссылкам.

Описанное матобеспечение используется в ВИНИТИ для поддержания БДНП Всесоюзного банка структур биполимеров.