ПРИМЕНЕНИЕ ЭВМ В ИНФОРМАЦИОННО - БИБЛИОТЕЧНОЙ ТЕХНОЛОГИИ

В.М. Хуторецкий

Институт органической химии РАН

Доступ к современной научно-технической информации через STN International

Рост объема научно-технической информации не оставляет практическому работнику реальной возможности лично знакомиться с первичной литературой, а в более объемистых отраслях знаний, как химия, медицина, биотехнология - даже и со вторичной, т.е. обзорной и реферативной. Для ретроспективного поиска сейчас используется третичная литература, т.е. индексы к реферативным журналам. Применение машинного поиска позволяет резко смягчить проблему поиска необходимой информации.

Технология прохождения информации от её создателя - автора к её читателю - пользователю представлена на схеме:

Telecom

primary literature - producer - vendor <-----> broker - user

Остановлюсь на конкретном примере взаимодействия одного из крупнейших вендоров мира в области научно-технической информации The Scientific and Technical Information Network (STN International) и Академии наук, выступающей в качестве не только коллектива пользователей, но и брокеров, т.е. посредников.

STN International - представляет собой объединение Chemical Abstracts Service, безусловного лидера в производстве разнообразной химической информации, и Fachinformationszentrum в Карлсруэ, специализирующегося на создании БД в области физики, математики, энергетики. Третий партнер, японский центр научно-технической информации, пока менее заметен и предоставляет доступ к японской литературе, зареферированной на английском языке. Как и другие вендоры мира, STN покупает право распространения целого ряда чужих БД с тем, чтобы предоставить своим клиентам максимум информации на едином командном языке. Всего в STN сейчас около 140 БД и это количество ежегодно растет. Все три учредителя и STN в целом являются not-for-profit organizations.

Благодаря этому STN, в отличие от чисто коммерческих фирм, имеет налоговые льготы и государственные дотации, что дает ей возможность предоставить целый ряд льгот, способствующих преодолению проблем снабжения российских пользователей современной научно-технической информацией.

Какие у нас обычно называют проблемы, когда заходит речь о доступе к зарубежной научной информации:

• Плохая связь

• Отсутствие твердой валюты.

Связь. Конечно, диалоговый доступ осуществить труднее и дороже, чем электронную почту. И это существенно, если Вы собираетесь лично проводить поиск. Но ведь это сомнительное удовольствие. Во всем мире, т.е. в развитом, цивилизованном мире, 85% online поисков из года в год проводят не сами пользователи, а брокеры. И это уже забота брокера организовать диалоговую связь, пользователь свой результат может получить по почте, если очень надо - по электронной почте. Почему брокер, а не сам? Парадокс - через брокера дешевле, поскольку у него не только связь налажена, его основное умение - провести поиск cost effective, с минимальными затратами. Если вы проводите поиск три-четыре раза в год, то проще и дешевле подробно обсудить с брокером задачу и оплатить его услуги по поиску, чем рисковать своей валютой и делать все самому.

STN, естественно, оплачивается валютой. Поэтому трудность вторая - валюта. Один аспект, специфический наш, - покупка валюты за рубли, решаем, были бы рубли. Другой, отсутствие денег вообще, тоже, как ни странно, решаем. Политика STN в предстоящем освоение нашего рынка определилась - это предоставление максимально возможных льгот, но с сохранением некоторого обязательного минимума оплаты, т.е. принципа, что информация не должна быть бесплатной. В результате STN объявила, что на те базы, которые она делает сама, а это целый ряд научных дисциплин и, я бы сказал, самых интересных баз данных, цены снижены, по сравнению с мировыми, в 5 раз. На многие бд, правда, тоже не на все, не вошедшие в STN-овский список, существуют значительные скидки для учебных и/или исследовательских институтов. В эти базы данных входят такие как Бейльштейн и Гмелин по химии, Inspec по физике, электротехнике и компьютерным наукам и т.п.

Я еще остановлюсь на ценах отдельно, но обычно приводимые аргументы о недоступности для нас западной информации кажутся, не хочу сказать несущественными, но вполне преодолимыми. В чем же тогда причины слабого использования зарубежных баз данных сегодня? На мой взгляд, это:

Первое и самое страшное - привычка к бесплатному доступу к информации, нежелание платить за услуги. Если применительно к программным продуктам такая привычка, при всех отрицательных, имеет и свои положительные стороны, скажем широкое знакомство с морем бесплатных программ, то применительно к научно-технической информации она создает только неинформированность, привычку жить со старым, зачастую еще студенческим, багажом всю жизнь.

Другая уродливая сторона того же явления - начальник, готовый дать деньги на компьютер, на CD-ROM reader, но не покупку информации, только на нечто вещественное, что останется в руках для отчётности.

Второе - Практическое отсутствие кадров с развитым вкусом к мгновенному получению самой современной информации, обусловленное отсутствием конкуренции. В лучшем случае традиционному ручному поиску учат в некоторых престижных химических ВУЗах, как Менделеевский институт или химфак МГУ, при этом упоминают о машинном. Физиков, даже в Физтехе, вообще не учат, как искать информацию, я уж не говорю о машинной. Наш центр уже учит студентов, аспирантов и даже одаренных школьников. STN предоставила центру права бесплатного использования своих БД для целей демонстрации и обучения пользователей. Поэтому если Вы хотите научиться сами или научить своих студентов - приходите. Это умение очень важно для понимания возможностей метода, даже если Вы не собираетесь лично сидеть за терминалом и проводить поиск.

Наконец слабая информированность о возможностях машинного поиска, недостаток рекламы. Этот недостаток я как могу, восполняю сейчас, поскольку реклама в средствах массовой информации стоит очень дорого.

В заключение хочу отдельно остановится на сравнении цен на традиционный и машинный поиск. Сложность такого сравнения состоит не только в том, что невозможно объективно вычислить некоторое отношение польза : цена и предпочесть тот способ, у которого это отношение выше. Дело еще и в том, что при сравнении ручного и машинного поиска содержание библиотек традиционно не включают в цену. Однако в солидной центральной библиотеке расходы на подписку только на зарубежные журналы составляют свыше десяти миллионов дол ларов. И если их никак не включать в расходы пользователя, сопоставляя только затраты времени (зарплаты) на ручной поиск и все расходы на машинный, то им трудно тягаться. Однако всюду и везде кто-то платит и за библиотеки, и за inhouse systems, т.е. за БД, принадлежащие пользователю и постоянно доступные его сотрудникам (это обычно БД на оптических компакт-дисках), и за интерактивный поиск в теледоступе. И если государство, научные общества или благотворительные фонды оплачивают содержание библиотек, да и самих научных учреждений целиком, то вполне естественно, если они же оплатят (целиком или частично) машинный поиск. Что и происходит во всем мире. Интерактивный поиск информации, впрочем, как и любой другой, стоит довольно дорого. Его составные части в некоем упрощенном и усредненном представлении для библиографических баз данных можно выразить как:

Z=ah+bw+cr

где Z - цена информации в одном сеансе поиска

h - время работы с БД (в часах)

w - количество слов (терминов) в запросе

r - количество документов (ссылок), выведенных на экран

a,b,c - коэффициенты из Price List

Кроме цены информации в стоимость сеанса поиска (S )

входят:

S = Z[(1-d) +T+B]

где d-скидка

Т - телекоммуникационные расходы

В - услуги посредника, специалиста по поиску.

По порядку величины Т=0,15 и В=0,1

Какова реальная ситуация с машинным поиском сегодня? Я уже упоминал, что STN на многие очень важные БД дает d=0,8. Кроме того, известно, что фонд Сороса оплатит телекоммуникационные расходы по доступу к сети Internet, тогда и Т будет равно 0. Достигнуты положительные результаты в переговорах о дальнейших очень существенных скидках за счёт того же фонда и в оплате информации, и услуг посредника. Вполне возможно, что в результате мы придём к формуле S = 0,05 Z. Тогда, даже очень серьезные и дорогие поиски будут пользователю стоить 6-7 долларов в пересчёте с рублевого курса.