Информационное обеспечение науки Новые технологии

О.М. Гиацинтов,
Н.Е.
Калёнов, Е.И. Козлова

(МГТУ им. Н.Э. Баумана, Москва)
(БЕН РАН, Москва)

МОДЕЛЬ ФОРМИРОВАНИЯ
ОПТИМАЛЬНОГО ЗАКАЗА
НА НАУЧНЫЕ ЖУРНАЛЫ
ДЛЯ ФОНДОВ БЕН РАН

Как известно [1,2], научные журналы являются основным источником информации для ученых, занимающихся фундаментальными исследованиями; без постоянной работы с ними в современных условиях невозможно получение важных научных результатов. Поэтому журналы составляют основную часть фондов многих научных библиотек, в частности, фонд БЕН РАН, возглавляющей централизованную библиотечную систему (ЦБС), на 80% состоит из журналов, 80% которых, в свою очередь, составляют зарубежные.

Задача отбора перечня журналов, подлежащих заказу, является одной из важнейших для научных библиотек; в последние годы она существенно усложнилась в связи с резким сокращением финансирования. Если до 1992-го года средняя экземплярность зарубежных журналов в ЦБС БЕН равнялась трем (при том, что выписывались все наиболее важные - мировые научные журналы), то сейчас не обеспечивается формирование и половины сложившегося за многие годы "репертуара" зарубежных журналов в одном экземпляре.

В этой ситуации в БЕН исключительно остро встала проблема формирования оптимального (в смысле максимального соответствия информационным потребностям ученых) фонда журналов в условиях постоянного сокращения финансовых ресурсов, решению которой посвящена настоящая работа.

Для решения задачи формирования оптимального журнального фонда необходимо построение математической модели, позволяющей численно оценить качество каждого журнала, который потенциально может быть включен в заказ. Очевидно, что показателем такого качества является информационная ценность (информативность) журнала для пользователей - сотрудников РАН. Если предположить, что тематика и качество публикаций данного наименования научного журнала достаточно стабильны (резкие изменения случаются достаточно редко и, как правило, сопровождаются изменением названия журнала), информативность журнала может быть оценена с помощью трех наиболее распространенных групп показателей:

  • данные о спросе на журнал за предыдущие годы по всем каналам обслуживания;
  • данные о количестве библиографических ссылок на данный журнал;
  • экспертные оценки журнала, выставленные ведущими учеными в данной области.

При этом необходимо учитывать, что для политематической библиотеки, каковой является БЕН РАН, при формировании заказа на журналы необходимо обеспечивать информационную поддержку всех научных направлений (естественно, в зависимости от их важности). Поэтому необходимо рассматривать не абсолютную информативность журналов (которая, в значительной степени определяется спецификой данной научной области), а относительную - внутри каждого тематического раздела. Соответственно, дополнительной проблемой является разработка методики предварительного распределения ассигнований между тематическими разделами, без которого может оказаться, что максимальная информативность фонда обеспечивается заказом журналов лишь по одному-двум научным направлениям.

Таким образом, разрабатываемая модель должна решать следующие задачи:

  • распределение ассигнований между тематическими разделами;
  • формирование оптимального заказа - перечня журналов, обладающих максимальной информативностью для пользователей по каждому научному направлению в рамках ассигнований, выделенных на эти направления;

Модель базируется на автоматизированной системе БЕН РАН (АС НАУКА), в рамках которой накапливаются данные о спросе на все издания по всем каналам обслуживания и данные о распределении читателей по библиотекам ЦБС; в базах данных АС НАУКА содержатся все сведения о заказах на журналы за каждый год, начиная с 1990 г. В основе тематического распределения журналов лежит специально разработанный рубрикатор БЕН РАН, успешно используемый в технологии с 1980 года (см., например, [3]).

Рассмотрим каждую из двух составляющих модели.

Распределение ассигнований
между тематическими разделами

Для распределения денежных средств между тематическими разделами используются следующие показатели:

  • значимость конкретного тематического направления в структуре РАН;
  • коэффициенты стоимости изданий по каждому научному направлению.

Значимость тематического раздела определяется относительным количеством пользователей, в работе которых необходима информация по данной тематике (в дальнейшем, возможно, будут использованы другие показатели, связанные, например, с государственными целевыми программами). Основой для получения этого показателя служат данные о количестве ученых в НИИ РАН и профиле комплектования библиотеки данного института.

По каждому разделу науки (i), отраженному в сводном тематическом плане комплектования (ТПК) ЦБС БЕН РАН, выбираются библиотеки, заинтересованные в материалах по этому разделу, и определяется суммарное количество читателей этих библиотек (Ki). Относительная значимость тематики (Ti) определяется как

Коэффициенты стоимости изданий по каждому научному направлению (Di) определяются по формуле

,

где Sj - средняя стоимость журнала по i-той тематике,

S - средняя стоимость всех журналов.

Средние величины рассчитываются на основе массивов данных подписки за предыдущие годы. Как показывает анализ, они оказываются достаточно стабильными, несмотря на ежегодное удорожание журналов.

Доля ассигнований, выделяемая на i - тое тематическое направление определяется как

,

где V - общая сумма средств, выделенных на заказ журналов.

Формирование оптимального заказа

Для формирования оптимального заказа необходимо численно выразить информативность каждого журнала и сопоставить с его ценой. Для определения информативности в системе БЕН РАН в настоящее время используются следующие данные:

.

В дальнейшем предполагается к этим данным добавить показатель цитируемости журналов по данным Института научной информации США.

Для обеспечения сравнимости различных показателей и удобства вычислений вместо абсолютных значений каждого показателя используются внутри каждого тематического раздела относительные величины. Кроме того, при расчетах учитываются поступления журналов.

В общем случае информативность каждого журнала (Ij) определяется как

Здесь символ "~ " над параметром означает его относительную величину; Ri - весовые коэффициенты, характеризующие сравнительную значимость того или иного параметра при вычислении информативности журнала. Выбор этих коэффициентов представляет отдельную задачу, и от него существенно зависит конечный результат.

В рассматриваемой модели показатель копирования с ВНП определен как базовая оценка и принят равным 1. Остальные коэффициенты (за исключением коэффициента при экспертной оценке) определяются через отношения соответствующих показателей к количеству копий, заказанных на ВНП.

Пользуясь данными, накопленными в АС НАУКА, можно получить списки журналов, ранжированные в порядке убывания их информативности. Вообще говоря, порядок следования журналов в этих списках зависит от весового коэффициента для экспертных оценок. Однако, как оказалось на практике, влияние этого коэффициента при реальных экспертных оценках незначительно (это объясняется тем, что более высокие оценки получают более спрашиваемые журналы). Выбор весового коэффициента для экспертных оценок определялся, исходя из опыта комплектования. В качестве модели оптимального комплектования был взят массив подписки на зарубежные журналы за 1990 год. Это было время наименьших финансовых ограничений и налаженных связей с достаточно большим количеством экспертов. Коэффициент, обеспечивающий максимальное соответствие рассчитанного по модели списка журналов подписки 1990 года, оказался равен 0,1.

Определение информативности и получение ранжированного (рекомендательного) списка журналов является начальным этапом процесса формирования заказа на журналы на следующий подписной год. В этом списке, как правило, содержатся журналы, имеющие достаточно близкую (или равную) информативность, но существенно различные цены, поэтому необходимо определить правила формирования из полученных списков окончательных заказов, т.е. установить порядок распределения средств внутри тематических групп. Для этого предлагается разделить ранжированные списки журналов на зоны комплектования [4] и использовать различные методы отбора изданий в заказ в зависимости от зоны комплектования.

Выделяются три зоны информативности:

  • сверхактивная ("ядро") - включающая журналы, пользующиеся наибольшим спросом среди абонентов;
  • активная - в нее входят издания после сверхактивной зоны до назначаемой границы процента информативности;
  • пассивная - часть изданий, не пользующихся активным спросом и являющихся кандидатами на исключение из подписки.

Журналы из "ядра" должны включаться в заказ безусловно, журналы из активной зоны - выборочно, исходя из условий обеспечения максимальной информативности заказа.

Деление журналов на зоны осуществляется заданием процентов информативности "ядра" и активной зоны от общей информативности внутри тематических разделов.

Исходя из первоначально заданных границ зон, проверяется возможность включения в заказ всего "ядра". Если стоимость "ядра" превышает сумму ассигнований, то его границы уменьшаются до достижения заданной суммы, при этом происходит отсев менее ценных изданий внутри "ядра" по сравнению с теми, которые остаются.

Если границы "ядра" были уменьшены из-за недостатка денег, то при условии получения дополнительных ассигнований формирование следующего заказа начнется как продолжение предыдущего заказа и, в первую очередь, будет заполнено "ядро" до заданных границ.

В активную зону входят издания, стоящие в ранжированном тематическом списке после "ядра" до назначаемой границы информативности. В активной зоне издания ранжируются по увеличению их стоимости и включаются в заказ до исчерпания суммы, определенной для тематики и оставшейся после заполнения "ядра".

Оставшиеся от активной зоны какого-либо тематического раздела деньги передаются для другой тематики, в которой средств для заполнения активной зоны не хватает.

Моделированием формирования подписки на зарубежные журналы прошлых "благополучных" лет установлено, что оптимальной границей "ядра" являются издания из верхней части списка, имеющие до 40% информационной ценности.

Предложенная модель реализована в БЕН РАН с помощью специально разработанных в среде WINDOWS программных средств. В качестве входных данных используется информация, формируемая в АС НАУКА в процессе ее функционирования; величина ассигнований, выделенных на заказ изданий; граничные значения "ядра" и "активной" зоны. Результатом работы являются списки журналов, рекомендуемых для включения в заказ по каждому тематическому разделу. Программный комплекс допускает варьирование значений весовых коэффициентов. В процессе работы можно получить значения информативности любого журнала, абсолютные и относительные данные о спросе на отдельные журналы по всем каналам обслуживания, ранжированные в порядке убывания информативности списки журналов из фонда БЕН.

Отдельной проблемой, не охватываемой данной моделью, является заказ новых журналов. Он обычно осуществляется только на основе рекомендаций специалистов ознакомившихся с рекламными материалами. При наличии достаточного финансирования на заказ новых изданий выделяется некоторая отдельная сумма.

Литература:

  1.  Edward Evans. Developing Library and Information Center Collections.- 3rd ed.- Englewood, Col.: Libraries Unlimited, Inc., 1995. - P. 186-187.
  2.  Большой А.А., Захаров А.Г., Калёнов Н.Е. Информационно-библиотечные потребности ученых филиалов и научных центров АН СССР // Науч. и техн. б-ки СССР. - 1983. - № 8. - С. 13-18.
  3.  Указатель иностранных периодических изданий, выписанных централизованной библиотечной системой БЕН АН СССР в 1991 году. Ч.1. Алфавитный список. - М., 1990. - С. 348 - 354.
  4.  Столяров Ю.Н. Вторичный отбор.- Библиотекарь. - 1975. - № 6. - С. 55-56.