Информационное обеспечение науки Новые технологии

А.Н. Ефимов, Я.М. Голдовский

(Московский Государственный Университет Путей Сообщения)

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ
ОПЕРАЦИЙ
НАД БАЗАМИ ДАННЫХ,
СОДЕРЖАЩИМИ ОШИБКИ

Рассматривается случай, когда над данными, содержащимися в БД реляционного типа, совершаются операции, необходимые для формирования ответа на запрос. Исходные данные содержат ошибки. Исследуются типы и количественные характеристики ошибок в результатах операций. Теоретические результаты сопоставляются с результатами моделирования.

Одним из важнейших критериев качества базы данных является достоверность сведений, получаемых пользователями системы. Обычно конечных пользователей интересует обработанная некоторым образом информация. Ошибки в ней являются следствием ошибок в хранимой информации, ошибок в алгоритмах обработки, отказов и сбоев аппаратуры. В докладе демонстрируется, что, даже при безупречной работе алгоритмов и аппаратуры, вероятность ошибок в обработанных данных может существенно отличаться от вероятности ошибок в самих данных и зависит от запросов, адресуемых к базе данных.

Анализируя различные ошибки в хранимой в базе данных информации, можно выделить три вида несоответствия между истинным содержанием базы данных и ее фактическим состоянием:

Был проведен анализ влияния ошибок в операндах на ошибку в результате при выполнении различных операций реляционной алгебры - объединение, пересечение, разность, произведение, ограничение по предикату и т.д. - для случая, когда только один операнд содержит ошибки только одного типа, ошибка типа "замена" только одна. При этом исследовались типы ошибок и их количественные и вероятностные характеристики.

Анализ показал, что:

С целью проверки достоверности и применимости полученных формул разработана программная модель, реализующая основные операции реляционной алгебры над массивами чисел, имитирующими отношения, хранящиеся в базе данных.

Проверка полученных формул расчета вероятности ошибки в результате операций реляционной алгебры по вероятностям ошибки в операндах с помощью программной модели подтвердила достоверность данных формул при вышеуказанных допущениях.