Oracle - Приложение Б. Секреты мастерства

В этом приложении "рассматриваются три проблемы, связанные с проектированием, и предлагаются наши хитрые методы их решения. Это — мутирующие таблицы, проблема тысячелетия (проблема 2000-го года) и расширенный SQL.

Что мы имеем в виду, когда говорим о мутирующей таблицей? Этот термин вызывает в воображении часть базы данных, трансформирующуюся в страшного монстра, который выскакивает из экрана и нападает на вас. В действительности все еще хуже! Мутирующая таблица — это просто таблица, которая изменяется текущим предложением. С ней связан серьезный недостаток в функциональных возможностях триггеров Oracle.

Мы можем определить табличные триггеры для различных событий в базе данных. Эти события происходят или на уровне строки, или уровне предложения. Вспомним, что одно предложение может обрабатывать много строк. Например, при помощи предложения DELETE FROM MY_TAB можно обработать все строки таблицы MY_TAB. Следовательно, триггер BEFORE DELETE сработает один раз, а триггер BEFORE DELETE...FOR EACH ROW — один раз для каждой строки таблицы. Проблема мутирующих таблиц возникает, когда в триггере уровня строки производится попытка обратиться к таблице, которая изменяется или может изменяться тем же предложением.

Рассмотрим простой пример, в котором применяется вездесущая таблица EMP. Предположим, вы хотите ввести следующее правило: если начальник удаляется, то для всех его подчиненных значение столбца MANAGER устанавливается в NULL. Это отношение между служащим и его начальником является рефлекторным. Мы не можем ввести это отношение декларативно (ограничением PRIMARY KEY), потому что Oracle7 поддерживает только режимы RESTRICT (по умолчанию) и ON DELETE CASCADE. Поэтому мы разрабатываем третий режим, ON DELETE NULLIFY, который некоторые другие реляционные СУБД поддерживают как стандартный. Учтите, что каждый раз, когда мы не задаем (или не можем задать) ограничения для определения отношений, мы должны писать собственный код, вводящий все правила.

Давайте сначала возьмем очевидное решение и посмотрим, почему оно не работает. Пример, иллюстрирующий это решение, приведен ниже. Триггер emp_bdr не сработал из-за ошибки, связанной с мутирующей таблицей: он не может получить доступ к таблице, вызвавшей срабатывание триггера (в данном случае это таблица ЕМР).

Каковы же причины появления ошибки? У оператора SET и у операторов, которые работают со множеством строк, есть общее, причем довольно теоретическое, свойство. SQL не гарантирует порядок обработки строк, указанных в таком операторе. Из этого следует, что если известно, что таблица мутирует во время выполнения оператора SET, то любая ссылка на эту таблицу в триггере может даваться до или после того, как фактически произойдет изменение таблицы. Поскольку порядок, в котором вносятся изменения, не гарантирован, то не обязательно, что при каждом выполнении идентичных операторов с идентичными данными вы получите одни и те же результаты.

Как же преодолеть это ограничение и добиться того, что вы собрались сделать? Мы видели, как эту проблему пытались решить самыми разными способами — например, с помощью зеркальных таблиц или выделенного серверного процесса, который ждет сигнала на выполнение обновления, приводящего к ошибке. Эти решения очень сложны и опасны, поэтому мы предлагаем вам два простых метода выхода из данной ситуации.

Сначала рассмотрим метод, который крайне неэффективен и, следовательно, не рекомендован, но работает. Вы ждете, пока будет выполнено удаление, а затем просматриваете всю таблицу на предмет наличия строк, в которых столбец MGR содержит ссылку на несуществующего служащего. если такие строки есть, вы обнуляете в них значение столбца MGR. Как это реализовать, показано в ниже.

Несмотря на некоторую неэффективность, это решение обладает одним интересным свойством: оно устраняет предыдущие ошибочные ссылки, которые могли появиться вследствие выполнения программы в течение нескольких часов (или недель) со случайно отключенным триггером. При первом же удалении любого служащего запустится триггер, который обнулит качения столбца MGR, соответствующие несуществующему начальнику, для всех служащих, а не только для тех, начальники которых удалены в текущем операторе.

Такое "самоисправление" данных, на первый взгляд, может показаться очень хорошим делом, но оно влечет за собой нежелательные последствия. Каждый раз, когда удаляется один служащий, вся таблица EMP просматривается на предмет поиска служащих, работающих у несуществующего начальника. Для взятой в качестве примера таблицы с двумя строками это не важно, но для таблицы с несколькими тысячами строк производительность будет ужасно низкой. Мы должны каким-то образом ограничить поиск только теми строками, которые содержат ссылки на удаленного начальника, не создавая при этом проблему мутирующей таблицы.

Какие же еще методы можно использовать для разрешения этой проблемы? Второй (рекомендуемый) метод предусматривает умный трюк — сохранить удаленных служащих при помощи триггеров уровня строки и отложить поиск служащих, у которых удаленный служащий был начальником, до триггера AFTER уровня предложения. Для временного хранения удаленных служащих нужно использовать глобальную таблицу PL/SQL.

Что такое глобальная таблица PL/SQL? Пакеты PL/SQL могут содержать глобальные переменные. Они объявляются либо в пакете (если должны быть доступны извне), либо в теле пакета, но вне всех процедур и функций. В последнем случае их можно видеть только из данного пакета. Переменные обоих типов создаются при первом обращении к пакету (по любой причине) и остаются в памяти до тех пор, пока сеанс Oracle не разорвет соединение. PL/SQL версии 2.3 позволяет очищать таблицы, но для любого узла, на котором используется Oracle версий 7.2 и меньше, постепенное увеличение памяти для глобальных переменных пакетов может стать проблемой, которую необходимо учитывать при проектировании. В качестве одной из мер очищаемой таблице можно присвоить пустую таблицу такого же типа.

Код для реализации решения с помощью глобальных переменных пакета приведен в примере Б.1. Этот код состоит из пакета с тремя процедурами и трех триггеров на таблице EMP, каждый из которых запускается разным событием и вызывает одну из пакетных процедур. Одна переменная пакета является таблицей для удаленных EMPNO, а другая — индексом для нее. Триггер BEFORE DELETE уровня оператора просто вызывает процедуру, которая устанавливает этот индекс в нуль, т.е. логически очищает таблицу. Триггер BEFORE DELETE уровня строки передает первичный ключ (EMPNO) удаляемой записи, и он добавляется в конец таблицы. Триггер AFTER DELETE уровня оператора проходит по таблице и обнуляет столбец MGR для всех служащих, у которых удаленный служащий был начальником.

Хотя все это может показаться набором большого числа несвязанных фрагментов кода, это проверенный и эффективный метод. Однако здесь есть небольшой нюанс.

Что произойдет, если строки из таблицы EMP удаляются не в результате выдачи пользователем предложения DELETE для этой таблицы, а вследствие каскадного удаления из главной таблицы? Давайте введем в наш пример столь же вездесущую таблицу DEPT, закрепим всех служащих за соответствующими подразделениями, а затем удалим подразделение, в котором работает начальник (Big Boss). В результате Big Boss будет удален и все его подчиненные лишаться начальника. Скрипт для проверки этого механизма показан в примере Б.2.

Удивительно, но проблема мутирующей таблицы возникла вновь, однако теперь о ней сообщается в триггере уровня оператора. Причина в том, что Oracle рассматривает таблицу как мутирующую (находящуюся в несогласованном состоянии) во время выполнения рекурсивного SQL. Рекурсивный SQL — это любое SQL-предложение, которое генерируется самой Oracle при выполнении другого SQL-предложения. В данном случае Oracle сгенерировала предложение DELETE для таблицы EMP при выполнении операции ON DELETE CASCADE.

Таким образом, мы выявили еще одну проблему, поэтому давайте решать и ее. Нам нужно создать для таблицы DEPT такие же триггеры уровня операторов, как и для таблицы EMP, чтобы они срабатывали и при удалении в этой таблице, а также предотвратить срабатывание кода уровня операторов для таблицы EMP, если он вызывается в результате рекурсивного SQL. Решение приведено в примере Б.3. В заголовок пакета включена глобальная переменная (in_cascade_ind), которая будет сообщать, находимся мы в режиме ON DELETE CASCADE или нет. Триггеры уровня операторов для EMP изменены таким образом, чтобы они не срабатывали, если эта переменная пакета установлена. Также определены триггеры BEFORE DELETE и AFTER DELETE для таблицы DEPT, назначение которых — установка и сброс глобальной переменной пакета, а также запуск процедуры nullify_reporting_emps. Все новые и исправленные фрагменты в примере Б.3 выделены жирным шрифтом.

Мы победили мутирующую таблицу! Теперь у нас есть всеобъемлющее решение, позволяющее обойти эту проблему. Наш пример относится к операции DELETE, но мы можем, конечно, распространить продемонстрированный в нем метод и на операцию UPDATE. Этот метод дает надежное и эффективное решение проблемы мутирующих таблиц, не оказывая при этом существенного влияния на производительность.

Сегодня в эксплуатации находится очень много компьютерных систем, которые представляют собой бомбы с часовым механизмом, ожидающие сигнала на взрыв. Многие из этих бомб взорвутся, когда человечество будет вовсю праздновать наступление нового века. Фактически большинство компьютеров начнет сбоить гораздо раньше — так скоро, что ни о каком спокойствии не может быть и речи. Мы говорим о так называемой проблеме тысячелетия, или проблеме 2000-го года.

Что такое проблема тысячелетия? Когда проектировались и писались старые системы, никто не побеспокоился о том, чтобы для представления года использовалось минимум три (а лучше четыре) значащие цифры. Чтобы проиллюстрировать этот вопрос, давайте рассмотрим, как чаще всего представляют дату. Обычно мы пишем дату в таком виде: 01/01/98, 01 JAN 98, 1st January 98 и т.п. Будем ли мы писать дату как 01/01/00 или 01/01/000, когда наступит 2000-й год? Может быть, но выглядеть это будет странно, поэтому, скорее всего, мы будем писать дату как 01/01/2000. Во многих компьютерных системах в полях даты на экранах век не отображается, хуже того, они не позволяют вводить век при вводе дат. К тому же, как правило, в них подразумевается, что все даты относятся к двадцатому веку, и когда пользователь вводит 01/01/98, система неявно считает, что он имеет в виду 01/01/1998. Чтобы довести наши рассуждения до логического конца, скажем, что когда пользователь вводит 01/01/00, система считает, что он имеет в виду 01/01/1900 — а как раз это он (почти во всех случаях) и не имеет в виду. Вот в чем суть проблемы.

Одновременный выход из строя всех компьютеров в мире 1 января 2000 года — это хорошая тема для научной фантастики, но это все-таки, скорее, фантастика, а не реалии будущего. Многим системам уже сейчас приходится обрабатывать такие понятия, как срок действия, и хранить даты, отстоящие от сегодняшней на несколько лет вперед. Например, в приложениях, которые обрабатывают закладные на недвижимость или пенсии, уже приходилось учитывать этот момент. Проблема 2000-го года страшна для тех, кто еще о ней не задумывался и ничего не предпринимал, причем некоторые пострадают раньше других.

Ранее мы описали проблемы, которые могут возникнуть в прикладном ПО. Кроме них, несомненно, будут и проблемы с аппаратными средствами, операционными системами и системным ПО (включая большинство систем управления базами данных).

У всех компьютеров есть внутренние часы, выдающие текущую дату и время. Эти данные хранятся в аппаратных средствах обычно во внутреннем формате. В более старых машинах, страдающих от дефицита оперативной памяти, дата и время могут храниться в максимально компактной форме. Один из методов сжатия этих данных предполагал исключение века. Если вы работаете на старой аппаратуре, единственный выход — поговорить с ее поставщиком или провести эксперимент, установив какую-нибудь дату после 2000-го года.

В большинстве операционных систем есть вызовы функций, которые позволяют приложениям извлекать системную дату из аппаратуры. Операционная система должна преобразовать эту дату из внутреннего формата в формат, приемлемый для приложения. Это еще один потенциальный источник ошибок, особенно в старых операционных системах.

Системы управления базами данных хранят даты во внутренних структурах, чтобы пользователи могли обращаться к ним или строить на них запросы. Опять-таки для хранения обычно применяется внутренний формат, и между БД и пользовательским приложением производится преобразование, контролируемое СУБД. Нет сомнения в том, что некоторые из этих внутренних форматов и процессов преобразования дадут сбой, когда дело дойдет до поддержки дат в следующем столетии.

Каковы последствия для пользователей таких систем, сидящих на этих бомбах замедленного действия? Они могут быть катастрофическими и очень дорогостоящими! Давайте рассмотрим в качестве простого примера систему начисления оплаты за время работы консультантов. В конце периода система определяет, сколько дней провел консультант у клиента, и умножает это число на дневную ставку. Предположим, что консультант Смит работал у клиента "Джонс Индастриз" с 29 декабря 1999 г. по 2 февраля 2000 г. Система начисления оплаты неверно истолковывает вторую дату, введенную как 02-02-00, и считает, что это 2 февраля 1900 г. В процессе расчета она вычитает первую дату из второй, получает большое отрицательное число и умножает его на ставку консультанта. В итоге выходит еще большее отрицательное число.

В результате вместо отправки скромного счета за работу консультанта (консультанты никогда не посылают маленькие счета) мы шлем запрос на большой кредит, которого, без сомнения, заслуживает наша маленькая консультационная фирма. Вы считаете этот пример надуманным? Может быть, но он ясно показывает, какие неприятности могут произойти.

Теперь, когда понятно, какие проблемы могут возникнуть, если проблемой тысячелетия не заниматься, рассмотрим последствия для систем, в которых используется база данных Oracle. Как мы говорили в главе 7, в Oracle есть тип данных DATE, предназначенный для хранения даты и времени, причем время в этом случае хранится с точностью до секунды. Этот тип поддерживает даты в диапазоне с 1 января 4712 г. до н.э. до 31 декабря 4712 г. н.э. Во внутренних структурах Oracle хранит дату в упакованном формате как семибайтное целое, где на век, год, месяц, день, час, минуту и секунду выделяется по одному байту. Имея этот внутренний формат, Oracle неявно записывает век во всех датах, хранящихся в столбцах типа DATE.

В символьном или числовом формате даты в таблицах Oracle хранятся крайне редко, поскольку нет никаких веских причин избегать формат DATE. Единственное исключение из этого правила — ситуация, когда записывается только год (например, год регистрации автомобиля). Этот год может храниться в числовом или символьном столбце с двумя или четырьмя значащими цифрами.

Главная проблема с ПО, написанным для базы данных Oracle, состоит в конвертировании дат из внутреннего формата во внешний (отображаемый) и наоборот. В Oracle имеется механизм масок, позволяющий программисту задавать требуемый внешний формат даты. Это достигается путем "склеивания" набора компонентов. Вот некоторые примеры масок; DD Month YYYY, DD-MON-YY, DD/MM/YY, MM/DD/YY. Проблемы непременно возникнут, если в компоненте, обозначающем год, будет пропущен век, потому что в этом случае он считается равным 19. Специалисты Oracle были достаточно прозорливы, чтобы предвидеть эту проблему еще в 1993 г., когда была впервые выпущена Огас1е7, и ввели маску RR. RR предполагает двадцатый век, если год больше или равен 50, и двадцать первый век, если год меньше 50. Так, TO_DATE('04-JAN-05', 'DD-MON-RR') дает дату в 2005-м году, а TO_DATE('01-MAR-68'. 'DD-MON-RR') - дату в 1968-м году.

К сожалению, проектировщики и программисты не особенно быстро проникаются важностью этого новшества и использование YY в масках дат продолжает процветать. Вероятно, 2000-й год все еще кажется им далеким будущим, особенно с точки зрения компьютерной индустрии. Даже в тех организациях, которые были достаточно дисциплинированы и узаконили использование маски RR, где это возможно, или ввели стандарт YYYY, этой практики обычно придерживаются только в новых разработках или при переработке существующего кода. В эксплуатируемых Oracle-системах все еще остается много строк кода, где для дат применяется маска YY или вообще никаких масок нет.

Руководители только сейчас начинают осознавать всю глубину проблемы тысячелетия и потенциальную стоимость ее решения. Задача обнаружения всего исходного кода (в каком бы то ни было формате) и проверки каждой строки на предмет наличия возможных проблем колоссальна с точки зрения логистики и требует огромных трудозатрат. Некоторый исходный код неизбежно окажется не в нужном месте, а единственным выходом будет его переписывание.

Что нужно делать, если ваш начальник поставит перед вами, проектировщиком, задачу проанализировать проблему и обеспечить плавный переход в следующее тысячелетие? Прежде всего, не следует недооценивать масштабность этой задачи. Но как уменьшить потенциально колоссальные затраты на поддержку работоспособности существующих Oracle-систем при подходе к рубежу тысячелетий? Вот некоторые мысли на этот счет.

Ответ на этот вопрос таков: решить эту проблему в базе данных без корректировки прикладного кода можно лишь в очень ограниченной степени.

Представим экранную форму, в которую пользователь вводит дату в типичное для Oracle девятисимвольное поле (без века). Возьмем эту экранную форму из промышленной системы, перенесем на тестовую арену и поэкспериментируем с ней. Вводим в поле дату 31-DEC-00, выполняем фиксацию и запрашиваем эту запись — нам выдается 31-DEC-00. Но если мы воспользуемся SQL*Plus и запросим поле даты с веком, то увидим 31-DEC-1900. В результате мы приходим к выводу, что в этой экранной форме для века не используется маска RR.

Допустим, что вводимая дата — срок действия. Мы можем предположить, что она никогда не будет в прошлом. Учитывая это, можно написать триггер, который проверяет дату и, если она в прошлом, конвертирует ее в дату в 21-м веке. Вот код этого триггера:

Работает такой триггер нормально, но этот подход имеет ряд недостатков:

Более вероятно, что программа содержит локальные переменные, в которых хранятся представления значений дат, выбираемых из базы данных. Пример Б.4 содержит фрагменты кода из действующей системы, в которых может возникнуть проблема тысячелетия.

Эта проблема касается не только экранно-ориентированных программ, и следует учитывать ее влияние на отчеты, пакетные программы и код, резидентный в базе данных. Отчеты не должны создавать слишком серьезную проблему, потому что они обычно не обновляют базу данных. Кроме того, если они показывают только двузначный год, пользователь, скорее всего, сможет истолковать его правильно в контексте отчета. Однако некоторые регулярно запускающиеся отчеты могут обновлять таблицу, в которой регистрируется последнее время запуска отчета, а оно наверняка будет включать поле даты. Кроме того, может оказаться, что столбец даты, помещенный из базы данных в поле отчета, не содержащее век, используется в условии последующего запроса. В отчетах следует также внимательно следить за тем, как осуществляется обработка параметров, которые являются датами.

В пакетных программах проблемы обычно возникают там, где значения столбцов типа DATA помещаются в символьные переменные без века, а затем записываются опять в столбцы типа DATA базы данных или используются в условиях SQL-предложений. Увеличить размер этих переменных на два символа и заменить маски YY на YYYY довольно просто.

Таким образом, вряд ли возможно избежать необходимости добывать старый прикладной код Oracle-систем и копаться в нем. Конечно, может быть, кто-то только этого и ждет, чтобы переписать массу этого кода (и модифицировать его, например, для применения ГПИ). Однако можно ли назвать разумным предложение переписать все существующие эксплуатируемые системы? К сожалению, у нас может не быть иного выбора, если мы не найдем весь исходный код.

Однако оставим пока вопрос о тотальном переписывании и посмотрим, как с наименьшими затратами выполнить поиск и исправление проблемных фрагментов кода.

Как найти сегменты кода, которые в новом столетии могут преподнести проблемы? Прежде всего, необходимо поместить файлы исходного кода в общий каталог (или создать отдельный каталог для файлов каждого типа). Затем требуется выбрать средство поиска. В ОС Unix есть богатый набор средств и утилит для поиска последовательностей символов в файлах (назовем лишь три из них — grep, sed и awk).

Что же мы ищем? Сначала можно провести поиск всех строк, содержащих символы "YY". Число ненужных совпадений можно сократить, если искать символы "Y" только в строках, заключенных в одинарные кавычки (но при этом в некоторых комментариях может остаться Y). Поиск всех экземпляров "YY", не входящих в строку "YYYY", отсеет еще некоторое число ненужных совпадений, но не проскользнут ли в эту сеть нужные нам экземпляры? Можно расширить критерии поиска, включив экземпляр типа .-...-.., где точка является метасимволом, обозначающим один любой символ. К сожалению, в SQL очень слабая типизация данных, и он позволяет конвертировать тип DATE в другие типы и наоборот, не задавая ни маску, ни конвертирующую функцию. Такие случаи найти простыми средствами поиска трудно.

В некоторых элементах кода могут возникать проблемы с датами, не имеющие связи с Oracle. Например, мы можем искать файл операционной системы по дате его создания. Часть нашего приложения может быть shell-скриптом Unix, в котором используется утилита date. В этом случае нам придется искать строки, содержащие последовательность "%у". Таким образом, без глубокого понимания того, как работает приложение, мы никогда не найдем все эти вещи до тех пор, пока что-нибудь не начнет действовать неправильно. Это одна из причин, по которой тщательное тестирование имеет очень важное значение.

Если весь исходный код хранится в текстовых файлах, то в результате поиска будут найдены отдельные строки кода. Их можно проанализировать и некоторые проблемы устранить на месте. Поиск в двоичном файле вряд ли даст понятные результаты, но он все равно полезен, поскольку даст возможность установить, содержит ли SQL, встроенный в приложение, проблемные участки, о которых мы говорили. В конце поиска у нас будет список "рисковых" файлов исходного кода, требующих внимания, и мы получим общее представление о масштабе проблемы. После этого нужно лишь закатать рукава и устранить ее!

К сожалению, каждый случай придется рассматривать отдельно. Мы не можем слепо заменить все экземпляры YY на RR. Сначала следует убедиться в том, правильно ли предположение, что любая дата, в которой год меньше 50, относится к двадцать первому веку. Конечно, нельзя заменять все экземпляры YY на YYYY, не проанализировав последствия от увеличения размеров для операций присваивания значений переменным или полям экранной формы. Если размер всех полей дат в экранной форме увеличится, то, возможно, придется полностью ее переделать.

Если масштабы проблемы значительны, то следует подумать об автоматизации, особенно если в коде встречаются повторяющиеся структуры. Вновь упомянем утилиты Unix, подобные awk, идеально подходящие для этой цели. Если в операционной системе утилит для манипулирования строками нет, можно написать программу на 3GL (например, на С или Коболе), которая читает файл или набор файлов, выполняет ряд четко определенных изменений и записывает файл. Вот некоторые правила, которых необходимо придерживаться, выполняя автоматизацию процесса исправления кода:

Хорошая стратегия тестирования — ключ к успеху всего мероприятия. Если вам удастся убедиться, что все будет по высшему классу, то в новогоднюю ночь 1999 г. вы сможете спать (или веселиться) в полной уверенности, что ничего не произойдет. Протестируйте все модули, выявленные на этапе поиска, с использованием даты после 1 января 2000 г., чтобы посмотреть, что происходит, если код не изменять. Это даст возможность контролировать последствия проблемы и уверенность при повторном тестировании после исправления в том, что исправление было необходимым и эффективным.

Для каждого изменяемого исходного модуля выполните полное автономное тестирование. При этом следуйте плану автономного тестирования модуля (если он есть) и, конечно, добавьте к этому плану специальные тесты для проверки дат в 2000 г.

Затем перезапустите систему и набор интеграционных тестов и также добавьте тесты для проверки дат.

Настройте специальный экземпляр Oracle для тестирования проблемы тысячелетия. Использование отдельного экземпляра позволит для выбираемых с сервера данных установить фиксированное значение даты (с помощью параметра инициализации Oracle FIX_DATE; он будет влиять только на дату Oracle — SYSDATE), Приложения клиент/сервер могут применять локальные часы на клиенте, и для получения даты вам придется проверять вызовы операционной системы. В Oracle Forms существует различие между переменными $$DATE$$ и $$DBDATE$$: первая — это локальная дата операционной системы, а вторая — дата базы данных сервера.

Как мы упоминали выше, в некоторых элементах кода могут использоваться даты, не относящиеся к сфере действия Oracle (например, даты создания файлов). Самый безопасный механизм тестирования этих дат — использовать выделенную машину с переустановленной датой, хотя это не всегда удобно.

Было бы прекрасно найти действительно универсальное решение, но, скорее всего, это несбыточная мечта. Если вы сможете изобрести такое решение, то наверняка заработаете кучу денег, когда начнется паника, а начальство высунет голову из песка и поймет, что, сколько бы тел оно не бросило на эту амбразуру, момент будет вот-вот упущен! *

Сейчас на рынке появляются средства, которые якобы позволяют автоматизировать процесс адаптации к 2000-му году. Однако у нас имеются сомнения на этот счет. Кроме того, необходимо еще узнать, рассчитаны ли какие-либо из них на Oracle.

Никогда не рано начинать планирование и исследование. Попробуйте оценить масштабы проблемы в своих приложениях и, если у вас используются приобретенные продукты, поговорите с их поставщиками. Работайте методично, выявляйте проблемные участки, исправляйте их и тестируйте. Проверьте, как работает исправленный код, чтобы обеспечить себе спокойный сон в следующем столетии.

Как мы уже неоднократно говорили, проектирование заключается в поиске допустимого способа удовлетворения функциональных требований имеющимися средствами. Мы решили поговорить о расширенном SQL, поскольку видели ряд проектов, в которых использовались очень дорогостоящие методы удовлетворения "простого" требования о том, что пользователь должны иметь возможность как-то управлять действиями своей системы. Ясно, что такие возможности необходимо проектировать заранее. Наш опыт говорит, что попытки добавить их потом могут быть исключительно трудными в реализации. Главная сложность здесь — найти все зависимости.

Многие требования по настраиваемости системы под требования пользователей легко реализовать с помощью обычных методов проектирования и компоновки. Если цены могут изменяться, то мы сохраняем их в таблице PRICES. Если уровни скидок могут изменяться, то мы заносим их в таблицу DISCOUNT_LEVELS, и т.д. Как мы отмечали в главе 3, выявление таких случаев должно быть частью аналитической работы, а ее результаты должны отражаться в модели "сущность-отношение".

А что если отдел маркетинга хочет, во-первых, иметь возможность автоматически применять скидки, а, во-вторых, изменять установленные правила с уведомлением за сутки? Условие об уведомлении за сутки в действительности будет результатом неимоверных усилий с вашей стороны — ведь сначала пользователи захотят, чтобы правила можно было изменять по требованию, т.е. моментально.

Всякий раз, когда вам говорят, что изменению подлежит не правило, а значение элемента в правиле, можно рассматривать возможность расширяемости. Если затем вам скажут, что о будущем правиле в данный момент ничего не известно, то вы, конечно, не сможете реализовать его прямо сейчас. Вы либо обеспечиваете расширяемость, либо должны изъять это требование. Таким образом, мы пришли к самой сути проблемы: необходимо определить, не является ли данное требование настолько неопределенным, что вы не можете гарантировать его выполнение.

Представьте, что вы потратили два-три года на проектирование расширяемости системы скидок и в итоге обнаружили, что достаточную расширяемость не обеспечили — например, потому, что не могли предполагать, что кто-то захочет использовать первые три-четыре цифры номера телефона покупателя в правиле установления скидки. Разве может что-либо принести большее разочарование?

Для простоты изложения мы проигнорируем целый ряд вопросов, которые нужно решать в реальной жизни (и которые часто игнорируются и там), например:

Этой теме можно посвятить целую книгу и, вероятно, когда-нибудь мы так и сделаем, но на данный момент мы лишь хотим завершить свою книгу небольшим разделом о методах, позволяющих обеспечить свойство расширяемости в Oracle-приложениях, и рассказать о некоторых связанных с этим проблемах.

Когда мы имеем дело с просьбами обеспечить расширяемость, то различаем два типа расширяемости (пользователи, а во многих случаях и обслуживающий систему персонал часто такого различия не проводят). Это:

Схемная расширяемость всегда сопровождается алгоритмической, поскольку существующий код вряд ли будет ссылаться на объекты, которые отсутствовали в момент его создания, и нет никакого смысла вводить новые объекты данных, если никакая логика не будет на них ссылаться. Кроме того, схемная расширяемость всегда управляется данными, т.е. ее основой является хранение в базе данных определений новых элементов данных, которые затем выбираются и используются алгоритмами, генерирующими динамический SQL.

В среде Oracle существует три основных подхода к предоставлению пользователям возможности алгоритмической расширяемости: управляемый данными, управляемый представлениями и управляемый процедурами или функциями. В следующих разделах мы рассмотрим эти методы и сравним их с традиционным подходом.

В большинстве знакомых нам проектов, где делалась попытка обеспечить алгоритмическую расширяемость, использовался метод, управляемый, данными. В примере Б.5 показано определение таблицы, в котором реализовано некоторое правило, управляемое данными.

Проведя анализ этого кода, мы можем предсказать, что, хотя с его помощью можно обрабатывать простые правила, в которых задействуются только столбцы одной строки, вы столкнетесь с проблемами, когда понадобится сослаться на другие таблицы. Кроме того, кажется, этот код не способен обрабатывать круглые скобки и арифметические функции, подобные ROUND(). Приложив некоторые усилия, можно предложить схему, которая реализует эти возможности, а, может быть, и позволяет выполнять операции IF. В этом случае нам нужно найти не только способы реализации таблицы и средств ее сопровождения, но и правил, которые эта таблица описывает.

Такую реализацию обычно осуществляют с помощью простого, написанного специально под конкретный проект генератора кода, выдающего динамический SQL или динамический PL/SQL. Скорее всего, интерпретатор PL/SQL использует центральный процессор менее интенсивно, чем динамический PL/SQL. Однако, если в большинстве случаев будет генерироваться один и тот же анонимный блок, то вам окажет услугу разделяемая SQL-область. Это вряд ли будет иметь место, если значения столбцов вставляются в сгенерированный код буквально (как литеральная константа), и, к сожалению, очень немногие специальные генераторы кода поддерживают связанные переменные.

Гораздо более серьезной проблемой при таком подходе является то, что пользователей приходится учить, как сопровождать таблицу RULE_ELEMENTS, поскольку они, скорее всего, хотят выразить свое требование так, как это делается в электронной таблице. Возможно, легче научить их писать на SQL и PL/SQL, чем объяснить, как разлагать решение на элементы. Если вы и впрямь хотите потратить деньги впустую, можете также написать компилятор, который будет брать выражения, записанные в какой-то изобретенной вами нотации, и преобразовывать их в таблицу RULE_ELEMENTS. Однако не забывайте, что вам уже пришлось написать программу преобразования элементов RULE_ELEMENTS в SQL.

Надеемся, что этот материал ясно иллюстрирует невозможность использования такого метода на уровне проектов. И стоимость, и время реализации заказа слишком велики, а гарантия, что пользователи смогут реализовать каждое расширение, которое может потребоваться, отсутствует.

Существует более "прямой" метод, который может обеспечить большую гибкость. Таблицы, представленные в табл. Б.1, содержат не отдельные элементы формул, а сами формулы (на PL/SQL) и предложения, при помощи которых получают значения задействованных в них операндов (на SQL).

Конечно, при этом возникает целый ряд вопросов реализации, а общая производительность зависит от того, насколько хорошо осуществляется управление кэшами, позволяющее избежать постоянного повторного посещения одних и тех же строк. По этой причине, может, лучше определить при помощи таблицы FORMULA_PARAMS двухуровневую структуру SQL-предложений, способную возвращать набор значений, чтобы при однократном обращении к базе данных из всех посещаемых строк получать все необходимые данные.

Нам импонирует этот "прямой" подход, при котором предложения на SQL или PL/SQL хранятся в таблицах правил, а для их вставки в требуемый контекст в процессе обработки используется динамический SQL. Однако здесь также могут возникнуть проблемы с эффективностью, связанные с объемом работы по синтаксическому анализу. Кроме того, этот метод будет полезным только при условии, что какой-то пользователь сможет аккуратно выполнить все этапы разработки этого мини-проекта, реализующего новое правило. Конечно, это:

Как правило, выполняют только этап реализации (кодирования). В результате в руки пользователей попадает мощное и дорогое оружие, при помощи которого они начинают зверски уничтожать свои данные.

Метод проектирования, управляемый данными, не является панацеей от всех бед. Им не следует увлекаться, иначе можно спроектировать нечто настолько абстрактное, что его реализация окажется не под силу простым смертным (вроде нас с вами) или полученный код будет очень неэффективным. Возможно и сочетание обоих результатов.

Одному из авторов недавно достался в наследство код, который вполне можно считать примером "программной перегрузки". Каждое поле экранной формы размещалось в одном и том же месте и имело один и тот же размер. Войдя в редактор экранных форм, он сразу же воскликнул: "Как странно выглядит эта экранная форма!" После долгих поисков в коде стало очевидно, что размер и положение каждого поля изменялись динамически. Размер определялся размером соответствующего столбца базы данных, а код, выполняющий позиционирование полей, обеспечивал плотное их размещение. Название поля в экранной форме образовывалось из его имени. Этот код работал и давал определенное преимущество: можно было изменить размер столбца в базе данных или добавить в экранную форму новый столбец, не беспокоясь о размещении полей. Тем не менее, он работал очень медленно, и его невозможно было сопровождать. Структура и последовательность меню в это системе хранились в таблицах базы данных, а все меню создавались динамически, даже несмотря на то, что в самом инструментальном средстве имелась программа сопровождения меню. Настоящее расточительство!

Некоторые проектировщики в своих моделях данных тяготеют к еще большей абстракции. У них наблюдается тенденция к созданию метамоделей, которые совершенно невозможно заставить работать эффективно. Как выявить таких опасных проектировщиков? Нужно обращать особое внимание на столбцы, содержащие имя другой таблицы или столбца. Например, большая дуга в концептуальной информационной модели может быть реализована как один внешний ключ и столбец, содержащий имя таблицы, на которую этот ключ ссылается. Проблема решения, в котором применяется имя таблицы, на которую ссылается внешний ключ, состоит в том, что единственный способ выполнения запроса к такой структуре заключается в выборе каждой строки из главной таблицы и в использовании отдельного запроса для выборки подчиненных строк. Это неэффективно и трудно, особенно из такого инструмента, как Oracle Forms или PowerBuilder.

Oracle Payroll входит в комплект приложений Oracle Financials. Исходная спецификация продукта требовала, чтобы программа могла вычислять заработную плату для любой организации, позволяя (требуя) вводить формулы расчета зарплаты в процессе локальной адаптации без изменения кода базового продукта. Кроме того, необходимо было обеспечить возможность быстрого изменения правил в случае, когда клиент сталкивался с изменением в налоговом законодательстве или коллективных трудовых соглашениях.

Решение, рекомендованное одним из авторов этой книги и принятое группой проектировщиков, заключалось в хранении правил расчета в виде PL/SQL-выражений в пользовательских таблицах. Необходимо также было реализовать метасловарь внутри приложения, чтобы выражение "возраст служащего" или "уровень квалификации" в формуле, можно было преобразовать в имя таблицы, имя столбца и первичный ключ. Во время выполнения соответствующая формула выбиралась и просматривалась на предмет того, какие переменные для нее необходимы. Эти переменные затем выбирались из базы данных. Формулу затем можно было выполнять как анонимный блок PL/SQL. В организации со сложными правилами начисления зарплаты для одного служащего пришлось бы выполнять более чем 100 формул, и в Oracle версии 6 единственный способ, которым можно было выполнять этот PL/SQL, заключался в выполнении его как анонимного блока.

С функциональной точки зрения данный подход был почти идеальным. Мы говорим почти, так как из-за его сложности конечные пользователи испытывали серьезные трудности с настройкой и ее часто приходилось выполнять силами собственных специалистов или с привлечением консультантов по зарплате. Кроме того, на ранних стадиях эксплуатации возникали большие проблемы с производительностью. В главе 14 мы описываем некоторые приемы, которые позволили достичь в данном случае приемлемой производительности.

Не углубляясь в дебри реляционной теории, отметим, что средствами SQL всегда можно выбрать любой четко упорядоченный набор данных из любого набора таблиц. Поэтому при помощи представлений всегда можно (по крайней мере, теоретически) расширить правила для запросов путем внесения дополнений в представления, используемые для поиска, т.е. в представления, применяемые в триггерах и процедурах, которые выполняют обновление.

К сожалению, при этом существуют весьма реальные проблемы. Задаче определения необходимых представлений может быть трудной, а во многих случаях создать эффективное представление вообще невозможно. Чтобы дополнить представление, пользователи не только должны обладать хорошими знаниями SQL и структур данных, но и иметь как минимум некоторые DDL-привилегии. Наконец, даже при наличии этих расширений в последних версиях Oracle очень немногие представления, содержащие соединения, поддаются обновлению.

Проблему не решает и использование генераторов, так как очень немногие из них (если такие вообще существуют) могут выдавать определения представлений, требуемые для выполнения сложных расчетов с условиями.

Предположим, что для реализации новых функциональных возможностей нам придется применять традиционные приемы программирования. В данном случае мы можем попытаться ограничить количество изменений в приложении, сделав так, чтобы каждое атомарное действие, выполняемое приложением, было реализовано в исходном коде только один раз. Это означает, что все правила реализации процессов (в отличие от правил отображения) будут храниться в словаре данных как хранимые процедуры (или функции).

Это не что иное, как еще один призыв к инкапсуляции. Если впасть в крайности, то такой подход в результате даст приложение с очень больший числом очень маленьких сегментов кода. А это, в свою очередь, вызовет проблемы с производительностью и управлением проектом. Тем не менее, в определенных случаях затраты на создание множества маленьких функций могут хорошо окупиться, поскольку простые изменения и расширения функциональных возможностей можно делать в одном месте (оперативном словаре данных), причем с гарантией того, что они немедленно вступят в силу в масштабах всей системы.

Таким образом, значения, область действия которых ограничена приложением (например, максимальная длина кода счета), могут быть реализованы как функции в пакете, относящемся конкретно к данному приложению. Например:

С синтаксической точки зрения функции без аргументов ничем не отличаются от глобальных переменных пакета. В данном примере значение можно получить с помощью глобальной переменной пакета и конструктора в этом пакете (полагая, что в 0 часов 1 января 1998 года к базе данных не подключено ни одно приложение). Однако функциональный подход имеет более общий характер, так как позволяет заменять константу значением, требующим поиска в базе данных, несмотря на то, что во многих случаях поиск в базе данных потребует наличия параметров. Они всегда должны передаваться как часть вызова функции или выбираться внутри функции путем вызова других функции. Например, acc_values.curr_acno возвращает номер счета, который в данный момент обрабатывает приложение.

Несмотря на мощь, такие приемы предполагают изменение исходного кода проекта, и поэтому могут рассматриваться просто как четко ограниченная форма традиционного расширения приложения, которую мы рассматриваем ниже. Они могут также стать очень сложными, если явно простые функции приложения будут зависеть от взаимодействия нескольких сотен специальных функций.

Традиционный подход заключается в том, чтобы просто попросить отдел вычислительной техники или поставщика приложения внести изменения, необходимые для поддержки нового требования. Этот метод хорошо известен отделам работы с заказчиками и воспринимается с большим недоверием, так как процесс выполнения заказов часто растягивается на годы. Пользователи излагают свои просьбы, ведутся нескончаемые переговоры, в конце концов создается и отправляется что-то, что может удовлетворить, а может и не удовлетворить их потребности. Именно по этим причинам пользователи требуют обеспечения гибкости, которая позволит им самим изменять правила.

Если невозможно обеспечить полную расширяемость алгоритмов, то мы рекомендуем использовать процедуры и функции PL/SQL, несмотря на потенциальные проблемы с производительностью.

Мы работали над приложениями, в которых задействовались и "самодокументированные" данные и правила, управляемые данными. Эти приложения работали (в установленных пределах), но, честно говоря, мы не можем рекомендовать никакой другой метод, кроме управления всеми действительно новыми требованиями в рамках сопровождения приложений. В процессе проектирования мы можем (чтобы продвинуть пользователей еще хотя бы на шаг вперед) лишь четко сформулировать, чего можно достичь в проектировании с помощью методов, управляемых данными. Вместе со сравнительными оценками затрат на обеспечение ограниченной и расширенной гибкости этого может оказаться достаточно для того, чтобы убедить спонсоров проекта согласится на менее претенциозную спецификацию.

Мы хотели бы завершить книгу утверждением, которое советуем вспомнить в случае, когда ваша задача как проектировщика покажется вам неразрешимой, — оно отражает истинную причину проблемы:

* Мы хотели дать здесь небольшой материал о том, что увеличение числа работников, решающих ту или иную проблему, не обязательно приведет к быстрейшему ее решению, но подумали, что раз вы начали читать эту книгу, то уже знаете это.

Знаете ли Вы, что объектно-ориентированное сборочное программирование - это разновидность сборочного программирования:
- основанная на методологии объектно-ориентированного программирования; и
- предполагающая распространение библиотек классов в виде исходного кода (obj) или упаковку классов в динамически компонуемую библиотеку (dll).