оглавление ДМ экономическая информатика визуальные среды - 4GL Теория и практика обработки информации

Калибровка

1. Базовые сведения: 1.1. Постановка задачи; 1.2. Линейная и нелинейная калибровки; 1.3. Калибровка и проверка; 1.4. "Качество" калибровки; 1.5. Неопределенность, точность и воспроизводимость; 1.6. Недооценка и переоценка; 1.7. Мультиколлинеарность; 1.8. Подготовка данных
2. Модельные данные: 2.1. Принцип линейности; 2.2. "Чистые" спектры; 2.3. "Стандартные" образцы; 2.4. Создание X данных; 2.5. Центрирование данных; 2.6. Обзор данных
3. Классическая калибровка: 3.1. Калибровка по одному каналу (однофакторная); 3.2. Метод Фирордта; 3.3. Непрямая калибровка
4. Обратная калибровка: 4.1. Множественная калибровка; 4.2. Пошаговая калибровка
5. Калибровка на латентных переменных: 5.1. Проекционные методы; 5.2. Регрессия на латентных переменных; 5.3. Практическое применение калибровки на латентных переменных; 5.4. Регрессия на главные компоненты (PCR); 5.5. Регрессия на латентные структуры -1 (PLS1); 5.6. Регрессия на латентные структуры -2 (PLS2)
6. Заключение: 6.1. Сравнение разных методов; 6.2. Выводы

В этом пособии рассмотрены основные методы, применяемые для решения задач калибровки (называемой также градуировкой). Текст ориентирован, прежде всего, на специалистов в области анализа экспериментальных данных: химиков, физиков, биологов, и т.д. Он может служить пособием для исследователей, начинающих изучение этого вопроса. Продолжить исследования можно с помощью указанной литературы.

В пособии интенсивно используются понятия и методы матричной алгебры – вектор, матрица, и т.п. Читателям, которые плохо знакомы с этим аппаратом, рекомендуется изучить, или, хотя бы просмотреть, пособие "Матрицы и векторы".

Изложение иллюстрируется примерами, выполненными в рабочей книге Excel “Calibration.xls”, которая сопровождает этот документ. Предполагается, что читатель имеет базовые навыки работы в среде Excel, умеет проводить простейшие матричные вычисления с использованием функций листа, таких как МУМНОЖ, ТЕНДЕНЦИЯ и т.п. Освежить эти знания можно с помощью пособия Матричные операции в Excel.

Важная информация о работе с файлом Calibration.xls

Ссылки на примеры помещены в текст как объекты Excel. По форме эти примеры имеют абстрактный, модельный характер, однако, по своей сути, они тесно связаны с задачами, встречающимися на практике.

Базовые сведения

Постановка задачи

Суть задачи калибровки состоит в следующем. Пусть имеется некоторая переменная (свойство) y, величину которой необходимо установить. Однако, по ряду обстоятельств (недоступность, дороговизна, длительность), прямое измерение величины y невозможно. В то же время можно легко (быстро, дешево) измерить другие величины: x=(x₁, x₂, x₃,…), которые связаны с искомой величиной y. Задача калибровки состоит в установлении количественной связи между переменными x и откликом y –

y=f(x₁, x₂, x₃,…| a₁, a₂, a₃,…) +ε

На практике это означает:

(1) подбор вида зависимости f, и ...

(2) оценку неизвестных параметров a₁, a₂, a₃,… в этой калибровочной зависимости.

Разумеется, калибровку нельзя построить абсолютно точно. В дальнейшем мы увидим, что это не только невозможно, но и опасно. В калибровочной зависимости всегда присутствуют погрешности (ошибки) ε, источник которых – пробоотобор, измерения, моделирование, и т.д.

Простейший пример калибровки дает общеизвестный прибор, называемый безменом, т.е. пружинные весы. Искомая величина y – это вес образца, а x – это удлинение пружины весов. Закон Гука –

y=ax + ε,

связывает y и x через коэффициент жесткости пружины a, который априори неизвестен. Процедура калибровки очень проста – взвешиваем стандартный образец весом в 1 кг и отмечаем на шкале удлинение пружины, затем используем образец в 2 кг, и т.д. В результате этой калибровки (точнее, градуировки) получается шкала, по которой можно определить вес нового, нестандартного образца.

Этот элементарный пример демонстрирует основные черты процедуры калибровки, которые подробно будут рассмотрены далее. Во-первых, для калибровки необходимы несколько стандартных образцов, для которых величины y известны заранее. Во-вторых, диапазон, в котором предполагается измерять показатель y, должен полностью покрываться этими калибровочными образцами. Действительно, нельзя измерять образцы весом более 5 кг, если в калибровке использовались образцы, весом менее чем 5 кг.

Разумеется, на практике все обстоит не так просто, как в этом элементарном примере. Например, в калибровке может участвовать не один показатель y (отклик), а несколько откликов y₁, y₂,..... y_K, которые нас интересуют. Все возможные особенности, различные трудности, сопутствующие процедуре калибровке будут рассмотрены далее. Сейчас же мы подведем первые итоги и сформулируем задачу калибровки в общем виде.

Пусть имеется матрица Y, размерностью (I×K), где I – это число стандартных образцов (сравнения), использованных в калибровке, а K – это число одновременно калибруемых откликов. Матрица Y содержит значения откликов y, известные из независимых экспериментов (референтные или стандартные значения). Пусть, с другой стороны, имеется соответствующая матрица переменных X размерностью (I×J), где I – это, естественно, тоже число образцов, а J – это число независимых переменных (каналов), используемых в калибровке. Матрица X состоит из альтернативных, как правило, многоканальных (J>>1) измерений. Используя калибровочные данные (X, Y), требуется построить функциональную связь между Y и X.

Рис. 1 Калибровочный набор данных

Итак, задача калибровки состоит в построении математической модели, связывающей блоки X и Y, с помощью которой можно в дальнейшем предсказывать значения показателей y₁, y₂,..... y_K, по новой строке значений аналитического сигнала x.

1.2. Линейная и нелинейная калибровки

Теоретически функциональная связь между переменными x и y может быть сложной, например,

y=b₀exp(b₁x+b₂x²) + ε .

Однако на практике большинство используемых калибровок являются линейными, т.е. имеют вид –

y=b₀+ b₁x₁ + b₂x₂+...+ b_Jx_J + ε .

Заметим, что термин "линейность" употребляется в контексте этого пособия вместо более правильного термина "билинейность", означающего линейность как по отношению к переменным x, так и в отношении коэффициентов b. Поэтому, калибровка

y=b₀+ b₁x + b₂x²+ ε .

является нелинейной, несмотря на то, что она легко "линеаризуется" введением новой переменной x₂=x².

Главное преимущество билинейной модели – это единственность, тогда как все прочие калибровки образуют бесконечное множество, выбор из которого затруднителен. В этом пособии рассматриваются только линейные калибровки вида –

Y = XB + E.

(1)

Читатели, заинтересованные в изучении нелинейных методов анализа данных могут обратиться к описанию программы Fitter.

Предпочтение (би)линейных, формальных моделей, не отягощенных дополнительным физико-химическим смыслом, является магистральным направлением развития хемометрики. Такой подход позволяет исключить влияние субъективного фактора, проявляющегося при выборе калибровочной зависимости. Однако за это приходится расплачиваться – все линейные модели имеют ограниченную область применения.

Рис. 2 Линеаризация калибровки

Суть дела иллюстрирует Рис. 2, где показаны четыре участка, на которых сложная нелинейная зависимость приближается простыми линейными моделями. Каждая из этих моделей работает только на своей области переменной x и выход за ее границы приводит к грубым ошибкам. Принципиальным моментом здесь является то, какую область можно считать допустимой – иначе говоря, насколько широко можно применять калибровочную модель. Ответ на этот вопрос дают методы проверки (валидации).

оглавление ДМ экономическая информатика визуальные среды - 4GL Теория и практика обработки информации

Знаете ли Вы, что двойственная оценка ограничения - это величина, характеризующая прирост значения целевой функции задачи математического программирования при малом изменении величины свободного члена данного ограничения; частная производная оптимального значения целевой функции, рассматриваемого в качестве функции свободных членов ограничений задачи математического программирования, по величине свободного члена данного ограничения. Измеряется в единицах измерения целевой функции в расчёте на единицу измерения ограничения.

НОВОСТИ ФОРУМА

Рыцари теории эфира