© 2008 Алексей Померанцев
Сопоставление различных методов начнем с характеристик RMSEC и RMSEP, которые наиболее полно отражают качество моделирования.
Рис. 44 Среднеквадратичные
остатки обучения (RMSEC) и проверки (RMSEP)
в
различных методах калибровки веществ A
и B
На Рис. 44 показаны среднеквадратичные остатки обучения и проверки, вычисленные для различных методов калибровки. Первое, что можно заметить на этих графиках – явное превосходство калибровки на латентных переменных: PCR, PLS и PLS2, перед традиционными подходами. Вторая интересная особенность состоит в том, что, часто, RMSEP больше, чем RMSEC. Это типично для правильной калибровки, если только различие между RMSEP и RMSEC не так разительно, как в случае множественной калибровки (MLR) или пошаговой регрессии (SWR) вещества B.
Рис. 45 Смещение в обучении (BIASC) и в проверке (BIASP) для различных методов калибровки веществ A и B
На Рис. 45 представлены величины смещений, полученные на обучающей выборке (BIASC) и на проверочной (BIASP) выборке. Здесь опять мы видим превосходство проекционных методов, которые дают значительно меньшие величины систематических отклонений. Аналогично, почти всегда BIASC меньше, чем BIASP, а для UVR и MLR отличие обучения от проверки особенно заметно.
Рис. 46 Коэффициенты корреляции в обучении и в проверке для различных методов калибровки веществ A и B
На Рис. 46 показаны величины коэффициентов корреляции между стандартными и оцененными откликами. Видно, что проекционные методы не только дают лучшие значения R2 (ближе к единице), но и , кроме того, представляют правильный баланс между обучением и проверкой.
Рис. 47 Стандартные ошибки в обучении (SEC) и в проверке (SEP) для различных методов калибровки веществ A и B
На Рис. 47 показаны стандартные ошибки в обучении (SEC) и в проверке (SEP). Из-за того, что в нашем примере все смещения малы по сравнению с RMSE, эти графики не добавляют нам новых открытий по сравнению с уже исследованными зависимостями показанными на Рис. 44.
Рис. 48 Полная дисперсия
остатков в обучении (TRVC) и в проверке (TRVP)
Объясненная дисперсия остатков в
обучении (ERVC) и в проверке (ERVP)
для
различных методов калибровки веществ A
и B
На Рис. 48 слева приведена полная дисперсия остатков в обучении (TRVC) и в проверке (TRVP), а справа – объясненная дисперсия остатков в обучении (ERVC) и в проверке (ERVP). На этих графиках мы снова видим те же закономерности, что и ранее – методы калибровки на латентных переменных лучше традиционных. Можно также отметить, что графики ERV неудобны для анализа качества моделирования – на них плохо заметны недостатки или преимущества различных методов
Подведем итоги исследования различных методов калибровки. Итак, мы видели, что –
калибровка по одному каналу приводит к недооценке – величины RMSEC и RMSEP слишком велики;
множественная калибровка, напротив, ведет к переоценке – величина RMSEC значительно меньше, чем RMSEP;
наилучшие результаты дает калибровка на латентных переменных (PCR и PLS) – достигается правильный баланс между величинами RMSEC и RMSEP