Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

SMOOTHING CUBIC SPLINE PARAMETER CHOICE IN CASE OF UNKNOWN MEASUREMENT NOISE CHARACTERISTICS

Voskoboynikov Yu.E. 1, 2 Boeva V.A. 1
1 Novosibirsk State University of Architecture and Civil Engineering (Sibstrin)
2 Novosibirsk State Technical University
Unit-defected smoothing cubic spline is a universal technique for measurement noise filtering both for one- and two-dimensional signals. Due to the continuity of first and second spline derivatives over the entire spline definition interval, spline is used for effective construction of non-parametric identification algorithms involving first derivatives from input and output signals of the system identified. Both smoothing and differentiation errors essentially depend on the value of so-called smoothing parameter. At low parameter values measurement noise filtering is insufficient, and calculated first derivative has an oscillating form typical for unstable solutions of ill-posed problems. At high parameter values spline curve tends to straight line and spline second derivative tends to zero. Consequently, informative components of the function under processing are essentially smoothed. The optimal parameter value minimizes smoothing error and lies within these two limit values. Unfortunately, in a practice, it is unable to evaluate the exact value of optimal parameter for lack of a priori information on exact signal characteristics. Therefore, for practical applications, various parameter selecting algorithms are used providing acceptable smoothing error values but exceeding so far other times the minimum value. Two cases are meant to be considered: when the measurement noise variance is reliably known and when the information about the variance is lacking. If in the first case, selecting algorithms can evaluate the optimal value of smoothing parameter rather precisely, but in case of unknown variance, and correlated measurement noise most of all, the evaluation issue remains undetermined. For the reasons aforementioned, in this paper two smoothing parameter selecting algorithms are investigated for unknown measurement noise variance. Special attention is given to optimal parameter evaluation in case of correlated noise. Based on the investigation findings, some practical recommendations on the smoothing splines construction in non-parametric identification problems are given.
noise filtering
smoothing cubic splines
smoothing parameter
parameter choice for unknown noise variances

Для описания поведения линейных стационарных динамических систем в терминах «вход-выход» часто используется математическая модель в виде интегрального уравнения Вольтера I рода [1, 2]:

Vos01.wmf (1)

где k(t) – импульсная переходная функция (ИПФ) системы (ядро интегрального уравнения); φ(τ), f(t) – входной и выходной сигналы системы. Для такой математической модели задача непараметрической идентификации заключается в построении оценки для ИПФ k(t) по зарегистрированным в эксперименте значениям входного и выходного сигнала, т.е. необходимо решить уравнение (1) относительно k(t). Как известно, такая задача является некорректно поставленной. Для построения устойчивого (к погрешностям исходных данных) решения возможны два подхода. В первом подходе уравнение (1) аппроксимирует дискретной сверткой, и ее решение находят с помощью регуляризирующего алгоритма, основанного на использовании дискретного преобразования Фурье и алгоритма быстрого преобразования Фурье [3]. Второй подход заключается в сведении уравнения (1) к интегральному уравнению второго рода, решение которого уже является корректно поставленной задачей, но само уравнение включает первые производные входного и выходного сигналов идентифицируемой системы [4, 5]. Дифференцирование зашумленных сигналов также является некорректно поставленной задачей, но этот подход авторам работы представляется более предпочтительным – подробную аргументацию можно увидеть в публикации [5]. Здесь же только заметим, что, используя для фильтрации шумов сглаживающие кубические сплайны (СКС), удается эффективно подавлять шум измерения не только выходного сигнала идентифицируемой системы, но и шум измерения входного сигнала, что весьма затруднительно сделать в первом подходе. Главной проблемой при использовании СКС на практике является выбор параметра сглаживания, от величины которого существенно зависит ошибка сглаживания. Очевидно желание выбрать такое значение (назовем его оптимальным), при котором величина ошибки была бы минимальной. Однако из-за отсутствия априорной информации о «точных» значениях обрабатываемой функции вычисление оптимального параметра невозможно. Поэтому на практике используются различные алгоритмы выбора этого параметра, дающие приемлемые ошибки сглаживания, но превышающие (иногда значительно) минимальное значение. Следует выделить два случая: когда дисперсия шума измерения достоверно известна и когда такая информация отсутствует. Если в первом случае есть алгоритмы выбора, которые позволяют достаточно точно оценить оптимальное значение параметра сглаживания, то в случае неизвестной дисперсии вопрос такого оценивания остается открытым, особенно в случае коррелированного шума измерения, т.е. между соседними значениями шума существует значимая корреляция. Такой шум может появиться после предварительной фильтрации зарегистрированных сигналов идентифицируемой системы (например, после фильтрации аномальных измерений).

Целью данной работы является построение и исследование алгоритмов выбора параметра сглаживания при неизвестной дисперсии шума измерения и коррелированном шуме измерения. При этом решаются две задачи: а) построение и исследование алгоритмов выбора параметра сглаживания при неизвестной дисперсии и некоррелированном шуме измерений и б) построение и исследование алгоритмов выбора параметра сглаживания при коррелированном шуме измерений.

Материалы и методы исследования

Сначала приведем некоторые определения и понятия сглаживающего кубического сплайна (СКС), необходимые для дальнейшего изложения алгоритмов выбора параметра сглаживания СКС [6, 7].

Предположим, что на интервале [T1,T2] заданы n узлов Vos02.wmf, и в этих узлах измерены значения функции:

Vos03.wmf, (2)

где ηi – случайный шум измерений с нулевым средним и дисперсией Vos04.wmf (равноточные измерения). Функция Sn(t) называется кубическим сплайном дефекта единица, если:

а) на каждом интервале Vos05.wmf функция Sn(t) является кубическим многочленом вида

Vos06.wmf (3)

б) функция Sn(t) дважды непрерывно дифференцируема на всем интервале [T1,T2].

В отличие от интерполяционного сплайна, сглаживающий кубический сплайн Sn,α(t) в общем случае не проходит через точки Vos07.wmf, а проходит в некоторой окрестности (ее размеры определяются величиной параметра сглаживания α) от этих точек, обеспечивая тем самым сглаживание (фильтрацию) шума измерений. Для следующих часто используемых на практике краевых условий [6,8]: условия на значения первой производной вида

Vos08.wmf, (4)

или условия на нулевые значения второй производной

Vos09.wmf. (5)

СКС доставляет минимум функционалу [6,7]:

Vos10.wmf, (6)

где pi – весовые множители, отражающие точность i-го измерения Vos11.wmf (в случае равноточных измерений задаются одинаковыми, например Vos12.wmf).

Параметр сглаживания α «управляет» гладкостью сплайна, и ошибка сглаживания (как и ошибка дифференцирования) существенно зависит от величины так называемого параметра сглаживания. При малых значениях этого параметра фильтрация шумов незначительна, и вычисленная первая производная имеет осциллирующую форму, что характерно для неустойчивых решений некорректно поставленных задач. При больших значениях параметра график сплайна стремится к прямой линии (вторая производная стремится к нулю), и происходит существенное «сглаживание» информативных составляющих обрабатываемой функциональной зависимости. Между этими двумя предельными значениями находится значение параметра (назовем его оптимальным), для которого ошибка сглаживания (в принятой норме) минимальна. К сожалению, точное значение оптимального параметра на практике вычислить не удается (из-за отсутствия априорной информации о характеристиках «точного» сигнала). Поэтому обратимся к двум методам оценивания параметров алгоритмов регрессионного анализа и регуляризирующих алгоритмов решения некорректных задач и попытаемся их адаптировать для оценивания оптимального параметра сглаживания СКС.

Первоначально рассмотрим метод, который назовем методом перекрестной проверки (или методом перекрестной значимости), в зарубежной литературе – cross-validation method (CVM). Метод использовался при построении моделей (например, [9]) и для выбора параметра регуляризации (например, [10]). Идейная основа этого метода видна из следующих рассуждений [8, с. 68–69].

Предположим, что имеются два вектора Vos13.wmf и Vos14.wmf размерности n, составленные из двух наборов наблюдений (2). По первому вектору Vos15.wmf построен сплайн Sn,α (t), из значений которого в узлах построен вектор Sn,α. Введем функционал:

Vos16.wmf, (7)

где математическое ожидание M [·] берется по ансамблю распределения шума измерений ηi, а ||·|| означает евклидову норму вектора. Можно показать, что U(α) допускает представление

Vos17.wmf, (8)

где f – вектор, составленный из «точных» значений Vos18.wmf. Если математическое ожидание шума измерений равно нулю и шумы измерений двух набора данных не коррелированы между собой, то (8) можно переписать как

Vos19.wmf, (9)

где второе слагаемое

Vos20.wmf (10)

определим как среднеквадратическую ошибку (СКО) сглаживания. Так как первое слагаемое в (9) не зависит от параметра сглаживания α, то минимум U(α) соответствует минимуму СКО, т.е. задача вычисления оптимального параметра αopt, минимизирующего (10), решена. Однако на практике минимизация U(α) сопряжена с двумя трудностями. Во-первых, вычисление математического ожидания в (7) и, во-вторых, отсутствие во многих экспериментах второго набора данных, т.е. вектора Vos21.wmf. Попытаемся преодолеть эти трудности, перейдя от математического ожидания случайной величины к ее отдельному значению и формируя второй вектор Vos21.wmf из одного набора Vos23.wmf данных с помощью следующего алгоритма. Заметим, что предлагаемый способ формирования вектора Vos21.wmf отличается от известных [9].

Шаг 1. Все измеренные значения Vos25.wmf, разбиваются на K групп по m измерений в каждой, и в k-ю группу входят измерения: Vos26.wmf, где Vos27.wmf, L – периодичность выборки при формировании групп измерений. Задавая величину L, можно определить количество измерений в группе и количество групп:

Vos28.wmf, (11)

где Vos29.wmf – целая часть числа.

Шаг 2. Из экспериментальных значений исключается k-я группа, а по оставшимся n – m значениям строится СКС Vos30.wmf и вычисляется величина

Vos31.wmf, (12)

Vos31.wmf,

где Ik – набор индексов

Vos32.wmf.

Шаг 3. После вычисления

Vos33.wmf,

определяется среднее значение:

Vos34.wmf. (13)

Шаг 4. Используя методы одномерной минимизации, вычисляем точку минимума αU функционала (13), и это значение примем за оценку для оптимального параметра Vos36.wmf, который минимизирует ошибку сглаживания

Vos37.wmf (14)

конкретной одной реализации измеренного сигнала Vos38.wmf.

Перейдем к выбору параметра сглаживания на основе метода L-кривой, который используется в алгоритмах регрессионного анализа [11] и решения некорректных задач [12]. Введем в рассмотрение два функционала:

Vos39.wmf

Vos39.wmf, (15)

которые можно рассматривать как координаты некоторой параметрической функции (названной L-кривой) в декартовой системе координат. Кривизну этой функции определим как

Vos40.wmf. (16)

В качестве оценки для оптимального параметра αopt в методе L-кривой принимается значение αL, вычисленное из условия максимума кривизны kL(α). Для упрощения вычисления значений kL(α) предлагается первоначально на некотором множестве значений Vos41.wmf вычислить величины Vos42.wmf, а затем по этим данным построить интерполяционные сплайны, по которым вычислить производные, входящие в (16).

Из описания этих двух алгоритмов выбора параметра сглаживания видно, что оба алгоритма не требуют задания дисперсии шума измерений, но требуют решения соответствующих оптимизационных задач, что приводит к дополнительным вычислениям по сравнению с выбором параметра при известных дисперсиях шума измерений.

Результаты исследования и их обсуждение

Для исследования оптимальных свойств оценок αU , αL был выполнен обширный вычислительный эксперимент. Остановимся только на некоторых результатах. В качестве тестовых сигналов были приняты два типичных для задач непараметрической идентификации, но разных по спектру: сигнал 1 – изображен сплошной кривой на рис. 1 и сигнал 2 – показан штриховой линией. Точные значения сигнала, вычисленные в узлах Vos43.wmf, искажались случайными нормально распределенными погрешностями с относительным уровнем

Vos44.wmf.

При этом значения шума измерения были: а) не коррелированы между собой, б) коррелированы с значениями выборочной корреляционной функции R(0) = 1, R(1) = 0.678, R(2) = 0.421, R(3) = 0.121 (сильно коррелированный шум). Относительная ошибка сглаживания определялась выражением

Vos46.wmf.

Для исследования оптимальности значений параметров сглаживания αU , αL были определены соответствующие коэффициенты эффективности:

Vos48.wmf. (17)

Очевидно, что чем ближе значения этих коэффициентов к 1, тем меньше проигрыш по точности соответствующего параметра сглаживания по сравнению с Vos49.wmf. Так как эти коэффициенты являются случайными величинами, то по выборке объемом 200 вычислялись их числовые характеристики: средние значения Vos50.wmfи минимальные значения Vos51.wmf.

Начнем с рассмотрения свойств оценки αU. На рис. 2 показаны графики следующих зависимостей: сплошная – относительная ошибка Vos52.wmf при Vos53.wmf; штрих-точечная – Vos54.wmf при Vos55.wmf; штриховая – Vos56.wmf при Vos57.wmf; точечная – Vos58.wmf при Vos59.wmf.

Видно, что значения αopt находятся в области минимума функционала Vos56.wmf, но наличие плоского участка на графике Vos56.wmf усложняет процедуру минимизации Vos56.wmf. Заметим, что при уменьшении уровня шума наблюдается смещение αopt, αU в меньшую сторону. В табл. 1 приведены характеристики Vos66.wmf, Vos67.wmf.

Видно, что в случае коррелированного шума эти характеристики ухудшаются, особенно при большом уровне шума измерения и низкочастотном сигнале 1. Точностные характеристики Vos76.wmf, Vos77.wmf метода L-кривой приведены в табл. 2. Также заметно их ухудшение в случае коррелированного шума, но не столь значительное, как в методе перекрестной значимости (табл. 1).

Для сравнения в табл. 1 и 2 жирным шрифтом выделены ячейки с наибольшим средним значением коэффициента эффективности из этих двух алгоритмов выбора параметра сглаживания. Видно, что алгоритм выбора, основанный на методе L-кривой, в большинстве случаев имеет более высокие точностные характеристики.

Doc2.pdf

Doc3.pdf

Рис. 1. Тестовые сигналы

Рис. 2. Характеристики параметра сглаживания αU

Таблица 1

Уровень

шума

Сигнал 1

Сигнал 2

Шум не

коррелирован

Шум

коррелирован

Шум не

коррелирован

Шум

коррелирован

Vos66.wmf

Vos67.wmf

Vos66.wmf

Vos67.wmf

Vos66.wmf

Vos67.wmf

Vos66.wmf

Vos67.wmf

0,02

0,961

0,717

0,927

0,725

0,984

0,864

0,958

0,911

0,05

0,942

0,628

0,851

0,528

0,967

0,811

0,914

0,714

0,07

0,926

0,581

0,801

0,428

0,944

0,756

0,893

0,695

0,10

0,910

0,480

0,746

0,407

0,938

0,731

0,878

0,627

0,15

0,893

0,438

0,704

0,269

0,914

0,628

0,863

0,605

Таблица 2

Уровень

шума

Сигнал 1

Сигнал 2

Шум не

коррелирован

Шум

коррелирован

Шум не

коррелирован

Шум

коррелирован

Vos76.wmf

Vos77.wmf

Vos76.wmf

Vos77.wmf

Vos76.wmf

Vos77.wmf

Vos76.wmf

Vos77.wmf

0,02

0,972

0,863

0,952

0,749

0,982

0,835

0,981

0,913

0,05

0,949

0,736

0,913

0,652

0,978

0,803

0,976

0,863

0,07

0,932

0,652

0,901

0,636

0,943

0,859

0,921

0,819

0,10

0,905

0,573

0,896

0,582

0,962

0,840

0,902

0,732

0,15

0,901

0,589

0,875

0,416

0,944

0,779

0,894

0,685

Заключение

Построенные в данной работе на основе методов перекрестной значимости и L-кривой алгоритмы могут успешно использоваться для оценивания оптимального параметра сглаживания СКС в случае некоррелированного шума измерений. Оба эти алгоритма не требуют априорной информации о величине дисперсии шума измерения. В случае коррелированного шума измерения предпочтение следует отдать алгоритму на основе метода L-кривой. Худшие точностные характеристики метода перекрестной значимости можно объяснить тем, что медленное изменение амплитуды коррелированного шума воспринимается алгоритмом выбора как некоторая составляющая «точного» сигнала, и для ее сохранения алгоритм вычисляет заниженное (по сравнению с оптимальным) значение параметра сглаживания.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-38-90041. Acknowledgments: The reported study was funded by RFBR, project number 20-38-90041.