Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

NUCLEAR ESTIMATES FOR CALCULATIONS OF TOLERANT INTERVALS

Osechkina T.A. 1
1 St. Petersburg State Forestry University named after S.M. Kirov
The article describes the method of non-parametric nuclear assessment of tolerant limits of reliability indicators of machine parts for their certification and standardization. It is noted that for some distribution laws, in particular, normal, lognormal, exponential, Gauss, Weibull, formulas for estimating tolerant limits have been obtained. But in some cases, the form of the distribution law of the quantity being studied is unknown, and in the conditions of small samples the statistical verification of the distribution law is impossible. In this case, nonparametric estimates of the reliability characteristics of the parts are used. The main results in this direction were obtained on the basis of the theory of order statistics using the properties of the beta function. Such estimates are usually tightly related to the number of observations and the confidence probability, or the number of observations and the necessary share of the population. In the proposed article, formulas are obtained for determining tolerant intervals of reliability characteristics based on nuclear assessments. An algorithm for obtaining tolerance limits is given. Comparative results of the application of the algorithm when finding tolerant limits of fatigue characteristics by various methods are given. To calculate the estimates using the nuclear method, the Epechnikov function was used. It is shown that the estimates obtained by the proposed algorithm, in some cases, improves the tolerance limits obtained using ordinal statistics. In particular, if the distribution of the general population is consistent with the normal or lognormal distribution laws.
tolerance limits
tolerance intervals
reliability
nonparametric evaluation
nuclear evaluation

Указание границ толерантных интервалов является одним из основных условий международной сертификации промышленных изделий.

Толерантный интервал – интервал, определяемый по выборке, относительно которого можно утверждать с уровнем доверия γ, что он содержит, по крайней мере, указанную долю p0 совокупности.

Границы статистического толерантного интервала – толерантные границы.

Уровень доверия γ = 1 – α – это вероятность того, что толерантный интервал будет содержать не менее p0•100 % совокупности.

Вероятность попадания СВ Х с функцией распределения FX(x) в интервал [L, U] равна FX(U) – FX(L). То есть границы толерантного интервала – это решение уравнения

ocech02.wmf

для двустороннего интервала [L, U] и

ocech03.wmf

ocech04.wmf

для односторонних интервалов (–∞; U] и [L; +∞) соответственно.

Обычно двусторонние толерантные интервалы ищутся в форме [M – kσ; M + kσ], односторонние – в форме ocech05.wmf или ocech06.wmf.

На данный момент достаточно полно изучен вопрос оценки толерантных пределов, как двусторонних, так и односторонних, для некоторых известных распределений.

Так, в работах [1] выводятся оценки толерантных пределов нормально распределенной генеральной совокупности, в работах [1, 2] рассматриваются оценки толерантных пределов показательно распределенных совокупностей. В ряде работ предлагаются оценки толерантных границ для распределений Вейбула, Гаусса, логнормального распределения [3] сведением их к нормальному распределению.

Но в некоторых случаях априори вид распределения неизвестен. В этом случае необходимо либо предварительно выдвинуть гипотезу о виде распределения и проверить ее, что в случае ограниченной информации может вызвать затруднения, либо использовать непараметрические критерии для требуемых оценок.

Значительная часть результатов математической статистики основана на предположении о том, что информации, имеющейся у потребителя, достаточно для представления участвующих в задаче распределений в виде некоторых функций с конечным числом параметров. Однако на практике это предположение часто оказывается невыполнимым. Потребности в создании статистических процедур, не предполагающих знание вида распределений, отвечает ветвь математической статистики, получившая название непараметрическая статистика. Непараметрическая статистика рассматривает только такие ситуации, в которых о функциональном виде распределений ничего не известно. Теория непараметрического оценивания плотности распределения широко представлена в работах Л. Девроя и Л. Дьёрфи, Парзена, Розенблатта, Ш. Закса, Хансена и Кумпенса. Обзор укакзанных методов приведен в [2]. Оказалось, что, несмотря на малый объем априорной информации, используемой при построении непараметрических процедур, они обладают высокой эффективностью. Потери эффективности при переходе от параметрических к непараметрическим процедурам (в случае истинности параметрической модели) незначительны и довольно часто составляют всего несколько процентов. Эффективность непараметрической процедуры по сравнению с фиксированной параметрической резко возрастает при отклонении истинных распределений от расчетных. В большинстве случаях непараметрические процедуры оказываются асимптотически оптимальными.

Материалы и методы исследования

Широко известна [2] непараметрическая оценка толерантных границ с использованием β-распределения. Для упорядоченной выборки ocech07.wmf из произвольно распределенной генеральной совокупности решение неравенства ocech08.wmf определяет долю p генеральной совокупности, попадающей в интервал ocech09.wmf с вероятностью γ. Но полученная таким образом оценка жестко связывает долю p, доверительную вероятность γ и объем выборки n. То есть при одном и том же объеме выборки увеличение доли p ведет к уменьшению доверительной вероятности γ и наоборот.

Теория непараметрических доверительных и толерантных интервалов развивалась в исследованиях Уилкса, Оуэна, Гаттмена, Роббинса, Фрэзера, Барлоу и Прошана, Хансона и Кумпенса и других. В этих работах строятся функции специального вида, мажорирующие вероятность попадания случайной величины в заданный интервал, представленной в виде упорядоченной статистики. В основном эти оценки связаны с β-функцией.

В работах Хансена и Купменса [2] предлагается искать верхнюю толерантную границу для выборки Xi в виде

ocech10.wmf,

где коэффициент b является решением уравнения

ocech11.wmf

В ряде отечественных работ [3–5] для непараметрических оценок используется ядерный метод получения функции распределения. Согласно указанной методике, функция плотности вероятности рассматриваемой случайной величины определяется формулой

ocech12.wmf (1)

где ocech13.wmf – выборка, полученная в результате наблюдений за исследуемым объектом; n – объем выборки; ocech14.wmf – ядерная функция, удовлетворяющая условиям регулярности

ocech15.wmf

σ > 0 – параметр сглаживания, такой, что ocech16.wmf.

В качестве ядерной функции чаще всего выбираются следующие функции [6]:

ocech17.wmf – прямоугольное ядро;

ocech18.wmf – ядро Епанечникова;

ocech19.wmf – квадратическая ядерная функция.

В рассматриваемых функциях ocech20.wmf

Точность оценки зависит как от выбора функции-ядра, так и выбора параметра сглаживания. В работе [7] предложена методика поиска оптимального значения параметра сглаживания.

В работе [6] получена оценка доверительного интервала для теоретической функции плотности вероятности при n ≥ 100

ocech21.wmf

и при небольших значениях n ≤ 100:

ocech22.wmf.

Результаты исследования и их обсуждение

Рассуждая аналогично [6], проведем оценку одностороннего толерантного интервала. Обозначим ocech23.wmf. Случайные величины ηi при каждом x независимы.

Согласно центральной предельной теореме, при больших значениях n, оценка функции плотности вероятности, как суммы независимых величин, является при каждом x нормально распределенной случайной величиной, т.е.

ocech24.wmf

где

ocech25.wmf

ocech26.wmf (2)

Соответственно, случайная величина ocech27.wmf имеет нормальное распределение с нулевым математическим ожиданием и той же дисперсией:

ocech28.wmf

Тогда

ocech29.wmf

и при доверительной вероятности β:

ocech30.wmf

ocech31.wmf

(uβ – β-квантиль стандартного нормального распределения).

Окончательно получаем, что с вероятностью β верна оценка

ocech32.wmf

или

ocech33.wmf

При небольших значениях n используется распределение Стьюдента с n – 1 степенью свободы, т.е.

ocech34.wmf

и

ocech35.wmf (3)

Пусть ocech36.wmf – оценка функции плотности вероятности f для случайной величины X, представленной выборкой ocech37.wmf. Оценка L нижней толерантной границы для доли p0 с доверительной вероятностью γ является решением уравнения

ocech38.wmf (4)

Проинтегрировав неравенство (3) и выполнив необходимые оценки, получим

ocech39.wmf

ocech40.wmf

где

ocech41.wmf

ocech42.wmf

Другими словами, неравенство

ocech43.wmf

верно с вероятностью β. Тогда, если верно неравенство

ocech44.wmf,

то с вероятностью β будет верно неравенство

ocech45.wmf,

т.е. ocech46.wmf

Следовательно, уравнение (4), определяющее значение оценки нижней границы L одностороннего толерантного интервала, верно в случае, если β = γ. Таким образом, оценку границы левостороннего толерантного интервала для доверительной вероятности γ можно найти как решение неравенства

ocech47.wmf (5)

при n ≤ 100 и неравенства

ocech48.wmf (6)

при n > 100.

Таким образом, получен алгоритм построения нижней толерантной границы с помощью ядерной оценки функции плотности.

1. Оценить выборочное среднее, выборочную дисперсию СВ, представленной выборкой ocech49.wmf. Выбрать оптимальное значение параметра сглаживания.

2. Найти промежутки ненулевых значений ядер: ocech56.wmf.

3. Определить на каждом из промежутков ocech51.wmf функцию

ocech52.wmf.

4. Определить на каждом из промежутков ocech53.wmf функцию F(x):

ocech54.wmf.

5. Определить значение статистики ocech55.wmf.

6. Определить дисперсию оценки по формуле (1).

7. Найти нижнюю толерантную границу, решив неравенство (5) ((6)).

Заключение

Для апробации была рассмотрена выборка, полученная в результате усталостных характеристик 78 экспериментальных образцов. Варианты выборки принадлежали отрезку [195, 230]. Были получены оценки нижней толерантной границы для γ = 0,95, p = 0,9 а) по формулам для случая нормально распределенной генеральной совокупности L = 191,44, б) по методу Хансена – Кумпенса L = 144,15, в) по предложенному алгоритму ядерной оценки L = 188,1.