Орлов А.И. Эконометрика: Статистический контроль по двум альтернативным признакам и метод проверки их независимости по совокупности малых выборок

А.И. Орлов
Эконометрика
Учебник. М.: Издательство "Экзамен", 2002.

Глава 13. Эконометрические методы управления качеством и сертификации продукции

13.5. Статистический контроль по двум альтернативным признакам и метод проверки их независимости по совокупности малых выборок

В настоящем пункте рассмотрим статистический приемочный контроль по двум альтернативным признакам одновременно. Обсуждается соотношение входного уровня дефектности изделия в целом с входными уровнями дефектности отдельных контролируемых параметров. На основе результатов статистики объектов нечисловой природы (глава 8) рассмотрен метод проверки независимости двух альтернативных признаков. Метод нацелен на применение прежде всего в задачах статистического контроля качества продукции. При этом проверка независимости проводится по совокупности малых выборок, т.е. в так называемой асимптотике А.Н.Колмогорова, когда число неизвестных параметров распределения не является постоянным, а растет пропорционально объему данных.

При статистическом контроле качества продукции, в частности, при сертификации, чаще всего используют контроль по альтернативным признакам. При этом устанавливается, соответствует ли контролируемый параметр единицы продукции (изделия, детали) заданным в нормативно-технической документации требованиям или не соответствует. Если соответствует - единица продукции признается годной. Примем для определенности, что в этом случае результат контроля кодируется символом 0. Если же не соответствует - единица продукции признается дефектной, а результат контроля кодируется символом 1.

Таким образом, в рассматриваемой нами математической модели контроля альтернативный признак - это функция X = X(w), определенная на множестве единиц продукции W = {w} и принимающая два значения 0 и 1, причем X(w) = 0 означает, что единица продукции w является годной, а X(w) = 1 - что она является дефектной.

Методы статистического контроля, в частности, включенные в государственные стандарты и иную нормативно-техническую документацию (НТД), как правило, используют контроль по одному признаку. В НТД указывают правила выбора планов контроля и расчета различных их характеристик, приводят графики оперативных характеристик и т.п.

Однако на производстве контроль нередко проводится по нескольким альтернативным признакам. Возникает проблема выбора плана контроля и расчета его характеристик. В настоящее время для решения этой проблемы нет достаточно обоснованных и общепринятых рекомендаций.

Рассмотрим сначала контроль по двум альтернативным признакам X(w) и Y(w). В вероятностной модели X(w) и Y(w) - случайные величины, принимающие два значения - 0 и 1. Пусть, пользуясь стандартной терминологией,

p₁ = P ( X(w) = 1)

- входной уровень дефектности для первого признака, а

p₂ = P ( Y(w) = 1)

- для второго. Вероятности результатов контроля по двум признакам одновременно описываются четырьмя числами:

P ( X(w) = 0, Y(w) = 0) = p₀₀ , P ( X(w) = 1, Y(w) = 0) = p₁₀ ,

P ( X(w) = 0, Y(w) = 1) = p₀₁ , P ( X(w) = 1, Y(w) = 1) = p₁₁ ,

при этом справедливы соотношения:

p₀₀ + p₁₀ + p₀₁ + p₁₁ = 1, p₁₀ + p₁₁ = p₁ , p₀₁ + p₁₁ = p₂ .

С прикладной точки зрения наиболее интересна вероятность p₀₀ того, что единица продукции является годной (по всем параметрам), и вероятность ее дефектности (1-p₀₀ ), т.е. входной уровень дефектности для изделия в целом.

В табл.1 сведены вместе введенные выше вероятности.

Табл. 1. Вероятности результаты испытаний

при контроле по двум альтернативным признакам

	X=0	X=1	Всего
Y=0
Y=1
Всего			1

Есть три важных частных случая - поглощения, несовместности и независимости дефектов, другими словами, поглощения, несовместности и независимости событий {w: X(w) = 1} и {w: Y(w) = 1}. В случае поглощения одно из этих событий содержит другое, а потому

p₀₀ = 1 - max ( p₁ , p₂ ) .

В случае несовместности

p₀₀ = 1 - p₁ - p₂ .

В случае независимости

p₀₀ = (1 - p₁ )(1 - p₂) = 1 - p₁ - p₂ + p₁p₂ .

Ояевидно, что вероятность годности изделия всегда заключена между значениями, соответствующими случаям поглощения и несовместности. Кроме того, известно, что при большом числе признаков и малой вероятности дефектности по каждому из них случаи поглощения и независимости дают (в асимптотике) крайние значения для вероятности годности изделия, т.е. формулы, соответствующие независимости и несовместности, асимптотически совпадают.

Рассмотрим несколько примеров. Пусть некоторая продукция, скажем, гвозди, контролируются по двум альтернативным признакам, для определенности, по весу и длине. Пусть результаты контроля 1000 единиц продукции представлены в табл.2

Табл. 2. Результаты 1000 испытаний

по двум альтернативным признакам (случай поглощения)

	Х=0	Х=1	Всего
У=0	952	0	952
У=1	0	48	48
Всего	952	48	1000

Судя по данным табл.2, дефекты всегда встречаются парами - если есть один, то есть и другой. Входной уровень дефектности как по каждому показателю, так и по обоим вместе - один и тот же, а именно, 0,048. Получив по результатам статистического наблюдения данные типа приведенных в табл.2, целесообразно перейти к контролю только одного показателя, а не двух. Каково именно? Видимо, того, контроль которого дешевле. Однако совсем иная ситуация в случае несовместности дефектов (табл.3).

Табл. 3. Результаты 1000 испытаний

по двум альтернативным признакам (случай несовместности )

	Х=0	Х=1	Всего
У=0	904	48	952
У=1	48	0	48
Всего	952	48	1000

Судя по данным табл.3, дефекты всегда встречаются поодиночке - если есть один, то другого нет. В результате входной уровень дефектности по каждому признаку по-прежнему равен 0,048, в то время как доля дефектных изделий (т.е. имеющих хотя бы один дефект) вдвое выше, т.е. входной уровень дефектности для изделия в целом равен 0,096.

Случай независимости результатов контроля по двум независимым признакам (табл.4) лежит между крайними случаями поглощения и несовместности. Независимость альтернативных признаков обосновывается путем статистической проверки с помощью описанного ниже критерия n1/2V, значение которого для данных табл.4 равно 1,866.

Табл. 4. Результаты 1000 испытаний

по двум альтернативным признакам (случай независимости)

	Х=0	Х=1	Всего
У=0	909	43	952
У=1	43	5	48
Всего	952	48	1000

Согласно данным табл.4, входной уровень дефектности для каждого из двух альтернативных признаков по-прежнему равен 0,048, в то время как для изделий в целом он равен 0,091, т.е. на 5,5% меньше, чем в случае несовместности, и на 47% больше, чем в случае поглощения.

Проблема состоит в том, что таблицы и стандарты по статистическому приемочному контролю относятся обычно к случаю одного контролируемого параметра. А как быть, если контролируемых параметров несколько? Приведенные выше примеры показывают, что входной уровень дефектности изделия в целом не определяется однозначно по входным уровням дефектности отдельных его параметров.

Как должны соотноситься характеристики планов контроля по отдельным признакам с характеристиками плана контроля по двум (или многим) признакам одновременно? Рассмотрим распространенную рекомендацию - складывать уровни дефектности, т.е. считать, что уровень дефектности изделия в целом равен сумме уровней дефектности по отдельным его параметрам. Она, очевидно, опирается на гипотезу несовместности дефектов, а потому во многих случаях преувеличивает дефектность, а потому ведет к использованию излишне жестких планов контроля, что экономически невыгодно.

Зная специфику применяемых технологических процессов, в ряде конкретных случаев можно предположить, что дефекты по различным признакам возникают независимо друг от друга. Это предположение необходимо обосновывать по статистическим данным. Если же оно обосновано, следует рассчитывать входной уровень дефектности по формуле

1 - p₀₀ = p₁ + p₂ - p₁p₂ ,

соответствующей независимости признаков.

Итак, необходимо уметь проверять по статистическим данным гипотезу независимости двух альтернативных признаков. Речь идет о статистической проверке нулевой гипотезы

Н₀: p₁₁ = p₁ p₂ (22)

(что эквивалентно проверке равенства p₀₀ = (1 - p₁)(1 - p₂)). Нетрудно проверить, что гипотеза о справедливости равенства (22) эквивалентна гипотезе

Н₀ : p₀₀ p₁₁ - p₁₀ p₀₁ = 0. (23)

В простейшем случае предполагается, что проведено n независимых испытаний (Xi , Yi), i = 1,2,...,n, в каждом из которых проконтролированы два альтернативных признака, а вероятности результатов контроля не меняются от испытания к испытанию. Общий вид статистических данных приведен в табл.5.

Табл. 5. Общий вид результатов контроля

по двум альтернативным признакам.

	Х=0	Х=1	Всего
У=0	a	b	a+b
У=1	c	d	c+d
Всего	a+c	b+d	n

В табл.5 величина a - число испытаний, в которых (Xi , Yi) = (0,0), величина b - число испытаний, в которых (Xi , Yi) = (1,0), и т.д.

Случайный вектор (a, b, c, d) имеет мультиномиальное распределение с числом испытаний n и вектором вероятностей исходов (p₀₀ , p₁₀ , p₀₁ , p₁₁ ). Состоятельными оценками этих вероятностей являются дроби a/n, b/n, c/n, d/n соответственно. Следовательно, критерий проверки гипотезы (23) может быть основан на статистике

Z = ad - bc . (24)

Как вытекает из известной формулы для ковариаций мультиномиального вектора (см., например, формулу (6.3.5) в учебнике С.Уилкса [14] на с. 153),

М(Z) = n (p₁₀ p₀₁ - p₀₀ p₁₁), (25)

что равно 0 при справедливости гипотезы независимости (23).

Связь между переменными X и Y обычно измеряется коэффициентом, отличающимся от Z нормирующим множителем:

V = (ad - bc) { (a + b)(a + c)(b + d)(c + d) } - 1/2 (26)

(см. классическую монографию М. Дж. Кендалла и А. Стьюарта [15, с.723], на которую уже были ссылки, в частности, в главе 5). При справедливости гипотезы Н₀ и больших n случайная величина nV2 имеет хи-квадрат распределение с одной степенью свободы, а n1/2V имеет стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1 (см. [15, с.736]).

Рассмотрим еще один пример. Пусть проведено 100 испытаний, результаты которых описаны в табл.6. Тогда

V = (50 . 20 - 10 . 20) (60 . 70 . 30 . 40)-1/2 =

= (1000 - 200) . 5940000-1/2 = 800 / 2245 = 0,35635,

n1/2V = 3,5635 .

Табл. 6. Результаты 100 испытаний

по двум альтернативным признакам.

	Х=0	Х=1	Всего
У=0	50	10	60
У=1	20	20	40
Всего	70	30	100

Поскольку полученное значение n1/2V превышает критическое значение при любом применяемом в статистике уровне значимости, то гипотезу о независимости признаков необходимо отклонить.

К сожалению, приведенный простой метод годится не всегда. При статистическом анализе реальных данных возникают проблемы, связанные с отсутствием достаточно больших однородных выборок, т.е. выборок, в которых постоянны параметры вероятностных распределений. Реально единицы продукции представляются на контроль партиями, из каждой партии контролируются лишь несколько изделий, т.е. малая выборка. При этом от партии к партии меняются параметры p₀₀, p₁₀, p₀₁, p₁₁, описывающие уровень дефектности. Поэтому необходимы статистические методы, позволяющие проверять гипотезу независимости признаков по совокупности малых выборок. Построим один из возможных методов.

Рассмотрим вероятностную модель совокупности k малых выборок объемов n₁ , n₂ ,..., nk соответственно. Пусть j -я выборка (Xjt , Yjt), t = 1, 2,..., nj , имеет распределение, задаваемое вектором параметров (p₀₀j, p₁₀j, p₀₁j, p₁₁j) в соответствии с ранее введенными обозначениями, j = 1,2,...,k . Будем проверять гипотезу

Н₀: p₁₁j = (p₁₀j + p₁₁j) (p₀₁j + p₁₁j), j = 1,2,...,k, (27)

или в эквивалентной формулировке

Н₀ : p₁₁j p₀₀j - p₁₀j p₀₁j , j = 1,2,...,k . (28)

Основная идея состоит в нахождении асимптотического распределения статистики типа n1/2V при росте числа k малых выборок, а именно, статистики

S = g1 Z1 + g2 Z2 + ... + gk Zk , (29)

где Z1 , Z2 ,..., Zk - статистики, рассчитанные по формуле (24) для каждой из k выборок, т.е. Zj = ajdj - bjcj , j = 1,2,...,k, а g₁ , g₂ , ... , gk - некоторые весовые коэффициенты, которые, в частности, могут совпадать. Поскольку

М(S) = g₁ М(Z₁) + g₂ М(Z₂) + ... + gk М(Zk), (30)

то при справедливости гипотезы независимости (27) - (28) имеем М(S) = 0 согласно соотношению (25). Поскольку слагаемые в сумме (29) независимы, то при росте k случайная величина S в силу Центральной Предельной Теоремы является асимптотически нормальной. Дисперсия этой величины равна сумме дисперсий слагаемых:

D(S) = g₁2 D(Z₁ ) + g₂2 D(Z₂) + ... + gk2 D(Zk) . (31)

Для оценивания дисперсии S необходимо использовать несмещенные оценки дисперсий в каждой из k выборок (и в этом одна из основных "изюминок" разбираемого метода). Предположим, что построены статистики Tj такие, что

М(Tj) = D(Zj) , j = 1,2,...,k . (32)

Тогда при некоторых математических "условиях регулярности", на которых нет необходимости здесь останавливаться, несмещенная оценка дисперсии статистики S, имеющая согласно формулам (31) и (32) вид

L = g₁2 T₁ + g₂2 T₂ + ... + gk2 Tk , (33)

в силу закона больших чисел такова, что дробь D(S) / L приближается к 1 при росте числа выборок (сходимость по вероятности). Отсюда следует, что распределение случайной величины Q = S L-1/2 приближается при росте числа выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Следовательно, критерий проверки гипотезы (27) - (28) независимости признаков, состоящий в том, что при - 1,96 < Q < 1,96 гипотеза принимается, а при Q , выходящих за пределы интервала (- 1,96; 1,96) , гипотеза отклоняется, имеет уровень значимости, приближающийся к 0,05 при росте числа выборок. Мощность этого критерия зависит от величины М(S)D(S)-1/2 при альтернативе.

Для реализации намеченного плана осталось научиться несмещенно оценивать D(Zj). К сожалению, в литературе по несмещенному оцениванию не рассматривают случай мультиномиального распределения, поэтому кратко опишем процедуру построения несмещенной оценки D(Zj). Поскольку согласно формулам (24) и (25)

D(Zj) = М( Zj2 ) - (М( Zj ))2 = М (aj2dj2) - 2 М (ajbjcjdj) +

+ М (bj2cj2) + nj2 (p₁₁j p₀₀j - p₁₀j p₀₁j)2, (34)

то для вычисления D(Zj) достаточно найти входящие в правую часть формулы (34) начальные смешанные моменты мультиномиального распределения (четвертого порядка). Теоретически это просто - известен вид характеристической функции мультиномиального распределения (см., например, формулу (6.3.4) в монографии [14, с.152]), а начальные смешанные моменты равны значениям ее соответствующих производных в 0, деленным на нужную степень мнимой единицы (формула (5.2.3) в монографии [4, с.131]). Например, с помощью описанной процедуры после некоторых вычислений получаем, что (для упрощения записи здесь и далее опустим индекс j)

М (a2d2) = n(n-1)(n-2)(n-3)p₁₁ 2p₀₀2 + n(n-1)(n-2)(p₁₁2p₀₀ +

+ p₁₁ p₀₀2 ) + n(n-1)p₁₁ p₀₀ . (35)

Формула (35) показывает, что начальные смешанные моменты мультиномиального распределения являются многочленами от параметров p₁₁, p₀₀, p₁₀, p₀₁ этого распределения, однако конкретный вид этих многочленов достаточно громоздок, поэтому не будем их здесь выписывать, ограничившись формулой (35) в качестве образца.

Как вытекает из формул (34) и (35), для построения несмещенной оценки D(Zj) достаточно научиться несмещенно оценивать произведения типа p₁₁rp₀₀m , где целые неотрицательные числа r, m не превосходят 2. Эта задача решается, начиная с меньших степеней. Известно, что для ковариации мультиномиального вектора

М (ad) = - n p₀₀ p₁₁ (36)

(см., например, формулу (6.3.5) в монографии [14, с.153]), а потому несмещенной оценкой для p₀₀ p₁₁ является ( - ad / n ). Далее, поскольку справедлива аналогичная (35) формула

М(a2d) = n(n-1)(n-2) p₁₁p₀₀2 + n(n-1)p₁₁p₀₀ , (37)

то с помощью формулы (36) преобразуем формулу (37) к виду

М(a2d + (n-1)ad) = n(n-1)(n-2)p₁₁p₀₀2 , (38)

т.е. несмещенной оценкой p₁₁p₀₀2 является ad(a + n-1){n(n-1)(n-2)}-1.

Следующий шаг - аналогичным образом с помощью формул (36) и (38) получаем несмещенную оценку для p₁₁2p₀₀2, а затем и для D(Zj) . Промежуточные формулы опущены из-за громоздкости. Окончательный результат таков:

Tj = ( bj + dj )(cj + dj)(aj+ cj)(aj + bj)(n-1)-1 . (39)

Как легко видеть,

Zj / Tj-1/2 = (nj -1)1/2 Vj ,

т.е. в случае одной выборки предлагаемый метод совпадает с классическим.

Общая идея рассматриваемого метода проверки гипотез по совокупности малых выборок состоит в том, что подбирается статистика, математическое ожидание которой для каждой малой выборки равно 0 при справедливости проверяемой гипотезы. Затем для каждой выборки строится несмещенная оценка дисперсии этой статистики. Итоговая статистика критерия для проверки гипотезы - это сумма рассматриваемых статистик для всех малых выборок, деленная на квадратный корень из суммы всех несмещенных оценок дисперсий рассматриваемых статистик. При справедливости нулевой гипотезы эта итоговая статистика имеет в асимптотике стандартное нормальное распределение (при выполнении некоторых математических "условий регулярности", которые обычно выполняются при анализе реальных статистических данных).

Впервые такой способ проверки гипотез по совокупности малых выборок был предложен в монографии [16, раздел 4.5]. Нестандартность постановки состоит в том, что число неизвестных параметров растет пропорционально объему данных, т.е. имеет место т.н. "асимптотика Колмогорова", или асимптотика растущей размерности. Дальнейшее развитие применительно к данных типа "да"-"нет" (или "годен" - "дефектен") шло в рамках теории люсианов как части статистики объектов нечисловой природы (см. главу 8).

Оглавление