抜き取り検査、OC曲線とは:Juliaによる実践例

どうも、木村(@kimu3_slime)です。

今回は、抜き取り検査、OC曲線とは何か、Juliaによる実践例をもとに紹介します。

 

抜き取り検査

抜き取り検査(acceptance sampling)は、工業製品など大量の生産物が不良品を含みすぎないかどうかを、そこからtリ出した少数のサンプルをもとに判断する検査です。

たとえば1ロット(1まとまり)1000個のネジを作り、その長さ(cm)が次のようであったとしましょう。

そして、10(cm)から誤差が約0.1cmを超えるものを不良品とするとしましょう。

このとき、ロットから20個のサンプルを取り出し、不良品が1つ含まれるかどうかで、そのロットが合格か不合格か判断するのは、どのくらい妥当なのでしょうか?

 

抜き取り検査では、不良品(defectives)の個数\(x\)が、許容個数\(c\)(acceptance number)以下であるかどうかによって、ロットを合格(accept)とするか不合格(reject)とするかを決めます。\(x \leq c\)なら合格、\(x>c\)なら不合格です。

例えば不良品の基準を10(cm)から誤差が約0.1cmを超えるもの、許容個数を\(1\)とするとき、20個のサンプル

は合格です。不良品は「9.892182909273245」のみで、不良品の個数は1個なので。

 

OC曲線

ロットが合格となる確率について、理論的に考えていきましょう。

ロットのサイズを\(N\)、サンプルのサイズを\(n\)、許容個数を\(c\)、不良品の個数を\(X\)とします。このとき、不良品の個数が従う確率分布は、超幾何分布であることが知られています。ロットが合格になる確率は、

\[P(X \leq c) =\sum_{k=0}^c \frac{C(M,k)C(N-M,n-k)}{C(N,n)}\]

です。

ここで\(M\)はロットに含まれる不良品の個数、\(C\)は2項係数です。

 

そして、不良品率(defect rate)を\(\theta = \frac{M}{N}\)と置いて書き直すと、

\[P_\theta(X \leq c) =\sum_{k=0}^c \frac{C(N\theta,k)C(N-N\theta,n-k)}{C(N,n)}\]

となります。\(N,n, c\)を固定して、これを\(\theta\)の関数と見るとき、そのグラフはOC曲線(OC curve; operating characteristic curve ,検査特性曲線)と呼ばれます。

 

例えば\(N=1000, n=20, c=1\)のときのOC曲線は次の通りです。「Hypergeometric(s, f, n)」で超幾何分布、「cdf」でその累積分布が計算できます。

例えば、\(\theta =0.02\)のとき、関数の値は

となりますが、これはロットの不良品率が\(0.02\)であるとき、抜き取り検査によってロットが合格になる確率は約\(0.94\)であることを意味しています。

 

\(N\)に対して\(n, \theta\)が十分小さいとき、ロットが合格になる確率はポアソン分布\(\mathrm{Poisson}(n\theta)\)で近似できることが知られています。

\[P_\theta(X \leq c) \sim e^{-n\theta}\sum_{k=0}^c \frac{(n\theta)^k}{k!}\]

実際グラフを描いて比較してみると、特に\(\theta < 0.1\)のときは良い近似になっていることがわかります。

以降では、ポアソン近似を用いて計算してみましょう。

 

抜き取り検査の考え方は、仮説検定の考え方によく似ています。

仮説検定で二種類の過誤があったように、抜き取り検査には二種類のリスクがあります。

不良品率が\(\theta_0 =0.02\)、\(\theta _1 = 0.15\)のところに垂直線を引きました。

\(\theta_0\)より小さな不良品率を、良い品質のロットと生産者は考えるとしましょう。この基準\(\theta_0\)を合格品質水準(AQL; acceptable quality level)と呼びます。

仮に不良品率が合格品質水準のロットであったとしても、抜き取り検査によって

約6%が不合格となります。合格ロット(合格品質水準を超えるロット)を、不合格とする確率\(\alpha\)は、生産者リスク(producer’s risk)と呼ばれるものです。これは検定でいう第一種の過誤に対応します。

 

一方で、\(\theta_1\)より大きな不良品率を持つロットを、消費者は受け入れたくないとしましょう。\(\theta_1\)を不合格品質水準(ROL; rejectable quality level, LTPD)と呼びます。

仮に不良品率が不合格品質水準のロットであったとしても、抜き取り検査によって

約20%が合格になります。不合格ロット(不合格品質水準より悪いロット)が合格となる確率は、消費者リスク(consumer’s risk)と呼ばれるものです。検定でいう、第二種の過誤に対応します。

 

Juliaによる実践例

コンピュータ、Juliaによって抜き取り検査を実験し、OC曲線や生産者・消費者リスクの意味を確かめてみましょう。

冒頭で示した\(N=1000\)個のネジを1つのロットとし、そこから\(n=20\)個のサンプルを取り出し、許容個数を\(c=1\)とします。

サンプルに含まれる不良品の個数は

といったように数えることができます。

 

ロットの不良品率が合格品質水準(\(\theta_0 =0.02\))となるような、不良品の範囲を設定しましょう。

今回は正規分布に従う乱数によってロットを生成しているので、そのような範囲が設定できます。

 

不良品の個数をカウントする関数、不良品率を求める関数を作りましょう。

試しにロットを10個作り、不良品率が約0.02となることを確認してみましょう。

 

また、抜き取り検査が合格か不合格か判別する関数を作ります。

合格なら0、不合格なら1としました。さきほどのサンプルは

となるので合格です。

 

さまざまなロットとサンプルで抜き取り検査を行い、ロットの不良品率が\(\theta_0 =0.02\)のとき、抜き取り検査によって不合格となる割合を計算します。

これが生産者リスク\(\alpha \)の意味ですね。

 

同様に、不良品率が\(\theta_1 =0.15\)(不合格品質水準)のロットからサンプルを抜き取り検査することを繰り返し、合格となった割合を計算します。

これが生産者リスクの意味ですね。

「約18%が不良品であることを生産者は受け入れる」といった誤解をしないように気をつけましょう。ロットの不良品率が15%であるにもかかわらず、抜き取り検査をすり抜けて合格になってしまう確率が約18%という意味です。

 

サンプルサイズ\(n\)や許容個数\(c\)を変えることで、消費者リスクや生産者リスクは変わります。

サンプルサイズを増やせば消費者リスクは下がりますが、その分サンプルを調べるコストが生産者側にかかる、というトレードオフの関係です。

指定された合格品質水準に対し、サンプルサイズをできるだけ小さくする\(n,c\)は数値計算によって表にまとめられています。詳しくは「入門数理統計学」など。

参考:Quality Standards – QIMA

 

以上、抜き取り検査、OC曲線とは何か、Juliaによる実践例をもとに紹介してきました。

統計学、検定の考え方の応用として、少ないサンプルで不良品のリスクできるだけ減らす抜き取り検査の考え方は、知っておくと面白いですね。

木村すらいむ(@kimu3_slime)でした。ではでは。

 

Probability and Statistics: Pearson New International Edition
DeGroot, Morris(著), Schervish, Mark(著)
Pearson Education Limited (2013-07-30T00:00:01Z)
5つ星のうち4.3
¥10,792 (中古品)

 

入門数理統計学

入門数理統計学

posted with AmaQuick at 2022.03.27
P.G.ホーエル(著), 浅井 晃(翻訳), 村上 正康(翻訳)
培風館 (1978-01-01T00:00:01Z)
5つ星のうち4.1
¥5,280

 

Advanced Engineering Mathematics
Kreyszig, Erwin(著)
John Wiley & Sons Inc (2011-05-03T00:00:01Z)
5つ星のうち4.5
¥5,862 (中古品)

 

こちらもおすすめ

組み合わせ・二項係数nCkの覚え方:パスカルの三角形

統計的仮説検定とは:平均の検定、t検定を例に、Juliaを使って

離散確率分布とは:一様分布、ベルヌーイ分布、二項分布、ポアソン分布を例に