« September 2008 | Main | January 2009 »

December 2008

2008.12.29

ノイズの話(3)JISは液クロとガスクロでノイズの定義が違う

ノイズの定義法が複数あり、それぞれの違いや使い分け方について明記された資料が見つけられないことを話題にしている。各文献はどのような表現を使ってノイズを定義しているか、個別にやや詳しく見ていこう。

一番不思議なのは、JIS(日本工業規格)の分析通則の中で、ガスクロと液クロとでは定義が違う点だ。
JISは下記サイトで規格番号または規格名称を入力することにより検索・閲覧できる。
  JIS検索

 JIS K 0114:2000 ガスクロマトグラフ分析通則
この規格では、検出下限の求め方はa)とb)の2通りが定められている。a)がS/N比に基づく方法。

既知の低濃度の分析対象物を含む試料の一定量をガスクロマトグラフに注入し、得られたシグナルSとベースラインノイズNを同条件で測定する。シグナル対ノイズ比が2又は3を検出下限とする。 検出下限は次で示される。
検出下限D = 2N/S又は3N/S
(津村注:シグナルは検出器の感度として定義されているためSが分母になる。)
次のような図が付いている。(そのまま画像を貼ると著作権侵害になるので、本質を損ねないように津村がスケッチしたもの。きれいでありませんがご容赦を。)
Noisegc
振れ幅そのものがN とされていることがわかる。 なおb)法は、検量線から求めた濃度ゼロにおけるシグナルの標準偏差に3.3を掛けて濃度に換算し検出下限とするもの。

 JIS K 0123:2006 ガスクロマトグラフィー質量分析通則
ガスクロ通則と同じ。

 JIS K 0124:2002 高速液体クロマトグラフィー通則
ブランク試料の測定値の標準偏差から求める方法を述べた後、次のように述べている。

また、検出下限は、シグナルSとノイズNとの比、すなわちS/Nの値が2又は3の場合の目的成分量又は濃度としてもよい(24)(25)。この方法で検出下限を述べる場合は、必ずS/Nの値と、記録計の応答時間又はデータ処理装置のパラメータ(積分時間など)を併記する。これは、通常、単一の分析対象成分を極めて低濃度に含む試料のクロマトグラムを図11に示すように、ノイズレベルが十分に測定できるように高感度に記録して描き(図11の細線)、次のようにして求める。
 シグナル:検出器出力の平均値を線で結びノイズを含まないクロマトグラム(図11の太線)を得て、ベースラインからピークの頂点までのピーク高さhをシグナルSとする。
   S = h …………………(1)
 ノイズ:ピークの前後におけるベースラインの、ピーク半値幅の20倍の間における出力信号の最大値と最小値の差の振れ幅の1/2をノイズNとする(26)。
   N = hN / 2 …………………(2)

 注(24) S/N = 2を検出下限として定めると、理論的には、これは誤りの確率0.1%で、ブランク信号と区別できる信号を与える分析対象成分の濃度(量)であるといえる。
  (25) S/N = 2又は3を検出下限として定めるのは、S/N = 2では理論的には誤りの確率が0.1%であるとはいえ、ドリフト、ふらつき、汚染などの影響で、経験的には2~3にするのが妥当であると判断されているからである。
  (26) JIS K 0114とは定義が異なるので注意する。

参考 検出下限は、IS0 11843-1 : 1997“capability of detection 第1部 用語と定義”では“minimum detectable value of the net state variable 検出可能な最小正味状態変数値”と呼び、JIS Z 8462-1 : 2001としてJIS化され、“検出下限”という用語は使用しない方向にある。


図11のスケッチはこれ。振れ幅の1/2がN である。
Noiselc

 JIS K 0136:2004 高速液体クロマトグラフィー質量分析通則
液クロ通則とほぼ同じ。

液クロとガスクロでなぜノイズの定義法が違うのか?液クロ通則の注(26)には「ガスクロ通則とは定義が異なる」と書かれているわけだが、その理由や意味の違いについては説明されていない。

説明を求めてJISの解説書をひもといてみた。
田中 龍彦 (編集) 「化学分析の基礎と実際 (JIS使い方シリーズ)」(日本規格協会、2008)では、化学分析の信頼性の章で「検出下限は、検量線標準液を繰り返し測定した実験標準偏差の3倍に相当する濃度などで計算される」と述べているのみ。クロマトグラフィーの章は7ページだけで、検出限界については書かれていない。

文面だけを比較すると、LCの規格のほうが細部に気を配って書かれているようであり、「振れ幅の1/2」をノイズ幅とする方法は「振れ幅」を使う方法を踏まえた上で、何らかの事情があって出てきたもののようにも思える。この背景を知っている人がいたらぜひ教えてほしい。

| | Comments (2) | TrackBack (1)

2008.12.28

ノイズの話(2)S/N比から検出限界を求める便利さと危うさ

昨日書いたように、S/N比から検出限界を求める際のNの決定方法には少なくとも3通りあるらしい。
ところでそもそも、「S/N比から検出限界を求める」は統計学的にはどのような位置づけなのか。この点についてちょっと確認しておく。

Noisegreen

James N. Miller、Jane C. Miller 著「データのとり方とまとめ方―分析化学のための統計学とケモメトリックス 第2版」(共立出版、2004)は、化学分析データの取り扱いに関して定番といってよい教科書だと思う。ところが、この本ではS/N比から検出限界を求める方法について触れていない。では、どうしろと書かれているか。
要約すれば、ブランク信号の標準偏差sBから検出限界を求める。分析対象物質をまったく含まないブランク試料の測定値の標準偏差を求め、
 検出限界=(ブランク信号+3 sB ) / 検量線の傾き
とする。
この中に出てくる3という数字は固定されたものでなく、分析目的に応じて任意に選ぶ。sBの求め方としては、ブランク実験を数回行う方法と、検量線の切片の標準偏差を計算する方法とが挙げられ、後者のほうが優れているとされる。

化学同人編集部編「実験データを正しく扱うために」(化学同人、2007)も確かめてみた。こちらにもMillerの本と同様S/N比から検出限界を求める方法については書かれていない。

丹羽誠さんの「これならわかる化学のための統計手法―正しいデータの扱い方」(化学同人、2008)は、統計学的に厳密なことだけでなく、分析において現実に使われている手法も紹介している本だ。この本にはこうある。

クロマトグラムの解析など、シグナルとノイズの弁別が目視的に容易な場合には目視的に認識できる特異的なシグナル(クロマトグラムのピーク)をシグナル、バックグラウンドノイズをノイズと定義して運用することも多い。一般に、シグナル対ノイズ比が2~3となる濃度または量を検出限界とする。

短い記述だ。残念ながら、ノイズの大きさをどう見積もるかについては書かれていない。

以上簡単に見たように、S/N比から検出限界を求めるのは統計学的に扱いにくい(相手にされていない?)方法のようだ。その理由はいくつも考えられるので追々書いていきたい。統計学的にはブランク信号の標準偏差から検出限界を求める方法がスタンダードである。これは上に挙げた3冊すべてに書かれている。

しかしブランク信号の標準偏差を求めるのは手間がかかる。それに対してS/N比はただ一回の測定から求めることができる。統計の本における扱われ方に反して、もっと分析実務に近い文献では幅広くS/N比が使われている。次回以降はそれぞれの文献の内容を紹介したい。

Noisered

(挿入したノイズ画像はExcelでランダム関数を使って描いたもの。乱数を生成しなおすたびにパターンが変わり、同じものは二度と現れない。なんだか美しい形なので、つい色々遊んでしまった。)

| | Comments (0) | TrackBack (0)

2008.12.27

ノイズの話(1)こんな基礎的なことが不統一

「検出」か「不検出」か?
分析に縁のない人にも、両者が大きく違うことはぼんやりわかると思う。検出限界ぎりぎりの「検出」とぎりぎりの「不検出」、実際の物質量としてはほとんど同じでも、与える影響の大きさが天と地ほど違う場合がある。

残留農薬、環境汚染物質、品質管理・・・機器分析では、この図のようなデータ(クロマトグラムまたはスペクトル)を使って「検出」か「不検出」かを決めることがよくある。

Noise1

では問題。AからCの中で「検出と不検出の境界」を表すピークはどれでしょう。つまり、一般的に「この大きさ以上のピークが現れたら『検出』、これ以下なら『不検出』」と合意されているのはどの図でしょう。(S/N=3を検出限界とする。)

こんな図なんか見たこともないという人は、直感的にどれか考えてみてほしい。
ある程度化学分析の経験を積んだ人は、正解と思う図を選んだだろう。

私はずっとAが正解だと思ってきた。自分の使っている装置のデータ処理ソフトがそうなっているからだ。ところが「ぶんせき」12月号に掲載された山下博教さん「スペクトルデータ、クロマトグラムデータの取り扱い」にBの方法のみが書かれているのを読んで、おやっと思った。そしてさらにCの方法もあることを知った。つまり、AからCのいずれも正解らしいのである。

これらの図の違いはノイズの大きさNの定義の仕方だ。
ある時間範囲におけるベースラインの最小値と最大値を「振れ幅」と呼んでおく。振れ幅そのものをNと考えるのがA法、振れ幅の1/2とするのがB法、同じく2/5とするのがC法である。
(少し説明を簡略化している。)

科学の世界では、同じ言葉に対して複数の定義があることは珍しくない。しかし、そのように混乱しやすい事項については教科書に「○○の定義と××の定義がある。その経緯は・・・」といった解説が書かれているものだ。
ところがこのノイズの求め方については、今のところ見つけた限りではどの解説も唯我独尊状態で、それぞれAからCのうち一通りしか書かれていない。これでは、どんな場合にどれを用いるのが適当か判断ができない。

S/N=3または2を検出限界とする方法は厳密なものとは言えないが、使いやすさとわかりやすさから広く普及している。それなのにこんな不統一があったとは驚きだ。日常的にクロマトグラフィーを使う身としては、それぞれの背景くらいは知っておきたい。
例年よりも長い年末年始の休暇を使って、この問題について私が集めた情報を整理してみようと思う。

各方法の代表例
 Aの求め方を採用
 JIS K 0114 ガスクロマトグラフ分析通則
 IUPAC オレンジブック
 アジレントのGCデータ解析用ソフト
 島津のLCデータ解析用ソフト
 ASTM規格

 Bの求め方を採用
 JIS K 0124 高速液体クロマトグラフィー通則
 第15改正日本薬局方第一追補 一般試験法 液体クロマトグラフィー
 ヨーロッパ薬局方 液体クロマトグラフィー

 Cの求め方を採用
 環境省「要調査項目等調査マニュアル」

| | Comments (2) | TrackBack (1)

« September 2008 | Main | January 2009 »