Quantile正規化

quantile 正規化法は、各群のデータ分布の統計量をまったく同じように揃える方法である。次のような手順で求める。

  1. 各群のデータをそれぞれ独立に昇順に並べ替える。
  2. 並べ替えたデータに対して、平均値を求める。
  3. 平均値を、オリジナルデータと置換する。

次に示したデータに対して quatile 正規化を行う例。

A 群B 群
遺伝子 11314
遺伝子 25155
遺伝子 33487
遺伝子 42166
遺伝子 51512
平均26.846.8

A 群と B 群をそれぞれ独立に昇順に並べ替えてから、各行の平均値を計算する。

A 群B 群平均
遺伝子131212.5
遺伝子151414.5
遺伝子215538.0
遺伝子346650.0
遺伝子518769.0

次に、データを正規化する。

例えば、A 群遺伝子 1 のデータは「13」。平均値の表から、A 群遺伝子 1 「13」に対応する平均値は「12.5」である。よって、正規化後の A 群遺伝子 1 のデータは「12.5」になる。

次に、B 群遺伝子 1 の例。B 群遺伝子 1 のデータに対応する平均値は「14.5」である。よって、正規化後の B 群遺伝子 1 のデータは「14.5」となる。

すべての遺伝子について、この操作を行う。正規化後のデータは次のようになる。

A 群B 群
遺伝子 112.514.5
遺伝子 269.038.0
遺伝子 350.069.0
遺伝子 438.050.0
遺伝子 514.512.5
平均26.826.8

References

  • Bolstad BM, Irizarry RA, Astrand M, Speed TP. A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics. 2003, 19(2):185-93. PubMed Abstract
  • Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome Res. 2008, 18(9):1509-17. PubMed Abstract
  • Eisenberg E, Levanon EY. Human housekeeping genes are compact. Trends Genet. 2003, 19(7):362-95. PubMed Abstract