CNVs

2 倍体生物の場合は、一般に 1 つの遺伝子に対して父親由来と母親由来の 2 コピーを持つ。しかし、中には、1 コピーになったり、3 コピー以上になったりするような遺伝子も存在する。このように、個体によってコピー数が異なる遺伝子、正確には、個体によってコピー数が異なる DNA 領域のことを CNV (copy number variation; コピー数多型)と呼ぶ。CNV の長さは多様であり、300 bp と 6 kb 前後の CNV が最もよく見られる。

WES (whole-exome sequencing) データから CNV を検出するソフトウェアおよびその入出力データのフォーマットは以下のようになってる(Tan et al., 2014)。

ソフトウェア入力フォーマット出力フォーマットアルゴリズム
CODEX (Jiang et al., 2015)BAMTSVHMM
XHMM (Fromer et al., 2012)
GATK depth-of-coverage fileVCF, TSVPCA, HMM
CoNIFER (Krumm et al., 2012)BAM, RPKMTSVSVD
ExomeDepth (Plagnol et al., 2012)BAMCSVHMM, beta-binomial model
CONTRA (Li et al., 2012)BAMVCF, TSVbase-level log-ratio

References

  • Tan R, Wang Y, Kleinstein SE, Liu Y, Zhu X, Guo H, Jiang Q, Allen AS, Zhu M. An evaluation of copy number variation detection tools from whole-exome sequencing data. Hum Mutat. 2014, 35(7):899-907. DOI: 10.1002/humu.22537 PMID: 24599517
  • Fromer M, Moran JL, Chambert K, Banks E, Bergen SE, Ruderfer DM, Handsaker RE, McCarroll SA, O'Donovan MC, Owen MJ, Kirov G, Sullivan PF, Hultman CM, Sklar P, Purcell SM. Discovery and statistical genotyping of copy-number variation from whole-exome sequencing depth. Curr Protoc Hum Genet. 2012, 91(4):597-607. DOI: 10.1016/j.ajhg.2012.08.005 PMID: 23040492
  • Krumm N, Sudmant PH, Ko A, O'Roak BJ, Malig M, Coe BP; NHLBI Exome Sequencing Project, Quinlan AR, Nickerson DA, Eichler EE. Copy number variation detection and genotyping from exome sequence data. Genome Res. 2012, 22(8):1525-32. DOI: 10.1101/gr.138115.112 PMID: 22585873
  • Plagnol V, Curtis J, Epstein M, Mok KY, Stebbings E, Grigoriadou S, Wood NW, Hambleton S, Burns SO, Thrasher AJ, Kumararatne D, Doffinger R, Nejentsev S. A robust model for read count data in exome sequencing experiments and implications for copy number variant calling. Bioinformatics. 2012, 28(21):2747-54. DOI: 10.1093/bioinformatics/bts526 PMID: 22942019
  • Li J, Lupat R, Amarasinghe KC, Thompson ER, Doyle MA, Ryland GL, Tothill RW, Halgamuge SK, Campbell IG, Gorringe KL. CONTRA: copy number analysis for targeted resequencing. Bioinformatics. 2012, 28(10):1307-13. DOI: 10.1093/bioinformatics/bts146 PMID: 22474122
  • Jiang Y, Oldridge DA, Diskin SJ, Zhang NR. CODEX: a normalization and copy number variation detection method for whole exome sequencing. Nucleic Acids Res. 2015, 43(6):e39. DOI: 10.1093/nar/gku1363 PMID: 25618849