Picard

Picard は高速シーケンサーの出力データのフォーマットを変換したり、編集したりするソフトウェアである。Java で関われているプログラムであり、基本的に jar ファイルを指定して実行する。

java -jar picard.jar -h

Picard には多くの機能が実装されている。Picard Tool documentation のページに実行した機能および豊富な使い方が公開されている。

CreateSequenceDictionary

FASTA フォーマットのリファレンス配列を読み込んで、配列ディクショナリーを作成する。GATK などを利用するときに、この配列ディクショナリーを用意する必要がある。

java -jar picard.jar CreateSequenceDictionary R=human_g1k_v37_decoy.fasta O=human_g1k_v37_decoy.dict
head human_g1k_v37_decoy.dict
## @HD	VN:1.5	SO:unsorted
## @SQ	SN:1	LN:249250621	M5:1b22b98cdeb4a9304cb5d48026a85128	UR:file:/Users/../human_g1k_v37_decoy.fasta
## @SQ	SN:2	LN:243199373	M5:a0d9851da00400dec1098a9255ac712e	UR:file:/Users/../human_g1k_v37_decoy.fasta
## @SQ	SN:3	LN:198022430	M5:fdfd811849cc2fadebc929bb925902e5	UR:file:/Users/../human_g1k_v37_decoy.fasta
## @SQ	SN:4	LN:191154276	M5:23dccd106897542ad87d2765d28a19a1	UR:file:/Users/../human_g1k_v37_decoy.fasta
## @SQ	SN:5	LN:180915260	M5:0740173db9ffd264d728f32784845cd7	UR:file:/Users/../human_g1k_v37_decoy.fasta
## @SQ	SN:6	LN:171115067	M5:1d3a93a248d92a729ee764823acbbc6b	UR:file:/Users/../human_g1k_v37_decoy.fasta