[bioinfo]縮重塩基コードを含むアライメントのomega value(dN/dS)を算出する。
CDSをゲノムから抽出し、遺伝子ごとのmultiple FASTAファイルを作成する。脊椎動物であれば数万ファイルになるが、これを一つのファイルに入れ、SNPGenie (Nelson et al., 2015)のsnpgenie_within_group.plを使って計算させる。
SNPGenieは多型状態の塩基部分も組み合わせごとに計算するので、結構時間がかかる。数万ファイルあるとワークステーションを使っても計算に約一日必要とする。
for fasta in $(find . -name "*.fasta"); do perl snpgenie_within_group.pl --fasta_file_name=${fasta} --gtf_file ../test.gtf --num_bootstrap=0 --procs_per_node=56; done;