プロトコル

[bioinfo]縮重塩基コードを含むアライメントのomega value(dN/dS)を算出する。

CDSをゲノムから抽出し、遺伝子ごとのmultiple FASTAファイルを作成する。脊椎動物であれば数万ファイルになるが、これを一つのファイルに入れ、SNPGenie (Nelson et al., 2015)のsnpgenie_within_group.plを使って計算させる。
SNPGenieは多型状態の塩基部分も組み合わせごとに計算するので、結構時間がかかる。数万ファイルあるとワークステーションを使っても計算に約一日必要とする。

for fasta in $(find . -name "*.fasta"); do perl snpgenie_within_group.pl --fasta_file_name=${fasta} --gtf_file ../test.gtf --num_bootstrap=0 --procs_per_node=56; done;

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です