雑記

slurmによるAlphafold3クラスタの構築

新規ゲノム決定において、タンパク質の機能解析を網羅的にできたら魅力的なことに違いない。そんなことを考えてスモールスケールの解析に着手していたら、縁あって三浦恭子先生(九州大学)との共同研究において、ゲノムにコードされる全タンパク質の構造解析を担うこととなり、Alphafold3(Af) による計算を行っている。これまでに12台のAf計算用PCを導入して、すでにAf2による全タンパク質の計算は完了し、精度向上が望めるAf3での再解析にあたって、slurm (Simple Linux Utility for Resource Management) work managerによるクラスタ化システムを構築した。というのも、Af2での計算の際は、個々のPCにジョブを手動で割り振ってloop処理で計算をさせたのだが、結構な頻度でマシントラブルがあり、予定よりもかなり遅滞した。また個々にジョブを投入するのは非効率であるので、クラスタ化による臨機応変なジョブ分散を狙って、slurmによるクラスタを構築した。

PCは1年目と2年目に分けて導入しており、若干基盤等が異なるが、計算ノードは概ね下記の仕様とした。ヘッドは私の10年以上前の退役ノートPC。

CPU: AMD Ryzen7 7700X
RAM: DDR5 128GB
NVMe: 4TB
HDD: 4TB
GPU: Nvidia RTX3060 / RTX4070Ti Super

このクラスタをフル稼働させると平均的な長さ(500残基程度)のタンパク質であれば、1日あたり約600個が構造推定が可能で、仮に1つの生物種にisoformを含めて4万程度あるとすると、2ヶ月程度で完了できる。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です