プロトコル

[bioinfo]Nanoporeのベースコールクオリティを比較してみた。

以前のデータを使ってNanoporeのベースコーラー、Guppyのバージョン間での結果を比較してみた。ちなみにこのランはMinIONでの初めての試行で、through putが300Mbしかなかった(それでもアセンブル結果には絶大な効果があって驚いたが)。

basecallされたfastqをNanoStatとNanoPlotを使って分析。

[Guppy CPU v.2.3.5]

General summary:
Mean read length: 1,944.7
Mean read quality: 10.0
Median read length: 1,156.0
Median read quality: 9.6
Number of reads: 159,584.0
Read length N50: 2,874.0
Total bases: 310,335,247.0
Number, percentage and megabases of reads above quality cutoffs
Q5: 158281 (99.2%) 309.9Mb
Q7: 156088 (97.8%) 308.2Mb
Q10: 67808 (42.5%) 146.6Mb
Q12: 26219 (16.4%) 62.7Mb
Q15: 593 (0.4%) 0.6Mb
Top 5 highest mean basecall quality scores and their read lengths
1: 19.8 (215)
2: 19.5 (209)
3: 18.4 (252)
4: 17.9 (291)
5: 17.8 (257)
Top 5 longest reads and their mean basecall quality score
1: 91961 (9.4)
2: 79794 (8.3)
3: 76229 (10.2)
4: 75801 (11.9)
5: 72135 (9.0)

[Guppy GPU v.3.5.1]

General summary:
Mean read length: 1,948.7
Mean read quality: 9.7
Median read length: 1,159.0
Median read quality: 9.4
Number of reads: 159,584.0
Read length N50: 2,880.0
Total bases: 310,976,975.0
Number, percentage and megabases of reads above quality cutoffs
Q5: 157777 (98.9%) 310.4Mb
Q7: 149137 (93.5%) 305.1Mb
Q10: 59422 (37.2%) 148.0Mb
Q12: 22889 (14.3%) 68.8Mb
Q15: 495 (0.3%) 1.2Mb
Top 5 highest mean basecall quality scores and their read lengths
1: 19.2 (252)
2: 17.4 (240)
3: 17.2 (2467)
4: 17.1 (295)
5: 17.0 (1574)
Top 5 longest reads and their mean basecall quality score
1: 91998 (9.5)
2: 79814 (8.4)
3: 76201 (10.5)
4: 75714 (12.2)
5: 72222 (9.1)

数字だけ見ると大して変化が内容に見えるが、新しいバージョンのguppyの方が短いリードのコールを落とさずにコールしてくれているようである。
ちなみにv3.5.1のguppyはGPU(nvidia Quadro P4000)を使ったがCPU版と比べるとかなり高速でコールしてくれる。SSDに加えてGPUも必須である。nanoporeの納期や注文方法には困ったものだが、開発者とは馬が合いそうだと感じる。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です