[bioinfo]Nanoporeのベースコールクオリティを比較してみた。
以前のデータを使ってNanoporeのベースコーラー、Guppyのバージョン間での結果を比較してみた。ちなみにこのランはMinIONでの初めての試行で、through putが300Mbしかなかった(それでもアセンブル結果には絶大な効果があって驚いたが)。
basecallされたfastqをNanoStatとNanoPlotを使って分析。
[Guppy CPU v.2.3.5]
General summary: Mean read length: 1,944.7 Mean read quality: 10.0 Median read length: 1,156.0 Median read quality: 9.6 Number of reads: 159,584.0 Read length N50: 2,874.0 Total bases: 310,335,247.0 Number, percentage and megabases of reads above quality cutoffs Q5: 158281 (99.2%) 309.9Mb Q7: 156088 (97.8%) 308.2Mb Q10: 67808 (42.5%) 146.6Mb Q12: 26219 (16.4%) 62.7Mb Q15: 593 (0.4%) 0.6Mb Top 5 highest mean basecall quality scores and their read lengths 1: 19.8 (215) 2: 19.5 (209) 3: 18.4 (252) 4: 17.9 (291) 5: 17.8 (257) Top 5 longest reads and their mean basecall quality score 1: 91961 (9.4) 2: 79794 (8.3) 3: 76229 (10.2) 4: 75801 (11.9) 5: 72135 (9.0)
[Guppy GPU v.3.5.1]
General summary: Mean read length: 1,948.7 Mean read quality: 9.7 Median read length: 1,159.0 Median read quality: 9.4 Number of reads: 159,584.0 Read length N50: 2,880.0 Total bases: 310,976,975.0 Number, percentage and megabases of reads above quality cutoffs Q5: 157777 (98.9%) 310.4Mb Q7: 149137 (93.5%) 305.1Mb Q10: 59422 (37.2%) 148.0Mb Q12: 22889 (14.3%) 68.8Mb Q15: 495 (0.3%) 1.2Mb Top 5 highest mean basecall quality scores and their read lengths 1: 19.2 (252) 2: 17.4 (240) 3: 17.2 (2467) 4: 17.1 (295) 5: 17.0 (1574) Top 5 longest reads and their mean basecall quality score 1: 91998 (9.5) 2: 79814 (8.4) 3: 76201 (10.5) 4: 75714 (12.2) 5: 72222 (9.1)
数字だけ見ると大して変化が内容に見えるが、新しいバージョンのguppyの方が短いリードのコールを落とさずにコールしてくれているようである。
ちなみにv3.5.1のguppyはGPU(nvidia Quadro P4000)を使ったがCPU版と比べるとかなり高速でコールしてくれる。SSDに加えてGPUも必須である。nanoporeの納期や注文方法には困ったものだが、開発者とは馬が合いそうだと感じる。