ROSALINDをはじめた

http://rosalind.info/problems/list-view/

Project Eulerが死亡してすぐにこのサイトを見かけた。前からあることは知っていたが。そして木曜からはじめてとりあえず10問解いた。

ここはバイオインフォマティックス版のProject Eulerらしい。これを解いていくとバイオインフォマティックスに詳しくなれる、またはバイオを知っている人がプログラミングを勉強できるようなことになっているようだ。

問題自体は今のところ簡単だが、英語をたくさん読まないといけない。問題に例が載っているので、それを使ってコードを書く。そして、データをダウンロードする。答えを出して、それをアップロードする。ただし、ダウンロードを開始してから5分以内(今のところ)にアップロードする。

少しだけ問題のレビューを。

5問目、GC含量を求めるだけ。だが、率と%を最初間違えた。
7問目、確率を求める問題だが、英語をなかなか理解できなかった。
8問目、RNAからタンパク質を1文字で表した文字列を求める。そのタンパク質を1文字で表す表がなかなか見つからずに苦労した。


追記:
15問目まで解いた。

12問目はVelvetとか(よく知らない)のアセンブラのグラフを作るまで。
14問目はナイーブに実装したらPyPyで30秒もかかった。少し見直したら0.5秒になった。もっと速くなる方法はあるので、後日考える。