大量塩基配列登録申請システムができるまで

今日の生命科学研究には塩基配列データというものが欠かせません。これは生物の遺伝情報を特定のルールに従って表現したもので、ATTAAAGGTT... のような見た目をしています。

塩基配列データは科学の公共財であり、目的や国籍に関わらず誰でも利用できることが望ましいと考えられます。そのため日米欧の研究機関は連携して国際塩基配列データベースの共同運用をしています。この取り組みを INSDC (International Nucleotide Sequence Database Collaboration) と言います。

INSDC の一員として塩基配列データベースの構築・運用を行っている日本の組織が DDBJ (DNA Data Bank of Japan) センターです。国内の研究者は DDBJ センターに塩基配列データを提出することで世界中の研究者に自身の成果を共有できます。

さて、簡単に「データを提出する」と書きましたが、そのデータが例えば 10GB ある場合はどうしたらいいでしょうか。アップロードしてもらうだけなら何とかなるかもしれませんが、パースした結果をその場でユーザに提示したいとなったらどうでしょうか。今回はそんな Web システムの開発を請け負った話をします。

アバター画像:Keita Urashima
Keita Urashima

フリーランスのプログラマ。Ruby と Gentoo Linux と 3 ではない Web が好き。