- 春はまだか

2005/02/21/Mon.春はまだか

部屋の中で白い息を吐きながら日記を書いている T です。こんばんは。

今夜は寒い。洗濯物が凍らせた豚バラ肉のようになっていたのには笑った。そのうち暖かくなるだろうと、壊れたヒーターを放置したままにしているけれど、直しに行こうか行くまいか。バイクに積めるとは思うが、そのバイクも、寒いからバッテリーを抜いて置きっぱなしにしているんだよなあ。

DNA to Protein

スクリプトといえども言語は言語、使わないとすぐに忘れてしまう。文字列の扱いとハッシュの勉強を兼ねて、「DNA to Protein」というプログラムを組んでみた。名前の通り、DNAの塩基配列をアミノ酸配列に翻訳するスクリプトである。専用ソフトに比べるとクソみたいなものだが、急な用事でDNAを翻訳したいとき(どんなシチュエーションだ)なんかにはお手軽に使えると思う。

主な機能は以下の通り。

  1. DNA の塩基配列をアミノ酸配列に翻訳する。使える塩基は「A, T, G, C, U」の 5種類。大文字小文字は問わない。
  2. スペース、タブ、改行、数字、ハイフンは無視される。論文などの塩基配列をそのままコピー&ペーストしても恐らく大丈夫。
  3. アミノ酸の 1文字/3文字表記を選択可能。
  4. アミノ酸の残基数、タンパク質の分子質量、各アミノ酸残基の含有率・含有量を計算する。

現在判明している問題点は以下の通り。

  1. 上述した以外のアルファベット、記号、日本語を入力するとエラーになる。
  2. ポリペプチドの途中に出てくるストップコドンは、分子質量 0 のアミノ酸として計算される(最後のストップコドンは正常に処理される)。

対応を考えている機能は以下の通り。

  1. マルチフレーム対応。
  2. アンチセンス対応。

難しい処理ではないので、そのうち実装すると思う。