Windows

バイオインフォマティクスの分野では Linux マシンがよく用いられる。Linux は無償で利用できるだけでなく、ビッグデータの処理や大規模な演算などを得意とする。しかしながら Windows に比べると Linux の操作は難しく、初心者にとって取り扱いづらい。このサイトでは Linux を主に取り扱っているが、以下に Windows 向けの情報を幾つか掲載する。

ソフトウェアのインストール方法

Python Windows に Python の実行環境をインストールし、Python を実行できるようにする。Python は PyMOL(タンパク質立体構造可視化ツール)や MODELLER(タンパク質立体構造ホモロジー予測ツール)などに使われている。バイオインフォマティクスだけでなく、numpy や scipy などの強力なライブラリーを持ち、高水準の科学技術計算が行える。
Perl Windows に ActivePerl をインストールし、Perl を実行できるようにする。Perl はテキストの処理に優れているスクリプト言語である。GenBank などに保存されているデータを取得して、エキソンの部分だけを切り出したり、mRNA の塩基配列をアミノ酸配列に翻訳したりするなどの作業が簡単に行える。
R 統計学の分野でより利用されるソフトウェア。昔ながらの検定法や解析法が使えるだけでなく、発表されて間もないような新しい手法も R 用にリリースされるものが多い。特にバイオインフォマティクス、生物統計学に関しては豊富なライブラリーが提供されている。
BLAST BLAST はホモロジー検索を行うプログラムの一つで、データベース中からクエリー配列と相同性の高い配列を検索する。例えば、機能未知な新規アミノ酸配列をクエリーとして BLAST 検索を行い、データベース中にあるそれと相同性の高い配列を見つけることができる。検索された配列の特徴を考慮し、クエリー配列の三次構造や分子機能などを推定できるようになる。
Ubuntu
BioLinux
Ubuntu は Linux の一種で、比較的に初心者にとって親しみやすいシステムである。Windows 上に仮想マシン(VMware Player)をインストールし、その上に Ubuntu をインストールする方法を説明する。仮想マシンを利用することで、Windows と Ubuntu の両方が同時に使えるようになる。
BioLinux は Ubuntu にバイオデータを解析するためのソフトウェアやパッケージを予めインストールしたシステムである。多くのソフトウェアがデフォルトで入っているため、自分でインストールする手間が省けるので便利である。

Windows の設定など

クロスケーブル 2 台の Windows 7 を LAN ケーブルあるいは無線で繋ぎ、データ交換を行う方法。
環境変数の設定 一部のプログラムではインストールする際に、プログラムへのパスを手動で追加する必要がある。Windows では環境変数の設定にてパスの追加を行う。