ORI-GENE: A Tool for Gene Classification and Prediction of Function Based on the Evolutionary Tree
manuscript - presentation
水野英明1,2$田仲可昌1中井謙太3、皿井明倫2#
1筑波大学、2理化学研究所、3東京大学、現$中外製薬、現#九州工業大学

近年、ゲノム研究が本格化し、塩基配列情報に基づいて多くの機能未知遺伝子が同定されている。こうした遺伝子の機能推定は一般的に、相同性検索によって既知遺伝子との相同性を見つけ、両者が類似する機能を持っていると結論する方法によってなされてきた。しかし、この方法は機能既知遺伝子と相同性が見つからない場合、何の手がかりも与えない。相同性検索結果からより多くの生物学的情報を抽出するための手法・ツールの開発が期待されている。

ゲノム研究の本格化による配列情報の蓄積は、相同性検索の新しい応用−各生物種に類似の遺伝子が存在するかどうかを調べる−を可能にした。我々は相同性検索結果から得られる、類似遺伝子の生物種間における有無の情報を進化系統樹に投影し、遺伝子の進化的な情報を抽出する新しいアルゴリズムを考案した。そして、それを実現するためのツール;ORI-GENEを開発した。ORI-GENEはグラフィカルなインターフェースを備えたツールで、次のように機能する。1)相同性検索結果の遺伝子IDから各類似遺伝子がどの生物種に由来するかを識別する。2)系統樹に識別された生物種を割り当て、各々を再短距離で結んだ分布パターンを作成する。3)分布パターンの最初の分岐点”Origin”を求め、この位置に基づいて遺伝子を分類する。

我々はORI-GENEを実際のデータに適用し、こうした機能が相同性検索結果の解釈に有効であることを次のように示した。

Ⅰ)遺伝子伝播の様子を推測する;遺伝子の伝播は基本的に祖先から子孫への一方向に起こる。したがって、系統樹上に遺伝子の分布パターンを示すことで、遺伝子がどのように広がっていったのかを推測することができる。ORI-GENEを用い、微小管を構成する因子の1つである beta tublinの遺伝子分布を調べたところ、この遺伝子が真核生物に広範に存在し、原核生物・古細菌には存在しないパターンが示された。微小管は真核生物に特有の構造で、beta tublinの分布は真核生物に限定されると予測されている。ORI-GENEによる解析結果は、この遺伝子が真核生物の成立に近い時期に獲得され、それ以降の生物に垂直伝播していったという説を支持した。一方、ribulose 1,5-bisphosphate carboxylase (RuBisCo) small subunit(rbcS)の遺伝子分布を調べたところ、cyanobacteria, proteobacteria, plantaeの3系統への不連続な分布パターンが示された。RuBisCoについては水平伝播によって光合成細菌に広まり、その後、共生によって植物の起源となる原始真核細胞に広まったとする説が有力である。ORI-GENEの示した遺伝子分布パターンも、この遺伝子に垂直伝播以外のイベントが起きたことを示唆した。

Ⅱ)遺伝子の進化的役割を考察する;遺伝子の獲得は生物進化において重要な役割を果たしてきた。したがって、遺伝子の進化的起源(=“Origin”)の推定は、その役割を考察する手がかりになる。ORI-GENEを用い、出芽酵母Saccharomyces cerevisiaeの6,241遺伝子を解析した結果、遺伝子は”Origin”に応じて10のクラスターに分類された。 MIPSデータベースの機能アノテーションを参照し、各クラスターの遺伝子構成を調べたところ、全生物の起源となる'root'クラスターでは代謝(49.6%)やエネルギー生産(18.1%)といった基本的な生命維持に関係する遺伝子の比率が高くなっていた。一方、真核生物の起源となる'Eukaryota'クラスターでは細胞内輸送(12.8%)やシグナル伝達(17.5%)など複雑な細胞構造を維持するための遺伝子の比率が高くなっていた。これらの結果から、”Origin”に基づく遺伝子分類は進化的役割を反映しており、各クラスターに含まれる未知遺伝子の役割を生物進化の面から考察できることが示唆された。これは既知遺伝子のアノテーションに依存しない機能推定であるという点で新しい。

ORI-GENEはウェブ上で公開(http://www.abren.net/ORI-GENE3)されている。この遺伝子解析ツールは、今後の大規模ゲノム解析において威力を発揮するだろう。
Screenshots
Hideaki Mizuno - ABREN - KIT