株式会社ボーゲンファイル
トップページ
ニュース
会社概要
問合せ
赤水対策
遺伝子解析
レジオネラ症の根本対策

遺伝子解析受託サービス
★概要 ★例 ★特徴 ★性能
★ゲノム創薬にとってなぜ「系統樹」が必要か
★産業界が「系統樹」を使用する意義
★「系統樹」の種類と長所、短所
★霊長類の系統樹を最節約法で計算
★おわりに
概要 ↑ページ先頭へ

(株)ボーゲンファイルは 遺伝子解析受託サービスを提供しています。 ゲノム創薬等の分野に役立てています。 農業環境研究所の三中信宏博士やチュラルテック(株)と 共同で自社開発したシステム:Bogenを用いて 入力である塩基配列から系統樹を計算し、 また、タンパク質の復元・合成を計算しています。 膨大な組み合わせの中から高速で高精度の最適解を計算しています。

↑ページ先頭へ
■入力:塩基配列。形質数※1が20で サンプル数※2が10の入力例。
※1塩基配列の長さを以後、形質数と記します。
※2塩基配列のサンプルの数を以後、サンプル数と記します。
                     11111111112
Taxon/Node  12345678901234567890
--------------------------------
sample00    CTGACAGGGACCCTCTTGTA
sample01    TAGCAGCAGTTGTGCATTTG
sample02    TTGCCACTCATAGCCTTCCG
sample03    ATGGAGAGAAGCGCGGGCCA
sample04    CTAGAAGATAATGTCGGGCC
sample05    CTTGAGCGCGCCAAGCCCCA
sample06    GGCATTTGTAGGCAGGTTTC
sample07    CTCTCCCGCAGGGGCAATGT
sample08    GTACATTCGGTAGAACATAA
sample09    CGCTGGAATTACATTCGCCG
■出力:塩基配列から、その塩基配列の進化の変遷を系統樹で再現します。
  /--------------- sample00
  |
  |                            /------------------- sample01
  |                            |
/18      /--------------------12       /---------------------- sample02
| |      |                     \------11
| |      |                             \----------------------------- sample07
| \-----14
|        |              /----------------------------- sample06
|        \-------------13
|                       \--------------------------------- sample08
|
|                              /--------------- sample03
|                              |
|                /------------16       /------------------------- sample05
|                |             \------15
\---------------17                     \----------------------------- sample09
                 |
                 \-------------- sample04
特徴 ↑ページ先頭へ
本サービスの特徴は以下の3点です。
1.計算スピードが速い
計算量のオーダーを改善することによって 飛躍的なスピードアップを実現しています。 たとえば、 従来手法では100日かかっていた解析を1日で計算しています。
2.計算精度が高い
精度の高い最適解(=系統樹)を計算できます。 ベンチマークテスト:Zilla (形質数759、サンプル数500)の 最適解(樹長16,218)を計算できています。
3.スケーラビリティに優れている
従来手法では計算不可能だった膨大なデータ(=塩基配列、系統樹)も 計算可能です。形質数30,000、サンプル数30,000の計算実績があります。
性能 ↑ページ先頭へ
Bogenでの計算結果を以下に示します。
形質数*1:2500、サンプル数*2:100
入力: 100x2500.nex.lzh 出力: 100x2500.tre.lzh
形質数*1:1000、サンプル数*2:500
入力: 500x1000.nex.lzh 出力: 500x1000.tre.lzh
ゲノム創薬にとってなぜ「系統樹」が必要か ↑ページ先頭へ

過去「系統樹」は生物進化の過程を調べるのに 重要なツールであった事は事実でありますが、 最近この「系統樹」が生物進化の過程を 調べる学問だけの分野から、 この「系統樹」が産業界(ゲノム創薬、農業の品種改良等)の分野での活用が 要求されはじめました。 そこで「系統樹」推定の方法としては、 最節約法、最尤法、距離法(近隣結合を含む)の方法が一般的ですが、 それぞれの長所と欠点があり、これを理解して活用することが 大変重要であるにもかかはらず、「系統樹」であれば どの方法を使用しても同一であると考えられているのが現状です。 距離法だけが先行して、「系統樹」全体では よい活用方法があるにもかかわらず、 「系統樹」に対する評価は低いものでした。

産業界が「系統樹」を使用する意義 ↑ページ先頭へ
産業界で「系統樹」を使用する場合は、 A.共通祖先が復元出来る事、 次にB.近縁関係が正確に出る事、 更にC.機能遺伝子や機能タンパク質を探索するためには、 強引にブラインド・リサーチするのでなく、 「系統樹」に基づく探索をすればもっと効率的に最適な解が得られます。 これらの3項目を十分に考慮する必要があります。
A.共通祖先の復元は
祖先復元遺伝子や祖先復元タンパク質は、 生物が過去の世界で持っていた機能や活性を 現在の世界では失っている場合があります。 祖先の復元は、失った機能、 失った活性を見つける事かできます。 極論すると新しい人工タンパク質の発見を 意味するものです。
B.近縁関係の重要性は
生物関係者であれば大変に重要な事柄であることは周知の事実です。 「系統樹」の中でも最節約法は近縁関係を正確に出すことが出来ます。
C.「系統樹」を使用する意義
大量のデーターから網羅的に調査している場合は、 事の優位性が把握出来なく、時間を浪費します。 この場合「系統樹」の最節約法に基ずく探索を 行えばもっとも効率的に最適な標的を見つけることができます。
「系統樹」の種類と長所、短所 ↑ページ先頭へ

産業界が「系統樹」を使用する立場で 長所、短所を列挙します。

A.最節約法
長所 祖先の復元ができます。これは機能遺伝子、 機能タンパク質の発見につながり、 更に人工タンパク質の発見につながります。 近縁関係が「系統樹」の他の方法より正確です。
短所 従来は、計算時間が大変でしたが ソフトウェア:Bogenが開発されたことで解決しました。
実験1. 実験系統学から、 Hilis(1992)最節約法に基ずく祖先復元の正解率を調査したところ 97〜98%を超える高い値が得られました (Science,255:589-592)。
実験2. 実験生化学から、 Jermann(1995)家畜の消化酵素の最節約法にて推定し、 現存するいずれの家畜よりも5倍もの酵素活性を 持つ祖先タンパク質がウェット実験で証明されました (Nature,374:57-59)。
B.最尤法
長所 祖先の復元はできます。
短所 計算時間は実用時間で計算することは困難です。
C.距離法
長所 計算時間が速い。
短所 祖先復元ができません。産業界で使用する近縁関係は疑問があります。

霊長類の系統樹を最節約法で計算 ↑ページ先頭へ
※霊長類の系統樹と仮想祖先配列
おわりに ↑ページ先頭へ

「系統樹」の距離法ソフトは無償である為に、 バイオ関係のコンピューターに標準装備されていが、 距離法で計算されたがため、 「系統樹」の活用が産業界では有効でありませんでした。

最節約法で祖先配列から人工タンパク質の発見へと、 データー量の膨大の中から標的を絞り込む事、 近縁関係をより正確に把握出来る事、が産業界では大変に重要です。 更に、最節約法で当社が開発したソフトウェア:Bogenは、 計算時間も短時間で精度にも優れています。 最節約法の活用で良い研究成果を揚げて下さい。

本件に関するお問合せは こちらから
トップページへ戻る

All Rights Reserved, Copyright(C) Bogenpfeil Co., LTD.