Instruction manual for KNApSAcK:
A Comprehensive Species-Metabolite Relationship Database
中村 由紀子, 旭 弘子, Md. Altaf-Ul-Amin, 黒川 顕, 金谷 重彦
植物において約10万種以上が同定されているといわれている二次代謝産物の構造は多様性
に富んでおり、科や属といった特定の生物分類において存在が確認されていることからも、
代謝産物の多様性は生物の進化が反映されたものと考えられています。このことから、代謝産
物とそれが同定された生物に関するデータは、生物、化学進化や代謝経路の推定、有用物
質を合成する生物の探索等の研究に有用な情報を与えると考えられます。そこで、
生物種と代謝産物の関係を体系化することを目的に、二次代謝産物データベースシステム
KNApSAcKを開発し、無償で公開しています。
KNApSAcKは分子式、分子量、生物種名や実験によって得られたマススペクトル解析結果から
の化合物検索や、生物系統からの情報検索等がおこなえます。
A. データベースのダウンロード
KNApSAcKには自身のコンピュータにインストールして使用するダウンロードバージョンと簡易版のウェブバージョンがあります。
1. ウェブバージョン
ウェブバージョンはこちらのURLから入ってください。 -> http://kanaya.naist.jp/KNApSAcK/KNApSAcK.php
2. ダウンロードバージョン
KNApSAcKのダウンロードバージョンを使用する際には、お使いのコンピュータにJava j2sdk-1.4.2がインストールされている必要があります。
(Javaはサンマイクロシステムズのホームページからダウンロードができます -> http://jp.sun.com/ )
http://kanaya.aist-nara.ac.jp/KNApSAcK/ からソフトをダウンロードし解凍すると、KNApSAcK_databaseフォルダが
得られます。このフォルダ内には2つのフォルダ(spectrum data, taxonomic files)と2つのファイル(KNApSAcK.jar, KNApSAcK.gif)が
入っており、KNApSAcK.jarをクリックするとソフトが立ち上がります(インターネットに接続している必要があります)。
B. 検索方法
検索方法は、ダウンロードバージョンとウェブバージョンに違いはありません。Panel 1aがKNApSAcKのメインウィンドウで、パネル右下
には現在の化合物数と化合物-生物種のデータ数が表示されます。statistics of genusをクリックすると、それぞれの科(family)において
の統計情報が表示され、含まれている属(genus)の数と化合物数を知ることができます(Panel 1b)。
Panel 1a
Panel 1b
(1) 化合物名、生物種名からの検索 (パネル左・赤枠)
化合物名、生物種名からの検索では、大文字、小文字の区別をする必要はありません。また、生物種は学名で入力する必要があります。
(1a) 生物名からの検索
Organism をチェックし(Step 1 in Scheme 1a), 生物種名を入力し (Step 2) 次に「List」をクリックします (Step 3)。
入力した文字にマッチした生物種に関する情報(化合物名、分子式、分子量、文献等)が中央パネルに表示されます。
KNApSAcKは部分一致検索が可能ですので、生物名の入力の際に名前の全てを入力する必要はありません。
(Arabidopと入力すると、Arabidopを含む生物種名であるArabidopsis thaliana等が検索結果として表示されます。)
Scheme 1a
(1b) 化合物名からの検索
Metabolite をチェックし(Step 1 in Scheme 1b), 化合物の名前を入力し(Step 2) 次に「List」 をクリックします (Step 3)。
入力した文字にマッチした化合物に関する情報(生物種名、分子式、分子量、文献等)が中央パネルに表示されます。
生物名からの検索と同様に、KNApSAcKは部分一致検索が可能ですので、化合物名の入力の際に名前の全てを入力する必要はありません。
Scheme 1b
(2) 分子量からの検索 (パネル左・青枠)
分子量を入力し(Scheme 2での150)その前後の範囲(Scheme 2での1)を入力し、「List」をクリックします。
分子量が149-151の範囲にある化合物が中央パネルに表示されます。
Scheme 2
(3) 分子式からの検索 (パネル左・緑枠)
分子量を入力し (Step 1 in Scheme 3a) Listをクリックします(Step 2)。入力した分子式をもつ化合物が中央パネルに表示されます。
Scheme 3a
分子量を入力した後、「Molecular structure」をクリックすると、入力した分子量をもつ構造式一覧が
別ウインドウで表示されます。
Scheme 3b
(4) 生物階層からの検索
生物系統に関するデータはNCBI のデータを使用しています(ftp://ftp.ncbi.nih.gov/pub/taxonomy/)。
パネル右にあるピンクの枠(Scheme 4のStep 1)「Search by hierarchy」をクリックすると、各生物階層名が
表示されます。
階層を選択しクリックすると、その階層に含まれている生物系統名が表示されます (Step 2)。そのうち
の一つを選択し「Serch by …」をクリックすると、選択した系統が持つ属名がパネル右下に表示されます。
属名を選択すると(Step 3)化合物名や分子量といった情報が中央パネルに表示されます。
各階層から生物系統名を選択すると、「Serch by superkingdom」から「Surch by subtribe」までの部分に自動的に生物系統名が振られます。
例えば、familyの階層からBrassicaceaeを選択した場合、order、subclass、phylum、kingdom、superkingdomの表示が「Brassicales」、「rosides」、
「Streptophyta」、「Viridiplanta」、「Eukaryota」と自動で表示されます。
Scheme 4
Panel 2
(5) マススペクトル解析結果からの検索
[ マススペクトルデータの形式 ]
マススペクトルデータの形式はウェブバージョン、ダウンロードバージョンのどちらも同じです(Format of mass spectra data参照)。
データはタブ区切りのテキストファイルで作成して下さい。1行目はコメント行で「:」ではじめる必要があり、2行目は実験名を
入れる行で「:Mean_Mass」ではじめて下さい。ファイルの1列目はm/zを入れ、2列目以降は実験で得られたm/zを入れてください。
以下の例では1行目のコメント行に「:Arabidopsis T87 14days-Negative mode Scaling」を、2行目には
「:Mean_Mass」に続きタブ区切りで「Light」、「Dark」、「Light_2」と3つの実験名を入れています。3行目以下は
m/zが続いています。
Format of mass spectra data
(5a) ウェブバージョン
MASS dataにマススペクトル結果を貼り付けた後(Scheme 5aのStep 1)、
「submit」をクリックし(Step 2)、Display chartの「Your data」をクリックしてください。
表示させたい実験名を選択すると、解析結果のチャートが
表示されます (Panel 3)。
Scheme 5a
(5b) ダウンロードバージョン
マススペクトル解析結果のファイルをKNApSAcK_databaseフォルダ内にあるspectrum dataフォルダの
中に保存してください。KNApSAcK.jarをクリックしてソフトを立ち上げ、Display chartの「Select MS data」をクリックしてください。
表示させたい実験名を選択すると、解析結果のチャートがパネル下半分に表示されます (Panel 3)。
Panel 3
スペクトルデータは同時に3つまで表示することができ、それぞれ別の色で表示されます(赤、青、緑)。
3つのデータのうち前面表示するデータはPanel 3のAの部分で選択できます。
ファイル内の全ての質量はパネル左に表示されます(C)。リスト内の質量を選択するとパネル上段のチャートにある
黒のポインターが選択した質量の位置に移動します。また、チャートの下段(B)は黒のポインター位置の拡大図です。
質量を選択する際には前後の範囲を設定することができ(D)、その範囲内に分子量をもつ化合物のリストが
中央パネルに表示されます。
実験で使用したイオンを考慮した分子量にするには「Actual」をクリックし[Actual+NH4]+、
[Actual+K]+、[Actual+Na]+、[Actual+H]+、
[Actual-H]-から使用したイオンを選択してください。
例えばm/z値、95.02147002に対し、[Actual-H]-を選択するとイオン化を考慮して
96.0292951019 = 95.02147002 + 1.0078250319(水素のモノアイソトピック質量)となります。
化合物等の情報は96.0292951019を基準に表示されます。
Copyright (C) 2007 NAIST Comparative Genomics Laboratory All Rights Reserved.