遺伝子万能解析サイト All-IN-ONE SEQ-ANALYZERは、遺伝子やタンパク質の配列解析を簡単に行うためのサイトです。いわば、遺伝子解析ソフトのオンライン無料版です。本サイトを利用することで、今まで個々の遺伝子解析ソフトやブックマークに列挙した解析サイトに一々カット&ペーストをしていたわずらわしさから開放されます。といっても解析は他の解析使用料フリーの専門サイトで行っており、本サイトはこれらのサイトへのいわば共通のゲートなのです。さあ、次世代の配列解析をはじめましょう!
本HPはJAVAScript 1.2を利用しているので以下のブラウザのご利用を推奨します。
もしも上記をお持ちでない方は上記のリンクをクリックしてダウンロード(無料)されることをお勧めします。著者はネットスケープのWindows95用最新版を利用しています。同環境であればおそらくまちがいなく動くと思います。
読み方
「本HP」とは遺伝子万能解析サイト All-IN-ONE SEQ-ANALYZER(http://www-personal.umich.edu/~ino/blast.html)を指します。
本HPで利用できる配列は一文字表記法のDNAおよびアミノ酸配列です。
本ページ上部の大きなテキストボックスに配列を入力できます。
入力は他のホームページやお手持ちのエディタ(またはワープロ)から配列をカット&ペーストするか、 直接タイプしてください。
配列のみを入力されることを推奨いたしますが、ほとんどの場合、EMBLフォーマットやGenBankフォーマットでも問題はないようです。また、例え、問題があってもブラウザの「戻る」のコマンドでそのサイトから戻った後、Plain seq変換を行うと問題は解決します。
テキストボックス下のClearボタンを押すと入力された配列をクリアできます。
ここでいう配列の変換とは"Convert to "の中にあるコマンドを指します。
これらのコマンドはJAVAScriptを利用しているおり、処理は本HPで行っています。
Plain sequence変換コマンドはEMBLフォーマットやGenBankフォーマットなど配列から不要な数字やスペース(空き文字)を除去して全ての解析サイトに使用できるようにします。この時、注意しなければならないのは、配列と同種の文字は除かれないことです。従って、EMBLフォーマットやGenBankフォーマットの配列のうちの、配列記述部分だけをテキストボックスに入力する必要があります。また変換後の文字は全て大文字となります。どうしてかって?それは作者が大文字表記が好きだからです。(^^;) G C A→GCA
Comp.seq変換は核酸配列を相補配列に変換します。このとき、Plain seq変換コマンド(上記参照)も行なわれます。 AATC→GATT
配列を大文字に変換します。 gatc→GATC
配列を小文字に変換します。 GATC→gatc
全配列を選択します。 クリップボードに入力したり、キー配列の全置換に使うと便利です。
- Homology Search -
配列相同性検索(BLAST)
配列の相同性検索をBLASTプロトコールに従い行います。ひらたくいうと、あなたの配列と同じもの、似たものを見つけます。配列の解析には自分でパラメーターを設定するMannual Modeと、作者推薦のパラメータを利用した自動モード(Search with the best presets)があります。また、探せるデータベースはGenBankとDDBJを用意しました。
Search with the best presets
パラメータの設定の手間を省くために解析目的別に予め作者推薦のパラメータを準備しました。Mannual Mode
同一遺伝子があるかを検索するのに向いています。
処理は速いですが、相同性検出感度が低いです。
同一タンパク質があるかを検索するのに向いています。
処理はもっとも速いですが、相同性検出感度が低いです。
相同性のあるタンパク質を全てピックアップします。
処理は遅いですが、相同性検出感度が高いです。
ESTデータベースをタンパク質キー配列として検索します。 HTGSデータベースをタンパク質キー配列として検索します。 PSI BLASTをタンパク質キー配列として検索します。
GenBankの検索サイトと同様、自分で全てのパラメータを設定できます。
処理はGenBankと全く同一なので、そちらの説明を参考にしていただければ幸いです。GenBankとDDBJ検索の違い
基本的にデータベースは日々アップデートされているので同じです。ただ、両者の検索のBLASTプロトコールを変えています。従って結果もそれに従って違ってきます。特に、相同性の少ないタンパク質間で大きな差が出ます。GenBankの方は局所的な相同性を中心に検索しています。DDBJの方は検出感度がよくないので確認用です。
- Protein Analysis -
タンパク質配列の解析
タンパク質配列の性質を調べます。
コマンド 説明 利用サイト Profiles ドメイン構造データベースに似た配列があるかどうかを検索します ISREC ProfileScan Patterns タンパク質パターンデータベースに似た配列があるかどうか検索します ScanProsite SMART ProfileScanと同様の機能があります。 SMART Conserved Domain ドメイン構造データベースを最大感度で検索します CDD pI&MW 等電点と分子量を求めます Compute pI/Mw tool Hydropathy Kyte&Dolittle法で疎水性領域を調べます ProtScale 2nd Structure 二次構造を予測します NNPREDICT coiled-coil coiled-coil領域があるかどうか予測します COILS Cellular Localization 細胞内局在性を予測します PSORT Digest プロテアーゼ切断断片を求めます PROLYSIS
DNA配列の性質を調べます。
コマンド 説明 利用サイト Translate DNAを翻訳します The Protein Machine Restriction Sites 制限酵素切断部位を求めます Webcutter PCRPrimer Tm計算からPCRプライマー配列を求めます Virtual Genome Center ORF 読み枠を見つけます。翻訳もできます ORF Finder(NCBI) Intron/Exon Intron/Exon構造の予測します Splice Site Prediction by Neural Network Scan Gene 遺伝子の存在を予測します。29168 bp以上はメールサーバーが利用可能 ScanGene ([1, 2, 3]) Find Genes 遺伝子の存在を予測します。29168 bp以下です FGENES in CCG Transcriptional Elements 転写調節領域を予測します TFSEARCH
本HPのリンクは自由です。本HPはフリーウエアであり、著作権は猪原直弘にあります。しかし、各解析サイトの著作権は各サイトにあります(当たり前か?)(^^;)。本サイトを用いた解析の結果については各サイトの権利と責任に関するネット使用者とリンク先のサイト作者の合意に依存し、本HPは解析の結果についていかなる責任・権利を有するものではありません。本HPへの要望・サポートは作者(著作権者)にお願いします。サイト管理者であるミシガン大学は本HPに対してなんらサポートを保障するものではありません。本HPはフリーウエアですので、本HPが直接起因するところ障害・損害に関して作者はいかなる保障もしかねます。しかし、作者は著作権を放棄するものではなく、本HPの無断コピー・転載を禁じます。本HPの商業的な紹介は作者の了解を必要とします。
本サイトを用いることにより、ユーザーの配列情報や利用するサイトについて私は一切関知しておりません。
ヒストリ & What's New?
Mar/19/1998
β版公開
Jun/1/1998
遺伝子予測機能FGENESを加えたJuly/15/1998ProfileScanのサイトを更新したJuly/19/1998
SMARTを加えたver 1.0ついにリリース!Sept/14/1999久しぶりにこの「説明書」をアップグレード。この間、ver1.15になってしまった。Oct/20/1999NCBI BLASTの旧バージョンがなくなったので新バージョンにリンクしたFeb/15/2000EMBLを使うメリットが薄れたのでDDBJ切り替えた。Aug/30/2000NCBI Concerved Domain Searchを加えたMay/17/2001NCBI 旧BLASTがなくなったので新しいバージョンにリンクしたJul/14/2001UCSC BLASTを加えた
ご意見ご要望は以下まで
ino@umich.edu
現在分かっているバグと改良すべき点
プライマー設計末端GCを計算するサイトではないのでプライマーダイマーができる可能性がある
TBLASTN,BLASTX,TBLASTXをいちいち選ばなくてはならなくなった。
NCBIのBLASTの変更に伴い、打ち出される相同性配列の数が100以下になった。
Back to All-in-One