「分子生物学実験:ゲノム情報データベースの利用(その1)」

農学部応用生命科学科 植物分子生物学分野(遺伝子特性学分野)の時のサイトです。記録の為に残しています。

担当: 福澤 秀哉(2011.1.1からは,生命科学研究科 統合生命科学専攻 微生物細胞機構学分野を担当)

開講期間:2010年9月27日(月)・10月13日(水)・10月19日(火) 3限目〜5限目

2011年10月の実習については,こちらを参照のこと

福澤のホームページへ移動

分子生物学1のホームページへ移動

塩基配列の翻訳、制限酵素認識部位検索、相補鎖変換ツール分子質量推定
(リストにあるEMBOSSアプリケーションのうち、それぞれ"transeq"、"remap"、"revseq", "getorf" を使ってください)

 

(注意)

本実習の受講は、学術情報メディアセンターの利用アカウントを取得していることが前提です。また,基本的な事項は「分子生物学1」の補助ページに説明があるので,参照してください. また,組換えDNA実験を含みますので,大学の規定に従って血液検査等を含む登録が必要です。 京都大学組換えDNA実験安全管理規程第28条を参照して下さい。大学のホームページで確認できます。

 

<はじめに> 遺伝子工学に利用されるプラスミド等の基本的情報の取得

 本実習では、P1-B1系の規制に則り,大腸菌宿主ベクター系を用いて遺伝子のクローン化を行います。この際に利用するベクタープラスミドの性質や塩基配列情報を理解しておくことが重要です。

<準備>今回使用するクローニングベクター「pBluescript II SK+」(SK+と省略する)は,旧Stratagene(ストラタジーン)社が開発し,現在アジレント・テクノロジー社が「In vitro RNA 転写/高解像度制限酵素サイトマップの作成」用に販売しているプラスミドです。PhageとPlasmidの両方の性質を持つので,Phagemidとメーカーでは記載しています。アジレント社のホームページ<www.chem-agilent.com/contents.php?id=300267>から詳しい説明書が入手可能です。ただし,pBluescript SK+とは構造が異なるので注意して下さい。(pBluescript II SK(+) Phagemid Kitのマニュアルを開く)。 また,プラスミドの全塩基配列は,NCBI/DDBJ/EMBLデータベースに,Accession 番号X52328で登録されていますから,検索して配列を取得して下さい。<www.ncbi.nlm.nih.gov/>

<課題1>SK+プラスミドDNA上には,抗生物質耐性遺伝子(アンピシリン耐性遺伝子=βラクタマーゼ遺伝子),ラクトース分解酵素遺伝子の一部(αフラグメントをコードする遺伝子:lacZ'),大腸菌での複製に必要な複製開始点2種類(ColE1系Ori=pUC系Oriと,f1ファージOri),マルチクローニングサイト(Multi Cloning Site, KpnI-***-HindIII-***-BamHI-***-SacI),があります。タンパク質をコードする遺伝子については,その翻訳開始コドン,終止コドンの位置を答えなさい。また,それぞれについて説明しなさい。

<課題2>ラクトースオペロンの発現制御,α相補(αコンプリメンテーション)を理解しておく必要があります。宿主として用いる大腸菌DH5αの遺伝子型は,F− φ80lacZΔM15 Δ(lacZYA-argF)U169 deoR recA1 endA1 hsdR17(rK −,mK +) phoA supE44 λ− thi -1 gyrA96 relA1 です。α相補に必要な性質はどの遺伝子型に依存しているのか説明しなさい。

<課題3>実験し使用するGFP遺伝子断片は,制限酵素BamHIで切断されたDNAです。テキストの解説を読み,その正確なサイズが何ベースペア(bp)であるか,答えなさい。制限酵素に関しては,タカラバイオのURL(www.takara-bio.co.jp/research.htm のメニュー)から「制限酵素」を選び,「制限酵素の使用に際して」,「制限酵素の活性の定義,純度検定,保存,添付バッファーについて」,「Universal Bufferによる制限酵素活性表示システム」の3ヶ所は良く読んでおきましょう。(配布するカタログにも記載されています)。

<課題4>T4 DNAリガーゼは,2段階の反応を触媒してDNA同士を連結する酵素ですが,反応効率を上げるために通常のバッファー(終濃度として,66mM Tris-HCl pH7.6, 6.6mMMgCl2, 10mM DTT, 0.1mM ATP)に,次の薬品を添加します。終濃度として,10% PEG 6000ならびに200 mM NaClとなるように添加します。何故,このような添加すると反応効率が上昇するのか説明しなさい。なお,下記の論文「Hayashi et al. Nucleic Acids Res. 13(9):3261-3271 (1985)www.ncbi.nlm.nih.gov/pmc/articles/PMC341233/」で詳しく検討されているので,参考にして下さい。また,T4 DNAリガーゼが,大腸菌DNAリガーゼと違う点について説明しなさい。配布するカタログなどに説明があります。

<課題5>配布されるGFP遺伝子断片が,ある方向でSK+と連結されると,融合タンパク質が大腸菌で発現されますが,そのアミノ酸配列を答えなさい。

(補足)大腸菌DH10Bの遺伝子型:F− mcrA Δ(mrr-hsd RMS-mcr BC) φ80lacZΔM15 ΔlacX74 recA1 endA1 araD139 Δ(ara, leu)7697 galU galK λ− rpsL nupG

5.2.1 DNA塩基配列情報の処理

 遺伝情報は、DNAの塩基(G, A, T, C)配列にコードされていることから、DNAの正確な一次構造(塩基配列)を知ることは、遺伝子の機能や調節を研究する上で重要である。DNAシークエンサーから得られた塩基配列データには、不正確な部分や間違った部分があるので、正確に読めている部分のみを抽出もしくは利用する必要がある。DNA断片の塩基配列を決定するためには、研究(補助)者が正しい配列かどうかを判定(解読)する必要がある。DNA塩基配列の決定は、現在、Sanger法を改変した以下の手順で行われることが多い。

 塩基配列決定操作の概要

(1)

塩基配列を決定したい大腸菌プラスミドPCR (Polymerase Chain Reaction) 断片を調製する。

(2)

このDNA断片に、相補的なオリゴヌクレオチドプライマー(20〜23 mer)、蛍光色素を結合したジデオキシヌクレオチド3-リン酸、ヌクレオチド3-リン酸、バッファー、耐熱性DNAポリメラーゼを混合し、DNA合成反応を行なう。この時、塩基特異的にDNA合成反応が停止し、種々の長さを持った新しいDNA鎖が合成される。この鎖の3'末端には塩基特異的な蛍光色素が結合している。

(3)

反応液から、未反応の蛍光色素を結合したジデオキシヌクレオチド3-リン酸をエタノール沈殿で除去する。

(4)

生成した塩基配列特異的な鎖長を持つDNAをゲル電気泳動やキャピラリー電気泳動で分離し、蛍光用のレーザー検出器で検出する(「DNAシ−ケンサ−」)。

(5)

(4)のシグナルをデータファイルとしてコントロ−ル用コンピューターに取り込む。得られた波形データから解析プログラム(「ベースコーラー」 "base caller")を用いて配列データを生成し、素データとする。素データは、コントロ−ル用コンピュ−タ−のハードディスクにテキストデータとして記録される。


 ここでは、(1)例題(unknown-1)について解析の練習を行い,次に(2)配布された配列について解析する。更に(3)実際に自分たちがクローン化した断片の配列について解析する。(2)の解析では、配布される波形データと塩基配列データを用いる。波形データはプリントで、配列データはこのページの最後に掲載されているので、各自のプリントにあるデータの番号と対応する配列を選んで解析に用いる。実習終了時には解析結果を各自のディスク領域に保存し,最終的にレポートにまとめること。

 まず、例題(unknown-1)についてを説明するので、その説明に従って得られた結果を見て、以下の問いに対する答えをレポートで提出する。なお、今回配布する塩基配列データは、大腸菌DNAをクローニングベクターpUC19にクローン化したものから得られたものである。

10月13日<練習課題>

1.

与えられた配列unknown-1は、大腸菌ゲノム上のどの部分か?制限酵素HindIIIの認識部位(AAGCTT)2カ所とタンパク質コード領域との位置関係を図示すること。ただし、タンパク質コード領域の翻訳開始コドンと終止コドンを記入せよ。

2.

与えられた配列に含まれる遺伝子は何か?また、その遺伝子の周辺はどのような構成になっているかを図示せよ。オペロンを構成しているか?転写方向を矢印で示し、発現調節領域の場所を記入すること。

3.

近傍に遺伝子が見つかれば、その遺伝子産物の機能が何であるかをコンピューター上で調べる。さらに、その遺伝子の機能について、関連文献をインターネットや図書館で探し出し、説明すること。例えば,アミノ酸生合成経路(糖代謝・複製・翻訳など)の中でも「トリプトファンの生合成の段階で,中間反応産物○○○を○○○に変換する反応を触媒する」など詳細に記載する.レポートには参考とした論文を記載すること.

 下記の配列「unknown-1」は、FASTA形式で記載した塩基配列である。1行目の「>unknown-1」の「>」の記号は、この行がコメント行であることを示し、次の行からの配列が「unknown-1」という名称の配列であることを示す。また、この次の「>」の記号が出てくるまでは、改行やスペースがあっても、ひと続きの配列と見なされる。

>unknown-1
GAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTTGCACATCG
TCCATATTTCTGGCCTGGTGGTTATTAATTTCAATGGCTGCCCATGTATTTGCACTTAGC
AAAAGCACAGCCAGAAGGGCTAAAACACGACTGAACATAGATACCTCCTCGACGGCTGAC
TTTGTGTGCTCTCCTCTGTGATGATCTTCTGATTTAATTTTAATCAATGATAAAGAAGTT
GATGGTGACCATTTCTGATGCAGTTGTTCAAAAAAACACCATGATGAAGTGTGATGAACT
TCAAATCAGCGTGTTAGAGGTTAATTGCGAAAGGGGAGATTTATTTCGGCTCTGCCCTTG
AGTTTAGCGAGGCATACAAGTACTATAACGCGTCATTTTTCAGCCGACCTTTAACACGTT
CCCTTGCCTCCCCCGGGAATTCCGGCTGACCCCAGAACAGGAGGGCCGAAATAAATCCGT
AAAGGAGCCAAATCGGATGGCCGTCATTACNGAANCCGTTTTAAGGGCCCAACCNGGACC
AGANGNGANN
 
 

注)

1行目右の方にHindIII認識部位(AAGCTT)がある。この配列から以降はインサートDNA由来である。配列の終わりに近づくと未決定塩基(確定できない塩基:Nで表示)が頻繁にあらわれ、不正確な配列が含まれていることが分かる。場合によっては、波形データと照合しても塩基を確定できないこともある。

 

1. DNA塩基配列データの処理

(1)前処理

1.

ワードプロセッサ(例えばMS-Word)やエディタで塩基配列データを開く。

2.

波形データと見比べて、各塩基のピークが明確に判定できない部分を削除する。特に始めの部分には、蛍光基質の残存が原因と思われる判別不可能な蛍光シグナルのピークが認められる場合があるので、この部分に相当する塩基配列データを削除する。

3.

波形データの読み取り不能な残基(Nと表示される)が現れたら、それ以降のデータを削除する。例えば25塩基に2回以上出てくるNの部分、あるいは明らかに各塩基のピークが不明瞭になり始める部分を探し出す。そのような部分から以降の塩基配列は信頼性が低いので削除する。

4.

編集した塩基配列データを、新規文書ファイルとして各自のディスク領域に保存しておく。

 

(2)ベクター配列の除去

クローニングベクターpUC19の説明は、下記のアドレスにある。(pBluescript II(SK+)は2958 bp .Stratagene社のホームページで検索すると良い.Accession numberは,X52328です.)

  http://gillnet.lab.nig.ac.jp/cgi-bin/accvec_browse.pl

  http://www.shigen.nig.ac.jp/ecoli/strain/

画面左端のリストから例えばpUC19を探し、クリックして解説を読む。MapAccesionを選択して、情報を得る。得た情報は、新規文書ファイルとして各自のディスク領域に保存し、レポート作成に利用する。

配布された塩基配列データは、pUC19(またはpUC18)の一部から始まり、クローン化に用いた制限酵素の認識部位が現れる。それ以降はクローン化したDNA断片の塩基配列である。ベクターとクローン化したDNA断片の配列を区別する必要があるので、まず、HindIII 制限酵素認識部位(制限サイト)を、実際に目で探してみる。次に、この検索を下記のWWWブラウザ上のプログラムを利用して行う。

  http://tools.neb.com/NEBcutter2/index.php

配布された塩基配列データのベクター配列が、公開されているベクター配列と一致しているかどうかをまず確認する。一致しない場合は、対応する波形データを目で確認し、波形データに食い違いの部分を記入する。次に、クローニングに用いられた制限酵素認識部位を見い出す。挿入断片の配列情報は、このクローニングサイトから数百塩基である。

 

2. データベースを利用した塩基配列の相同性検索

 ある配列が、データベースに登録されている配列と相同性をもつかどうかは、相同性検索プログラムを用いて調べることができる。最も一般的に用いられる検索アルゴリズムはBLAST (Basic Local Alignment Search Tool)とFASTAの2種である。BLASTは局所的に高い類似性を有するものを高速に検索するときに使う。FASTAはW. Pearsonによって開発されたプログラムで、はじめに文字のよく一致する領域を高速に検索し、最終的にはギャップを入れた完全なアライメントを行なう方式をとる。FASTAは、低い全体的相同性を検出できるという特性を持っているため、長い範囲で配列の類似性を保っているものを検索するときに使われる。今回はBLASTを用いて未知配列の相同性検索を行い、その由来を明らかにする。いくつかのウェブサイトでBLAST検索用のページが公開されている。まず、次のサイトを見て、説明を読むこと。

BLASTの簡単な使い方

http://www.ncbi.nih.gov/Education/BLASTinfo/information3.html

BLASTの解説

http://www.ncbi.nlm.nih.gov/blast/blast_overview.shtml

BLASTの日本語概説

http://www.ddbj.nig.ac.jp/search/archives/blast_doc-j.html

BLAST質問集 (FAQ)

http://www.ddbj.nig.ac.jp/search/help/blast_help.html

 

 今回は、下記の3種類のサイトから1つを選んで、BLASTプログラムを利用する。説明は下記のウェブサイトにあるので各自読むこと。

(1)

http://www.ncbi.nlm.nih.gov/blast

英語

米国National Center for Biotechnology Information
"Nucleotide"の中の"Nucleotide-nucleotide BLAST (blastn)"を利用する。

(2)

http://blast.ddbj.nig.ac.jp/top-j.html

英語/日本語

国立遺伝学研究所

(3)

http://blast.genome.jp

英語

ゲノムネット(京都大学化学研究所バイオインフォマティクスセンター)

使用プログラムは、まず「blastn」(nucleotide blast)を使用する。検索結果を、新規テキスト文書として名前を付けて保存する。次に、使用プログラムを「blastx」に変更して検索する。結果をblastnの場合と同様に保存する。

注)

「blastn」、「blastx」のどちらを用いるかで検索に用いるデータベース(塩基配列 or アミノ酸配列?)が異なる。また、生物種などで区分したサブデータベースもいくつかあるが、今回は「nr (non-redundant)」や「全DNA/アミノ酸」といった包括的なものを選択すること。

 

(BLAST検索結果の見方)

サイトによって多少の違いはあるが、データベース検索の結果はほぼ次のようになる。

 
Sequences producing significant alignments: 
                                                                 Score    E
 accession |          Description                      (bits) Value
 
gi|1263172|gb|U14003.1|ECOUW93  Escherichia coli K-12 chromo...   712   0.0   
gi|2367357|gb|AE000491.1|AE000491  Escherichia coli K12 MG16...   712   0.0   
gi|42844|emb|X04022.1|ECRPSFRI  E. coli genes rpsF, rpsR and...   640   0.0   
gi|26111307|gb|AE016771.1|  Escherichia coli CFT073 section ...   595   e-167 
gi|30043695|gb|AE016993.1|  Shigella flexneri 2a str. 2457T ...   593   e-166 
gi|24054884|gb|AE015442.1|  Shigella flexneri 2a str. 301 se...   505   e-140 
gi|12519178|gb|AE005652.1|AE005652  Escherichia coli O157:H7...   490   e-135 
gi|13364484|dbj|AP002568.1|  Escherichia coli O157:H7 DNA, c...   490   e-135 
gi|24054867|gb|AE015441.1|  Shigella flexneri 2a str. 301 se...   200   2e-48 
gi|7705080|gb|AC068564.1|AC068564  Filobasidiella neoformans...   105   8e-20 
  ・
  ・
  ・
 

このblastnの結果の中では、accession番号 | Description(配列の説明) | スコア(Score) | 期待値(E-Value)に注目する。

スコアとは「2つの配列を並べて同じ位置に同じ残基があれば正の値、違えば負の値を与えて合計した点」で、高い値であれば、相同性が高い。

期待値とは「現在のデータベースにおいて、全く偶然に同じスコアになる配列の数の期待値」である。E-Valueが小さいほど偶然には起こり得ないことを示す。

 従って、スコア値が大きく、期待値が小さい場合には、その配列間の相同性は高いと言える。有意な相同性を示した配列については、配列のアライメントを調べ、どの部分で相同性が高いのかを確認する。その部分のQuerySubjectの配列について、各々の両端に表示された数値(塩基番号)を記録しておく。次に、最も高い相同性を示した配列(今回はDH10B株)について,accession番号をクリックすることで詳細な情報を得る。

 

自分がクローン化した配列はどこから由来したのか?

 前述のBLAST検索サイトで得られた結果の中で、相同性を示した相手の配列の"accession | locus"の部分をクリックすれば,その配列に関する詳しい情報(生物種、遺伝子名、研究者、文献等)が得られる。また、スコアをクリックすると,2本の配列を比較した図(アラインメント)が表示される。 アラインメントの中で,相同性を示した相手の配列(Subject)の初めと終わりの塩基番号を,ノートに控えておき,その塩基番号を頼りに配列を位置を登録済みのデータないでの位置を推定することができる。

 ただし,NCBIの情報検索システムEntrez にて、accession番号で詳しい説明を検索することもできる。

 練習課題にならって,配布された配列近傍の遺伝子構成を図示し、下記の点について考察せよ。

 

<課題1>10月13日

1.

今回配布された配列は、大腸菌のゲノム上のどこから由来したのでしょうか? プラスミドの挿入断片の両末端は,制限酵素HindIIIの認識部位(AAGCTT)だと考えられますが,その2カ所の認識部位とタンパク質コード領域(Open Reading Frame: ORF)との位置関係を図示します。ただし、タンパク質コード領域の翻訳開始コドンと終止コドンを記入します。ATGでない翻訳開始コドンや,TAAでない翻訳終止コドンもありますから注意しましょう。

2.

今回配布された配列に既知の遺伝子は存在しましたか? また、その遺伝子の両隣には,どのような遺伝子が存在していますか、オペロンを形成していますか.どのような遺伝子構成になっていますか、図示して,さらに文章で説明します。

3.

遺伝子が見つかれば、その遺伝子産物の機能について調べます。特に、遺伝子の機能について記載した文献を調べます。文献にたどりつくには、文献検索プログラムやオンラインジャーナル(下表参照)を利用すると良いです。

<課題2>10月19日(実験データが取得できてから調べる)

1.

今回クローン化した大腸菌染色体の断片は、大腸菌のゲノム上のどこから由来したのでしょうか? プラスミドの挿入断片の両末端は,制限酵素HindIIIの認識部位(AAGCTT)だと考えられますが,その2カ所の認識部位とタンパク質コード領域(Open Reading Frame: ORF)との位置関係を図示します。ただし、タンパク質コード領域の翻訳開始コドンと終止コドンを記入します。ATGでない翻訳開始コドンや,TAAでない翻訳終止コドンもありますから注意しましょう。

2.

その配列に既知の遺伝子は存在しましたか? また、その遺伝子の両隣にはどのような遺伝子が存在していますか、オペロンを形成していますか.どのような遺伝子構成になっていますか、図示して,さらに文章で説明します。

3.

遺伝子が見つかれば、その遺伝子産物の機能について調べます。特に、遺伝子の機能について記載した文献を調べます。文献にたどりつくには、文献検索プログラムやオンラインジャーナル(下表参照)を利用すると良いです。

 与えられた波形データに対応する配列は、このページの最後にあるので、画面からコピーして解析に用いること。

 

<課題3>10月19日

今回は、改変GFPタンパク質をコードするBamHI断片をベクターSK+にクローン化してもらいました。

1.

テキストp.22の配列(accession number: DQ000653)を利用して、大腸菌で生成するGFPタンパク質のアミノ酸配列をレポートにまとめて提出して下さい。BamHIサイトで連結したことで融合タンパク質が大腸菌で生成するが、元のGFPタンパク質には無かった部分が分かるように太字で示して下さい。

ただし、核酸の配列をアミノ酸配列に変換するためには,下記のサイトを利用しましょう。

● http://pro.genomics.purdue.edu/emboss/  の「transeq」を利用します。

● http://bio.lundberg.gu.se/edu/translat.html

● http://arbl.cvmbs.colostate.edu/molkit/translate/

今回配付されたGFP遺伝子断片のコードするアミノ酸配列は、Accession番号DQ000653に説明があります。

misc feature 1179..1888の行を見ると、/note="synthetic gfp gene coding for the greeen fluorescent protein without stop codon"とあります。

2.

GFPを改変した種々の蛍光タンパク質をコードする遺伝子が利用されています。今回のCrGFPの配列(1,下記参照)と、CrYFP(2,下記参照)は,野生型オワンクラゲ(Aequorea victoria)由来のGFPタンパク質(3, L29345)の塩基配列を元にして設計した合成遺伝子です。元のmRNA配列と塩基配列を比較して,どのような配列変更がなされているか調べましょう。3種類のmRNA配列を取得し,FASTA形式でまず保存します。そのファイルをCLUSTALWのサイトを使って比較することで,CrGFPとCrYFPに共通な特徴があります。それはどんな点でしょうか。

次に,他にも蛍光特性を変えた改変GFPが数多く使われています。上記の3種類のタンパク質(1-3)の配列以外に,次の配列をデータベースから取得して比較しましょう。蛍光強度を上げた改変GFP(4, EGFP:AAB02576), 蛍光特性を改変したタンパク質EYFP(5, AAG34036)、Citrine (6, AAV97899)、CFP(7, ABU48526),およびサンゴ由来のDsRed(8, Q9U6Y8)を比較して、実際にどのアミノ酸残基がタンパク質によって異なるのかを調べましょう。どのアミノ酸の置換が蛍光特性に影響を与えているのか考察しよう(プリントおよびこの文献を参照)。さらにアミノ酸配列を用いて分子系統樹を書きましょう。分子系統樹を描く際には,アミノ酸残基の相同性が高い部分(Kから以降)を使って検索します。

複数の配列を比較するためのプログラムが「CLUSTALW」です。下記のアドレスから利用できます。ただし,検索開始前に,アミノ酸配列か,DNA配列を確認してボタンを選択すること。

http://align.genome.jp/ または www.ebi.ac.uk/Tools/clustalw2

1.7.1「性の表現型と遺伝子型 」<質問>の補足

(1)PCR反応で増幅する断片の理論的サイズを,データベースKyoto ChlamyBaseを利用して算出し,実験データと比較してレポートにまとめる。ただし,Accession番号U49864とU92071のデータを用いて,調べることもできます.

 ●雌(mt+)特異的遺伝子FUS1を検出するためのPCRプライマー
  fus1-F: 5’-CGCTGAATATAACTGGTGAGTGAT-3’
  fus1-R: 5’-TCGGTCCGTCATCTTGAGCTCTAC-3’

 ●雄(mt-)特異的遺伝子MIDを検出するためのPCRプライマー
  mid-F3: 5’-GGTTTGACTGGCAAGGGATT-3’
  mid-R3: 5’-ACGTTGTAGAGTTGCCCGTT-3’

(2)2つの遺伝子MIDFUS1について調べ,レポートにまとめる。(染色体上の位置,転写の特異性,遺伝子から精製するタンパク質のドメインと機能・役割)

重要参考文献: 緑藻クラミドモナスのゲノムから植物と動物の機能を探る。蛋白質核酸酵素」53:1133-1143(2008)

 

1.7.2「調節変異株の表現型と遺伝子型 」<質問>の補足 

(1)PCR反応で増幅する断片の理論的サイズを,データベースKyoto ChlamyBaseを利用して算出し,実験データと比較してレポートにまとめる。ただし,Accession番号AB168089のデータを用いて,調べることもできます.

 ●PCR-pre-mix(1)に含まれるプライマーの配列(Lcr1遺伝子内部を増幅する)
  5’-GGCTACCGTGACAACCTGGTCTACG-3’ (C44dele-9539-F)
  5’-TGACGACGGTATCACCAGTGGATGAGAG-3’ (cmpA-R)

 ●PCR-pre-mix(2)に含まれるプライマーの配列(Lcr1遺伝子3'側近傍を増幅する)
  5’-ACCCCATAAGGCTCACCAAGCTGCTCAA-3’ (cmpD-F)
  5’-GATGATGCCATACATGCCTATTTCCCTG-3’ (cmpD-R)

 ●PCR-pre-mix(3)に含まれるプライマーの配列(Nia1遺伝子内部を増幅する)
  5’-GAAGCATGGCAAGGATATTACT-3’ (IPCRnit3-2F)
  5’-CTGGTCGCCCCTGGGAGTCTAA-3’ (IPCRnit3-2R2)

(2)遺伝子Lcr1Nia1について調べ,レポートにまとめる。(染色体上の位置,転写の特異性,遺伝子から精製するタンパク質のドメインと機能・役割)

重要参考文献: 二酸化炭素による転写調節機構 − 緑藻クラミドモナスのCO2濃縮機構。蛋白質核酸酵素(共立出版)Vol. 50, pp. 958-965 (2005) クリックした後に「福澤」で検索すると文献を見ることができます。

 クラミドモナスセンターや クラミドモナスのゲノムデータベース(米国) も参照すると良い。

 

文献情報の利用

また、下記のオンラインジャーナルが利用できる。

京都大学図書館オンラインジャーナル

edb.kulib.kyoto-u.ac.jp/gakunaiej.html

京都大学医学部図書室

www.lib.med.kyoto-u.ac.jp

(その他参考になるURL)

NCBI

配列データベースの本家本元(アメリカ)。各種解析ツールも充実。

EMBL-EBI

ヨーロッパの配列データベース。各種ゲノム情報に対して独自の統合データベースサービスを提供。

日本DNAデータバンク

NCBI、EMBL-EBIに並ぶ日本の配列データベース。

かずさDNA研究所

千葉県が世界に誇るゲノム研究所。シロイヌナズナのゲノム解析などで多大なる貢献。

The Sanger Institute

Dideoxy法 (Sanger法)の生みの親Sangerにちなむゲノム研究所(イギリス)。 ヒトの他、マウスなどのモデル生物のゲノム解析の老舗。

J. Craig Ventor Institute

微生物ゲノム解析が顕著。その他動物・植物など幅広く手がけている。旧 The Institute for Genomic Research (TIGR)。

ゲノムネット

一般的な配列データベースの他、ゲノム解析によって得られた情報を細胞機能に関連づけた独自のデータベースKEGG (Kyoto Encyclopedia of Genes and Genomes) を提供。

大腸菌サイト

About PEC - PEC (Profiling of E.coli Chromosome)

分子生物学研究用ツール集

分子生物学関連データベース、配列解析ツールなどの網羅的コレクション。

Webラーニングプラザ

「ライフサイエンス」の解説アニメーションは一見の価値あり。

    

(参考書籍)

書  名

著  者

ISBN

バイオデータベースとウェブツールの手とり足とり活用法
今日からできるバイオインフォマティクス はじめの一歩

中村保一、礒合 敦、石川 淳/編

4-89706-357-4

初心者でもわかる!バイオインフォマティクス入門
−やさしいUNIX操作から遺伝子・タンパク質解析まで−

坊農秀雅/著

4-89706-290-X

実践 バイオインフォマティクス

Cynthia Gibas, Per Jambeck/著
水島 洋/監訳

4-87311-068-8

 

<配付した波形データに対応する配列>

>01.seq
CTGCAGGCGTGGCTGCNGTCNTCTAGAGTCGACCTGCAGGCATGCAAGCTTATCGATAT
CACTCATGGTGAAGTCGATTTCCGCTTCCTGCGCCGCCGCCAGCAGGTGAAGTACGGNG
TTAGTCGATCCACCCATCGNGATATCCAGNGTCATGGCGTTTTCAAACGCNGCCTTACT
GGCGATATTACGCGGCAGTGCACTTTCGTCGTTTTGCTCGTAATAACGTTTGGTCAATT
CAACAATGCGTTTACCAGCATTAAGGAACAGCTGCTTACGGTCGGCGTGGGTTGCCAGC
AGCGAGCCGTTGCCCGGCTGCGACAGGCCCAGCGCTTCGGTCAGGCAGTTCATTGAGTT
AGCGGTAAACATCCCGGAGCAGGAACCGCAGGTCGGACACGCGGAACGTTTCAACCTGA
TCGCTCTGGGAGTCAGATACTTNCGGGTCTGCGCCCTGGCATCATCGCATCAACCAGAT
CGAGCTTGNATGATCTGAATCGGAAAGTTTGGTTTTCCCGGCCTCCANCGGGACCGCCG
GAAACAAAGATACACCNGGNTATTCAGGCGCAGGAAGCCATCAGCATCCCCGNGGTGAT
TTTGTCGCATTAGAGATGCAGANNATNGNCGTCGGCCANATGGGGCNANGACCATATAC
TCAACGGAATCAGCGATCAGTTCGCGANGATNGCANNGAATAAAAGCATCCCCCCGTNG
CCCANGGGCAATCCCATCATCCANCGNAAAGGAGTTGAACNCTTTGGAAACGCCGCNCA
ACCGGCTTNNAANNNGNACGGGGGAACAAGATTTACCGAGAAAACGCNGCAAATAGGAC
GTGAACCCNGGNANAAATTGGGTGAACGAGNTCANAAACCGCGAAAAATCGGNNTTACC
GAAATNCGGCGGACGGACAANCCCGGTNGGCGCGCCAAAAAGCGCAACGGAACAANCCG
NCCAAAAATACGGNCCAATAAAATNGGTGGGTNGCCGGAAACGGGAACTAAGGCAAACC
NTTAATTNACCCCCCAAANNGNCTGGCCCCCGAAAAAAGGGGGN

 

>02.seq
CTCGGTACCCGGGGGNTCCTCTCAGAGTCGACCTGCCAGGCATGCAAGCTTCTTGTTCAG
ACGTTCACTATCCAGTTTAACGCCGCAGCGCTCAGAAAAAAGTGGCGTAATGAGGCTTAC
ACCGAGTTCGATCGATTTCTGGATAGTAAATTCCATTTTTTCACCACGCGACATCACCTG
ACCGAGGTGAATATGCAGCGGAGATTCGCGATCGTCGATCTGGCCTTCCAGCACCTTCAC
TTCCACGCTTTTTTTGCTGGCGCTGGTAATTTCGGCGTCAAAGACCTGGTTGCTACCGTC
AAACAATTGCAACGCCTGCCCCGGCCCCATGCGCAGTACGCGCCCGATATGGTTGGCGGC
ATCTTCGCAAAGCGCGATGTGAGAATGGCTGGTCAGTGGTTCAGGATGATAAATGCGGGG
GATACGCATAGTTAAAAATCCGCGTCGTCTCCCCACGCGGTTGTACGCGTGGGGTAGGGG
TTAACAAAAAGAATCCCGCTAGTGTAGGTTAGCTCTTTCGCGCCTGGCAAGCGCGTTGCA
CATACGGGTTATGATTGCCCTGCACCTTCGCGATGCGTTCATCGCGCTCGCACTCCCAGT
CGGTAACCGGATACATCTTGTTCCATGGCGTTGAACAGCTGCGTTTGCTGGCGAGAGAGT
GTCAGGTTGGTANTGGTCGCGCATATAGAAGTANGTGCGCGCAATGGGCACCGCGTGCAC
GCGCTGGTGGTTCGGCAGCCTTTTNCCTTGGAAAATCGACCTTCAAGGGCGCATTGAACC
GTACCGGGCTTCANCGNCAATCCACTGGGCCGGNACAAAAAAGTTTGCCGCGAAACGCCA
ATCANCTCCAACCGANTGAANGGCTNNAAGGGTAAAGCCAAAACGCCTTTNCCAACNNTN
GCGGAAAAAACCGGAACCTTTAAGCGCCAGTTTTTAACGGCCAACCGGNCCTNGCCAANA
ANNGGGGCCCNGGNGAACCGAAANTNCCAANGCCGGGGAAAGNAAANGTTCCCCAAACCC
AAAACGGNNTNGGNCCNGGNTTAANA

 

>06.seq
AGCTCGGTACCCGGNGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTCGTTATGGC
GCTGTTTATGGCGTTTGGTGTCTCCTTTGAAGTGCCGGTAGCAATTGTGCTGCTGTGCTG
GATGGGGATTACCTCGCCAGAAGACTTACGCAAAAAACGCCCGTATGTGCTGGTTGGTGC
ATTCGTTGTCGGGATGTTGCTGACGCCGCCGGATGTCTTCTCGCAAACGCTGTTGGCGAT
CCCGATGTACTGTCTGTTTGAAATCGGTGTCTTCTTCTCACGCTTTTACGTTGGTAAAGG
GCGAAATCGGGAAGAGGAAAACGACGCTGAAGCAGAAAGCGAAAAAACTGAAGAATAAAT
TCAACCGCCCGTCAGTNGTNCNATATGGAGTACAGGATGTTTGATATCGGCGTTAATTTG
ACCAGTTCGCAATTTGCGAAAGACCGTGATGATGTTGTAGCGTGCGCTTTTGACGCGGGA
GTTAATGGGCTACTCATCACCGGGCACTAACCTGCGTGAAAGCCAGCAGGCGCAAAAGCT
GGCGCGTCATATTCGTCCTGTTGGTCAACGGCGGGCGTACATCCTCACGACAGCAGCCAG
TGGCAAACTGCGACTGAAGAAGCGATTATGAGCTGGGCCGCGCACCCAGAAAGTGGTGGC
GAATTGGTGAATGTGGGTCTCGACTTTAAACCGCAANTTTTCGAACGCCGGAAAAACCNG
GAACGCGCCTTTGTTGCCCAGCCAACGCATTGCCGCAGAATTTAAACATGNCCGGTATTA
ATGCACNGTCCGCGATGCCCACGAGNCGGGTTAATGACAATTGCNGGGAGCCGTGGCNNG
GAAAAAACANCCCNGGANGCGGGNCCTTCNAANGCNTTAACCNGGCACACCCCGAAAAAN
AATNCAAGCCGTCCGTGGCGNCATGGGAAATTAAAAACCGGCANNANCCGGTTGGGGTTT
CCGAANAAACCAACCCCGGACNNGAACCNNCCGGGAAAANTTNCCCGNNNAANCCCCNGC
NGGNAAAAAAAACCNN

 

>08.seq
GCTCGGTACCCGGNGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTGGATCAACCG
GTAGTTATCCAAAGAACAACTGTTGTTCAGTTTTTGAGTTGTGTATAACCCCTCATTCTG
ATCCCAGCTTATACGGTCCAGGATCACCGATCATTCACAGTTAATGATCCTTTCCAGGTT
GTTGATCTTAAAAGCCGGATCCTTGTTATCCACAGGGCAGTGCGATCCTAATAAGAGATC
ACAATAGAACAGATCTCTAAATAAATAGATCTTCTTTTTAATACCCAGGATCCCAGGTCT
TTCTCAAGCCGACAAAGTTGAGTAGAATCCACGGCCCGGGCTTCAATCCATTTTCATACC
GCGTTATGCGAGGCAATCACCATGTTTTATCCGGATCCTTTTGACGTCATCATCATTGGC
GGGGGTCATGCAGGCACCGAGGCCGCGATGGCCGCGGCGCGTATGGGTCAACAGACTCTG
GCTTTTGACACACAATATCGACACTCTGGGGCAGATGAGCTGCAACCCGGGCGATCGGCG
GTATTGGGAAGGGACATCTGGTAAAAGAAGTGGATGCACTCGGCGGTCTGATGGCGAAAG
CGATCGATCAGGCGGGTATCCAGTTTAGGATACTAAACGCAAGCAAAGGACCGGCGGTTC
GCGCTACCCGAGGCTCAGGCGGATCGTGTGCTCTACCGTCAGGCGGTACGTACGGCGCTG
GAGAACCAACCGAACCTGGATGATCTTCCAGCAGGCGGTTGAAGATCTTAATGGCCGAAA
ACGATCGCGTGGNCGGTGCCNGTTANCCNAATGGGGACTGAAAGTTCCGTGGCCAAAANC
CGTCGGTGCTCANCGTTGGGGACGGTCCCNCGAACGGGAAAAAATCCAAAANCNGGNCCG
GGANAAATACAACCGGTGGGCCGTGCCNGGTGANCCGCCGGTCCAAATCCCGCTTTTCCC
GCCCGTTTNCCGGAAAANCCCGCCNGCNCGTNNGGCCGNCNNAAAAACCGGGGAAACCAC
CCCCGGATT

 

>09.seq
CTCGGGTACCCGGNGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTTAACAATTTC
AACGGCCTGTTTAATTTCGTCCGCAGTTAGCGCATTAAGTGGGTGAGGGCGCTTTTCTAC
CTGAAAGTTTGATCCAGCCCGGACTGGAAAACATCGTTAATAAAGGTGTCAGAAACCCAG
GCTTTATTGTCTTTCATCACTACCGGTACTTGCAGTGCCAGAGGCTGACCATTAACAATT
GCTGTTTGCGCACCAGGCTTCACTTTCACGTACGCGCCATCTTTAATCAGGGTAAAGAGC
TGGGCGTAGTCGTCCCACTGCACATCGGCACCAAATTCTTTAAGCGTTTTATCCATTGGC
ACCATATGCGCTTCACCACCGTGGGCAAATACCGGCGCTTGCCAGGCGAAACTTAAGGCG
ACTGCCAACGCCAGGGTTGTTTTACGGGCAGAATACAGAGAGGGGCTTCCCATTATTAAC
CTCGTCAGATGTTGTGTTCTTGTTAGCAACCGCGCTCTGTGGGCGGTTTAGTTCAGGTTC
ACATTATCAGTACTGATGCAAAGGGGATTGCCTGCACCTGCCAGGTTGTTTGGCAGGTGT
GCCAGCTTTTCATACAGTGGATGCCCTGAAAATAGATGTACACATCATGCATAATGTGAC
AACGTCACAAAACTTAGTGAAATAAAAGGGCAACTATTCGCCGTTGCCCTTCATTCACCG
ATTAATCGACAAAATCACCGTGCTGCCTGGCCACCAGCGTCAGAATTGAATACAGCGCCA
CCGGGGTTTGANGCNGATTGAAATAACCTCCTACAGCCCATTCCACCACANCTGTTGGNN
TTTCCTCCTGCGGCNAAGCNGGTTTTTTCAGCGTCTTGGCGCTTAAAAGGTGAAACCGCA
CCCGGGAANGGGAACCGCCTGGGCCTTAACGGGTCCGANAAAAACGCCAAGCCTTGGGCG
GAAACCAAGGGCCAAAAGCCCGGNNCCCCGGGGGNAAAATGGTAANCCCGCCCAAAAN

 

>18.seq
AGCTCGGTACCCGGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTGAGTGAGCC
ATTATGAAAACGAAAATCCCTGATGCGGTATTGGCTGCTGAGGTGAGTCGCCGTGGTTTG
GTAAAAACGACAGCGATCGGCGGCCTGGCAATGGCCAGCAGCGCATTAACATTACCTTTT
AGTCGGATTGCGCACGCTGTCGATAGCGCCATTCCAACAAAATCAGACGAAAAGGTTATC
TGGAGCGCCTGTACAGTTAACTGTGGTAGTCGCTGCCCGCTACGTATGCACGTCGTGGAC
GGTGAAATCAAATATGTCGAAACGGACAATACCGGCGATGACAATTACGACGGCCTGCAC
CAGGTTCGCGCCTGCCTGCGTGGGCGTTCCATGGCGTTCGCCGTGTCTACAATCCGGACC
GCCTGAAATATCCGATGAAACGAGTCGGGGCGCGCGGTGAAGGGCAAATTCGAGCGCATT
AGCTGGGAAGAAGCCTACGACATCATCGCGACCAATATGCAGCGCCTGATCAAAGAGTAC
GGCAACGAGTCTATCTATCTGAACTATGGGCACCGGTACGCTGGGCGGCACCATGACCCG
CTCCTGGCCGCCGGGAAATACCCTGGTTCGCGCGGCTGATGAACTGCTGCGGCGGCTATC
TGAACCATTACGGCGACTACTCCTCCGCGCAAATTGCGGAAGGTTTGAACTATACCTACG
GCGGCTGGGCAGATGGCAACAGCCCGTCGGATATCGAAAACAGTAAGCTGGTAATGCTGT
TTGGTAATAACCCTGGCGAAAACGCGAATGAGTGGCCGGNGGGGTGACTTACTAATCTTG
AACAGGCACGCCAGAAATCTAAATGCCCGCATGATCATCATCGATCCGGCGCTAATANCG
ACANCCGGTTNCCGGGGCGCCAAANATGAAGTNGAANCCCAATTCCGNCCGGGAACAAGA
TGCCGCAACTGGGGTNAACNGGCCTTGGCGNAACGGNAATGANCACCTGNAAAACCCTGG
GNGGAACN

●GFP遺伝子の塩基配列

>CrGFP-DNA (Accesion number DQ000653の配列から由来している)

  1 GGATCCCATG GCCAAGGGCG AGGAGCTGTT CACCGGTGTG GTCCCCATCC TGGTGGAGCT GGACGGCGAC GTGAACGGCC
 81 ACAAGTTCTC CGTCTCCGGC GAGGGTGAGG GTGACGCCAC CTACGGCAAG CTGACCCTGA AGTTCATCTG CACCACCGGC
161 AAGCTGCCCG TGCCCTGGCC CACCCTGGTC ACCACCCTGA CCTACGGTGT GCAGTGCTTC TCCCGCTACC CCGACCACAT
241 GAAGCAGCAC GACTTCTTCA AGTCCGCCAT GCCCGAGGGC TACGTGCAGG AGCGCACCAT CTTCTTCAAG GACGACGGCA
321 ACTACAAGAC CCGCGCCGAG GTCAAGTTCG AGGGCGACAC CCTGGTGAAC CGCATCGAGC TGAAGGGCAT CGACTTCAAG
401 GAGGACGGCA ACATCCTGGG CCACAAGCTG GAGTACAACT ACAACTCCCA CAACGTGTAC ATCATGGCCG ACAAGCAGAA
481 GAACGGCATC AAGGTGAACT TCAAGATCCG CCACAACATC GAGGACGGCT CCGTGCAGCT GGCCGACCAC TACCAGCAGA
561 ACACCCCCAT CGGCGATGGC CCCGTGCTGC TGCCCGACAA CCACTACCTG TCCATCCAGT CCGCCCTGTC CAAGGACCCC
641 AACGAGAAGC GCGACCACAT GGTCCTGCTG GAGTTCGTCA CCGCTGCCGG CATCACCCAC GGCATGGACG AGCTGTACAA
721 GTAAGGATCC

>CrYFP 1 GGATCCCCCC AAGGGCGAGG AGCTGTTCAC CGGTGTGGTC CCCATCCTGG TGGAGCTGGA CGGCGACGTG AACGGCCACA 81 AGTTCTCCGT CTCCGGCGAG GGTGAGGGTG ACGCCACCTA CGGCAAGCTG ACCCTGAAGC TGATCTGCAC CACCGGCAAG 161 CTGCCCGTGC CCTGGCCCAC CCTGGTCACC ACCCTGGGCT ACGGTCTGCA GTGCTTCGCC CGCTACCCCG ACCACATGAA 241 GCAGCACGAC TTCTTCAAGT CCGCCATGCC CGAGGGCTAC GTGCAGGAGC GCACCATCTT CTTCAAGGAC GACGGCAACT 321 ACAAGACCCG CGCCGAGGTC AAGTTCGAGG GCGACACCCT GGTGAACCGC ATCGAGCTGA AGGGCATCGA CTTCAAGGAG 401 GACGGCAACA TCCTGGGCCA CAAGCTGGAG TACAACTACA ACTCCCACAA CGTGTACATC ACCGCCGACA AGCAGAAGAA 481 CGGCATCAAG GCCAACTTCA AGATCCGCCA CAACATCGAG GACGGCGGCG TGCAGCTGGC CGACCACTAC CAGCAGAACA 561 CCCCCATCGG CGATGGCCCC GTGCTGCTGC CCGACAACCA CTACCTGTCC TACCAGTCCG CCCTGTCCAA GGACCCCAAC 641 GAGAAGCGCG ACCACATGGT CCTGCTGGAG TTCGTCACCG CTGCCGGCAT CACCCTGGGC ATGGACGAGC TGTACAAGTA 721 AGGATC


予備配列

>23.seq
GCTCGGGTACCCGGAGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTTCGCAATGGTAAA
TTTTGATCCAGTAAGCACGGTTTTGGCCTTTTCGCCATTCTGTTGGCTCGGTTATTAGCATCAA
CAGCTTTGTAATAGCGTCTGCCCCGATTACGCTGAACTTCACGTGAGATCGTCGAAGGACTGCG
ATTCAGCGCAGTAGCTATCGCACGAATGCTCATTTTGGCTGACAAACCAGCTCGTATCTCCTCG
CGCTCAGACAGTGTCAGGTGAGCTACAGCCCGCTTACGCTCATGGGGTTTTATGCCGCCAGTAT
CCCTTAACATAGTGAAGATCGTTCCGGGTTTTGAACCCAGGATATTCGCTATTTCACTGAAGCC
TGTTCCGTTCTTCCATAGTTCAAAAACAGAGGCTTTTTCCTCTGCTGTAAATGTTCGTCTCATT
CAAAAAACCTCCGCAACCCCATGTTTTCACATAACTGTTGGCGTTGACCAATTGAATCTACAGT
TTCTGGATTCGTCTTCGCTGACCAGCACGATGTCATCGACTAATTCACGAACGATTTCGTAAGT
NAAATTACCCGGGGCGGGAGACATCACAACCATCCGCCAGGTGCCGGTAGTTCGGTGCGTGGTT
ATTTCTCCGGAGTGGAAAGAAGCCGCCATGCCGTGAACGTTTTCAGACTGTACGCCAATAACAC
GAATGGTCGGGTTAATAGATTTAANTGCCACCGCAATACCAGCAATTAAACCGCCACCACCAAT
TGGCACAATCACGTTAACGACATCATAGAGGATCTTCCCATAATTNCCAGACCAATCGGTTCCC
CNGGCCAAGCAAATCACTTTCCGGAACAANCGNAAGGNGGGGATAAAAAAAAACGGCCTTCCAA
TTTCCGACNAAATTTCGGCNCACCTTAAGCGGAAANGGGNCGTTGAAAGGTNATCACCCATGCC
AGAAACGNGCNTCNTGGCNGGAGGAAGCCCGCAACGGTNGCCGNCAAACTTNGGNATTTTGGGC
GCACCCTTT

以上。

このページのトップに戻る

福澤のホームページに戻る