0%

mRNA 、cDNA 、ORF 、CDS 序列、Promoter、STS、ETS

mRNA 序列、cDNA 序列、ORF 序列、CDS 序列、Promoter、STS、ETS

CDS 是Codingsequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语

ORF开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么

CDS与开放读码框ORF的区别

(1)开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。

(2)CDS,是编码一段蛋白产物的序列。

(3)cds必定是一个orf。但也可能包括很多orf。

(4)反之,每个orf不一定都是cds。

(5)Open reading frame (ORF) - a reading frame that does not contain a nucleotide triplet which stops translation before formation of a complete polypeptide.

Coding sequence (CDS) - The portion of DNA that codes for transcription of

messenger RNA

ORF—–translation, CDS—-transcription

​ translation是理论上的,而transcription则显然是事实存在的。cDNA为具有与某RNA链呈互补的碱基序列的单链DNA即complementary DNA之缩写,或此DNA链与具有与之互补的碱基序列的DNA链所形成的DNA双链EST(Expressed Sequence Tag)表达序列标签—是从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为360±120bp。由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST簇(EST clusteF)mRNA携带遗传信息,在蛋白质合成时充当模板的 RNA。

mRNA (messenger RNA)信使 RNA,是由编码区CDS、上游的 5’非编码区和下游 3’非编码区组成,真核生物 mRNA 的 5’端带有 7-甲基鸟苷-三磷酸帽子结构,3’端有多腺苷酸尾巴,但 NCBI 中 mRNA 序列实际上是 cDNA 序列 ,即经过反转录得到的与 RNA 序列互补的 DNA 序列,一般不包括 3’多腺苷酸尾巴。一个 cDNA 序列被称为一个 转录子 ,第一个碱基所在的位置为转录起始位点 (TSS) ,cDNA 都是由外显子组成,但编码蛋白质的外显子只有一个,即 CDS(coding sequence),这段序列也就是一个 ORF 区,也就是这个 cDNA的 ORF 序列。参与特定基因转录及其调控的 TSS 上游序列称为启动子(Promoter),如原核生物在转录起始位点上游-10 有一段 TATAAT 的保守序列,有助于局部解链,在-35 有一段 TTGACA 序列提供 RNA 聚合酶识别信号,真核生物上游-25 到-30TATA 决定起始位点,-75 位置 CAAT 与 RNA 聚合酶,这些都是启动子,启动子的范围非常大,可以包含转录起始位点上游 2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。

克隆可以简单理解为复制品,例如假设通过提取 mRNA,反转录后得到 cDNA 序列,然后将这段序列转入载体,再通过划线不断的繁殖,就会得到许多装有这段 cDNA 序列的克隆,实验室为了方便,在给得到的这些克隆起名时,一般会取 cDNA 序列的名,但实际上在这个克隆里面不仅包括了这个 cDNA,还包括了载体的 DNA。

STS (sequence-tagged site)序列标记位点,是基因组上定位明确、作为界标并能通过 PCR扩增被唯一操作的短的、单拷贝 DNA 序列,一般长度为 200-500bp,一个 DNA 序列要成为STS,首先序列必须已知,能用 PCR 方法检测,第二 STS 必须在基因组上具有唯一的定位点。通过 STS 可以判断在不同条件下测序得到的 DNA 序列的准确性。

EST(expressed sequence tag)表达序列标签,是从一个随机选择的 cDNA 克隆,进行 5’端和 3’端单一次测序挑选出来获得的短的 cDNA 序列。全基因组测序发现基因即昂贵又费时,因为基因组中只有2%序列编码蛋白质,因此可以对真正编码蛋白质的mRNA构建cDNA文库,对 cDNA 进行测序,得到 EST 序列,从而发现新基因。

​ 下面以大鼠 CTGF 基因为例子,小写字母是转录子前后 200bp 启动子相关序列,大写字母表示的是 cDNA 序列,也就是转录子,其中蓝色标记的部分为 CDS 序列,湖蓝色的为转录起始位点,即 TSS,加粗带下划线的为起始密码子

agtgtgccagctttttcagacggaggaatgtggagtgtcaaggggtcaggatcaatccggtgtgagttgatgaggcaggaaggtggggaggaatgcgaggaatgtccctgtttgtgtaggactccattcagttctttggcgagccggccgcccggagcgtataaaagccagcgccacccgcccagtctcacacagctcttCTCTCCAAGAAGACTCAGCCAGACCCACTCCAGCTCCGACCCTAGGAGACCGACCTCCTCCAGACGGCAGCAGCCCCAGCCCAGTGGACAACCCCAGGAGCCACCACCTGGAGCGTCCGGACACCAACCTCCGCCCCGAGACCGAGTCCAGGCTCCGGCCGCGCCCCTCGTCGCCTCTGCACCCCGCTGTGCGTCCTCCTGCCGCGCCCCGACCATGCTCGCCTCCGTCGCGGGTCCCGTTAGCCTCGCCTTGGTGCTCCTCCTCTGCACCCGGCCTGCCACCGGCCAGGACTGCAGCGCGCAGTGTCAGTGCGCAGCTGAAGCGGCGCCGCGCTGCCCCGCCGGCGTGAGCCTGGTGCTGGACGGCTGCGGCTGCTGCCGCGTCTGCGCCAAGCAGCTGGGAGAACTGTGCACGGAGCGTGATCCCTGCGACCCACACAAGGGTCTCTTCTGCGACTTCGGCTCCCCCGCCAACCGCAAGATTGGCGTGTGCACTGCCAAAGATGGTGCACCCTGTGTCTTCGGTGGGTCCGTGTACCGCAGCGGCGAGTCCTTCCAAAGCAGTTGCAAATACCAGTGCACTTGCCTGGATGGGGCCGTGGGCTGTGTGCCCCTGTGCAGCATGGACGTGCGCCTGCCCAGCCCTGACTGCCCCTTCCCGAGAAGGGTCAAGCTGCCCGGGAAATGCTGTGAGGAGTGGGTGTGTGATGAGCCCAAGGACCGCACAGTGGTTGGCCCTGCCCTAGCTGCCTACCGACTGGAAGACACATTTGGCCCTGACCCAACTATGATGCGAGCCAACTGCCTGGTCCAGACCACAGAGTGGAGCGCCTGTTCTAAGACCTGTGGGATGGGCATCTCCACCCGGGTTACCAATGACAATACCTTCTGCAGGCTGGAGAAGCAGAGTCGTCTCTGCATGGTCAGGCCCTGTGAAGCTGACCTAGAGGAAAACATTAAGGTAAATAAATACTCTGCCCCCAGACACTCATTTTCACAGAATGACAGGAAAGAGAACCAGAGCTGGCTGTCTCGCCGCCCTTCTTATTATAGGCCTGTTGTCTCCAGAAATATCTAACCATGGAGCTGTCTGGCTAGAATGAGAGATGCTGTAACAGCAGCTGCCAGTTTTCCACTACAAAATTCCCCGGGGTGTTAGTTAATACGAGACACTCCAAACGAAGCCATGGCTATTTTTGGAAAACTGGCGAATGAAACTCCCAGTCTCTCTCCCCTCAGAATATAAACACAAGTCAGATGACATAGGGCTAGTCTACAGAGGGTTGAGGAAGGCCACTCCCGTTGTAGTAATTGCGGTGTCTCTTCTCGTCTTCCCTTAGAAGGGCAAAAAGTGCATCCGGACGCCTAAAATTGCCAAGCCTGTCAAGTTTGAGCTTTCTGGCTGCACCAGTGTGAAGACCTACCGGGCTAAGTTCTGTGGGGTGTGCACGGACGGCCGCTGCTGCACACCGCACAGAACCACCACACTGCCGGTGGAGTTCAAGTGCCCCGATGGCGAGATCATGAAAAAGAACATGATGTTCATCAAGACCTGTGCCTGCCATTACAACTGTCCCGGGGACAATGACATCTTTGAGTCCTTGTACTACAGGAAGATGTATGGAGACATGGCGTAAAGCCAGGGAGTAAGGGACACGAACTCATTTAGACTATAACTTGAACTGAGTTACATCTCATTTTCTTCTGTAAAAAAACAAAAAGGATTACAGTAGCACATTAATTTAAATCTGGGTTCCTAACTGCTGTGGGAGAAAACACCCCACCGAAGTGAGAACCGTGTGTCATTGTCATGCAAATAGCCTGTCAATCTCAGACACTGGTTTCGAGACAGTTTAGACTTGACAGTTGTTCACTAGCGCACAGTGACAGAACGCACACTAAGGTGAGCCTCCTGGAAGAGTGGAGATGCCAGGAGAAAGACAGGTACTAGCTGAGGTCATTTTAAAAGCAGCGATATGCCTACTTTTTGGAGTGTGACAGGGGAGGGACATTATAGCTTGCTTGCAGACAGACCTGCTCTAGCAAGAGCTGGGTGTGTGTCCTCCACTCGGTGAGGCTGAAGCCAGCTATTCTTTCAGTAAGAACAGCAGTTTCAGCGCTGACATTCTGATTCCAGTGACACTGGTCGGGAGTCAGAACCTTGTCTATTAGACTGGACAGCTTGTGGCAAGTGAATTTGCCGGTAACAAGCCAGATTTTTATGGATCTTGTAAATATTGTGGATAAATATATATATTTGTACAGTTATCTAAGTTAATTTAAAGACGTTTGTGCCTATTGTTCTTGTTTTAAGTGCTTTTGGAATTTTTAAACTGATAGCCTCAAACTCCAAACACCATCGATAGGACATAAAGCTTGTCTGTGATTCAAAACAAAGGAGATACTGCAGTGGAAACTGTAACCTGAGTGACTGTCTGTCAGAACATATGGTACGTAGACGGTAAAGCAATGGATCAGAAGTCAGATTTCTAGTAGGAAATGTAAAATCACTGTTGGCGAACAAATGGCCTTTATTAAGAAATGGCTTGCTCAGGGTAACTGGTCAGATTTCCACGAGGAAGTGTTTGCTGCTTCTTTGACTATGACTGGTTTGGGAGGCAGTTTATTTGTTGAGAGTGTGACCAAAAGTTACATGTTTGCACCTTTCTAGTTGAAAATAAAGTATATATATTTTTTATATGaaaggcttggctgctcattcttgtaaactttccttgggtttccctgggtgtaagcaggaagtttatatttatcttaaggtaattcactaagatgtttacaaacaactttgatgtgcatgagtcacatgaaatcaatagaattttgcataagcatcccttacaccggaccaagtagacatgagcatcaattatctacatgg

谢谢你们对我的支持!

欢迎关注我的其它发布渠道