手把手教你用UCSC查找基因的启动子、内含子、外显子

启动子/内含子/外显子

首先请看中心法则↓↓↓

11968752-5b9effa85110ac76

 启动子是在DNA转录为RNA这一步过程中发挥作用的。

11968752-65c8d1272828d699

首先要区分转录起始位点与DNA自身复制起始点以及由mRNA翻译为蛋白质时的翻译起始点。

1. 复制子:DNA自身复制起始点

2. 转录起始位点:DNA转录为mRNA的起始点,上游约2000bp的片段即为启动子

3. 蛋白翻译起始点:通常以编码甲硫氨酸的ATG起始,可翻译的序列均为外显子,且为CDS区(Sequence coding for aminoacids in protein)

定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。

区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。

转录起始位点下游第一个核苷酸对应的碱基标记为+1(如下图),由此碱基向上游(5’方向)的碱基为负(-1,-2,……),向下游(3’方向)的碱基为正(+2,+3,……)

11968752-a70c9066cee582b1

如何使用UCSC基因组浏览器查找启动子序列

进入UCSC的主页后(http://genome.ucsc.edu/),在其左上角点击Genome Browser,进入基因组浏览器入口。新版UCSC较旧版界面改变了许多,但是使用上基本大同小异。

11968752-bdd10b0f88a09e50

系统已经默认选择人的基因库,如果有需要查找其他物种的,在红框中选择切换或手动输入切换。

11968752-8b1505d6eaf7bcac

系统会默认选择最新的基因组数据库,如有不同需求可以通过该下拉菜单进行手动切换。

11968752-61d2260fe305b11e

在SearchTerm框中键入基因名称,如SELP(是P选择素的基因名称),会自动下拉弹出具体的基因序列,单击第一个,然后点击GO。

11968752-2e0e2a8b217995f5

出现包含这序列的图解概要,主要显示部分是mRNA区域。移动使用move旁边的移动按钮,调节大小使用zoom in和zoom out,选择放大或缩小倍数即可。图谱上方显示染色体,红色短线提示该基因在染色体上的位置。需要重点关注的是第一部分GENECODE一块。一般是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。

11968752-fd245a6dbddbe5d6

如下图这块放大的区域即显示出箭头往左,提示该基因从右向左转录,鼠标悬停位置提示该区域是第1部分的内含子intron,共16部分。点击move>>可看到上游启动子promoter区域。

11968752-6e2b2eea7e8aacee

点击第一条

11968752-737480441fdaa5a9

Description处再次确认该基因是否是我们想找的基因。确认后点击Genomic Sequence。

11968752-b4e14936fa1c1320

以下是对几个重要条目的解释↓↓

11968752-39d2d4aadf70658f

根据需要选择后,点击submit提交。

11968752-eb48bd36fbd3f453


返回如下序列↓↓↓

11968752-60fb1e74be487983


为了进一步研究功能,返回后更改一下选项,再点击submit。

11968752-f09a4003931e2c08


结果如下↓↓↓

11968752-c3c74c4650a35086


总之,关于启动子区域和外显子、内含子的查找方法有很多,如利用NCBI。个人觉得UCSC更规范一些,功能也更全面,如可以自由选择返回带5’UTR区或3’UTR区或downstream区域的基因序列。

原创: 诺斯博士 智汇医圈Plus

转载于:https://www.jianshu.com/p/ebfe78411c7a

猜你喜欢

转载自blog.csdn.net/weixin_34044273/article/details/91226407