留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

人类基因组非冗余Exon/Intron数据库的构建

罗冬梅 金鹰 邓小元 刘 海

罗冬梅, 金鹰, 邓小元, 刘 海. 人类基因组非冗余Exon/Intron数据库的构建[J]. 华南师范大学学报(自然科学版), 2010, (4).
引用本文: 罗冬梅, 金鹰, 邓小元, 刘 海. 人类基因组非冗余Exon/Intron数据库的构建[J]. 华南师范大学学报(自然科学版), 2010, (4).
The Construction of non-redundant Exon/Intron Database of H. sapiens[J]. Journal of South China normal University (Natural Science Edition), 2010, (4).
Citation: The Construction of non-redundant Exon/Intron Database of H. sapiens[J]. Journal of South China normal University (Natural Science Edition), 2010, (4).

人类基因组非冗余Exon/Intron数据库的构建

基金项目: 

国家自然科学基金资助项目

详细信息
    通讯作者:

    金鹰

  • 中图分类号: 

    Q34

The Construction of non-redundant Exon/Intron Database of H. sapiens

  • 摘要: 以RefSeq作为原始数据库来构建EID (Exon/Intron Database)可以克服GenBank所带来的冗余问题。Homo sapiens(智人)的RefSeq基因组数据库(Build 36.3, March 26, 2008最后更新)由NCBI主页(http://www.ncbi.nlm.nih.gov/)下载。利用Perl语言编写的脚本程序自动分析基因组的海量信息并提取每个记录条目中的CDS(Coding Sequence,编码序列)区域。与每个编码基因相关的数据(基因的定义、基因标识符、基因序列、蛋白质标识符、蛋白质序列、外显子和内含子的数量、大小、总数、非翻译区(UTR)内含子、内含子相位、内含子剪切位点模式)。结果表明,人类24条染色体(22条常染色体和2条性染色体,共计2,870,827,355bps)中含有32,157个基因标识符 (gene blocks),其中7,398个基因为假基因,4,014基因个发生了可变剪切 (Alternative Splicing, AS),15,533个基因含有CDS内含子,765个基因含有UTR内含子,2,585个基因不含有内含子,其他的为异常基因。
  • 加载中
计量
  • 文章访问数:  2278
  • HTML全文浏览量:  119
  • PDF下载量:  1289
  • 被引次数: 0
出版历程
  • 收稿日期:  2010-04-12
  • 修回日期:  2010-05-25
  • 刊出日期:  2010-11-25

目录

    /

    返回文章
    返回