admin管理员组

文章数量:1794759

生物信数据库

生物信数据库

生物信与药物数据库
  • 前言
  • 生物信学与药物治疗
  • 一、蛋白质相关数据库
    • 1.STRING数据库
    • 2.Uniprot数据库
    • 3.DIP数据库
    • 4.HPRD数据库
  • 二、基因相关数据库
    • 1.COXPRES db数据库
    • 2.Coexpedia数据库
    • 3.OMIM数据库
  • 三、RNA,ncRNA数据库
    • 1.miRNA相关数据库
    • 2.ncRNA相关数据库
  • 四、通路数据库
    • 1.KEGG数据库
    • 2.BioCyc数据库
    • 3.RegulonDB数据库
  • 五、基因表达数据库
    • 1.TCGA数据库
    • 2.CGGA数据库
    • 3.GEO数据库
  • 六、疾病与基因关联数据库
    • 1.DISNOR数据库
    • 2.DisGeNet数据库
    • 3.GeneCards数据库
    • 4.Phenopedia数据库
  • 七、药物(化合物)数据库(西药为主)
    • 1.FDA数据库
    • 2.DrugBank数据库
    • 3.SIDER 4.1数据库
    • 4.ChEMBL数据库
    • 5.PubChem数据库
    • 6.药物组合数据库
  • 八、药物(化合物)数据库(中药)
    • 1.CHEM-TCM数据库
    • 2.中医资源网
    • 3.TCMID数据库
    • 4.TCMSP数据库
  • 九、药物(化合物)-基因(蛋白质)相互作用数据库
    • 1.DrugBank数据库
    • 2.TTD数据库
    • 3.BindingDB数据库
    • 4.STITCH数据库
    • 5.SwissTargetPrediction数据库
  • 十、其他数据库
    • 1.DAVID数据库
    • 2.NCBI数据库
  • 总结


前言

作为一名生物信学“磕盐”道路上的小白,虽然在学术上没有太大的突破,但是在学习过程中积累一些干货,所以突然想分享一下。那话不多说,就直接进入正题吧。 这篇文章主要总结了一些常用的生物信数据库以及药物数据库,就本人亲身的科研经历看,在生物信学研究中数据真的十分的重要,处理数据也是个大工程,但是这篇文章就先只总结下数据库,某些数据库的具体使用以及数据处理后面有时间会再写啦~


生物信学与药物治疗

生物信学是研究生物信的采集,处理,存储,传播,分析和解释等各方面的学科。它综合利用生物学,计算机科学和信技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。那么生物信数据库中就存储了大量已知的研究中所需的数据和一些已有的便捷的处理工具,掌握了可以大大加快后续的研究过程。 药物治疗是现有疾病的主要治疗方式,如何针对疾病进行正确的用药就十分关键。旧药新用是一个重要的方式,但是按照以往利用临床实验去寻求旧药新用的方式是十分耗时耗力的,所以现在多利用计算机技术先对药物做一个预选,这里就需要涉及到一些药物数据库,让我们了解现已有的药物信以及药物与生物信之间的联系。 这篇文章中的数据库主要就是针对生物信和药物的数据。生物信主要包括基因,蛋白质,RNA,LncRNA,表达数据,通路等,药物信主要是单药,药物组合,西药,中药等。

一、蛋白质相关数据库 1.STRING数据库

网址:string-db/cgi/input.pl STRING数据库十分便于获取蛋白质相互作用网络,即可以自己输入一组蛋白质,得到相互作用网络并可视化,也可以在DownLoad模块下载完整的蛋白质相互作用网络。同时其还有蛋白质功能富集分析的功能。

2.Uniprot数据库

网址:www.uniprot/ 该数据库主要提供蛋白质的序列和功能等信资源


3.DIP数据库

网址:dip.doe-mbi.ucla.edu DIP数据库也主要是挖掘蛋白质相互网络数据的数据库,具体的可以参考论文《DIP:The database of interacting proteins》


4.HPRD数据库

网址:hprd/index_html HPRD数据库全称为Human Protein Reference Database,它是专门存储人类蛋白质相互作用的数据库。


二、基因相关数据库 1.COXPRES db数据库

网址:coxpresdb.jp/ 该数据库提供了11种动物基因共表达数据,并可以进行共表达网络可视化。


2.Coexpedia数据库

网址:www.coexpedia/ 该数据库主要包含的也是基因共表达网络数据。


3.OMIM数据库

网址:omim/ 人类孟德尔遗传病的数据库,主要关注人类变异基因和表型性状之间的关系。


三、RNA,ncRNA数据库 1.miRNA相关数据库

miRNA接触比较少,这里只简单列举一些数据库的名称,感兴趣的自己去搜索了解哦~

  • miRbase
  • miRDB
  • miRanda
  • TargetScan
  • miRTarBase

  • 2.ncRNA相关数据库

    1.NPInter4.0

    网址:bigdata.ibp.ac/npinter4 该数据库中系统的收录了绝大多数种类非编码RNA(ncRNA)的相互作用,感兴趣可以参考论文《NPInter v4.0:An integrated database of ncRNA interactions》

    2.chipBase 网址:rna.sysu.edu/chipbase/index.php 研究转录因子结合位点和基序,从ChIP-seq数据中解码lncRNA,miRNAs、其他ncRNA和蛋白编码基因的转录调控网络。


    四、通路数据库 1.KEGG数据库

    网址:www.kegg.jp/ KEGG数据库中包含多个功能,里面有多个小的子数据库,最常用的是GENES数据库和PATHWAY数据库。GENES数据中主要包含基因组信,PATHWAY数据库里包含生物系统中的通路信,包含代谢,膜转运,信号传递,细胞周期等。另外其还可以链接到一些其他常用的大型生物信数据库,感兴趣的这个数据库可以详细了解哦~


    2.BioCyc数据库

    网址:biocyc/ 生物代谢途径数据库。


    3.RegulonDB数据库

    网址:regulondbg.unam.mx/index.jsp 大肠杆菌K-12转录调控的主要数据库。


    五、基因表达数据库 1.TCGA数据库

    网址:www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga 癌症基因组图谱,收录了各种人类癌症的临床数据,基因组变异,mRNA表达,miRNA表达,甲基化等数据,对于癌症研究是重要的数据来源。


    2.CGGA数据库

    网址:www.cgga/ 中国胶质瘤基因组图谱数据库,其中包含超过2000个样本的脑肿瘤数据集,包含图像基因组数据,单细胞测序数据,甲基化数据,mRNA测序数据,mRNA微阵列数据以及miRNA微阵列数据等。


    3.GEO数据库

    网址:www.ncbi.nlm.nih.gov/geo/ GEO是一个公共功能基因组学数据库,可以帮助用户查询和下载实验和精心策划的基因表达谱。


    六、疾病与基因关联数据库 1.DISNOR数据库

    网址: disnor.uniroma2.it/ 以疾病为中心,探索和生成连接疾病基因的蛋白质相互作用网络。


    2.DisGeNet数据库

    网址:www.disgenet/home/ 主要收录了与人类疾病相关的最大的公开可得的基因和变异。


    3.GeneCards数据库

    网址:www.genecards/ 该数据库提供了所有注释和预测的人类基因,包括基因组,转录组,蛋白质组,遗传学信。本人主要用于查找和特定疾病的相关基因。


    4.Phenopedia数据库

    网址:phgkb.cdc.gov/PHGKB/startPagePhenoPedia.action 基于疾病关联研究文章,针对疾病进行基因关键词的频次统计。


    七、药物(化合物)数据库(西药为主) 1.FDA数据库

    网址:www.fda.gov/ 全称为食品药品监督管理局。是专门从事食品和药品管理的最高执法机关。一般获得FDA批准的药物是具有最高可信度的,它已经成为全球食品药品消费者心中的金刚盾牌。


    2.DrugBank数据库

    网址:www.drugbank/ DrugBank 将详细的药物数据和全面的药物目标信结合起来,是一个真实可靠的生物信学和化学信学数据库。其中包含多种药物,营养品,实验药物等信,还有与药物相关联的蛋白序列信。


    3.SIDER 4.1数据库

    网址:sideeffects.embl.de/ 该数据库包含了上市药品及其记录的药物不良反应的信。


    4.ChEMBL数据库

    网址:www.ebi.ac.uk/chembl/ 人工筛选的具有药物性质的生物活性分子数据库,将化学,生物活性和基因组数据结合在一起,以帮助将基因组信转化为有效的新药。


    5.PubChem数据库

    网址:pubchem.ncbi.nlm.nih.gov/ 世界上最大的免费化学信收集网站,可以通过名称,分子式,结构和其他标识符搜索化学物质,查找化学和物理性质,生物活性,安全和毒性信,专利,文献引用等。


    6.药物组合数据库
  • DrugCombDB 网址:drugcombdb.denglab/main
  • Drugs 网址:www.drugs/
  • eMedExpert 网址:www.emedexpert/
  • DCDB 网址:public.synergylab/dcdb/
  • FDA 网址:www.fda.gov/ **注:**一般药物组合数据库里也都包含单药的信
  • 八、药物(化合物)数据库(中药) 1.CHEM-TCM数据库

    网址:www.chemtcm/ 传统草药中使用的植物的个体分子和成分的数据库。该数据库由化学鉴定、植物信、针对常见西医治疗靶点的活性预测和根据中草药分类的分子活性预测四大部分组成。


    2.中医资源网

    网址:www.tcmdoc/default.aspx


    3.TCMID数据库

    网址:www.megabionet/tcmid/ 该数据库收集了中药的各个方面的信,包括方剂、草药和草药成分,还收集了现代药理学和生物医学科学深入研究的药物、疾病的信并将这两套独立的知识与药物靶点或疾病基因/蛋白质连接起来。


    4.TCMSP数据库

    网址:old.tcmsp-e/tcmsp.php TCMSP是一个独特的中草药系统药理学平台,捕捉药物、靶标和疾病之间的关系。该数据库包括化学品、靶标和药物靶标网络、相关的药物靶标-疾病网络,以及天然化合物的药代动力学特性,包括口服生物利用度、药物相似性、肠上皮通透性、血脑屏障、水溶解度等。


    九、药物(化合物)-基因(蛋白质)相互作用数据库 1.DrugBank数据库

    网址:www.drugbank/ 该数据库前面已经提过,获取药物-靶标信也是十分的方便的。


    2.TTD数据库

    网址:db.idrblab/ttd/ TTD提供了已知和探索的治疗蛋白和核酸靶点、靶向疾病、通路信以及针对每个靶点的相应药物信的数据库。


    3.BindingDB数据库

    网址:www.bindingdb/bind/index.jsp 检索已知的以及被预测的化合物和蛋白质之间互作关系的平台。


    4.STITCH数据库

    网址:stitch.embl.de/ 化合物-蛋白相互作用的数据库,包含了已知和预测的相互作用。


    5.SwissTargetPrediction数据库

    网址:www.swisstargetprediction.ch/ 该数据库用于预测一个小分子的最可能的大分子目标,该预测是基于二维和三维相似性,以及来自三个不同物种的3000多个蛋白质上的37万个已知活性的文库。


    十、其他数据库 1.DAVID数据库

    网址:david.ncifcrf.gov/ 主要用于基因symbol和基因ID之间的转换啦~其他功能有待学习。


    2.NCBI数据库

    网址:www.ncbi.nlm.nih.gov/ NCBI给分子生物学家提供了一个信存储和处理的系统,里面包含了多个功能的数据库,提供了多功能强大的数据检索和分析工具。


    总结

    这里只总结了本人在磕盐道路上所接触到的数据库,当然总结的还不是很全面,也在不断的补充中~上述数据库中,就本人的经验来说,比较值得学习的有NCBI,FDA,Drugbank,KEGG等。第一篇文章有很多不足之处还请童鞋们多多指教啦,后面有时间也会更新一些其他的干货滴!

    本文标签: 生物数据库