热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库原理及其应用:ClinVar数据库解析

本文将详细介绍ClinVar数据库的基本概念、数据结构、搜索方法以及如何利用FTP下载和本地注释等功能,帮助科研人员更好地理解和利用这一重要资源。

ClinVar是由美国国家生物技术信息中心(NCBI)维护的一个公开数据库,专注于收集与人类健康和疾病相关的基因组变异信息。它整合了来自多个权威来源的数据,如dbSNP、dbVar、PubMed和OMIM等,形成了一个标准化且高可信度的遗传变异与临床关联数据库。ClinVar不仅支持在线查询,还允许用户下载数据进行本地分析。



ClinVar数据库的开放性鼓励全球研究机构贡献数据,并设有一个专家团队对提交的信息进行审核评级。数据库中的每个变异位点根据注释信息的可靠性和详实程度被赋予1至4个星级,星级越高表明该信息越值得信赖。例如,四星级表示该变异的功能已由多位专家验证,而一星级或无星级则意味着信息来源较为单一,可能仅基于一项研究结果。



在线搜索功能



ClinVar提供了灵活多样的搜索选项,包括基因符号、HGVS表达式、蛋白质变化编号、疾病名称、提交者信息和染色体位置等七种方式。以PTEN基因为例,通过搜索可以获取该基因的总体统计信息、具体变异详情、相关疾病列表、变异频率以及临床意义等关键数据。临床意义通常分为致病、可能致病、良性、可能良性等几个等级,反映了变异对疾病潜在影响的程度。



数据下载与本地注释



用户可以通过FTP访问ClinVar提供的数据下载服务,下载地址为:ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/。这里包含了多种格式的数据文件,如vcf格式的变异信息、疾病名称列表等。下载后,可以使用工具如ANNOVAR或SnpEff进行本地注释,以进一步分析变异的生物学意义。



例如,使用ANNOVAR下载并处理ClinVar数据的命令如下:



mkdir -p ~/annotation/variation/human/clinvar
cd ~/annotation/variation/human/clinvar
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/disease_names
mkdir vcf_GRCh37 && cd vcf_GRCh37
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170130.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz.tbi


随后,可以运行ANNOVAR进行注释:



~/biosoft/ANNOVAR/annovar/annotate_variation.pl -downdb -webfrom annovar -build hg19 -downdb clinvar_20170130 ~/biosoft/ANNOVAR/annovar/humandb/
~/biosoft/ANNOVAR/annovar/annotate_variation.pl --filter -buildver hg19 -out clinvar_20170130_anno -dbtype clinvar_20170130 jmzeng.annovar_input ~/biosoft/ANNOVAR/annovar/humandb/


此外,使用SnpEff进行注释的示例如下:



wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz
wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz.tbi
java -jar ~/biosoft/SnpEff/snpEff/SnpSift.jar annotate clinvar_20180429.vcf.gz merge_snpeff.vcf > merge_clinvar.vcf


参考资料:

http://www.biotrainee.com/thread-991-1-1.html

http://www.bio-info-trainee.com/3321.html

https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf


推荐阅读
  • 搭建Jenkins、Ant与TestNG集成环境
    本文详细介绍了如何在Ubuntu 16.04系统上配置Jenkins、Ant和TestNG的集成开发环境,涵盖从安装到配置的具体步骤,并提供了创建Windows Slave节点及项目构建的指南。 ... [详细]
  • 本文介绍了如何利用 Spring Boot 和 Groovy 构建一个灵活且可扩展的动态计算引擎,以满足钱包应用中类似余额宝功能的推广需求。我们将探讨不同的设计方案,并最终选择最适合的技术栈来实现这一目标。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • JMeter接口关联与数据提取:正则表达式和JSON Extractor的使用
    在使用JMeter进行接口测试时,常常需要从前一个接口的响应中提取数据并应用于后续请求。本文将详细介绍如何利用正则表达式提取器(Regular Expression Extractor)和JSON Extractor来实现这一需求。 ... [详细]
  • 本文探讨了2019年前端技术的发展趋势,包括工具化、配置化和泛前端化等方面,并提供了详细的学习路线和职业规划建议。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 解决Python中 'NoneType' 对象无属性 'find_all' 错误
    本文详细探讨了在Python编程中遇到的常见错误——'NoneType'对象没有属性'find_all',并深入分析其原因及解决方案。通过理解find_all函数的工作原理和常见用法,帮助读者避免类似问题。 ... [详细]
  • 2018-2019学年第六周《Java数据结构与算法》学习总结
    本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容,重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]
  • 本文介绍了如何使用JavaScript的Fetch API与Express服务器进行交互,涵盖了GET、POST、PUT和DELETE请求的实现,并展示了如何处理JSON响应。 ... [详细]
author-avatar
零落曦_622
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有