热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

关于计算机在植物基因上的作用的论文,基于随机森林的植物抗性基因识别方法研究计算机科学与技术专业毕业论文.docx...

文档介绍:ClassifiedIndex:TP391Q811.4U.D.C:681DissertationfortheMasterDegreeinEngineerin

文档介绍:

ClassifiedIndex:TP391Q811.4U.D.C:681DissertationfortheMasterDegreeinEngineeringANAPPROACHFORIDENTIFYINGAPLANTRESISTANCEGENEBASEDONTHERANDOMFORESTCandidate: GuoYingjieSupervisor: Prof.GuoMaozuAcademicDegreeAppliedfor: MasterofEngineeringSpeciality: ComputerScienceandTechnologyAffiliation: puterScienceandTechnologyDateofDefence: June,2011Degree-Conferring-Institution: HarbinInstituteofTechnology摘 要植物抗性基因的研究是目前生物信息学领域重要课题之一。自发现第一个抗性基因至今,已有70余条抗性基因经过生物实验验证,并逐步应用于分子育种、转基因等方面的研究中。越来越多的生物信息人员致力于从已有的测序数据中挖掘植物抗性基因,并分析其功能和作用机制。但目前的挖掘方法尚存在挖掘效率低、假阳性高以及无法发现新的基因家族等问题。因此,本文从分析抗性基因结构出发,结合机器学****方法,对抗性基因挖掘过程中分类工作涉及的若干关键问题进行研究。抗性基因的识别分类工作可归纳为机器学****中的二类分类问题,本文以抗性基因蛋白产物为研究对象,首先分析抗性蛋白数据保守结构域,以及各种理化特性对其抗性功能的影响,提取188维有效特征用于描述抗性蛋白序列。随后使用基于K-Means的聚类降采样算法,对具有严重类别不平衡性抗性基因数据集进行重建,以削弱其不平衡性。最后在重建的训练集上,利用随机森林算法构建可以识别抗性基因的分类器。实验表明,该算法的敏感性接近80%,特异性达到在90%以上,并且在反例集上的测试结果显示,该模型能够有效降低假阳性。因此,本文所提出抗性基因识别方法是有效的。关键词:抗性基因;特征提取;降采样;随机森林AbstractTheresearchtowardsPlantResistance-Genedevelopsasoneofthemostimportanttopicsinbioinformatics.essfullyfound,morethan70R-genehavebeengraduallyverifiedbyconfirmatoryexperimentuntilnow,withapplyingtoMolecularBreeding,Trans-geneandthelike.Besides,moreandmorebioinformaticsresearchersarededicatedtominingresistancegenes,analyzingitsfunctionandbiochemicalmechanisms.However,someproblemsarestillremainssuchasthelowefficiencyofcurrentminingapproachandthehighfalsepositive.Inthisthesis,wehaveanalyzedtheR-genestructureandexploitedthemachinelearningapproachtopredictresistancegene.Inourapproach,wehaveselectedtheproteinsequencesencodedbyR-geneastheresearchobject,convertingtheR-geneidentificationproblemtoaTwo-Classclassificationproblemofmachinelearning.Firstly,wehaveassayedtheconserveddomainsofresistanceprotein,andtheeffectofphysicalandchemicalpropertiesontheproteinsequences,thenagroupof188validfeatureshasbeendefinedtorepresentthesequence.Secondly,wehasutilizedtheunder-samplingapproachbasedontheK-Meansalgorithmtorebuildthetrainingsets,aimingatsolvetheimbalancelearningprobleminR-geneclass

内容来自淘豆网www.taodocs.com转载请标明出处.



推荐阅读
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 安卓select模态框样式改变_微软Office风格的多端(Web、安卓、iOS)组件库——Fabric UI...
    介绍FabricUI是微软开源的一套Office风格的多端组件库,共有三套针对性的组件,分别适用于web、android以及iOS,Fab ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • PostgreSQL OR条件
    PostgreSQLOR条件与WHERE子句一起使用,以从表中的一列或多列列中选择唯一数据。语法 ... [详细]
  • 本文讨论了在使用Git进行版本控制时,如何提供类似CVS中自动增加版本号的功能。作者介绍了Git中的其他版本表示方式,如git describe命令,并提供了使用这些表示方式来确定文件更新情况的示例。此外,文章还介绍了启用$Id:$功能的方法,并讨论了一些开发者在使用Git时的需求和使用场景。 ... [详细]
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
author-avatar
凡秘能
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有