本文主要分享【学习人工智能需要学习那些知识】,技术文章【机器学习在竞赛和工业界应用区别】为【毛飞龙】投稿,如果你遇到机器学习相关问题,本文相关知识或能到你。
机器学习在竞赛和工业界应用是有很大区别的,竞赛通常关注极致的评价指标,而工业应用会在满足应用标准的前提下,会更加关注模型的稳定性、可解释性和领域专家知识的应用
竞赛通常为了取的比赛名次,极致地通过各种方法提升评价指标
数据质量:数据源不变,不关注数据质量提升模型应用:使用新模型、复杂模型、模型融合的方法特征工程:使用计算代价很高的数据增强调参:进行大量的模型调参工作稳定性:离线模型,对稳定性要求低领域专家知识:很多竞赛甚至会对原始数据进行脱敏(如字段名称重新标记),防止专家知识的运用,因此竞赛中的领域专家知识运用较少 工业应用通常在满足应用场景的条件下,更加关注模型的稳定性,注重数据质量的不断提升
数据质量:数据是不断变化的,因此关注数据质量提升模型应用:一般使用主流、相对简单的模型,较少使用复杂模型、模型融合的方法,这对于模型的可解释性以及问题debug会有帮助特征工程:关注工程性能,一般不会使用计算代价很高的数据增强调参:超参数固定后,较长时间不动(一般一年调几次)稳定性:生产环境线上实时模型部署,对稳定性要求高领域专家知识:会运用专家知识、理论模型进行建模本文《机器学习在竞赛和工业界应用区别》版权归毛飞龙所有,引用机器学习在竞赛和工业界应用区别需遵循CC 4.0 BY-SA版权协议。