热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

容联AI实现「数据自动化打标」和「测试集自动提取」

尊敬的用户:本周迎来容联AICall产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效

尊敬的用户:

本周迎来容联AI Call产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效率,实现【数据自动打标】,自动将原始数据进行数据清洗、数据标注、数据分类,有效缩短了数据标注工期。同时,打破传统测试集数据手动拆分方式,实现【测试集数据自动提取】,数据提取更科学,评测结果更真实。

如下为V5.1.1本次更新内容:

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑,都可以在自学习平台完成,打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据,通过人工对数据进行标注,无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能,仅需上传原始数据集文件,系统按照配置策略,自动将原始数据进行数据清洗、数据标注、数据分类,人工仅需完成简单的复检,即可将数据用于模型训练,有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制,支持取消训练,在面对大量模型训练任务时,可以更好的承载超大并发量的模型训练任务,从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分,耗时耗力,如果数据拆分不均匀,还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式,仅需在模型训练时,选择所需训练集文件,系统自动按照训练集标签数量提取一定比率的测试集数据出来,数据提取更科学,评测结果更真实。

5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面,本次新增单意图、多意图、情感、句式识别的模型评测结果输出,同时我们还对模型评测的指标计算方式进行调优处理,使模型结果数据评测更加精准有效。

6、内置通用模型数据,全平台可使用

结合容联在数据上的沉淀积累,容联将百万级数据通过清洗整理,并训练成行业场景的通用模型,尽可能实现开箱即用,减低冷启环节的耗时。本次更新容联将这些模型开放出来,可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级,一方面对数据本身的安全加密,采用符合绝大部分客户要求的密码算法对数据进行主动保护,另一方面对数据防护的安全,采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。


推荐阅读
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 深入解析JVM垃圾收集器
    本文基于《深入理解Java虚拟机:JVM高级特性与最佳实践》第二版,详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景,帮助读者更好地理解和优化JVM内存管理。 ... [详细]
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • 优化联通光猫DNS服务器设置
    本文详细介绍了如何为联通光猫配置DNS服务器地址,以提高网络解析效率和访问体验。通过智能线路解析功能,域名解析可以根据访问者的IP来源和类型进行差异化处理,从而实现更优的网络性能。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 高效解决应用崩溃问题!友盟新版错误分析工具全面升级
    友盟推出的最新版错误分析工具,专为移动开发者设计,提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态,快速发现并修复错误,显著提升应用的稳定性和用户体验。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 帝国CMS多图上传插件详解及使用指南
    本文介绍了一款用于帝国CMS的多图上传插件,该插件通过Flash技术实现批量图片上传功能,显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]
author-avatar
法国警方解放军_847
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有