热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

容联AI实现「数据自动化打标」和「测试集自动提取」

尊敬的用户:本周迎来容联AICall产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效

尊敬的用户:

本周迎来容联AI Call产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效率,实现【数据自动打标】,自动将原始数据进行数据清洗、数据标注、数据分类,有效缩短了数据标注工期。同时,打破传统测试集数据手动拆分方式,实现【测试集数据自动提取】,数据提取更科学,评测结果更真实。

如下为V5.1.1本次更新内容:

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑,都可以在自学习平台完成,打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据,通过人工对数据进行标注,无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能,仅需上传原始数据集文件,系统按照配置策略,自动将原始数据进行数据清洗、数据标注、数据分类,人工仅需完成简单的复检,即可将数据用于模型训练,有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制,支持取消训练,在面对大量模型训练任务时,可以更好的承载超大并发量的模型训练任务,从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分,耗时耗力,如果数据拆分不均匀,还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式,仅需在模型训练时,选择所需训练集文件,系统自动按照训练集标签数量提取一定比率的测试集数据出来,数据提取更科学,评测结果更真实。

5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面,本次新增单意图、多意图、情感、句式识别的模型评测结果输出,同时我们还对模型评测的指标计算方式进行调优处理,使模型结果数据评测更加精准有效。

6、内置通用模型数据,全平台可使用

结合容联在数据上的沉淀积累,容联将百万级数据通过清洗整理,并训练成行业场景的通用模型,尽可能实现开箱即用,减低冷启环节的耗时。本次更新容联将这些模型开放出来,可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级,一方面对数据本身的安全加密,采用符合绝大部分客户要求的密码算法对数据进行主动保护,另一方面对数据防护的安全,采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。


推荐阅读
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • Google在I/O开发者大会详细介绍Android N系统的更新和安全性提升
    Google在2016年的I/O开发者大会上详细介绍了Android N系统的更新和安全性提升。Android N系统在安全方面支持无缝升级更新和修补漏洞,引入了基于文件的数据加密系统和移动版本的Chrome浏览器可以识别恶意网站等新的安全机制。在性能方面,Android N内置了先进的图形处理系统Vulkan,加入了JIT编译器以提高安装效率和减少应用程序的占用空间。此外,Android N还具有自动关闭长时间未使用的后台应用程序来释放系统资源的机制。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • GreenDAO快速入门
    前言之前在自己做项目的时候,用到了GreenDAO数据库,其实对于数据库辅助工具库从OrmLite,到litePal再到GreenDAO,总是在不停的切换,但是没有真正去了解他们的 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
author-avatar
法国警方解放军_847
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有