当前位置: 开发笔记 > 后端 > 正文

容联AI实现「数据自动化打标」和「测试集自动提取」

作者：法国警方解放军_847 | 来源：互联网 | 2023-05-25 20:37

尊敬的用户：本周迎来容联AICall产品又一次更新，本次更新重点丰富自学习平台的功能，旨在让运营更智能，提高运营整体工作效

尊敬的用户&＃xff1a;

本周迎来容联AI Call产品又一次更新&＃xff0c;本次更新重点丰富自学习平台的功能&＃xff0c;旨在让运营更智能&＃xff0c;提高运营整体工作效率&＃xff0c;实现【数据自动打标】&＃xff0c;自动将原始数据进行数据清洗、数据标注、数据分类&＃xff0c;有效缩短了数据标注工期。同时&＃xff0c;打破传统测试集数据手动拆分方式&＃xff0c;实现【测试集数据自动提取】&＃xff0c;数据提取更科学&＃xff0c;评测结果更真实。

如下为V5.1.1本次更新内容&＃xff1a;

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑&＃xff0c;都可以在自学习平台完成&＃xff0c;打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据&＃xff0c;通过人工对数据进行标注&＃xff0c;无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能&＃xff0c;仅需上传原始数据集文件&＃xff0c;系统按照配置策略&＃xff0c;自动将原始数据进行数据清洗、数据标注、数据分类&＃xff0c;人工仅需完成简单的复检&＃xff0c;即可将数据用于模型训练&＃xff0c;有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制&＃xff0c;支持取消训练&＃xff0c;在面对大量模型训练任务时&＃xff0c;可以更好的承载超大并发量的模型训练任务&＃xff0c;从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分&＃xff0c;耗时耗力&＃xff0c;如果数据拆分不均匀&＃xff0c;还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式&＃xff0c;仅需在模型训练时&＃xff0c;选择所需训练集文件&＃xff0c;系统自动按照训练集标签数量提取一定比率的测试集数据出来&＃xff0c;数据提取更科学&＃xff0c;评测结果更真实。

5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面&＃xff0c;本次新增单意图、多意图、情感、句式识别的模型评测结果输出&＃xff0c;同时我们还对模型评测的指标计算方式进行调优处理&＃xff0c;使模型结果数据评测更加精准有效。

6、内置通用模型数据&＃xff0c;全平台可使用

结合容联在数据上的沉淀积累&＃xff0c;容联将百万级数据通过清洗整理&＃xff0c;并训练成行业场景的通用模型&＃xff0c;尽可能实现开箱即用&＃xff0c;减低冷启环节的耗时。本次更新容联将这些模型开放出来&＃xff0c;可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级&＃xff0c;一方面对数据本身的安全加密&＃xff0c;采用符合绝大部分客户要求的密码算法对数据进行主动保护&＃xff0c;另一方面对数据防护的安全&＃xff0c;采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。

推荐阅读

timeout
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
漏洞
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
port
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
多线程
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
多线程
深入解析JVM垃圾收集器

本文基于《深入理解Java虚拟机：JVM高级特性与最佳实践》第二版，详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景，帮助读者更好地理解和优化JVM内存管理。 ... [详细]

蜡笔小新 2024-12-28 13:35:19
asp.net
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
ftp
优化联通光猫DNS服务器设置

本文详细介绍了如何为联通光猫配置DNS服务器地址，以提高网络解析效率和访问体验。通过智能线路解析功能，域名解析可以根据访问者的IP来源和类型进行差异化处理，从而实现更优的网络性能。 ... [详细]

蜡笔小新 2024-12-28 11:28:18
多线程
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
多线程
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
package
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
smtp
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
package
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
asp.net
高效解决应用崩溃问题！友盟新版错误分析工具全面升级

友盟推出的最新版错误分析工具，专为移动开发者设计，提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态，快速发现并修复错误，显著提升应用的稳定性和用户体验。 ... [详细]

蜡笔小新 2024-12-26 14:11:47
django
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
django
帝国CMS多图上传插件详解及使用指南

本文介绍了一款用于帝国CMS的多图上传插件，该插件通过Flash技术实现批量图片上传功能，显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]

蜡笔小新 2024-12-26 13:30:01

法国警方解放军_847

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章