热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

AI加持的WPS来了:金山开源全球首个办公DL框架KSAILite

自动生成PPT,自动图片转文字翻译,甚至自动辅助写文章……办公自动化的未来已来。WPS是个已有超过30年历史的办公软件,但它最近的用户数量

自动生成 PPT,自动图片转文字 + 翻译,甚至自动辅助写文章…… 办公自动化的未来已来。


WPS 是个已有超过 30 年历史的办公软件,但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户,其中还包括 1 亿海外用户。

如此受欢迎的原因当然是因为最近的大幅升级,如今在 WPS 上你会发现不少 AI 能力的加持。

7 月 22 日,金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术,还发布了 KSAI-lite,业内第一个面向办公领域的深度学习框架。

AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

对于众多使用者来说,如今的 WPS 已不再仅仅是一个文件编辑工具。「WPS 是一个成熟的办公软件,应该学会自己做 PPT 了,」金山办公副总裁、AI 中台负责人姚冬说道。

用最新版本的 WPS 编辑演示文稿,你只需要用文字列出一个思维导图,或者在每一页空白的 PPT 上打上文字,甚至只需要打开一个 Word 文档,AI 就可以帮助你实现智能配图、表格美化、多图拼图、多图轮播、图片介绍等多种效果,几秒钟生成一份可用的 PPT。

AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

如上图所示,「智能美化」功能可以自动为纯文字内容推荐出几十种 PPT 样式,加入背景、调好字号和格式,它们都是使用 AI 算法基于文字内容的语义产生的。如果你已有素材图片,只需要把它们堆放在幻灯片上就可以一键美化图片,自动整理好排版或加入动画特效。

这种自动生成 PPT 的功能既可以进行单页面美化,也可以实现全局换肤、对齐排版、配色、字体统一等问题。在使用时,你只需关注要介绍的内容,无须在选模版、调格式等操作上花费时间,大幅提升了效率,也解决了不常做 PPT 的人「一时找不到如何下手」的重要问题。

值得注意的是,在 AI 推荐的模板中,也有相当一部分是由算法自动生成的,这些都是金山办公后台几十台服务器 AI 模型训练获得的成果。

除了自动生成 PPT 之外,WPS 强大的 OCR「光学文字识别」技术也被人们经常使用。这个工具可以将书籍和文件的图片转成文字,并保留原排版,让原照片上的表格、分栏和图片都转至新文档中,并成为可编辑状态。对于 AI 来说,即使是照歪一点也不是问题。

金山办公还介绍了 WPS 中的「辅助写作」功能:如果你对写文章一时没有思路,只要写一个大概的提纲,AI 就可以自动生成一些段落。没开始写的情况下文章就已经有上千字了,其中都是语料算法生成的段落。

自动生成的文字内容合理吗?金山办公表示,用于模型训练的语料库是与人民网等机构合作完成的,其中包括媒体历年发布的文章,此外还包含大量官方出版物。

轻松办公是金山对 AI 时代办公软件确立的目标。「在效率上,WPS 的智能美化、智能表格等功能可以将用户的很多操作由分钟级提升至秒级;在用户体验方面,我们自研的全文翻译引擎可以解决不同类别文档识别翻译难、排版还原难等问题,快速输出高质量的译文,」姚冬表示。

AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

金山办公副总裁、AI 中台负责人姚冬在活动中。

在开放日上,金山办公还发布了一款人工智能深度学习推理框架 KSAI-lite,这是一款免费、开源、跨多个终端的全新工具,适配国内外主流软硬件平台,在 OCR、机器翻译、智能校对等落地场景上为开发者们带来了新选择。

KSAI-lite 面向通用性、高性能、轻量和专业性四个目标构建。在技术实践中,金山的开发团队在多框架支持、软硬件适配、性能、功耗、内存等方面都进行了优化。

在 KSAI-lite 中首个开源的是 OCR 模型,其支持移动端设备的离线识别,模型和库文件共计不到 9MB。该模型在文本检测、文本分类和文本识别上都表现出了业内第一梯队的性能。

据介绍,KSAI-lite 框架底层基于 TensorFlow,目前已经在 GitHub 上开源:https://github.com/kingsoft-wps/KSAI-Toolkits

AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

金山办公表示,未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公产品线和整个业界提供更多 AI 能力的支持。

金山办公转型 AI 的时间其实已经不短:其自 2017 年成立的 AI 中台如今已拥有超过 100 人的规模。几年内这一团队完成了 OCR、文档翻译、图文识别检测等多领域应用的落地,一些研究也已被 AI 顶会收录。

迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。

在公司内部,AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

WPS 在办公软件领域已拥有 30 余年的技术积累,由于支持从 Windows 到 Linux 的绝大多数操作系统和硬件,它受到了人们的持续欢迎。随着 AI 等技术的应用,未来我们还能期待 WPS 为我们带来更多、更方便的功能。

「WPS 为文字处理而生,而文字是办公活动的核心。我们在未来会继续以文字处理为核心研发新技术,满足企业数字化转型的巨大需求,」姚冬表示。


推荐阅读
  • 寻求更强大的身份和访问管理(IAM)平台的企业正在转向云,并接受身份即服务(IDaaS)的灵活性。要为IAM选择正确的场外解决方案,业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • 必备核心算法神经网络通俗讲解
    深度学习传统算法VS人工智能算法传统算法:都是人为去计算人工智能算法:部分人为需要做的事情交由机器去做【把更多的问题简单化】IT的发展比较高端的就是A ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
  • 【跨越鸿沟】学术界与工业界的GAP有多大?
    来自:美团技术团队2020年7月31日,由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV2020 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Centos7.6安装Gitlab教程及注意事项
    本文介绍了在Centos7.6系统下安装Gitlab的详细教程,并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时,还强调了使用阿里云服务器时的特殊配置需求,以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • 推荐 :以数据驱动的方式讲故事
    直觉vs数据首先,你有思考过一个问题吗?当你的直觉与你所掌握的数据矛盾的时候,你是听从于直觉还是相信你所掌握的数据呢?201 ... [详细]
  • SLAM优秀开源工程最全汇总
    https:zhuanlan.zhihu.comp145750808 1、CartographerCartographer是一个系统,可跨多个平台和传感器配置以2D和3D形式提供实 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
author-avatar
年庚瑶
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有