热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

科大讯飞前端websocket实时语音识别代码_高效办公+智慧生活:科大讯飞发布四款消费类新品...

9月1日,科大讯飞在北京召开以“声来即王者”为主题的消费类新品发布会,科大讯飞轮值总裁胡郁、科大讯飞副总裁李传刚出席此次发布会,并在现场发
9a60fab821e202e5fb4c7598d952cdf3.png

9月1日,科大讯飞在北京召开以“声来 即王者”为主题的消费类新品发布会,科大讯飞轮值总裁胡郁、科大讯飞副总裁李传刚出席此次发布会,并在现场发布了讯飞智能录音笔SR901、SR702、SR101,讯飞首款智能TWS耳机iFLYBUDS四款新品。

科大讯飞轮值总裁胡郁表示,科大讯飞坚持“To B+To C"双轮驱动战略,让AI应用服务大众。秉承着助力用户高效办公、智慧生活的理念,讯飞消费者业务连续三年保持超过30%的高增速。随着讯飞智能硬件产品体系不断完善,C端营收占比在2020年上半年达 37.59%。在AI转写赛道上,我们希望讯飞消费者产品不仅为文字工作者的记录场景赋能,更成为每个人的知识管理工具,开启高效记录新时代。

目前,全新发布的讯飞智能录音笔SR702、SR101,讯飞智能耳机iFLYBUDS已在9月1日0点开启预售,9月9日0点在天猫京东等电商平台同步现货开售。而SR901将在9月下旬开启预售。新品预售期享有不同程度分期免息计划、预定金充抵、赠品等多重优惠,参与预售有机会赢得讯飞智能录音笔SR301。

讯飞智能录音笔全系列布局完成,继续领跑AI录音笔市场

科大讯飞此次发布三款智能录音笔新品,补全了智能录音笔全系列,覆盖了从入门、旗舰再到尊享版全线机型,为不同需求的消费者提供最满意的选择。

讯飞智能录音笔SR101是面向职场新人和学生推出的入门级新品,融便携体验、高性价比和智能体验于一身。其拥有星空灰、深海蓝、象牙白三种配色可选,标配1.4英寸触摸屏使得转写实时可见,同时搭载1颗定向麦克风+2颗矩阵麦克风的组合,四核处理芯片,8GB存储空间和1500mAh电池容量,在硬件配置上毫不妥协。SR101售价599元,转写终身免费并享有3年5GB云空间服务。

0f4b3caa5e5e9d3d139397777de48a9c.png

【讯飞智能录音笔SR101】

讯飞智能录音笔SR702则是讯飞继SR701之后的旗舰之作。SR702采用星空灰配色,一体设计的3D陶瓷背板和航空级铝合金,其采用高密度2600mAh大容量电池,搭载2颗定向麦克和6颗矩阵麦克风,配置3.5英寸高清屏幕,并配备800万像素数字变焦后置摄像头。而讯飞智能录音笔SR901尊享版采用钢琴黑全陶瓷机身,搭载6.01英寸AMOLED屏幕,64GB存储空间及4000mAh支持18W快充大容量聚合物锂电池。

a10a8a2c624fa6c58f416b8fed7d36de.png

【讯飞智能录音笔SR702】

讯飞智能录音笔SR901拥有豪华三摄配置和2颗哈曼MEMS定向麦克风+10颗全向麦克风。通过全面升级的转写引擎,SR702和SR901搭载了行业首发的离线转写、OCR图文识别、视频字幕等新功能,再次拓宽了转写记录的易用性和使用场景。SR702售价3699元,SR901售价5999元,两款产品购买随硬件赠送终身免费会员服务,包含转写和翻译服务等,同时自激活之日起,另赠3年20GB云空间服务。

12c9738b028374232847d3e6e9f87327.png

【讯飞智能录音笔SR901】

上述三款新品均沿袭了讯飞智能录音笔的四大标准——识别准、录得远、录得清、语种全。识别准方面,讯飞智能录音笔新品语音识别模块采用基于深度全序列卷积神经网络的语音识别框架,识别准确率达98%;录得远方面,讯飞智能录音笔新品最远拾音距离均可达15米;录得清方面,讯飞智能录音笔新品采用AI算法降噪处理前端语音信号,保证拾音的准确性,并提供高清无损音质的音频格式;语种全方面,讯飞智能录音笔新品同样支持粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话12种方言转写、藏语、维吾尔语2种少数民族语言转写、中、英、日、韩、俄、法、越南、西班牙8种语言转写和IT科技、财经贸易、文化体育、医疗、政法、运营商、教育7大专业领域转写优化。同时,中英文混读识别功能也可在转写时自动识别夹杂着中英文的语音内容。

而得益于全新升级的转写引擎,讯飞智能录音笔SR901和SR702两款新品在行业率先搭载了离线转写功能。无需4G/WIFI网络,用户也能实现语音实时转文字、转写后的文字内容即刻保存,离线转写准确率高达95%,无惧断网环境。同时离线转写也防止了高度机密信息的泄露,保障了用户信息安全和特有转写需求的实现。同时,通过SR901和SR702的摄像头可将图片上的文字内容提取出来并实时呈现,便于用户实现重要音频和图文信息的混合记录,用于后期记录及整理。同时,这两款新品还支持录制视频、实时收音并实时生成字幕,同时后期也可编辑字幕,打造多场景重要信息记录的全新AI交互体验。

在讯飞智能录音笔前端降噪处理上,通过讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME),可以有效降低环境干扰噪声,并有效消除干扰说话人的声音,从而大幅降低语音识别的处理难度。在无喇叭的情况下3-10米远距离提升相对30%,有喇叭的情况超远距离(20-50m)演讲场景效果达到90%以上。而为了满足用户快速出稿的需求,讯飞大力投入语音识别后处理技术并运用到讯飞智能录音笔上,先后上线语气过滤词、口语规整、文本语义分段、文本智能摘要等文本理解能力。针对多人交谈会议场景,上线了分离与ASR联合建模的说话人分离方案,说话人分离的准确率达到95%让用户能够快速检索到目标说话人数据,提升编辑体验。

讯飞首款TWS智能耳机发布,语音实时转写打造移动商务新标配

与讯飞智能录音笔三款新品同时发布的还有讯飞首款TWS智能耳机iFLYBUDS。凭借通话实时转写、智能拨号识别、通话译文对照三大核心AI功能,能够轻松满足商务人士在自驾、通勤、会议等多场景中,解放双手、重要信息记录和从容沟通的需求。

23f275f927c17c7b6fc0afee9331a238.png

讯飞智能耳机iFLYBUDS采用珍珠白配色,弧形美学设计,耳机单只仅重4.6g,半入耳仿生设计,持久佩戴也舒适。该设备搭载旗舰级芯片,保证了连接的稳定性和超低延迟。此外,iFLYBUDS还拥有悦耳音质,通过智能降噪在机场、健身房等嘈杂环境也能带来清晰流畅的通话体验。iFLYBUDS支持智能语音助手,只要说“小飞小飞”即可快速唤醒语音助手。同时iFLYBUDS的特点还包括:支持轻击耳机交互,并且支持自定义功能;佩戴检测,摘下耳机时暂停播放,再次戴上音乐继续。不仅如此,讯飞智能耳机iFLYBUDS续航可以满足日常商务沟通。

7622da96f6453559fbdf402b9bbe9c3c.png

讯飞智能耳机iFLYBUDS的核心功能之一通话实时转写支持常规电话和网络电话(微信语音、腾讯会议、钉钉语音、Skype、Zoom等),随时随地可以接听网络电话会议。且对于多人会议还支持自动区分讲话人,查找通话内容更加方便。通话开始时一键录音,通话过程转成文字,转写准确率在98%以上。而在通话结束后可以形成智能摘要,自动提炼重点内容,还支持对通话内容进行快速查找、多终端分享(手机端和电脑端)和编辑。

ea711f177477f16668c980256c30dba8.png

智能拨号识别则让讯飞智能耳机iFLYBUDS解决了商务人士的通讯录里联系人繁多,并且多重名、同音联系人的痛点,针对拨号对象重名、同音等情况,iFLYBUDS可通过多种方式区分,例如章子怡的章、立早章;归属地名称区分,例如北京的李总、科大讯飞的李总。避免复杂查找,拨号效率成倍提升。与Siri等语音助手相比,iFLYBUDS的语音拨号功能专注拨号,更智能、精准,具备明显的优势:说法更自然,只说姓名即可拨号;纯语音交互,无需看屏;一句搞定,避免重复。

而在外语电话交流场景中,面对行业术语、俚语等生僻的专业词汇,经常会遇到语言沟通障碍,针对这一点,iFLYBUDS专为商务人士打造的核心功能之三就是通话译文对照。它在英语通话时,可将通话内容实时转译为汉字,辅助英语沟通,是你耳朵上的助理翻译官,沟通更加自信、简单。未来将会支持更多的语种。

二十一年AI技术深厚积累,讯飞消费者新品让消费者买的放心

在发布会现场,科大讯飞副总裁李传刚表示“技术革新与消费升级双轮驱动,将出现巨大的颠覆式创新机会,并催生新的领导品牌。讯飞智能录音笔和讯飞智能耳机均是这一理念的实践。通过顶尖的AI语音技术、优质的硬件和软件三位一体,打造极致便捷的体验,帮助用户有效提升效率,享受高品质智慧生活。

除了优秀的市场成绩外,讯飞消费者产品也在业界获得高度认可,这和科大讯飞在智能语音领域二十一年的深耕分不开。以语音转写功能应用到的语音识别技术为例,早在2016年9月,在业界影响力最大、参赛队伍最多、水平最高的国际多通道语音分离和识别大赛CHiME-4中,科大讯飞包揽了全部三个项目的冠军;2018年再次包揽CHiME-5大赛全部四个项目的冠军并大幅刷新了各项目的最好成绩;2020年的CHiME-6,在被称为“史上最难的语音识别任务”中,科大讯飞不仅在给定说话人边界的多通道语音识别两个参赛任务上夺冠,更一鼓作气刷新自己在CHiME-5中46.1%的语音识别错误率冠军成绩,直降至30.5%。

而在说话人识别技术方面,近期在VoxSRC国际说话人识别比赛限定训练数据任务中(公开刷榜阶段),科大讯飞刷新世界纪录,等错误率(EER)降低到0.81%。同时,科大讯飞在学术界公开测试集合VoxCeleb1上取得0.63%的EER,是截止目前的State Of The Art(最好结果),上述两个新纪录表明科大讯飞说话人识别技术站在了世界前列。



推荐阅读
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
  • 计算成像的原理与应用研究
    本文探讨了计算成像的原理与应用研究。首先介绍了小孔成像实验和软件方面的相关内容。随后从傅里叶光学的角度简单谈了成像的过程。成像是观测样品分布的一种方法,通过成像系统接收光的强度来呈现图像。视网膜作为接收端接收到的图像实际上是由像元组成的矩阵,每个元素代表相应位置像元接收光的强度。大脑通过对图像的分析,得出一系列信息,如识别物体、判断距离等。计算成像是一种采集记录系统,通过处理数据得到样品分布与像的对应关系,用于后续问题的分析。 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • Go语言实现堆排序的详细教程
    本文主要介绍了Go语言实现堆排序的详细教程,包括大根堆的定义和完全二叉树的概念。通过图解和算法描述,详细介绍了堆排序的实现过程。堆排序是一种效率很高的排序算法,时间复杂度为O(nlgn)。阅读本文大约需要15分钟。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • SEEBURGER SAP GTS解决方案:数字化助力企业实现海关流程数字化
    SEEBURGER作为SAP的合作伙伴,在2019 SAP GTS信息交流会上分享了SEEBURGER SAP GTS解决方案的应用案例,介绍了如何利用数字化助力企业实现海关流程数字化。SEEBURGER的集成技术和解决方案支持SAP GTS产品和服务的推广及应用,通过数据通讯和报文格式转换满足与海关当局的电子数据交换需求。该解决方案能够帮助企业管理全球贸易,保证贸易规范,优化跨境供应链,提升企业合规性。 ... [详细]
author-avatar
百万会员XTN_859
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有