音视频技术开发周刊53期

作者：墨尔本晴上残留的余温丶_856 | 来源：互联网 | 2023-06-21 13:50

『音视频技术开发周刊』由LiveVideoStack团队出品，专注在音视频技术领域，纵览相关技术领域的干货和新闻投稿，每周一期。点击『阅读原文』，浏览本期内容，祝您阅读愉快。策划 /

640?wx_fmt=jpeg

『音视频技术开发周刊』由LiveVideoStack团队出品，专注在音视频技术领域，纵览相关技术领域的干货和新闻投稿，每周一期。点击『阅读原文』，浏览本期内容，祝您阅读愉快。

策划 / LiveVideoStack

架构

阿里巴巴开源语音识别声学建模技术

本文介绍了DFSMN，一种改进的前馈顺序存储器网络（FSMN）架构，适用于大型词汇表连续语音识别。我们发布了基于流行的Kaldi语音识别工具包的DFSMN的源代码和训练配方，并证明DFSMN可以在LibriSpeech语音识别任务中实现最佳性能。

HDR转换曲线比较

随着显示技术的发展以及消费者对更极致观影体验的追求，超高清电视(UHDTV)逐渐成为热点话题，高分辨率、高帧率、高动态范围(HDR)、宽色域(WCG)是超高清电视的主要特征，其中高动态范围是近年的热点研究问题。

美拍短视频成本减半及毫秒起播优化实践

本文将从成本优化，成功率优化，播放体验优化等几个方面，整体介绍下美拍短视频成本减半以及毫秒起播优化实践之路。

心随手动，快手抖音的特效是怎么来的？

本文将从编辑的原理，预览功能，视频预处理，特效的制作等几个方面，介绍了抖音短视频背后的技术故事。

STUN/TURN/ICE协议在P2P SIP中的应用（一）

本文详细描述了基于STUN系列协议实现的P2P SIP电话过程，其中涉及到了SIP信令的交互，P2P的原理，以及STUN、TURN、ICE的协议交互。

STUN/TURN/ICE协议在P2P SIP中的应用（二）

本文详细描述了基于STUN系列协议实现的P2P SIP电话过程，其中涉及到了SIP信令的交互，P2P的原理，以及STUN、TURN、ICE的协议交互。

50种机器学习和预测应用的API，你想要的全都有

API 是一套用于构建软件程序的协议和工具。对于应用开发者而言，有了开放的 API，就可以直接调用其他公司做好的功能为我所用，这在很大程度上提升了工作效率。本文整理了以下四大类共 50 种 API，为你节省了寻找资源的时间。

音频/视频技术

腾讯视频全网清晰度提升攻坚战

腾讯视频移动端播放内核技术负责人李大龙围绕Codec，详细解读了腾讯为提升视频质量做的种种工作，包括播放器、编码与解码端、Codec优化、AI内容分类等。本文来自李大龙在LiveVideoStackCon 2017大会的分享，由LiveVideoStack整理。

WebRTC-Native 源码导读（十一）：混音

本文主要介绍了WebRTC 混音模块的相关内容与实践：AudioMixer 的实现原理、AudioMixer 的产品化、工程化要点等内容。

直播全流程探索

近年来，直播兴起，QQ音乐也接入了直播能力，支持演唱会的直播和主播、明星直播，根据互动方式的不同，我们可以分为互动直播和推流直播。本文主要对web部分的直播流程进行介绍。

GPUImage详细解析（十三）多路视频绘制

本文主要介绍了用GPUImage进行多路视频的渲染的几种不同的方案，通过分析，发现其对应的应用场景。

编解码

IBM Cloud Video工程师Scott Grizzle谈流媒体协议和Codec

Streaming Media特约编辑Tim Siglin在Streaming Media East 2018采访了IBM Cloud Video工程师Scott Grizzle。LiveVideoStack对本文进行了摘译。

H264/SVC Temporal Scalability

在多人远程会议或直播系统中，参与的用户可能处于不同的网络环境（有线、wifi、3G、4G）中，网络质量各不一致，为了所有用户可进行远程会议或者直播的观看，简单的做法就是降低发送端的视频码流，这样不管网络质量好坏，参与的用户都将观看低码率的视频流。这种方案缺点在于大部分网络较好的用户会被少数的网络较差的用户给拖累。这里介绍 H264 编码器中的 Temporal Scalability 机制来优化该方案。

webrtc 视频编码之 h264 自动调节分辨率一

webrtc 内部支持 vp8，vp9，h264 视频编码，由于业务需要和出于通用性考虑，我选择了 h264 编码，webrtc集成了openh264，ffmpeg用于h264的编解码。本文主要介绍openh264 是如何动态调整分辨率的。

webrtc 视频编码之 h264 自动调节分辨率二

webrtc 内部支持 vp8，vp9，h264 视频编码，由于业务需要和出于通用性考虑，我选择了 h264 编码，webrtc集成了openh264，ffmpeg用于h264的编解码。本文主要介绍openh264 是如何动态调整分辨率的。

AI智能

深度学习AI美颜系列----基于抠图的人像特效算法

美颜算法的重点在于美颜，也就是增加颜值，颜值的广定义，可以延伸到整个人体范围，也就是说，你的颜值不单单和你的脸有关系，还跟你穿什么衣服，什么鞋子相关，基于这个定义(这个定义是本人自己的说法，没有权威性考究)，本文主要介绍基于人体抠图来做一些人像特效算法。

一文概览主要语义分割网络：FCN,SegNet,U-Net...

本文作者总结了 FCN、SegNet、U-Net、FC-Densenet E-Net 和 Link-Net、RefineNet、PSPNet、Mask-RCNN 以及一些半监督方法，例如 DecoupledNet 和 GAN-SS，并为其中的一些网络提供了 PyTorch 实现。在文章的最后一部分，作者总结了一些流行的数据集，并展示了一些网络训练的结果。

身份采集、活体检测、人脸比对...旷视是如何做FaceID的？

本文讲述了深度学习在互联网身份验证服务中的应用以及人脸识别活体检测（动作、炫彩、视频、静默）技术应用场景及实现方式。

图像

图像处理之Canny边缘检测（一）

Canny边缘检测算法是1986年有John F. Canny开发出来一种基于图像梯度计算的边缘检测算法，同时Canny本人对计算图像边缘提取学科的发展也是做出了很多的贡献。尽管至今已经许多年过去，但是该算法仍然是图像边缘检测方法经典算法之一。

图像处理之Canny边缘检测（二）

Canny边缘检测算法是1986年有John F. Canny开发出来一种基于图像梯度计算的边缘检测算法，同时Canny本人对计算图像边缘提取学科的发展也是做出了很多的贡献。尽管至今已经许多年过去，但是该算法仍然是图像边缘检测方法经典算法之一。

浅析Android平台图像压缩方案

本文重点分享Android平台的压缩方案，并简单介绍了Bitmap的几个主要概念：像素密度、色彩模式以及Bitmap的计算方式。

图像处理之线性滤波

本文主要介绍了如何应用不同的线性过滤器来使用OpenCV函数来平滑图像。

推荐阅读

stream
FFMpeg学习进阶：音频处理基础理论与重采样技术详解

在Android平台中，播放音频的采样率通常固定为44.1kHz，而录音的采样率则固定为8kHz。为了确保音频设备的正常工作，底层驱动必须预先设定这些固定的采样率。当上层应用提供的采样率与这些预设值不匹配时，需要通过重采样（resample）技术来调整采样率，以保证音频数据的正确处理和传输。本文将详细探讨FFMpeg在音频处理中的基础理论及重采样技术的应用。 ... [详细]

蜡笔小新 2024-11-09 13:46:55
stream
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
stream
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
stream
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
ip
提升 Kubernetes 集群管理效率的七大专业工具

Kubernetes 在云原生环境中的应用日益广泛，然而集群管理的复杂性也随之增加。为了提高管理效率，本文推荐了七款专业工具，这些工具不仅能够简化日常操作，还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查，这些工具覆盖了集群管理的各个方面，帮助管理员更好地应对挑战。 ... [详细]

蜡笔小新 2024-11-07 17:01:31
function
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
process
第七天深入学习DGL框架：官方文档指导下的数据集下载与预处理技巧

在第七天的深度学习课程中，我们将重点探讨DGL框架的高级应用，特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧，帮助读者高效地构建和优化图神经网络的数据管道。此外，我们还将介绍如何利用DGL提供的模块化工具，实现数据的快速加载和预处理，以提升模型训练的效率和准确性。 ... [详细]

蜡笔小新 2024-10-27 21:10:17
ip
PJSIP 编译与开发指南：深入解析 PJSIP 库的应用与优化

PJSIP 编译与开发指南：深入解析 PJSIP 库的应用与优化 ... [详细]

蜡笔小新 2024-10-27 15:50:01
stream
Java Socket 关键参数详解与优化建议

Java Socket 的 API 虽然被广泛使用，但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数，如 backlog 参数，它用于控制服务器等待连接请求的队列长度。此外，还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响，并提供了优化建议，帮助开发者提升网络通信的稳定性和效率。 ... [详细]

蜡笔小新 2024-11-09 21:38:05
ip
OSChina 周末闲谈 —— 程序员的浪漫情话

在OSChina的周末闲谈栏目中，探讨了程序员特有的浪漫情话。本文不仅分享了一些程序员如何用代码表达爱意的有趣例子，还推荐了一首适合程序员聆听的歌曲——李克勤的《啜泣》。对于喜欢在编程之余享受音乐的朋友们，不妨点击链接试听一下。 ... [详细]

蜡笔小新 2024-11-09 15:46:47
process
C++ 异步编程中获取线程执行结果的方法与技巧及其在前端开发中的应用探讨

本文探讨了C++异步编程中获取线程执行结果的方法与技巧，并深入分析了这些技术在前端开发中的应用。通过对比不同的异步编程模型，本文详细介绍了如何高效地处理多线程任务，确保程序的稳定性和性能。同时，文章还结合实际案例，展示了这些方法在前端异步编程中的具体实现和优化策略。 ... [详细]

蜡笔小新 2024-11-09 15:14:28
string
卓盟科技：动态资源加载技术的兼容性优化与升级 | Android 开发者案例分享

随着游戏内容日益复杂，资源加载过程已不仅仅是简单的进度显示，而是连接玩家与开发者的桥梁。玩家对快速加载的需求越来越高，这意味着开发者需要不断优化和提升动态资源加载技术的兼容性和性能。卓盟科技通过一系列的技术创新，不仅提高了加载速度，还确保了不同设备和系统的兼容性，为用户提供更加流畅的游戏体验。 ... [详细]

蜡笔小新 2024-11-09 13:07:52
process
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38
string
Android开发常见问题汇总（含Gradle解决方案）第二篇

本文继续深入探讨Android开发中常见的问题及其解决方案，特别聚焦于Gradle相关的挑战。通过详细分析和实例演示，帮助开发者高效解决构建过程中的各种难题，提升开发效率和项目稳定性。 ... [详细]

蜡笔小新 2024-10-26 18:50:09
stream
无法为视频流0（H.264编码）确定编解码参数

Couldnotfindcodecparametersforstream0(Video:h264,none)这个方法没成功：在使用ffmpeg进行拉流分离音视频数据 ... [详细]

蜡笔小新 2024-10-23 09:59:16

墨尔本晴上残留的余温丶_856

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章