音视频技术开发周刊 74期

640?wx_fmt=jpeg

『音视频技术开发周刊』由LiveVideoStack团队出品，专注在音视频技术领域，纵览相关技术领域的干货和新闻投稿，每周一期。点击『阅读原文』，浏览第74期内容，祝您阅读愉快。

架构

VMAF：未毕之旅

本文来自Netflix的科技博客，阐述了VMAF的最新应用进展，以及VMAF正在做的改进工作。感谢邓斌的翻译，及快手相关同学的技术审校。

“ GPU视频处理技术调研报告 ”

本文来自英伟达高级工程师季光在LiveVideoStack 线上交流分享，并由LiveVideoStack整理而成。分享中季光详细解析了GPU在视频编解码，图像分析和视频处理方面的相关技术支持，及实际性能评测数据。可以说是一份详细的“GPU视频处理技术调研报告”。

HTTP over QUIC重命名为“HTTP / 3”协议

HTTP工作组暨QUIC工作组主席Mark Nottingham 建议将HTTP-over-QUIC（HTTP/QUIC）重命名为“HTTP/3”，以解决种种混淆。并在上周举行的IETF 103的QUIC工作组会议中提议通过。这标志着新HTTP版本将使用QUIC进行传输。

开源视频播放框架学习——AndroidVideoCache

本框架的思想就是在本地构建一个ServerSocket作为代理服务器，将对MP4地址进行封装，从而拦截到本地ServerSocket，拦截之后解析出url和请求头进行真正的网络请求。而视频播放控件例如MediaPlay、VideoView就相当于客户端了，最后将真正的网络请求通过Socket的方式写入到客户端，这样视频控件就可以播放了。

蚂蚁实时视频通话技术和实践

从电影、电视到电脑、手机，人们获取视频信息的方式越来越方便、快捷。时下较热门的视频通话、互动直播时长占据了当下年轻人很大一部分的生活时间，可见实时视频技术在生活中的重要性。今天，蚂蚁金服高级技术专家樟松将为我们揭秘“蚂蚁实时视频通话系统”的技术架构及特点，讲述实时视频通话的底层技术以及其运用。

音频/视频技术

音视频技术：视频质量评价方法简介

视频质量评估（VQA）一直是个很活跃的研究领域，原因其一是业内一直缺少一种统一且准确的评估标准，其二是影响视频质量的因素过多，且包含很多主观因素，难以客观、定量地评价。经过这么多年的研究，已经诞生了非常多的视频质量评估方法，本文将简单地对它们进行分类及介绍。

MP4大文件虚拟HLS分片技术，避免服务器大量文件碎片

本文主要介绍了通过虚拟分片技术，把MP4文件，映射为HLS协议中的一个个小的TS分片文件，实现了在不实际切分MP4文件的情况下，通过HLS协议播放MP4文件，从而避免了对MP4进行点播...

WebRTC基础实践 - 通过RTCPeerConnection传输流媒体视频

在WebRTC规范中, RTCPeerConnection用于视频流/音频流、以及数据的传输。文中的示例程序, 将会在一个页面上, 通过两个 RTCPeerConnection 对象建立一个连接通道。

Android Camera模块解析之视频录制

本文主要讲解如何利用Camera 2 实现录制视频的功能。拍照和录制视频的前期功能都是类似的，在拍照之前会有Camera Preview功能，录制视频之前也是有这个功能的，唯一的不同就是抓取的数据不同，拍照抓取的是Image，视频抓取的Video，数据组织格式不一样。

编解码

编解码器之战：AV1、HEVC、VP9和VVC

视频Codec专家Jan Ozer在Streaming Media West上主持了一场开放论坛，邀请百余名观众参与热门Codec的各项优势与短板。本文整理了讨论的主要成果，基本代表了AV1、HEVC、VP9和VVC主流的观点。LiveVideoStack对原文进行了摘译。

Netty学习之路（七）-编解码技术

当进行远程跨进程服务调用时，需要把被传输的Java对象编码为字节数组或者ByteBuffer对象。而当远程服务读取到ByteBuffer对象或者字节数组时，需要将其解码为发送时的Java对象。

JPEG-XS：用于IP视频的母片图像（mezzanine image）编解码器

本帖参考T. Richter等人发表在SMPTE Motion Imaging Journal的文章JPEG-XS—A High-Quality Mezzanine Image Codec for Video Over IP。超高清（UHD）内容的生产，需要更多的带宽用来传输和交换数据；基于IP协议栈的基础架构则更多的灵活性。在生产工作流程中的母片压缩技术可以减少必要的数据传输容量，甚至可以使用旧的、支持HD的基础架构。

TICO : UHD生产系统中的Mezzanine Codec

本帖参考M. Miyazaki等人发表在SMPTE Motion Imaging Journal的文章UHDTV-2 Mezzanine Compression Codec For Miniaturized and Simplified UHD Production System，重点介绍了我们在生产应用中硬件压缩的发展。

采集音频和摄像头视频并实时H264编码及AAC编码

本文所使用的技术，适用于实时性的应用，通过处理采集出来的音视频的每一帧，实现实时编码，实时输出。在直播应用中输入端采用DirectShow技术捕获音视频，然后对视频进行h.264编码，对音频进行aac编码，输出端则是生成文件，接下来还要进一步扩展输入端和输出端，以支持文件、桌面输入，RTSP、RTMP、HTTP等流式协议输出。

AI智能

「史上最强GAN图像生成器」BigGAN的demo出了！

BigGAN 一经提出即引起了大量关注，被称为「史上最强 GAN 图像生成器」。今日，DeepMind 放出了 BigGAN 的拿来即用 TF Hub demo，可以在 Colab 上运行图像生成和图像插值任务。

自动编程DNN加速器！只需3步，云端终端通用

美国伊利诺伊大学、IBM中国研究院等的最新研究，提出一种基于FPGA的DNN推理加速器DNNBuilder，获得电子设计自动化领域学术顶会ICCAD的最佳论文。实验证明，DNNBuilder生成的加速器拥有现时最先进的性能和效率，超越了同类加速器。本文带来论文作者的详细解读。

图像分割技术介绍

图像分割（image segmentation）技术是计算机视觉领域的一个重要的研究方向，是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程，从数学角度来看，图像分割是将图像划分成互不相交的区域的过程。

224秒训练ImageNet！这次创纪录的是索尼大法

深度神经网络训练速度越来越快已经不是新鲜事，但是，将ImageNet训练时间降低到200秒级别仍然让人震撼！近日，索尼发布新的方法，在ImageNet数据集上，使用多达2176个GPU，在224秒内成功训练了ResNet-50，刷新了纪录。

图像

Android-图片的压缩(质量压缩和尺寸压缩)

图片的尺寸压缩是指：按照一定的倍数对图片减少单位尺寸的像素值，可以改变图片在内存中的大小，不改变图片在磁盘中的大小。

一种JNI方法实现图片压缩，压缩率极高

本片文章介绍了一种JNI方法实现的图片压缩方式，其压缩率极高。直接使用项目或直接复制libs中的so库到项目中即可（当前只构建了armeabi），需要其他ABI可检下项目另外使用CMake构建即可。

音视频技术开发周刊 74期

猜你喜欢