音视频技术开发周刊 74期

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/84279405

640?wx_fmt=jpeg


音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第74期内容,祝您阅读愉快。


架构


VMAF:未毕之旅

本文来自Netflix的科技博客,阐述了VMAF的最新应用进展,以及VMAF正在做的改进工作。感谢邓斌的翻译,及快手相关同学的技术审校。


“ GPU视频处理技术调研报告 ”

本文来自英伟达高级工程师 季光在LiveVideoStack 线上交流分享,并由LiveVideoStack整理而成。分享中季光详细解析了GPU在视频编解码,图像分析和视频处理方面的相关技术支持,及实际性能评测数据。可以说是一份详细的“GPU视频处理技术调研报告”。


HTTP over QUIC重命名为“HTTP / 3”协议

HTTP工作组暨QUIC工作组主席Mark Nottingham 建议将HTTP-over-QUIC(HTTP/QUIC)重命名为“HTTP/3”,以解决种种混淆。并在上周举行的IETF 103的QUIC工作组会议中提议通过。这标志着新HTTP版本将使用QUIC进行传输。


开源视频播放框架学习——AndroidVideoCache

本框架的思想就是在本地构建一个ServerSocket作为代理服务器,将对MP4地址进行封装,从而拦截到本地ServerSocket,拦截之后解析出url和请求头进行真正的网络请求。而视频播放控件例如MediaPlay、VideoView就相当于客户端了,最后将真正的网络请求通过Socket的方式写入到客户端,这样视频控件就可以播放了。


蚂蚁实时视频通话技术和实践

从电影、电视到电脑、手机,人们获取视频信息的方式越来越方便、快捷。时下较热门的视频通话、互动直播时长占据了当下年轻人很大一部分的生活时间,可见实时视频技术在生活中的重要性。今天,蚂蚁金服高级技术专家樟松将为我们揭秘“蚂蚁实时视频通话系统”的技术架构及特点,讲述实时视频通话的底层技术以及其运用。


音频/视频技术


音视频技术:视频质量评价方法简介

视频质量评估(VQA)一直是个很活跃的研究领域,原因其一是业内一直缺少一种统一且准确的评估标准,其二是影响视频质量的因素过多,且包含很多主观因素,难以客观、定量地评价。经过这么多年的研究,已经诞生了非常多的视频质量评估方法,本文将简单地对它们进行分类及介绍。


MP4大文件虚拟HLS分片技术,避免服务器大量文件碎片

本文主要介绍了通过虚拟分片技术,把MP4文件,映射为HLS协议中的一个个小的TS分片文件,实现了在不实际切分MP4文件的情况下,通过HLS协议播放MP4文件,从而避免了对MP4进行点播...


WebRTC基础实践 - 通过RTCPeerConnection传输流媒体视频

在WebRTC规范中, RTCPeerConnection用于视频流/音频流、以及数据的传输。文中的示例程序, 将会在一个页面上, 通过两个 RTCPeerConnection 对象建立一个连接通道。


Android Camera模块解析之视频录制

本文主要讲解如何利用Camera 2 实现录制视频的功能。拍照和录制视频的前期功能都是类似的,在拍照之前会有Camera Preview功能,录制视频之前也是有这个功能的,唯一的不同就是抓取的数据不同,拍照抓取的是Image,视频抓取的Video,数据组织格式不一样。


编解码


编解码器之战:AV1、HEVC、VP9和VVC

视频Codec专家Jan Ozer在Streaming Media West上主持了一场开放论坛,邀请百余名观众参与热门Codec的各项优势与短板。本文整理了讨论的主要成果,基本代表了AV1、HEVC、VP9和VVC主流的观点。LiveVideoStack对原文进行了摘译。


Netty学习之路(七)-编解码技术

当进行远程跨进程服务调用时,需要把被传输的Java对象编码为字节数组或者ByteBuffer对象。而当远程服务读取到ByteBuffer对象或者字节数组时,需要将其解码为发送时的Java对象。


JPEG-XS:用于IP视频的母片图像(mezzanine image)编解码器

本帖参考T. Richter等人发表在SMPTE Motion Imaging Journal的文章JPEG-XS—A High-Quality Mezzanine Image Codec for Video Over IP。超高清(UHD)内容的生产,需要更多的带宽用来传输和交换数据;基于IP协议栈的基础架构则更多的灵活性。在生产工作流程中的母片压缩技术可以减少必要的数据传输容量,甚至可以使用旧的、支持HD的基础架构。


TICO : UHD生产系统中的Mezzanine Codec

本帖参考M. Miyazaki等人发表在SMPTE Motion Imaging Journal的文章UHDTV-2 Mezzanine Compression Codec For Miniaturized and Simplified UHD Production System,重点介绍了我们在生产应用中硬件压缩的发展。


采集音频和摄像头视频并实时H264编码及AAC编码

本文所使用的技术,适用于实时性的应用,通过处理采集出来的音视频的每一帧,实现实时编码,实时输出。在直播应用中输入端采用DirectShow技术捕获音视频,然后对视频进行h.264编码,对音频进行aac编码,输出端则是生成文件,接下来还要进一步扩展输入端和输出端,以支持文件、桌面输入,RTSP、RTMP、HTTP等流式协议输出。

 

AI智能


「史上最强GAN图像生成器」BigGAN的demo出了!

BigGAN 一经提出即引起了大量关注,被称为「史上最强 GAN 图像生成器」。今日,DeepMind 放出了 BigGAN 的拿来即用 TF Hub demo,可以在 Colab 上运行图像生成和图像插值任务。


自动编程DNN加速器!只需3步,云端终端通用

美国伊利诺伊大学、IBM中国研究院等的最新研究,提出一种基于FPGA的DNN推理加速器DNNBuilder,获得电子设计自动化领域学术顶会ICCAD的最佳论文。实验证明,DNNBuilder生成的加速器拥有现时最先进的性能和效率,超越了同类加速器。本文带来论文作者的详细解读。


图像分割技术介绍

图像分割(image segmentation)技术是计算机视觉领域的一个重要的研究方向,是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程,从数学角度来看,图像分割是将图像划分成互不相交的区域的过程。


224秒训练ImageNet!这次创纪录的是索尼大法

深度神经网络训练速度越来越快已经不是新鲜事,但是,将ImageNet训练时间降低到200秒级别仍然让人震撼!近日,索尼发布新的方法,在ImageNet数据集上,使用多达2176个GPU,在224秒内成功训练了ResNet-50,刷新了纪录。


图像


Android-图片的压缩(质量压缩和尺寸压缩)

图片的尺寸压缩是指:按照一定的倍数对图片减少单位尺寸的像素值,可以改变图片在内存中的大小,不改变图片在磁盘中的大小。


一种JNI方法实现图片压缩,压缩率极高

本片文章介绍了一种JNI方法实现的图片压缩方式,其压缩率极高。直接使用项目或直接复制libs中的so库到项目中即可(当前只构建了armeabi),需要其他ABI可检下项目另外使用CMake构建即可。

猜你喜欢

转载自blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/84279405