Sistema de comunicação semântica de vídeo escalável assistido por IA

【Resumo】A comunicação semântica, como um novo paradigma de comunicação orientado para a interação multiagente, fornece uma nova solução para a transmissão eficiente de comunicações futuras. Assim, é proposto um sistema de comunicação semântica de vídeo escalável assistido por IA. O sistema pode ser baseado em esquemas de codificação de separação de canal de origem existentes (como codificação de vídeo tradicional de alta eficiência HEVC e codificação de verificação de paridade de baixa densidade LDPC), combinado com codecs semânticos aprendíveis assistidos por IA, para obter streaming de vídeo e transmissão semântica comum. . O fluxo de dados semânticos aprendíveis são as informações semânticas extraídas de quadros de vídeo para tarefas específicas, o que pode melhorar melhor o desempenho de reconstrução precisa e tarefas posteriores na extremidade receptora. Experimentos provaram que, em comparação com a comunicação tradicional, esta estrutura de comunicação semântica de vídeo tem melhor desempenho de tarefa downstream com quase o mesmo desempenho de tarefa de reconstrução; e em comparação com o sistema de comunicação semântica baseado em aprendizagem profunda de ponta a ponta existente, o desempenho Ao mesmo tempo Ao mesmo tempo, ele pode ser projetado para ser expandido com base em uma variedade de padrões tradicionais de codificação e decodificação de vídeo, com acoplamento mais forte com esquemas de compressão tradicionais e capacidade de adaptação a mais cenários.

【Palavras-chave】Comunicação semântica; compressão de vídeo; aprendizagem profunda; comunicação sem fio

0 Prefácio 

No processo de desenvolvimento de sistemas de comunicação de 1G a 5G, diversas tecnologias de comunicação sem fio surgem indefinidamente, proporcionando um novo paradigma de comunicação para a interconexão de pessoas, máquinas e coisas. De acordo com o 48º relatório estatístico "Status de Desenvolvimento da Internet na China" divulgado pelo Centro de Informações da Rede de Internet da China (CNNIC), já em junho de 2021, o número de usuários de vídeo online em meu país atingiu 944 milhões, e a transmissão de alta- os vídeos em alta definição representam 10% do tráfego da Internet, mais de 80%[1]. Confrontado com o crescimento explosivo do tráfego global de dados móveis, não é difícil descobrir que os encargos de comunicação de dados e os estrangulamentos de atraso provêm principalmente da transmissão sem fios de servidores e terminais; além disso, com recursos de largura de banda limitados, a capacidade multidimensional e multicanal das pessoas necessidades de comunicação levam a dados Diversificação modal (voz, imagem, vídeo) requisitos de tarefas também são cada vez mais diversificados.A entrega de vídeo sem fio em cenários de aplicativos inteligentes 6G (como AR/VR) apresentou novos requisitos para eficiência computacional, consumo de energia e latência. . Portanto, como a próxima camada de transmissão da camada física em problemas de comunicação, a transmissão da camada semântica

Guess you like

Origin blog.csdn.net/qq_61890005/article/details/132401297