Redes Convolucionais para Segmentação Semântica de Nuvens de Pontos Combinando Recursos Locais e Globais

Autores: Song Xiurong, Quan Xuezhen, Zhang Jie, Zhao Chuang

Fonte: Informações Geoespaciais

Editor: Zheng Xinxin @一点Inteligência Artificial

Original: Redes Convolucionais para Segmentação Semântica de Nuvens de Pontos Combinando Recursos Locais e Globais

00 resumo

A segmentação semântica da nuvem de pontos desempenha um papel importante em muitas aplicações relacionadas à nuvem de pontos, especialmente para nuvens de pontos laser aerotransportadas, onde a anotação precisa pode expandir enormemente sua utilidade em diversas aplicações. No entanto, a segmentação semântica precisa e eficiente ainda é uma tarefa desafiadora, limitada pelo ruído do sensor, estruturas complexas de objetos, pontos incompletos e densidade irregular de pontos. Portanto, é proposta uma rede de segmentação semântica de nuvem de pontos laser aerotransportada combinando características locais e globais.

Primeiro, a nuvem de pontos é dividida em pontos terrestres e pontos não terrestres usando o algoritmo de filtragem de densificação de rede irregular de triangulação progressiva aprimorada e, em seguida, os recursos locais e globais são extraídos para os pontos não terrestres e, em seguida, os recursos locais e globais recursos são agregados para obter o resultado da rotulagem de pontos e, finalmente, otimizar o rótulo semântico com base no modelo de otimização de gráfico.

Para avaliar o desempenho do método, um experimento de teste é realizado em um conjunto de dados de nuvens de pontos de laser aerotransportados em grande escala. Os resultados mostram que o método proposto pode melhorar a precisão geral para 97,4% no conjunto de dados de benchmark DALES, classificando 8 classes semânticas com um mIoU de 78,2%. Este método atinge maior precisão de segmentação do que outros métodos de última geração.

01 Introdução

Como uma das tecnologias mais importantes para coleta de dados no sistema de observação da Terra, o sistema de varredura a laser 3D tem a vantagem de obter rapidamente informações terrestres de grande escala e alta precisão, e é amplamente utilizado em diversos produtos de informação geográfica (planejamento urbano, monitoramento ambiental e detecção de linhas de energia, etc.) desempenham um papel cada vez mais importante na produção. Ao escanear a cidade com um sistema de varredura a laser 3D aerotransportado, uma nuvem de pontos de laser 3D em grande escala com coordenadas e propriedades geométricas (como intensidade) pode ser obtida diretamente. A extração de vários tipos de informações geográficas de nuvens de pontos requer primeiro a segmentação semântica das nuvens de pontos.

No entanto, a segmentação semântica precisa e eficiente da nuvem de pontos ainda é uma tarefa desafiadora devido ao ruído do sensor, estrutura complexa do objeto, pontos incompletos e densidade irregular de pontos.

Os primeiros problemas de classificação de nuvens de pontos de laser aerotransportados foram resolvidos principalmente por métodos de aprendizado de máquina. Normalmente, a tarefa de classificação da nuvem de pontos é extrair recursos de pontos representativos local e globalmente e, em seguida, usar a representação de recursos aprendida para classificar cada ponto em uma categoria semântica predefinida. Esses métodos primeiro calculam características geométricas e, em seguida, usam classificadores específicos para distinguir ao máximo vários recursos semânticos, de modo a alcançar a segmentação semântica ponto a ponto; no entanto, a nuvem de pontos original tem recursos limitados de cálculo de recursos e depende muito de informações ou regras anteriores específicas. As características locais de cada ponto são estimadas independentemente e as previsões dos rótulos são geradas, sem considerar a consistência dos rótulos entre os pontos vizinhos, de modo que os resultados da segmentação semântica são vulneráveis ​​a ruídos e inconsistências de rótulos.

Alguns estudos tentaram integrar informações contextuais por meio de modelos de otimização, como campo aleatório de Markov e campo aleatório condicional, e melhorar a suavidade do rótulo para melhorar o desempenho; mas esses métodos de classificação de nuvem de pontos baseados em aprendizado de máquina usam de forma abrangente recursos artesanais para representar a nuvem de pontos de entrada. Cada ponto de, eles têm generalização limitada quando aplicados a cenários in-the-wild em grande escala.

Nos últimos anos, os métodos de aprendizagem profunda alcançaram um sucesso notável em aplicações como classificação de cenas, detecção de objetos, detecção de alterações e classificação de imagens hiperespectrais.

Seguindo essa tendência, os pesquisadores têm voltado sua atenção para a amostragem de alguns modelos de aprendizagem profunda para resolver o problema de segmentação semântica de nuvens de pontos 3D. Por exemplo, para explorar o poder das redes neurais convolucionais (CNNs), alguns métodos projetam nuvens de pontos brutos em imagens 2D e, em seguida, usam CNNs tradicionais para classificação de nuvens de pontos integradas, muitas vezes exigindo recursos artesanais para aumentar os recursos 2D. o desempenho da classificação é limitado devido à perda de informações durante a conversão de 3D para 2D. O método de voxelização de nuvens de pontos desordenadas em grades 3D regulares é um método alternativo para processar nuvens de pontos para se adaptar a redes neurais profundas.Por exemplo, Schmohl S primeiro voxeliza nuvens de pontos ALS e depois as coloca em uma rede de convolução esparsa subvariedade para processamento. Porém, a voxelização inevitavelmente leva à perda de informações e gera artefatos, o que afeta negativamente o aprendizado de recursos 3D. Além disso, um grande número de malhas desocupadas armazenadas na estrutura voxel levará a altos requisitos de memória.

Alguns pesquisadores também tentam aplicar o operador de convolução diretamente na nuvem de pontos original e usar a rede neural profunda para aprender recursos avançados de pontos, como Yousefhussien M et al. propuseram uma rede totalmente convolucional, que inserirá as coordenadas originais do ponto nuvem e da mesma As três características espectrais adicionais extraídas da imagem georreferenciada do local são usadas como entrada para classificação pontual; WANG S et al. desenvolveram uma rede neural profunda multiescala para obter um aprendizado de características mais poderoso e melhorar ainda mais desempenho de classificação de nuvem de pontos. Esses métodos primeiro utilizam uma rede MLP compartilhada para extrair recursos por ponto; em seguida, utilizam um bloco de downsampling para agregar recursos por ponto em recursos baseados em cluster; e, finalmente, utilizam outra rede MLP seguida por um classificador Softmax para classificação pontual. WEN C et al. propuseram um operador de convolução com direção restrita para extração de características de ponto e projetaram uma rede convolucional completa multiescala para classificação de nuvem de pontos; Arief HA et al. desenvolveram o módulo Atrous XCRF para aprimorar o modelo PointCNN original e desenvolve benefícios desempenho na classificação de nuvens de pontos LiDAR aerotransportadas.

No campo da silvicultura, WANG YJ e outros propuseram um método de segmentação semântica de nuvem de pontos 3D baseado na pesquisa KNN, que melhorou as deficiências dos métodos existentes na extração de características de nuvem de pontos locais e melhorou efetivamente a precisão da segmentação semântica. Embora esses métodos baseados em nuvens de pontos obtenham excelentes resultados na classificação de nuvens de pontos a laser aerotransportadas, eles não podem identificar adequadamente estruturas locais refinadas devido à distribuição desigual de densidade dos dados de nuvens de pontos. Para resolver este problema, LI X e outros usam convolução com reconhecimento de densidade para alimentar a densidade inversa de cada ponto para outra rede MLP para aprimoramento adicional e usam o regularizador do módulo de codificação de contexto para regularizar o contexto semântico global.

Considerando as informações topológicas inerentes às nuvens de pontos, os pesquisadores nos últimos dois anos usaram redes neurais convolucionais de grafos para classificação não ordenada de nuvens de pontos 3D. O modelo gráfico pode representar naturalmente a cena 3D e, em seguida, os dados estruturados em gráfico são incorporados à rede recém-projetada. Liang Zhenming et al. propuseram uma rede convolucional de gráfico dinâmico multiescala. Primeiro, os pontos representativos do conjunto de dados de nuvem de pontos 3D foram amostrados usando o método de amostragem de ponto mais distante para reduzir a complexidade computacional do modelo; Os K-nós vizinhos mais próximos de cada nó central na figura é posicionado; finalmente, os recursos de atributos locais do nó central e seus nós adjacentes são extraídos e agregados pela operação de convolução de borda para realizar a classificação da nuvem de pontos.

A fim de levar em conta a relação contextual global entre os pontos, WEN C et al.propõem uma rede neural convolucional de atenção de gráfico local global para classificação de nuvens de pontos de laser aerotransportados. A rede combina módulos de atenção local de atenção marginal e atenção de densidade, e um módulo de atenção global. O módulo de atenção de borda local aprende dinamicamente os pesos de convolução de acordo com a relação de posição espacial dos pontos adjacentes, e o campo receptivo do núcleo de convolução pode se adaptar dinamicamente à estrutura da nuvem de pontos; o módulo de atenção de densidade local resolve a distribuição desigual de densidade de não - pergunta sobre dados de nuvem de pontos com amostragem uniforme.

Para melhor obter as informações de contexto global da nuvem de pontos, o módulo de atenção global é implementado calculando a distância euclidiana entre cada dois pontos, e a rede MLP é utilizada para aprender seus pesos de atenção. Recentemente, o mecanismo de atenção tornou-se cada vez mais popular porque fornece pontuações de parâmetros de importância, o que pode ajudar a melhorar as características discriminativas e suprimir o ruído. HUANG R et al. estudaram a importância das relações espaciais de longo alcance e das relações de canal. Primeiro, eles usaram módulos de convolução de atenção de diferença espacial local para aprender descrições geométricas locais e dependências locais, e depois estudaram módulos de atenção com reconhecimento de relacionamento espacial e relacionamento de canal. módulos de atenção consciente. O módulo de atenção consciente de relação global composto compreende ainda mais as relações espaciais globais e de direção de canal entre os dois.

02 Métodos de Pesquisa

O método neste artigo consiste principalmente em quatro módulos (Figura 1): ①Extração de ponto terrestre , a nuvem de pontos é dividida em pontos terrestres e pontos não terrestres através da triangulação progressiva aprimorada e algoritmo de filtro de densificação de rede irregular; ②Extração de recursos locais ; ③Recurso Global extração ; ④ Refinamento do rótulo . Um algoritmo de otimização da estrutura gráfica é implementado para obter suavização espacial dos resultados iniciais da rotulagem semântica, construindo gráficos indiretos ponderados e resolvendo problemas de otimização usando cortes de gráficos.

Figura 1 Diagrama esquemático da estrutura de segmentação semântica da nuvem de pontos laser aerotransportada neste artigo

2.1 Extração de ponto de aterramento

Devido ao método de varredura e à alta taxa de repetição do pulso de laser do sistema lidar aerotransportado, os pontos terrestres ocupam uma grande parte da cena geral. Um grande número de pontos terrestres não apenas expande a área de busca para extração de objetos não terrestres, mas também aumenta a complexidade do espaço e reduz a velocidade de processamento. Portanto, distinguir pontos terrestres de pontos não terrestres é uma etapa preliminar, mas crucial, no processamento de dados brutos. A fim de reduzir a quantidade de dados a serem processados ​​​​e considerar as flutuações do terreno em cenas grandes, este artigo adota um algoritmo aprimorado de filtragem densa de triangulação irregular progressiva. O algoritmo pode remover de forma rápida e eficiente cenas de nuvens de pontos terrestres de vários pontos, especialmente de áreas com estruturas complexas. O efeito de separação dos pontos-alvo terrestres e terrestres é mostrado na Fig.

Figura 2 Resultados de filtragem terrestre da nuvem de pontos de laser aerotransportada

2.2 Extração de características pontuais com base na área local

PointNet e seus algoritmos derivados são difíceis para a classificação eficiente de nuvens de pontos aéreos em grande escala em cenas urbanas complexas. Para o treinamento e inferência de uma rede, o processo de divisão e amostragem é inevitável. Porém, podem ocorrer artefatos neste processo, onde pequenos objetos são cortados em pequenos pedaços, mas o processo não fornece informações suficientes para identificar os pequenos pedaços.

A fim de melhorar a capacidade da rede de processar objetos de diferentes escalas, este artigo aprimora a capacidade do PointNet++ de processar dados 3D complexos por meio de um método hierárquico de aprimoramento de dados. A estratégia de amostragem hierárquica fornece uma solução de compromisso para integridade do objeto e detalhes refinados, ou seja, primeiro na fase de treinamento, três rodadas de subdivisão são repetidas para toda a nuvem de pontos usada para treinamento, e a escala de cada subdivisão é repetida. o conjunto de pontos é diferente. O conjunto de pontos é apresentado com um número fixo de pontos, ou seja, cada rodada de subdivisão usará uma escala diferente para restringir o tamanho do conjunto de subpontos, a fim de subdividir a nuvem de pontos em não- conjuntos de subpontos sobrepostos com um número predefinido e fixo de pontos. Após 3 rodadas de subdivisão, a cena inteira é apresentada em conjuntos de subpontos de diferentes escalas e, após a etapa de redução da amostragem, todos os conjuntos de subpontos são alimentados em a rede para garantir que a entrada seja fornecida de maneira consistente, o que pode fazer com que a rede treinada na faixa de processamento Ela tenha uma capacidade de generalização mais forte quando tiver uma ampla gama de objetos; e então execute o mesmo processamento de subdivisão e redução da resolução no nuvem de pontos usada para teste. A diferença entre o processo de treinamento e teste é que os conjuntos de pontos de subdivisão de diferentes escalas não são inseridos na rede juntos. Insira subpontos em cada escala para obter recursos profundos e, em seguida, interpolar pontos na nuvem de pontos original que não estão incluídos na entrada da rede para obter vetores de características profundas, de modo que todos os pontos subdivididos de diferentes escalas podem receber uma subdivisão contendo diferentes níveis O vetor de características de profundidade de informações de contexto; finalmente, as características de profundidade de diferentes escalas podem ser concatenadas para formar um vetor de recursos de profundidade multiescala.

2.3 Incorporação de informações globais

Como cada camada convolucional tem apenas um campo receptivo local, e os recursos pontuais não podem codificar informações fora da área local e do relacionamento entre objetos, os recursos pontuais representam apenas a geometria local, o que não é suficiente para explorar a estrutura interna e os objetos de objetos grandes. interação entre eles. A falta de contexto global limita o desempenho de redes de previsão pontuais para cenas externas em nuvens de pontos ALS. Para um melhor desempenho, a partir de uma perspectiva global, as dependências espaciais ao nível do objecto devem ser exploradas e combinadas com características geométricas locais. Inspirado em gráficos de superpontos, este artigo constrói gráficos em segmentos compostos por pontos geometricamente homogêneos para capturar as relações entre objetos. Ao combinar recursos segmentais e recursos pontuais, a rede codifica de forma adaptativa recursos locais-globais para obter melhor previsão semântica no conjunto de dados ALS.

Primeiro, a nuvem de pontos é segmentada em blocos com base em características geométricas e intensidades predefinidas por um algoritmo não supervisionado antes do treinamento. Ao contrário das redes neurais que agrupam pontos dinamicamente durante o treinamento com base em recursos atualizados, esta rede adota uma estrutura gráfica fixa e todos os rótulos dos segmentos são herdados da segmentação inicial. Esta estrutura fixa é mais eficiente computacionalmente, pois não procura vizinhos KNN no espaço de características de alta dimensão para cada iteração de treinamento. Em seguida, os recursos pontuais obtidos são agregados em recursos de nós de acordo com os rótulos dos segmentos  M \in R^{N_s \vezes C_3} , onde N_sé o número de segmentos na cena. Dentro de um pedaço de nuvem de pontos, os recursos do nó são calculados como a média dos recursos do ponto em todos os pedaços. Para cada nó \{s_{ij}|  j<(N_s-1)\} , construa um gráfico com todos os outros nós da cena. siOs recursos do nó central são m_i\em R^{C_3}denotados por, S_{ij}os recursos do nó central são m_i\em R^{C_3}denotados por e os recursos de borda são e_{ij}=m_i-m_{ij}denotados por. As informações contextuais entre diferentes segmentos são capturadas por convolução condicionada por bordas e normalizadas por softmax para obter um mapa de atenção global \mathcal{W} \em R^{N}. Finalmente, inspirado no PointNet++, um codificador-decodificador é desenvolvido de ponta a ponta com base no módulo convolucional mencionado acima que funde recursos locais e globais e alimenta a geometria de recurso multinível contendo o mesmo número que o original ponto definido em uma convolução 1×1 para obter rótulos semânticos para cada ponto.

2.4 Otimização Global de Gráficos

Os resultados da classificação carecem de consistência e é necessário considerar mais informações contextuais para otimizar os resultados. Neste artigo, a solução para a configuração ótima do rótulo de classificação para nuvens de pontos é formalizada como a probabilidade máxima a posteriori de campos aleatórios de Markov (MRFs).

O problema de estimativa de taxa é expresso como a minimização de uma função de energia, a saber:

Entre eles, E_{data}(L)está o item de dados de primeira ordem, que é usado para medir a diferença entre o rótulo e os dados originais; E_{suave}(L)está o item de suavização de segunda ordem, que descreve principalmente a inconsistência do rótulo na vizinhança local com base no local informação de contexto; \lambdaé o item de energia de primeira ordem e o fator de peso de energia de segunda ordem entre os itens.

Os métodos existentes não podem usar diretamente um modelo matemático específico para expressar e otimizar o problema do modelo MRF, então o problema de distribuição de probabilidade é transformado em uma função de energia, e a solução ótima para classificação de nuvem de pontos é obtida minimizando a função de energia. A maioria dos métodos, como modelo condicional iterativo e recozimento simulado, alcançaram resultados muito bons em termos de qualidade da solução, mas para nuvens de pontos em grande escala, usar um valor maior ainda trará uma enorme carga computacional, então este artigo usa o algoritmo de corte de gráfico Kpara analisar A função energia é minimizada. O método modifica os rótulos em cada iteração, reduzindo o número de iterações para uma computação eficiente e com otimização de energia.

O cálculo da função energia inclui principalmente termos de primeira e segunda ordem. A função de energia de primeira ordem mede principalmente a inconsistência entre o valor previsto e o valor verdadeiro. Neste artigo, a função energia é representada pela estimativa de probabilidade posterior das características localmente ótimas, a saber:

Calcule o peso das arestas adjacentes de acordo com a relação de adjacência e, em seguida, calcule a função de energia de segunda ordem, a fórmula de cálculo é:

A fim de escolher o ideal \lambda, ou seja, coeficientes que equilibram os itens de dados e suavizam os dados, este artigo analisa o impacto \lambdano desempenho de rotulagem do conjunto de dados A. Será \lambdadefinido como 0,5, 0,75, 1,0, 1,25, 1,5, 1,75 e 2, respectivamente. Através de vários testes, os resultados iniciais da rotulagem \lambdamelhorarão com a mudança de . Quando \lambda= 1,5, a precisão da classificação atingirá seu pico. Maior \lambdasignifica impor mais custos ao número de classes usadas, mas pode levar à suavização excessiva dos resultados da nuvem de pontos rotulados; enquanto menor significa \lambdamenos penalidade ao número de classes usadas na região, levando à correção ineficaz do número de rótulos errados para is. alto;  \lambdadefini-lo como 1,5 atinge um equilíbrio e alcança a mais alta precisão de classificação para resultados promissores com rótulos finos. Os rótulos iniciais \alfa-expansãosão ajustados algoritmicamente, principalmente pela fusão da categoria errada na maioria das categorias vizinhas, reduzindo assim as inconsistências de classificação local.

03 Resultados experimentais e análises

3.1 Dados experimentais e indicadores de avaliação

Este artigo avalia o desempenho do nosso método no conjunto de dados Dayton Annotated LiDAR Earth Scan (DALES). O conjunto de dados DALES é um conjunto de dados de referência ALS com mais de 500 milhões de pontos rotulados manualmente abrangendo uma área de 10 km2; é o conjunto de dados ALS mais extenso disponível publicamente com mais pontos do que qualquer outro conjunto de dados de nuvem de pontos aéreos anotados atualmente disponível Mais de 400 vezes, a resolução é 6 vezes maior que a de outros conjuntos de dados e a densidade média de pontos é de cerca de 50 pontos/m2. No conjunto de dados, são considerados 8 tipos de objetos, incluindo solo, vegetação, carros, caminhões, linhas de energia, postes, cercas e edifícios, e um total de 40 fatias são incluídas, 29 das quais são usadas para treinamento e 11 para teste. Cada bloco cobre uma área de 0,5 km2 e contém aproximadamente 10 milhões de pontos. O conjunto de dados DALES fornece um grande número de pontos rotulados manualmente e validados por especialistas para avaliar novos algoritmos de aprendizagem profunda 3D, ajudando a estender o foco dos algoritmos atuais para dados aéreos. Neste artigo, três indicadores, interseção (IoU), precisão geral (OA) e IoU médio (mIoU), são usados ​​para avaliar o desempenho deste método. IoU é usado para avaliar o desempenho de classificação de cada categoria, e OA e mIoU são usados ​​para avaliar o desempenho do método em todos os dados de teste.

3.2 Configurações experimentais

O ambiente de hardware experimental são duas Nvidia RTX 1080Ti com 16 GB de RAM. O ambiente de software adota CUDA10.2 + CUDNN7.6.5 + Python3.6 + Anaconda3.6 + Pytorch1.0 no ubuntu16.04. O conjunto de dados DALES é um conjunto de dados relativamente grande, então este artigo o divide e todos os dados são subdivididos em subblocos de 20m × 20m sem sobreposição. Para atender aos requisitos de entrada da rede, os pontos de cada subbloco são reamostrados em um conjunto de pontos de tamanho 8192. O tamanho do lote durante o treinamento é 1.000, o tamanho do lote é definido como 8, a taxa de aprendizado inicial do modelo é 0,02, a taxa de declínio do aprendizado é 0,9 e o número de iterações de treinamento é 500.

3.3 Resultados experimentais

Os resultados da segmentação semântica de parte da nuvem de pontos do conjunto de dados DALES são mostrados na Figura 3, onde a Figura 3a é a visualização da nuvem de pontos original, colorida pela elevação de cada ponto; a Figura 3b é o resultado da segmentação semântica, diferentes categorias são pontilhados com cores diferentes, pode-se ver que nosso método tem bom desempenho na segmentação semântica de nuvem de pontos aéreos urbanos em grande escala, mas ainda existem alguns casos de erros de reconhecimento de instalações rodoviárias, a maioria dos quais são causados ​​​​por subsegmentação de complexos cenas e objetos incompletos.

Figura 3 Um exemplo de resultados de segmentação semântica com base no conjunto de dados DALES

Os resultados da classificação de KPConv, PointNet++, SPG, ShellNet, Po-intCNN e o método deste artigo são mostrados na Tabela 1. Pode-se observar que a arquitetura KPConv tem o maior OA e mIoU no conjunto de dados DALES, e tem um forte desempenho. O método deste artigo também obteve resultados de classificação satisfatórios, ficando em segundo lugar, há dois lotes grandes com baixo contraste, que são classificados incorretamente, um dos motivos pode ser a escolha do tamanho do bloco. Embora nosso método tenda a aprender dependências de longo alcance de outros pontos globalmente, as conexões são limitadas a uma caixa delimitadora do tamanho de um bloco. Para conjuntos de dados de grande escala, tamanhos de blocos pequenos são suficientes para obter corretamente informações contextuais para objetos pequenos; mas para objetos grandes, tamanhos de blocos pequenos não são suficientes para fornecer informações contextuais importantes. Ao mesmo tempo, blocos grandes aumentam a memória e o tempo de execução. A arquitetura KPConv difere de outros métodos (exceto gráficos de superpontos) porque não depende da seleção de um número fixo de pontos em uma caixa delimitadora, provavelmente por isso que o KP-Conv tem melhor desempenho no conjunto de dados DALES.

Tabela 1 Comparação dos resultados da classificação com base no conjunto de dados DALES e diferentes métodos de linha de base/%
Nota: Os valores mais altos em OA, mIoU e IoU para cada categoria estão marcados em negrito.

3.4 Experimento de ablação

A fim de avaliar a eficácia de cada módulo deste método, este artigo projeta um experimento de ablação para comparar 5 modelos: ① modelo sem recursos globais e locais (sem global, sem local); ② com módulo de recurso global, mas sem Modelos com módulos de recursos locais (com global, sem local); ③ Modelos sem módulos de recursos globais, mas com módulos de recursos locais (sem global, com local); ④ Combinando módulos de recursos globais e locais, mas sem pós-end -modelo otimizado (w global, w local, sem lr);⑤ arquitetura completa (w global, w local, w lr). Os resultados da classificação dos cinco modelos são apresentados na Tabela 2, e verifica-se que cada módulo de atenção melhora até certo ponto o desempenho da classificação.

Tabela 2 Comparação de desempenho de modelos com módulos no conjunto de dados DALES Nota
: O texto em negrito indica o modelo de melhor desempenho.

Para verificar o impacto da extração de pontos terrestres nos resultados da segmentação semântica, outro experimento de ablação é projetado neste artigo, ou seja, cenas de nuvem de pontos com pontos terrestres separados e cenas de nuvem de pontos sem pontos terrestres separados são colocadas na rede de segmentação semântica. Os resultados experimentais são mostrados na Tabela 3. Não é difícil descobrir que a pré-extração de pontos básicos não apenas não reduz a precisão geral da segmentação semântica, mas melhora efetivamente a eficiência operacional geral do algoritmo.

Tabela 3 Influência da extração do ponto fundamental nos resultados da segmentação semântica

04 Epílogo

Neste artigo, propomos uma nova rede de segmentação semântica de nuvem de pontos de laser aerotransportada aplicada diretamente a nuvens de pontos 3D não estruturadas. A rede considera características estruturais locais e informações contextuais globais separadamente, e sua eficácia é verificada por um conjunto de experimentos comparativos. Nosso método pode aprender dinamicamente os pesos convolucionais de acordo com a estrutura local da nuvem de pontos, ao mesmo tempo que considera a distribuição de densidade desequilibrada da nuvem de pontos e a relação espacial entre todos os pontos. O método neste artigo é comparado com outros modelos de última geração no conjunto de dados DALES, e os resultados mostram que o modelo proposto supera os modelos de classificação de nuvem de pontos mais populares e atinge desempenho de última geração em termos de OA e mIoU.

1.  Nove algoritmos de fusão de sensores na direção autônoma

2.  Um artigo ensina como usar a reconstrução 3D de sistemas de código aberto conhecidos

3.  Recomendação de livro - "Modelagem Geométrica Baseada em Imagens e Geração de Malha"

4.  Recomendação de livro - “Aplicação da tecnologia SLAM em robôs móveis em terrenos complexos”

5.  Recomendação de livro - "Análise de nuvem de pontos 3D: métodos tradicionais, de aprendizado profundo e de aprendizado de máquina interpretável"

Acho que você gosta

Origin blog.csdn.net/weixin_40359938/article/details/130389039
Recomendado
Clasificación