Série obrigatória para arquitetos de IA: Aplicação de IA no transporte

Autor: Zen e a arte da programação de computadores

1. Introdução

1.1 O que é transporte?

Transporte de Tráfego é um projeto sistemático que utiliza diversos meios de transporte, como trens, automóveis, navios, aviões, etc., para transportar pessoas, mercadorias, equipamentos, etc. O transporte inclui gestão de tráfego, transporte rodoviário, serviços de passageiros, transporte de carga, etc., e é uma parte importante da vida social moderna.

1.2 Por que fazer aplicações de IA em transporte?

Actualmente, o transporte tem um enorme impacto no desenvolvimento económico e social. Com a expansão contínua da população urbana, as estradas urbanas e os meios de transporte estão cada vez mais lotados, fazendo com que a incidência de vários acidentes de trânsito e doenças de trânsito continue a aumentar. Além disso, com a implementação do planeamento de transportes urbanos e rurais da China, a escala das redes de transporte urbano aumentou gradualmente e a operação das redes de transporte tornou-se cada vez mais complexa.Ao mesmo tempo, alguns sistemas de "condução não tripulada" com um surgiu um maior grau de humanização e automação. Portanto, a fim de atender às necessidades de viagem do público em geral, promover a formulação de regras de trânsito internacionais e a transformação dos modos de viagem das pessoas, melhorar a qualidade de vida das pessoas, reduzir acidentes de trânsito, reduzir a poluição ambiental, etc., com base na inteligência artificial tecnologias como visão computacional, reconhecimento de padrões e aprendizagem por reforço. A aplicação de sistemas de inteligência artificial no transporte é uma direção importante no campo dos transportes.

1.3 Quais são as perspectivas de aplicação da IA ​​em transporte?

Com o desenvolvimento contínuo de tecnologias de aprendizado de máquina, aprendizado profundo e inteligência artificial, as aplicações de IA no transporte estão gradualmente se tornando uma direção dominante. Até agora, muitas equipes estão explorando e desenvolvendo sistemas de inteligência artificial de transporte adequados para diferentes cenários de transporte. Por exemplo, os primeiros investigadores propuseram sistemas de detecção, tomada de decisão e controlo de cenas de trânsito baseados em dados de sensores e dados de radar; mais tarde, os investigadores também voltaram a sua atenção para motores de inteligência artificial que funcionam em plataformas móveis para melhorar a eficiência e reduzir custos. Esses resultados inovadores de pesquisa em diferentes cenários trarão aos gestores de transporte uma experiência de viagem mais conveniente, econômica, segura, ecologicamente correta e humana.

2. Explicação de conceitos e termos básicos

2.1 Detecção de cena de trânsito

2.1.1 O que é detecção de cenas de trânsito?

A detecção de cenas de trânsito, também conhecida como monitoramento inteligente de cenas, rastreamento de pedestres, detecção de veículos, monitoramento de motocicletas, etc., é uma tecnologia de detecção e controle de tráfego baseada em visão computacional e tecnologia de processamento de imagens. Ele pode efetivamente ajudar o pessoal de operação e manutenção a descobrir, rastrear e identificar com rapidez e precisão todos os veículos e suas informações de status na área de trabalho, e realizar análises de comportamento de veículos e alertas de risco para obter controle de tráfego na área.

2.1.2 Principais características funcionais

  • Capacidade precisa de detecção de cena: Usando tecnologias como detecção de alvo, rastreamento multialvo e detecção de pedestres, a posição e postura de veículos e pedestres podem ser detectadas com precisão, permitindo o monitoramento panorâmico da cena, melhorando assim a eficiência geral.
  • Capacidades inteligentes de análise de movimento: Ao analisar vários dados, como trajetórias de movimento de veículos, características comportamentais, informações de alvo e informações ambientais regionais, a análise inteligente de movimento é realizada e o gerenciamento inteligente da operação do sistema é realizado.
  • Capacidade de apresentação visual: Use um método visual para exibir os resultados ao pessoal de operação e manutenção, fornecer feedback de efeito preciso e intuitivo e ajudar o pessoal de operação e manutenção a detectar anomalias rapidamente e fazer os ajustes correspondentes.
  • Capacidades de garantia de segurança de dados: Utilize transmissão criptografada, mecanismos de autenticação de identidade e outros meios para garantir a segurança dos dados e evitar vazamento ou adulteração de informações.

    2.1.3 Como usar

  • Implantação da plataforma: Primeiro, você precisa selecionar uma plataforma adequada, como um computador central, um servidor local, etc., depois instalar e configurar a plataforma e, finalmente, instalar software e hardware relevantes de acordo com as necessidades.
  • Treinamento de modelo: Use os dados de vídeo ou imagem de tráfego coletados para treinamento de modelo para obter um modelo que possa detectar com precisão cenas de tráfego, classificar e rastrear pedestres.
  • Integração do sistema: Integre o modelo treinado na plataforma de operação e manutenção para formar um sistema completo de gerenciamento e controle para que o pessoal de operação e manutenção compreenda prontamente as mudanças em veículos e pedestres e obtenha um controle de tráfego preciso.

    2.1.4 Vantagens e Desvantagens

    vantagem
  • Alta precisão da cena: Ao treinar uma grande quantidade de dados de cena, recursos de detecção precisos e em tempo real podem ser alcançados e o gerenciamento automatizado da operação pode ser realizado.
  • Ampla gama de aplicações: A detecção de cena pode auxiliar o pessoal de operação e manutenção no monitoramento de toda a estrada, posição do veículo, velocidade, condições de parada, distribuição de pedestres, etc., fornecendo soluções abrangentes de monitoramento da indústria.
    deficiência
  • Tamanho grande do modelo: Os métodos baseados em aprendizagem profunda requerem uma grande quantidade de dados e recursos computacionais, o que pode colocar alguma pressão no desempenho em cenas de tráfego em grande escala.
  • Alto consumo de recursos computacionais: Devido à necessidade de uma grande quantidade de cálculos, o desempenho da plataforma é limitado. Para aplicações de detecção de cena com recursos limitados, algumas dificuldades podem ser encontradas.
  • Atraso: Como o processo de detecção de cena é realizado em tempo real, o atraso é relativamente longo.Para o departamento de administração de transportes, o tempo real é muito importante.

    3. Explicação dos princípios básicos do algoritmo, etapas operacionais específicas e fórmulas matemáticas

    3.1 Solução usando método de matriz homográfica

    3.1.1 O que é o método da matriz homográfica?

    O método da matriz homográfica é um método de transformação geométrica proposto por Rodriguez e faz parte da transformação afim. Ele pode mapear pontos de uma imagem para outro plano e reter a posição relativa desses pontos neste sistema de coordenadas. Através desta transformação, a transformação da perspectiva da imagem alvo pode ser concluída, realizando assim o corte, rotação, dimensionamento, corte incorreto, etc. da imagem.

    3.1.2 O papel do método da matriz homográfica

    Como tecnologia central na tecnologia de reconhecimento de imagem, o método da matriz homográfica tem as seguintes funções:
  • Reconhecimento de área semelhante: Quando o objeto alvo aparece várias vezes na imagem, o método da matriz homográfica pode ser usado para determinar se é o mesmo objeto.
  • Costura de reconstrução de imagem: Duas imagens podem ser unidas de acordo com sua relação externa para obter uma imagem mais completa.
  • Modelagem 3D: Ao observar a transformação de pixels da imagem alvo, seus parâmetros locais do modelo 3D podem ser obtidos e, em seguida, o objeto pode ser modelado.
  • Correspondência de pontos-chave: Ao obter a matriz homográfica entre os pontos característicos da imagem, a correspondência entre os pontos-chave pode ser combinada.

    3.1.3 Método de solução da matriz homográfica

    O método para resolver a matriz homográfica é o seguinte:
  • Encontre os pontos característicos do contorno de acordo com o operador de detecção de contorno e encontre seus valores de coordenadas na imagem.
  • Encontre a reta correspondente ao seu espaço entre cada ponto, ou seja, a primeira reta.
  • Repita esse processo na segunda imagem para encontrar a segunda linha reta.
  • Combinando duas linhas retas, a matriz essencial pode ser encontrada.
  • Então, através do método do ponto externo, a matriz homográfica pode ser obtida.

    3.1.4 Representação matemática da matriz homográfica

    Matematicamente, a matriz homográfica pode ser representada pela seguinte representação linear ternária: $$\begin{bmatrix} \xi_u \ \xi_v \ \end{bmatrix}=H\cdot\begin{bmatrix} x_u \ y_u \ 1 \end{ bmatrix }$$ Entre elas, $x_u,\ y_u$ são as coordenadas originais da imagem, $\xi_u,\ \xi_v$ são as novas coordenadas da imagem; $H$ é a matriz homográfica, com $|H|=9$. A matriz homográfica pode ser decomposta em duas formas equivalentes:
  • Notação de ângulo oblíquo: $H=\frac{\begin{pmatrix}\alpha&\beta&t_x\-\gamma&\delta&t_y\0&0&1\end{pmatrix}}{|A_{11}|}$, onde $(\alpha, \ \beta,\ t_x)$ e $(\gamma,\ \delta,\ t_y)$ representam o ângulo de inclinação do eixo horizontal, o ângulo de inclinação do eixo vertical e o vetor de translação, respectivamente.
  • Notação de matriz de rotação: $H=R_{\theta}, R_{\theta}=\begin{pmatrix}\cos\theta&\sin\theta&0\\sin\theta&\cos\theta&0\0&0&1\end{pmatrix}$ , onde $\theta$ representa o ângulo de rotação, ou seja, o sistema de coordenadas após girar o ângulo $\theta$ no sentido anti-horário.

    3.1.5 Passos para resolver a matriz homográfica

    As etapas para resolver a matriz homográfica são as seguintes:
  • Extraia pontos característicos iniciais (pontos-chave) da imagem de entrada.
  • Projete os pontos de recurso iniciais no plano correspondente à imagem de saída.
  • Através do alongamento tridimensional, encontre uma linha reta da imagem de saída para ajustar os pontos característicos da imagem de saída.
  • Use esta linha reta para ajustar os pontos característicos da imagem de entrada e estabelecer uma rede interna.
  • Execute a interpolação bilinear na rede interna para obter a função de transformação correspondente.
  • Otimize esta função de transformação, encontre a melhor matriz de homografia e obtenha o resultado final da transformação.

    3.1.6 Vantagens e Desvantagens do Método Matriz Homográfica

    3.1.6.1 Vantagens
  • A operação é simples: apenas operações básicas de álgebra linear são usadas.
  • Pequeno erro: Como a transformação homográfica é usada para realizar a transformação da perspectiva da imagem, a precisão é alta.
  • Pequena quantidade de cálculo: Para processar uma imagem, a quantidade de cálculo é muito pequena.
    3.1.6.2 Desvantagens
  • Dificuldade em estimar a distorção: Embora a matriz homográfica seja um método eficaz de transformação de imagem, ela não pode avaliar o grau de distorção da imagem.
  • Os requisitos para a transformação são relativamente elevados: a imagem de entrada e a imagem de saída devem ter uma relação externa óbvia para obter resultados de transformação eficazes.
  • Velocidade de cálculo lenta: como os cálculos precisam ser realizados em um computador de alta velocidade, o algoritmo geralmente é executado lentamente.

    4. Exemplos e explicações de códigos específicos

    4.1 Use a função findHomography() no OpenCV para resolver a matriz de homografia

Suponha que temos duas imagens coloridas A e B e queremos transformar o quadro retangular vermelho em A no quadro retangular azul em B, podemos usar a função findHomography() para resolver a matriz homográfica H.

import cv2 as cv
import numpy as np

def get_homography(img_src, img_dst):
    # Find the key points and descriptors using SIFT algorithm
    sift = cv.SIFT_create()

    kp_src, des_src = sift.detectAndCompute(img_src, None)
    kp_dst, des_dst = sift.detectAndCompute(img_dst, None)

    # Define a rectangle for source image that we want to transform in destination image
    src_points = np.float32([[100, 100], [200, 100], [200, 200], [100, 200]])
    dst_points = np.float32([[100, 300], [200, 300], [200, 400], [100, 400]])

    # Calculate homography matrix
    H, mask = cv.findHomography(src_points, dst_points, method=cv.RANSAC, ransacReprojThreshold=5.0)

    return H

if __name__ == "__main__":
    # Read two images from file

    if img_src is None or img_dst is None:
        print("Image not found!")
        exit()

    # Get the homography matrix between the two images
    H = get_homography(img_src, img_dst)

    # Transform the source image into destination image based on the calculated homography matrix
    transformed_image = cv.warpPerspective(img_src, H, (img_dst.shape[1], img_dst.shape[0]))

    # Show original and transformed images side by side
    combined_image = np.hstack((img_src, transformed_image))

    cv.imshow("Original Image", img_src)
    cv.imshow("Transformed Image", transformed_image)
    cv.imshow("Combined Images", combined_image)

    cv.waitKey(0)
    cv.destroyAllWindows()

5. Tendências e desafios futuros do desenvolvimento

  • Planejamento e implementação de redes rodoviárias inteligentes: Com base na infraestrutura rodoviária atual e nas políticas, leis, regulamentos e requisitos padrão relacionados, combinados com a tendência de desenvolvimento da tecnologia de transporte emergente, combinada com a aplicação de inteligência artificial, big data, computação em nuvem e outras tecnologias científicas e tecnologias de inovação tecnológica, tentam melhorar o nível de inteligência das vias de transporte público. Por exemplo, a tecnologia blockchain é usada para construir um modelo de compartilhamento de dados da rede rodoviária para realizar o compartilhamento e verificação de informações da rede rodoviária e aumentar a credibilidade da rede rodoviária.
  • Gestão dinâmica da ordem do transporte público: A formação de serviços de transporte público como super metrô, T-BART, bicicletas compartilhadas e passagens subterrâneas permite que todos desfrutem da comodidade do transporte público sem restrições. No entanto, estes serviços têm frequentemente impactos negativos, tais como custos mais elevados e poluição ambiental. No futuro, como aproveitar plenamente as funções da inteligência artificial e gerenciar de forma inteligente a ordem do transporte público para melhorar a eficiência operacional geral da rede de transporte público, reduzir custos, reduzir a poluição ambiental e garantir a segurança do transporte público será uma questão inevitável. na melhoria da qualidade dos serviços de transporte público.
  • Transformação dos meios de transporte: À medida que o ritmo de vida das pessoas aumenta, o ritmo de vida se torna cada vez mais rápido e o estilo de vida se torna cada vez mais conveniente, nossos métodos de viagem estão se tornando cada vez mais diversificados, especialmente com a popularidade dos smartphones hoje, cada vez mais mais pessoas As pessoas não dependem mais das operadoras tradicionais, mas prestam mais atenção aos terminais móveis. Portanto, como utilizar métodos baseados em dados para impulsionar a atualização e a transformação do sistema de transporte é uma tarefa importante para melhorar a eficiência da gestão do tráfego e reduzir custos.
  • Previsão de riscos de transporte: A operação do sistema de transporte é inseparável de regras e processos complexos.Como prever e gerenciar possíveis problemas e riscos no sistema de transporte também é um aspecto importante da gestão de transporte. A aplicação da inteligência artificial nesta área está amadurecendo gradativamente e apresentando resultados cada vez melhores. Mas esta tecnologia ainda não está totalmente madura e ainda há muito trabalho a ser feito.

    6. Apêndice Perguntas e Respostas Frequentes

おすすめ

転載: blog.csdn.net/universsky2015/article/details/133446339