2023 Huawei Cup Pós-Graduação Competição de Modelagem Matemática E Pergunta Análise de Ideia + Código + Papel

A seguir está uma análise das ideias para a Questão E da Competição de Modelagem Matemática de Pós-Graduação da Huawei Cup 2023, escrita pelo Sr. C. Veja o documento de código no final do artigo.

E-question idea diagnóstico clínico inteligente de acidente vascular cerebral hemorrágico e modelagem de tratamento

1. Introdução ao contexto

O AVC hemorrágico refere-se à hemorragia cerebral causada pela ruptura não traumática de vasos sanguíneos intraparenquimatosos, sendo responsável por 10-15% de todas as incidências de AVC. A causa da doença é complexa, geralmente devido a fatores como ruptura de aneurisma cerebral e artérias cerebrais anormais, que fazem com que o sangue flua para o tecido cerebral a partir dos vasos sanguíneos rompidos, causando danos mecânicos ao cérebro e desencadeando uma série de problemas fisiológicos complexos. e reações patológicas. O AVC hemorrágico tem início agudo, progressão rápida e mau prognóstico. A taxa de mortalidade no período agudo chega a 45-50%. Cerca de 80% dos pacientes terão disfunção neurológica grave, o que traz pesadas consequências para a saúde da sociedade e do família do paciente e encargos financeiros. Portanto, é de grande importância clínica explorar o risco de acidente vascular cerebral hemorrágico, integrar características de imagem, informações clínicas do paciente e diagnóstico clínico e planos de tratamento, prever com precisão o prognóstico do paciente e otimizar a tomada de decisão clínica em conformidade.

Análise de antecedentes: O primeiro parágrafo é sobre qual problema a questão precisa resolver. Descobrir o risco de doença pode exigir que estabeleçamos uma modelagem matemática para julgar, a integração de recursos pode exigir o uso de algoritmos relacionados à engenharia de recursos e a previsão do prognóstico do paciente pode exigir o uso de algoritmos de aprendizado de máquina para prever dados.

Após acidente vascular cerebral hemorrágico, a expansão do hematoma é um dos importantes fatores de risco para mau prognóstico. Num curto período de tempo após a ocorrência da hemorragia, o alcance do hematoma pode expandir-se gradualmente devido a factores como danos no tecido cerebral e resposta inflamatória, levando a um rápido aumento da pressão intracraniana, o que pode piorar ainda mais a função neurológica e até pôr em perigo o vida do paciente. Portanto, monitorar e controlar a expansão do hematoma é uma das principais preocupações clínicas. Além disso, o edema ao redor do hematoma, como marcador de lesão secundária após hemorragia cerebral, tem atraído ampla atenção clínica nos últimos anos. O edema ao redor do hematoma pode causar compressão do tecido cerebral, o que por sua vez afeta a função dos neurônios e danifica ainda mais o tecido cerebral, agravando assim o comprometimento neurológico do paciente. Em resumo, a identificação precoce e a previsão de dois eventos-chave importantes após o AVC hemorrágico, nomeadamente a expansão do hematoma e a ocorrência e desenvolvimento de edema perihematoma, são de grande importância para melhorar o prognóstico do paciente e melhorar a sua qualidade de vida.

Análise de antecedentes: Este parágrafo é óbvio. A última frase é o ponto chave, que é a ocorrência e desenvolvimento de expansão de hematoma e edema de perihematoma. A identificação e previsão precoces são de grande importância para melhorar o prognóstico do paciente e melhorar sua qualidade de vida. Ele nos disse que, ao identificar e prever, precisamos estabelecer modelos matemáticos correspondentes para dilatação e edema, quantificar a gravidade dos dois e, em seguida, criar um modelo abrangente para fundir os dois. Esta etapa é o processo de fusão do modelo. O modelo integrado pode ser usado para identificação e previsão precoces.

O rápido progresso da tecnologia de imagens médicas fornece um meio poderoso para monitoramento dinâmico não invasivo de danos e evolução do tecido cerebral após acidente vascular cerebral hemorrágico. Nos últimos anos, a tecnologia de inteligência artificial desenvolveu-se rapidamente e tem sido amplamente utilizada na área médica, trazendo novas oportunidades para mineração aprofundada e análise inteligente de dados de imagem massivos. Espera-se que, com base nas informações de imagem fornecidas nesta competição , combinadas com informações pessoais do paciente, plano de tratamento e dados de prognóstico, um modelo inteligente de diagnóstico e tratamento possa ser construído para esclarecer os fatores de risco que levam ao mau prognóstico do AVC hemorrágico e obter resultados precisos. e avaliação personalizada da eficácia e previsão do prognóstico. Acredita-se que num futuro próximo, resultados relevantes de investigação e evidências científicas serão ainda mais aplicados na prática clínica e contribuirão para melhorar o prognóstico dos pacientes com AVC hemorrágico.

Análise de antecedentes: Este parágrafo aponta o que precisamos fazer. Com base nas informações de imagem, combinadas com as informações pessoais do paciente, plano de tratamento e dados de prognóstico, podemos construir um diagnóstico inteligente e modelo de tratamento para esclarecer os fatores de risco que levam a problemas prognóstico de acidente vascular cerebral hemorrágico e obter diagnóstico personalizado preciso, avaliação de eficácia e previsão de prognóstico. Vejamos o tópico abaixo

A imagem à esquerda é uma tomografia computadorizada simples de um paciente com hemorragia cerebral.A imagem à direita é vermelha para hematoma e amarela para edema ao redor do hematoma.

1. Introdução aos conjuntos de dados e objetivos de modelagem

A questão do concurso fornece o histórico pessoal, histórico da doença, informações relacionadas ao início e ao tratamento e exames de imagem repetidos (tomografias computadorizadas) de 160 pacientes (100 conjuntos de dados de treinamento + 60 conjuntos de dados de testes independentes) de pacientes com AVC hemorrágico. avaliação, esta parte da informação pode ser consultada na “ Tabela 1 – Lista de Pacientes e Informações Clínicas” . A Figura 1 mostra uma tomografia computadorizada simples de um paciente com hemorragia cerebral, sendo a área vermelha a área do hematoma e a área amarela a área do edema. A questão do concurso fornece dados de exames de imagem, incluindo informações como volume, localização, características de formato e distribuição em escala de cinza do hematoma/edema em cada momento. As informações de volume e localização podem ser consultadas na “ Tabela 2 – Volume e localização do hematoma e edema nas informações de imagem do paciente” . As informações de forma e distribuição em escala de cinza podem ser consultadas na “ Tabela 3 - Informações da Imagem do Paciente Forma e Distribuição em Escala de Cinza do Hematoma e Edema” .

O objetivo da competição: Através da análise de dados clínicos reais, estudar o risco de expansão do hematoma, a ocorrência e evolução do edema ao redor do hematoma em pacientes com AVC hemorrágico e, finalmente, prever o prognóstico clínico de pacientes com AVC hemorrágico combinando resultados clínicos e informações de imagem.

Variável alvo:

Ø Se a expansão do hematoma ocorreu dentro de 48 horas após o início: 1 sim; 0 não. 

Ø mRS 90 dias após o início: 0-6, variável ordinal. Entre eles, o mRS é uma ferramenta importante para avaliar o estado funcional de pacientes após AVC. Para detalhes, consulte o Apêndice 2 para conceitos relacionados.

Informações clínicas: Informações relevantes são obtidas na “Tabela 1 - Lista de Pacientes e Informações Clínicas”.

Ø ID: ID do paciente.

n Conjunto de dados de treinamento: sub001 a sub100, 100 casos no total. Inclui: informações do paciente, primeiros e todos os dados de imagem de acompanhamento e mRS de 90 dias.

n Conjunto de dados de teste 1: sub101 a sub130, 30 casos no total. Contém: informações do paciente, primeiros dados de imagem. Não incluídos: dados de imagem de acompanhamento e mRS de 90 dias.

n Conjunto de dados de teste 2: sub131 a sub160, 30 casos no total. Inclui: informações do paciente, primeiros e todos os dados de imagem de acompanhamento. Não incluído: mRS de 90 dias.

Ø Número de série do primeiro exame de imagem após internação: código de 14 dígitos. Os primeiros 8 dígitos representam o ano, mês e dia, e os últimos 6 dígitos são o número sequencial (nota: não horas, minutos e segundos ). O número de série é o único código para o exame de imagem. O momento específico do exame de imagem pode ser pesquisado no " Anexo 1 - Formulário de Pesquisa - Número de Série vs Tempo" através do número de série correspondente.

ØIdade: anos

Ø Gênero: Masculino/Feminino

Ø pontuação mRS antes da hemorragia cerebral: 0-6, variável de grau ordinal

Ø História de hipertensão: 1 sim, 0 não

Ø História de acidente vascular cerebral: 1 sim 0 não

Ø História de diabetes: 1 sim 0 não

Ø História de fibrilação atrial: 1 sim, 0 não

Ø História de doença coronariana: 1 sim 0 não

Ø Histórico de tabagismo: 1 sim 0 não

Ø Histórico de consumo de álcool: 1 sim, 0 não

Características relacionadas à doença, total de 2 campos.

Ø Pressão arterial: pressão arterial sistólica/pressão arterial diastólica. Unidade: mmHg

Ø Intervalo de tempo desde o início até o primeiro exame de imagem: Unidade: horas

Características relacionadas ao tratamento, total de 7 campos.

Ø Drenagem ventricular: 1 sim 0 não

Ø Tratamento hemostático: 1 sim 0 não

Ø Tratamento para baixar a pressão intracraniana: 1 sim 0 não

Ø Tratamento anti-hipertensivo: 1 sim, 0 não

Ø Sedação e tratamento analgésico: 1 sim 0 não

Ø Antivômito e proteção estomacal: 1 sim 0 não

Ø Nervos nutricionais: 1 sim 0 não

Recursos relacionados à imagem, um total de 84 campos/pontos no tempo.

Ø As informações de volume e localização de hematoma e edema são obtidas na " Tabela 2 - Volume e localização das informações de imagem do paciente hematoma e edema" , incluindo: o volume total de hematoma (Hemo) e o volume total e diferença de edema (ED) em cada ponto de tempo A proporção de posições. Definição da relação de volume: A proporção do volume do hematoma/edema neste local em relação ao volume total. O intervalo de valores é: 0-1. Por exemplo: 0 significa que nenhum hematoma/edema ocorre nesta área e 1 significa que todo hematoma/edema neste paciente ocorre nesta área. O volume absoluto deste local pode ser calculado convertendo a proporção. Esta questão usa um modelo universal para distinguir as artérias cerebrais anteriores esquerda e direita (ACA_L, ACA_R), as artérias cerebrais médias esquerda e direita (MCA_L, MCA_R), as artérias cerebrais posteriores esquerda e direita (PCA_L, PCA_R) e a esquerda. e ponte/medula oblonga direita (Pons_Medulla_L, Pons_Medulla_R), um total de dez locais diferentes no cerebelo esquerdo e direito (Cerebelo_L, Cerebelo_R).Para localizações e referências específicas, consulte o Apêndice 2 - Conceitos relacionados . Resumindo, volume total: 2 campos (unidade: 10-3ml), posição: 20 campos. Em cada momento, há um total de 22 campos para recursos de volume e localização.

Ø A forma e a distribuição em escala de cinza do hematoma e edema são armazenadas em duas abas diferentes da " Tabela 3 - Forma das informações da imagem do paciente e distribuição em escala de cinza do hematoma e edema" , e os dados correspondentes podem ser recuperados através do número de série. A forma e as características da escala de cinza do hematoma e do edema em cada momento refletem a distribuição da intensidade do sinal do voxel na área alvo (17 campos) e a descrição da forma tridimensional (14 campos). Portanto, em cada ponto de tempo, o hematoma e edema Há um total de 62 campos de formato de edema + características de distribuição em escala de cinza.

Nota: Os dados de repetição de imagens são fornecidos com base em condições clínicas reais e pode haver diferenças nos tempos de repetição entre indivíduos.

3. Modele e responda às seguintes perguntas

1 Exploração e modelagem de fatores relacionados ao risco de expansão do hematoma.

a) Por favor, julgue os pacientes sub001 a sub100 com base na "Tabela 1" (campo: número de série do primeiro exame de imagem após a admissão, intervalo de tempo desde o início até o primeiro exame de imagem) e na "Tabela 2" (campo: número de série em cada momento e HM_volume correspondente) Se a expansão do hematoma ocorreu dentro de 48 horas após o início.

Especificações de preenchimento do resultado : 1 sim, 0 não, posição de preenchimento: campo C da “Tabela 4” (se ocorre expansão do hematoma).

Se ocorrer um evento de expansão do hematoma, registre também o momento em que ocorreu a expansão do hematoma.

Especificações de preenchimento do resultado : Por exemplo, 10,33 horas, posição de preenchimento: "Tabela 4" campo D (tempo de expansão do hematoma).

lA   ocorrência de expansão do hematoma pode ser baseada nas alterações no volume do hematoma, que é especificamente definido como: um aumento de volume absoluto de ≥6 mL ou um aumento de volume relativo de ≥33% em exames subsequentes em comparação com o primeiro exame.

Nota: Você pode consultar o ponto de tempo do exame de imagem correspondente através do número de série no "Apêndice 1 - Formulário de pesquisa - Número de série versus tempo" e combinar o intervalo de tempo desde o início até a primeira imagem e o intervalo de tempo do exame de imagem subsequente para determinar se o exame de imagem atual ocorre durante o início da doença 48 em poucas horas.

Análise da questão 1a: A questão precisa ser baseada na Tabela 1 e na Tabela 2 para determinar se um evento de expansão do hematoma ocorreu em 100 pacientes dentro de 48 horas após o início da doença. Esta questão é relativamente simples. Primeiramente, é necessário realizar operações de limpeza de dados nas duas tabelas, ou seja, pré-processamento de dados, após a limpeza dos dados anormais. Agora você pode fazer previsões. Recomendo usar alguns algoritmos de aprendizado de máquina para previsão, como Xgboost, floresta aleatória, SVM e outros algoritmos. Se a expansão do hematoma ocorre é claramente afirmado. A questão menciona que o intervalo de tempo desde o início até a primeira imagem e o intervalo de tempo entre os exames de imagem subsequentes devem ser combinados, portanto, estes precisam ser incluídos nos indicadores. O que você deve prestar atenção aqui é um modelo de classificação, então você precisa especificar um limite no final. Por exemplo, se o resultado da sua previsão for 0,7 (se estiver entre 0-1 aqui), então você pode escolher 0,65 como o limite e, caso ultrapasse, será julgado como 1, ou seja, mesmo que ocorra um evento de expansão do hematoma, isso também será útil para a próxima questão.

Finalmente, você precisa avaliar o modelo e avaliar a precisão. Aqui você pode desenhar curvas ROC, etc., para visualizar a precisão do seu modelo.

Aqui eu gostaria de dar uma dica sobre como fazer engenharia de recursos no início. Existem as seguintes etapas:

1 Limpeza de dados: Esta é a etapa mais básica e inclui o tratamento de valores ausentes, valores discrepantes e dados incorretos.

2 Codificação de recursos: Converta dados categóricos em um formato adequado para uso pelo modelo. Por exemplo, para modelos de regressão linear, as variáveis ​​categóricas precisam ser One-Hot Encoded.

3 Dimensionamento de recursos: inclui operações como padronização e normalização, que podem garantir que recursos de diferentes escalas ou unidades tenham a mesma influência durante o treinamento do modelo.

4 Seleção de recursos: Para dados de alta dimensão, precisamos selecionar o subconjunto mais significativo. Os métodos comumente usados ​​​​incluem Método de Filtro, Método Wrapper e Método Incorporado.

5 Construção de recursos: envolve a criação de novos recursos, por exemplo, a realização de operações matemáticas (como adição, subtração, multiplicação, divisão, etc.) em recursos existentes para gerar novos recursos ou a criação de recursos com base no conhecimento do domínio.

6 Redução da dimensionalidade: Quando a dimensão do recurso é muito grande, pode ser necessário reduzir a dimensionalidade dos dados. As técnicas de redução de dimensionalidade comumente usadas incluem análise de componentes principais (PCA) e incorporação estocástica de vizinhos distribuída em t (t-SNE).

b Utilize se um evento de expansão de hematoma ocorre como variável alvo, com base no histórico pessoal, histórico da doença, relacionado ao início (campos E a W) dos primeiros 100 pacientes (sub001 a sub100) na "Tabela 1" e suas exames de imagem na “Tabela 2” Variáveis ​​como resultados (campos C até A probabilidade.

Nota: Esta pergunta só pode incluir informações do primeiro exame de imagem do paciente.

Especificações de preenchimento do resultado : registrar a probabilidade prevista de ocorrência do evento (faixa de valores 0-1, reter 4 dígitos após a vírgula); preencher o local: "Tabela 4" campo E (probabilidade prevista de expansão do hematoma).

Análise da questão 1b: Esta questão é muito simples. A já estabeleceu um modelo de classificação, ou seja, se a classificação que ele faz ocorre. Ao usar um algoritmo de aprendizado de máquina para fazer um modelo de classificação na questão anterior, por exemplo, sua máquina algoritmo de aprendizado fez isso O número é 0,7. Quando você classifica, 0,7 é classificado como um evento de expansão de hematoma. Eu lhe disse anteriormente para escolher um limite apropriado, como 0,6. Então, a fórmula para calcular a probabilidade aqui é uma escala igual, 0,5+0,5*(0,7-0,6)/1-0,6 = 0,5 + 0,125 = 0,625, que é uma probabilidade de 62,5%.

2. Modelar a ocorrência e progressão do edema ao redor do hematoma e explorar a relação entre intervenção terapêutica e progressão do edema.

a) Com base no volume do edema (ED_volume) e nos pontos de tempo de exames repetidos dos primeiros 100 pacientes (sub001 a sub100) na "Tabela 2", construa uma curva de progressão do volume do edema ao longo do tempo para todos os pacientes (eixo x: tempo do início ao exame de imagem , Eixo y: volume do edema, y=f(x)), calcule o erro residual existente entre os valores reais dos primeiros 100 pacientes (sub001 a sub100) e a curva ajustada.

Especificações de preenchimento de resultados : registrar os resíduos e preencher o campo F (resíduos (todos)) da “Tabela 4”.

b) Explore as diferenças individuais no padrão de progressão do volume do edema do paciente ao longo do tempo, construa a curva de progressão do volume do edema ao longo do tempo para diferentes grupos (subgrupos: 3-5) e calcule o valor real e a soma dos primeiros 100 pacientes (sub001 a sub100) Resíduos entre curvas.

Especificações de preenchimento de resultados : registrar os resíduos, preencher o campo G (resíduos (subgrupo)) da “Tabela 4”, e preencher o subgrupo ao qual pertence na seção H (subgrupo ao qual pertence).

c) Analise o impacto dos diferentes tratamentos (campos Q a W na "Tabela 1") no padrão de progressão do volume do edema.

d) Analise a relação entre volume do hematoma, volume do edema e métodos de tratamento (campos Q a W da “Tabela 1”).

2-3 Perguntas sobre ideias, códigos e artigos estão no final do artigo.

3. Previsão prognóstica e exploração de fatores-chave em pacientes com acidente vascular cerebral hemorrágico.

a) Construa um modelo de previsão com base no histórico pessoal, histórico de doença, doença relacionada (campos E a W na "Tabela 1") e primeiros resultados de imagem (campos relacionados na Tabela 2 e Tabela 3) dos primeiros 100 pacientes (sub001 a sub100) e prever pontuações mRS de pacientes em 90 dias (sub001 a sub160).

Nota: Esta pergunta só pode incluir informações do primeiro exame de imagem do paciente.

Especificações de preenchimento de resultados : registre os resultados previstos do mRS, 0-6, variáveis ​​de notas ordinais. Preencha o campo I da posição "Tabela 4" (mRS previsto (com base na primeira imagem)).

b) Com base em todos os resultados clínicos conhecidos de tratamento (tabela 1 campos E a W), de imagem (primeiro + acompanhamento) da Tabela 2 e Tabela 3 para os primeiros 100 pacientes (sub001 a sub100), prever todos os pacientes com acompanhamento exames de imagem (sub001 a sub100, sub131 a sub160) pontuação mRS de 90 dias.

Especificações de preenchimento de resultados : registre os resultados previstos do mRS, 0-6, variáveis ​​de notas ordinais. Preencha a posição "Tabela 4" no campo J (mRS previsto).

c) Analise a correlação entre o prognóstico (mRS de 90 dias) de pacientes com AVC hemorrágico e seu histórico pessoal, histórico de doença, métodos de tratamento e características de imagem (incluindo volume de hematoma/edema, localização de hematoma/edema, características de intensidade de sinal e características de forma). , para fornecer recomendações para decisões clinicamente relevantes.

4. Acessórios

ü Tabela 1-Lista de pacientes e informações clínicas.xlsx

ü Tabela 2-Volume de informações de imagem do paciente e localização de hematoma e edema.xlsx

ü Tabela 3-Informações da imagem do paciente: formato e distribuição em escala de cinza do hematoma e edema.xlsx

ü Tabela 4-Arquivo de respostas.xlsx

ü Anexo 1 - Formulário de pesquisa - número de série vs time.xlsx

ü Anexo 2 – Conceitos relacionados.docx 

Para cada ideia de pergunta, código, vídeo explicativo, artigo e outros conteúdos relacionados, você pode clicar no cartão abaixo para escanear o código QR.

Guess you like

Origin blog.csdn.net/weixin_43345535/article/details/133164168