Rastreamento em tempo real das tendências da pesquisa científica 丨 Novos artigos selecionados em 26 de julho, com revisão do ChatPaper

Como pesquisador científico, você precisa pesquisar e navegar em uma grande quantidade de literatura acadêmica todos os dias para obter os últimos progressos científicos e tecnológicos e resultados de pesquisa. No entanto, os métodos tradicionais de recuperação e leitura não podem mais atender às necessidades dos pesquisadores.

ChatPaper, uma ferramenta de conhecimento de documentos que integra recuperação, leitura e perguntas e respostas de conhecimento. Ajudá-lo a melhorar rapidamente a eficiência da pesquisa e leitura de artigos, obter as últimas tendências de pesquisa no campo e tornar a pesquisa científica mais fácil.
insira a descrição da imagem aqui

Combinado com a função de assinatura dinâmica de ponta, selecione os novos jornais populares do arXiv do dia para formar um resumo dos papéis, para que todos possam entender as tendências de ponta mais rapidamente.

Se você deseja ter um diálogo aprofundado sobre um determinado papel, pode copiar diretamente o link do papel para o seu navegador ou ir diretamente para a página do ChatPaper: https://www.aminer.cn/chat/g/

Lista de novos artigos em destaque para 26 de julho de 2023:

1. Página de detalhes do papel de controle baseado em exemplo contrastivo

https://www.aminer.cn/pub/64a29620d68f896efa28f818/

O artigo discute os desafios no aprendizado por reforço de que problemas práticos raramente se encaixam no modelo de um processo de decisão de Markov (MDP), a interação com o ambiente costuma ser cara e a especificação de funções de recompensa é um desafio. Para enfrentar esses desafios, estudos anteriores propuseram abordagens baseadas em dados que aprendem totalmente com amostras de dinâmicas de transferência e exemplos de estados de alta recompensa. Esses métodos geralmente aprendem uma função de recompensa a partir de estados de alta recompensa, rotulam as transições com essa função de recompensa e aplicam algoritmos de aprendizado por reforço offline a essas transições. Embora esses métodos possam alcançar bons resultados em muitas tarefas, eles podem ser complexos, muitas vezes exigindo atualizações de regularização e diferença de tempo. Este artigo propõe um método de controle baseado em exemplo off-line que aprende um modelo implícito de transferências em várias etapas em vez de uma função de recompensa. Mostramos que esse modelo implícito pode representar valores Q para problemas de controle baseados em exemplos. Em uma variedade de tarefas de controle offline baseadas em estado e em imagem, nosso método supera os métodos de linha de base usando funções de recompensa aprendidas; experimentos adicionais demonstram maior robustez e escalabilidade para o tamanho do conjunto de dados.

2. LoraHub: generalização eficiente de tarefas cruzadas por meio da página de detalhes do papel de composição LoRA dinâmica

https://www.aminer.cn/pub/64c09a963fda6d7f06e3e219/

O artigo apresenta uma estrutura chamada LoraHub, que visa alcançar adaptabilidade ajustável a tarefas invisíveis, combinando módulos LoRA treinados em diferentes tarefas. O artigo afirma que, com o LoraHub, vários módulos LoRA podem ser combinados fluentemente sem experiência humana, apenas obtendo alguns exemplos de novas tarefas. Essa combinação não requer parâmetros de modelo adicionais nem gradientes. Os resultados experimentais mostram que o LoraHub pode efetivamente simular o desempenho no aprendizado de contexto com um pequeno número de exemplos, sem exigir exemplos contextuais ao lado de cada entrada de inferência. Uma contribuição importante desta pesquisa é o estabelecimento de uma comunidade LoRA onde os usuários podem compartilhar seus módulos LoRA treinados para facilitar sua aplicação em novas tarefas. Espera-se que esse recurso expanda a aplicação e o avanço da inteligência geral e dos LLMs na produção.

3. ARB: Benchmark de Raciocínio Avançado para Página de Detalhes do Documento de Modelos de Linguagem Grandes

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e9dd/

Apesar do desempenho impressionante de grandes modelos de linguagem em vários benchmarks quantitativos de raciocínio e conhecimento, muitos benchmarks gradualmente perdem sua utilidade à medida que os modelos de linguagem obtêm pontuações cada vez mais altas, embora ainda não tenham atingido o nível de especialista. Para resolver isso, os pesquisadores introduziram um novo benchmark chamado ARB, que contém questões de raciocínio avançado em domínios como matemática, física, biologia, química e direito. Eles avaliaram o desempenho de modelos de última geração, como GPT-4 e Claude no ARB, e descobriram que os modelos atuais pontuaram bem abaixo de 50% em tarefas mais desafiadoras. Para melhorar os recursos de avaliação automática e assistida, eles introduzem um método de avaliação baseado em critérios de pontuação que permite ao GPT-4 pontuar suas próprias etapas intermediárias de raciocínio. Além disso, eles realizaram avaliação humana em um subconjunto de símbolos do ARB e encontraram algum grau de concordância entre as pontuações dos anotadores e do GPT-4.

4. Prevendo a cobertura do código sem a página de detalhes do documento de execução

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e898/

Para o problema de cálculo de cobertura de código, o artigo aponta que os recursos necessários para calcular a cobertura de código são grandes e o contexto de todo o programa é necessário para calcular a cobertura de fragmentos de código. Para reduzir o custo de cobertura de código de computação, os autores propõem usar aprendizado de máquina para prever a cobertura de código, exigindo apenas o contexto do código-fonte. Os autores propõem uma nova tarefa de avaliação chamada "Code Coverage Prediction for Large Language Models (LLMs)", que visa avaliar a capacidade dos LLMs de entender a execução do código. Os autores criam um conjunto de dados chamado COVERAGEEVAL realizando testes e coletando informações de cobertura de código e relatando o desempenho de quatro LLMs de última geração para tarefas relacionadas a código. Finalmente, os autores também demonstram que a cobertura de código é valiosa como um indicador e fonte de dados de pré-treinamento para o desempenho geral dos LLMs em tarefas de engenharia de software.

5. Aprendizagem Focada na Decisão: Fundamentos, Estado da Arte, Referência e Oportunidades Futuras página de detalhes do artigo

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e956/

O artigo discute principalmente o aprendizado focado na decisão (DFL), um paradigma emergente de aprendizado de máquina. O DFL visa treinar modelos para otimizar decisões, integrando previsão e otimização em um sistema de ponta a ponta. Esse paradigma promete transformar a tomada de decisão em muitas aplicações do mundo real que enfrentam incertezas, onde a estimativa de parâmetros desconhecidos nesses modelos de decisão geralmente apresenta um obstáculo importante. Este artigo fornece uma revisão abrangente de DFL e uma análise aprofundada de várias técnicas usadas para integrar aprendizado de máquina e modelos de otimização, propõe uma taxonomia de métodos DFL classificados de acordo com suas características e conduz extensa avaliação empírica desses métodos. Conjuntos de dados de referência e tarefas adequadas para DFL. Finalmente, o estudo fornece informações valiosas sobre as direções futuras atuais e potenciais da pesquisa DFL.

6. Reconhecimento de atividade de grupo em Visão Computacional: Uma Revisão Abrangente, Desafios e Perspectivas Futuras página de detalhes do artigo

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e93c/

Este artigo discute principalmente o problema de reconhecimento de atividades em grupo em visão computacional. O reconhecimento de atividade de grupo pode simular efetivamente relacionamentos hierárquicos em cenas, identificando relacionamentos de grupo e extraindo com precisão recursos espaço-temporais discriminativos de grupos, que têm amplas perspectivas de aplicação. O artigo primeiro revisa a literatura relevante e diferentes métodos para reconhecimento de atividades em grupo, incluindo métodos tradicionais e métodos de última geração baseados em estrutura espacial, descritores, aprendizado não profundo, redes neurais recorrentes hierárquicas, modelos relacionais e mecanismos de atenção . Em seguida, o artigo apresenta a rede relacional e a arquitetura relacional de cada módulo. O artigo então explora métodos para reconhecimento de atividades em grupo e compara seu desempenho com técnicas de ponta. O documento resume os desafios existentes e fornece um guia abrangente para os recém-chegados entenderem o reconhecimento de atividades em grupo. Por fim, o artigo também revisa novos rumos e possibilidades para o reconhecimento da atividade grupal.

7.FacTool: Detecção de factualidade em IA generativa - uma estrutura aprimorada de ferramenta para cenários multitarefa e multidomínio

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e92d/

O artigo aponta as vantagens dos modelos generativos pré-treinados na síntese de texto de alta qualidade, mas também apresenta o desafio de identificar erros factuais no texto gerado. Especificamente, o artigo aponta as seguintes questões: (1) À medida que os modelos generativos lidam com tarefas cada vez mais diversas, o risco de conter erros factuais também aumenta. (2) Os textos gerados tendem a ser longos e carecem da granularidade de fatos bem definidos para fatos individuais. (3) Falta de evidências claras durante o processo de verificação dos fatos. Com os desafios acima em mente, este artigo propõe FacTool, uma estrutura independente de tarefa e domínio (por exemplo, ChatGPT) para detectar erros factuais em texto gerado por grandes modelos de linguagem. O artigo demonstra a eficácia do método proposto realizando experimentos em quatro tarefas diferentes, incluindo resposta a perguntas baseadas em conhecimento, geração de código, raciocínio matemático e revisão da literatura científica.

8. Analisando a solicitação de cadeia de pensamento em grandes modelos de linguagem por meio de atribuições de recurso baseadas em gradiente .

https://www.aminer.cn/pub/64c09a9c3fda6d7f06e3e869/

O artigo aponta que, embora os modelos generativos de pré-treinamento produzam texto de alta qualidade, eles também trazem o desafio de identificar erros factuais no texto gerado. Questões específicas são: (1) À medida que mais tipos de tarefas são tratadas por modelos generativos, há um risco maior de incluir erros factuais. (2) Os textos gerados tendem a ser mais longos e carecem de granularidade factual bem definida. (3) Falta de evidências claras durante o processo de verificação dos fatos. Tendo em vista as questões acima, este artigo propõe uma estrutura orientada a tarefas e domínios, FacTool, para detectar erros factuais em textos gerados por modelos de linguagem de larga escala como o ChatGPT. Experimentos em quatro tarefas diferentes (resposta a perguntas baseadas em conhecimento, geração de código, raciocínio matemático e revisão da literatura científica) demonstram a eficácia da abordagem.

9.Strivec: página de detalhes do artigo Sparse Tri-Vector Radiance Fields

https://www.aminer.cn/pub/64c09a963fda6d7f06e3e1eb/

O artigo propõe uma nova representação neural chamada Strivec para modelar cenas 3D como campos de radiação com grades de recursos de tensor locais esparsamente distribuídas e compactas. O método utiliza a decomposição de tensores para modelar grades de tensores. Ao contrário do método TensoRF recente, que usa tensores globais e se concentra na decomposição de vetor-matriz, o método Strivec utiliza um conjunto de tensores locais e aplica o método clássico A decomposição CANDECOMP/PARAFAC (CP) decompõe cada tensor em três vetores capazes de representar a distribuição de recursos locais ao longo do eixo espacial e codificar de forma compacta o campo neural local. Ao mesmo tempo, os autores também aplicam grades de tensores multiescala para descobrir semelhanças geométricas e de aparência e exploram a coerência espacial da decomposição de três vetores multiescala. Finalmente, as propriedades do campo de radiação são regredidas pela agregação de características neurais de vários tensores locais em várias escalas. Esses tensores de três vetores são distribuídos esparsamente em torno da superfície real da cena, descobertos por reconstrução rápida e grosseira, explorando a dispersão das cenas 3D. Experimentos demonstram que nosso modelo pode obter melhor qualidade de renderização com significativamente menos parâmetros do que os métodos anteriores, incluindo TensoRF e Instant-NGP.


Como usar o ChatPaper?

O método de usar o ChatPaper é muito simples: abra a página inicial do Aminer e entre na página do ChatPaper na barra de navegação no topo da página ou no canto inferior direito.

insira a descrição da imagem aqui

Na página ChatPaper, você pode optar por ter um diálogo baseado em um único documento ou um diálogo baseado em toda a biblioteca (biblioteca pessoal), e você pode optar por fazer upload de um PDF local ou procurar documentos diretamente no Aminer.

Acho que você gosta

Origin blog.csdn.net/AI_Conf/article/details/131954576
Recomendado
Clasificación