Echtzeit-Verfolgung wissenschaftlicher Forschungstrends | Neue Artikel, ausgewählt von Li Hang, Daniela L. Rus und anderen am 8.11., mit einer ChatPaper-Rezension

Als wissenschaftlicher Forscher müssen Sie täglich eine große Menge akademischer Literatur durchsuchen und durchsuchen, um die neuesten wissenschaftlichen und technologischen Fortschritte und Forschungsergebnisse zu erhalten. Allerdings können herkömmliche Abruf- und Lesemethoden den Anforderungen wissenschaftlicher Forscher nicht mehr gerecht werden.

ChatPaper ist ein Literaturwissenstool, das das Abrufen, Lesen und Wissensfragen und -antworten integriert. Helfen Sie dabei, die Effizienz beim Abrufen und Lesen von Arbeiten schnell zu verbessern, die neuesten Forschungstrends auf diesem Gebiet zu erhalten und die wissenschaftliche Forschungsarbeit komfortabler zu gestalten.

Fügen Sie hier eine Bildbeschreibung ein

In Kombination mit der Abonnementfunktion für aktuelle Nachrichten wählt arXiv die beliebtesten neuen Zeitungen des Tages aus und erstellt eine Rezension, sodass jeder die neuesten Nachrichten schneller verstehen kann.

Wenn Sie ein ausführliches Gespräch über ein bestimmtes Papier führen möchten, können Sie den Papierlink direkt in den Browser kopieren oder direkt zur ChatPaper-Seite gehen: https://www.aminer.cn/chat/g/explain

Liste ausgewählter Neuerscheinungen am 11. August 2023:

1.Alles verfolgen: Erkennung, Verfolgung und Verfolgung offener Sets in Echtzeit

https://www.aminer.cn/pub/64d5b21d3fda6d7f060d0db9/

ChatPaper-Rezension: Das Papier stellt ein Robotersystem namens „Follow Anything“ (FAn) vor, das jedes Objekt in Echtzeit erkennen, verfolgen und verfolgen kann. Das System verwendet ein multimodales Modell, das nicht durch Konzepte eingeschränkt ist, die zum Zeitpunkt des Trainings entstanden sind, und kann Text-, Bild- oder Klickabfragen nutzen, um sie zum Zeitpunkt der Inferenz auf neuartige Kategorien anzuwenden. Durch die Nutzung der umfangreichen visuellen Deskriptoren eines groß angelegten vorab trainierten Modells (Basismodell) kann FAn Objekte erkennen und segmentieren, indem multimodale Abfragen (Text, Bilder, Klicks) mit eingegebenen Bildsequenzen abgeglichen werden. Diese erkannten und segmentierten Objekte können zwischen Bildrahmen verfolgt werden, wobei Verdeckungen und das Wiedererscheinen von Objekten berücksichtigt werden. In einem Echtzeit-Regelkreis demonstrieren wir FAn an einem realen Robotersystem (einem Mikroluftfahrzeug) und berichten über seine Fähigkeit, interessierende Objekte nahtlos zu verfolgen. FAn kann auf Laptops mit leichten Grafikkarten (6–8 GB) eingesetzt werden und verarbeitet 6–20 Bilder pro Sekunde. Zusammenfassend löst dieser Artikel das Problem der Erkennung, Verfolgung und Verfolgung beliebiger Objekte in Echtzeit und schlägt ein Robotersystem namens FAn vor, um dieses Ziel zu erreichen. Das System verfügt über ein offenes Vokabular und ein multimodales Modell, das zum Zeitpunkt der Inferenz auf neuartige Kategorien angewendet werden kann und visuelle Deskriptoren aus großen, vorab trainierten Modellen zur Objekterkennung, Segmentierung und Verfolgung nutzt. Gleichzeitig berücksichtigt das System auch die Okklusion und das Wiedererscheinen von Objekten. Die Leistungsfähigkeit des Systems wird durch Experimente an einem Mikroflugzeug demonstriert. Um schließlich eine schnelle Einführung und Skalierbarkeit des Systems zu ermöglichen, wurde der gesamte Code als Open Source bereitgestellt.

2.OpenProteinSet: Trainingsdaten für die Strukturbiologie im großen MaßstabLesen Sie den Originaltext

https://www.aminer.cn/pub/64d5b2153fda6d7f060d0070/

ChatPaper-Rezension: Verdeutlicht ein Problem mit Trainingsdaten für die Strukturbiologie, dass die Generierung mehrerer Sequenz-Alignments rechenintensiv und zeitaufwändig ist, sodass der Forschungsgemeinschaft vergleichbare Datensätze für das Training mit Produkten wie AlphaFold2 fehlen, wodurch Proteinfortschritte beim maschinellen Lernen eingeschränkt werden. Um dieses Problem zu lösen, führten die Autoren OpenProteinSet ein, einen Open-Source-Datensatz, der mehr als 16 Millionen Ergebnisse des Mehrfachsequenz-Alignments, verwandte Strukturhomologe aus der Proteindatenbank und Ergebnisse zur Proteinstrukturvorhersage von AlphaFold2 enthält. Die Autoren haben OpenProteinSet erfolgreich zum Umschulen von AlphaFold2 eingesetzt und gehen davon aus, dass OpenProteinSet in großem Umfang für Trainings- und Validierungsdaten für so unterschiedliche Aufgaben wie Proteinstruktur, -funktion und -design sowie für groß angelegte multimodale maschinelle Lernforschung verwendet wird.

3.AudioLDM 2: Erlernen der ganzheitlichen Audioerzeugung mit selbstüberwachtem Vortraining

https://www.aminer.cn/pub/64d5b21d3fda6d7f060d0db5/

ChatPaper-Übersicht: Dieses Papier löst die Herausforderung der Unterschiede in spezifischen Zielen und Präferenzen zwischen verschiedenen Arten von Problemen bei der Audiogenerierung und schlägt ein einheitliches Framework für die Audiogenerierung vor. Das Framework nutzt selbstüberwachte, vorab trainierte Modelle, um eine universelle Darstellung von Audio zu erlernen, und wandelt jede Form von Audio über das GPT-2-Modell in diese Darstellung um. Während des Generierungsprozesses wird diese Darstellung in Verbindung mit einem latenten Diffusionsmodell für selbstüberwachtes Lernen der Audiogenerierung verwendet. Experimentelle Ergebnisse zeigen, dass das Framework bei der Text-zu-Audio-, Text-zu-Musik- und Text-zu-Sprache-Konvertierung neue State-of-the-Art- oder Wettbewerbsleistungen erzielt.

4.Vertrauenswürdige LLMs: eine Umfrage und Richtlinie zur Bewertung der Ausrichtung großer Sprachmodelle

https://www.aminer.cn/pub/64d5b2153fda6d7f060d00a4/

ChatPaper-Rezension: Das Papier weist darauf hin, dass unklare Leitlinien zur Beurteilung, ob große Sprachmodelle (LLMs) mit sozialen Normen, Werten und Vorschriften vereinbar sind, eine große Herausforderung für Praktiker darstellen. Dieses Hindernis behindert die Systemiteration und den Einsatz von LLMs. Um dieses Problem anzugehen, bietet dieses Papier eine umfassende Übersicht über Schlüsseldimensionen der LLM-Vertrauenswürdigkeit. Die Umfrage umfasst sieben Hauptkategorien für die Vertrauenswürdigkeit von LLM: Zuverlässigkeit, Sicherheit, Fairness, Missbrauchsprävention, Erklärbarkeit und Argumentationsfähigkeit, Einhaltung sozialer Normen und Robustheit. Jede Hauptkategorie ist weiter in mehrere Unterkategorien unterteilt, sodass es insgesamt 29 Unterkategorien gibt. Darüber hinaus wurden 8 Unterkategorien für weitere Untersuchungen ausgewählt und entsprechende Messstudien an mehreren weit verbreiteten LLMs durchgeführt. Messungen zeigen, dass stärker abgestimmte Modelle insgesamt besser in Bezug auf die Gesamtglaubwürdigkeit abschneiden. Allerdings ist die Wirksamkeit des Alignments für die verschiedenen betrachteten Glaubwürdigkeitskategorien unterschiedlich. Dies unterstreicht die Bedeutung einer verfeinerten Analyse, Prüfung und kontinuierlichen Verbesserung der LLM-Ausrichtung. Durch die Beleuchtung dieser Schlüsseldimensionen der LLM-Vertrauenswürdigkeit soll dieses Papier Praktikern auf diesem Gebiet wertvolle Erkenntnisse und Orientierungshilfen bieten. Das Verständnis und die Bewältigung dieser Probleme ist entscheidend für den zuverlässigen und ethischen Einsatz von LLMs in einer Vielzahl von Anwendungen.

5.Erklärbare KI-Anwendungen im medizinischen Bereich: eine systematische ÜbersichtLesen Sie den Originaltext

https://www.aminer.cn/pub/64d5b2153fda6d7f060d00c9/

ChatPaper-Rezension: Das Papier untersucht die Anwendung erklärbarer künstlicher Intelligenz (XAI) im medizinischen Bereich. Während KI-Anwendungen in der Medizin in retrospektiven Studien erfolgreich waren, waren praktische Anwendungen selten. Der Bereich der medizinischen künstlichen Intelligenz steht vor zahlreichen Herausforderungen, darunter der Aufbau des Vertrauens der Benutzer, die Einhaltung relevanter Vorschriften und die rationale Nutzung von Daten. Ziel der erklärbaren KI ist es, den Menschen zu helfen, die Ergebnisse der KI zu verstehen und ihnen zu vertrauen. Dieses Papier führt eine Literaturrecherche von 198 relevanten Artikeln durch, die in den letzten Jahren veröffentlicht wurden, und fasst einige Ergebnisse zusammen. Erstens nutzen diese Lösungen hauptsächlich modellunabhängige, erklärbare KI-Techniken. Zweitens werden Deep-Learning-Modelle häufiger verwendet als andere Arten von Modellen für maschinelles Lernen. Obwohl Interpretierbarkeit zur Stärkung des Vertrauens eingesetzt wurde, wurde in wenigen Studien über die Beteiligung von Ärzten an diesem Prozess berichtet. Schließlich sind visuelle und interaktive Benutzeroberflächen nützlicher für das Verständnis der Erklärungen und Empfehlungen des Systems. Es ist mehr gemeinsame Forschung zwischen Medizin- und KI-Experten erforderlich, um die Entwicklung geeigneter Rahmenbedingungen für den Entwurf, die Implementierung und die Bewertung erklärbarer KI-Lösungen in der Medizin voranzutreiben.

6.LLM als DBALesen Sie den Originaltext

https://www.aminer.cn/pub/64d5b21d3fda6d7f060d0cab/

ChatPaper-Rezension: Das Papier schlägt einen Datenbankadministrator D-Bot vor, der auf einem großen Sprachmodell (LLM) basiert und kontinuierlich Erfahrung in der Datenbankwartung aus Textquellen sammeln und vernünftige und fundierte zeitnahe Diagnose- und Optimierungsvorschläge für die Zieldatenbank liefern kann. Diese Forschung löst hauptsächlich die schwierigen und umständlichen Probleme, mit denen Datenbankadministratoren bei der Verwaltung einer großen Anzahl von Datenbankinstanzen konfrontiert sind.


Wie verwende ich ChatPaper?

Die Verwendung von ChatPaper ist sehr einfach. Öffnen Sie die AMiner-Homepage und rufen Sie die ChatPaper-Seite über die Navigationsleiste oben auf der Seite oder in der unteren rechten Ecke auf.
Fügen Sie hier eine Bildbeschreibung ein

Auf der ChatPaper-Seite können Sie wählen, ob Sie eine Konversation basierend auf einem einzelnen Dokument oder eine Konversation basierend auf der gesamten Datenbank (persönliche Dokumentendatenbank) führen möchten. Sie können wählen, ob Sie ein lokales PDF hochladen oder direkt auf AMiner nach Dokumenten suchen möchten.

Tutorial zur ChatPaper-Nutzung: Klicken Sie hier, um es anzuzeigen

Supongo que te gusta

Origin blog.csdn.net/AI_Conf/article/details/132273142
Recomendado
Clasificación