ウェストバージニア大学の研究者らは、Code Interpreter と呼ばれる最新の公式 ChatGPT アドオンに教育用途への可能性を見出している一方で、がんや遺伝性疾患の標的治療に取り組むには計算手法を使用することが重要であることも発見しました。データがある場合、このプラグインの使用には制限があります。
「コードインタープリターは、STEM 分野でのプログラミングを学生にとってよりアクセスしやすくするため、特に教育において有望なツールです。」ウェストバージニア大学医学部微生物学、免疫学、細胞生物学科助教授、バイオインフォマティクス部長コアのGangqing "Michael" Hu氏は、「しかし、バイオインフォマティクスの分野で必要とされるすべての機能を提供しているわけではない。これらは技術的な改善によって解決できる問題である。将来的にはコードインタープリタが使用される可能性がある。」と述べた。バイオインフォマティクス、金融、経済学などの分野です。」
人気の人工知能チャットボットである ChatGPT は、2022 年 12 月のリリース以来、ビジネス、教育、世間の注目を集めています。しかし、これは、バイオインフォマティクスの横断的な分野を含む生物医学研究に従事する人々のニーズを完全に満たしているわけではなく、これらの科学者は、OpenAI のコードインタープリタープラグインがこれらのギャップを埋めることを期待して、熱心に期待しています。
Hu 氏と彼のチームは、コード インタプリタの特性を評価するために、さまざまなタスクでコード インタプリタのパフォーマンスをテストしました。『Annals of Biomedical Engineering』に掲載された彼らの調査結果は、このプラグインがいくつかの点で優れているものの、依然としていくつかの制限があることを示しています。
たとえば、科学的背景のない人でも、コード インタプリタを介してプログラミングやコンピュータ プログラミングに簡単に触れることができます。また、費用対効果も高く、データ分析を探求する生徒の好奇心を刺激し、学習への関心が高まると胡氏は述べた。同氏は、ユーザーはデータを解釈する方法を理解し、結果が正確かどうかを特定し、チャットボットと対話する方法を知る必要があると指摘しました。
バイオインフォマティシャンは、現代医学の進歩のために、正確なプログラミング、コンピューター ソフトウェア プログラム、インターネット アクセスに依存して、DNA やヒトゲノムなどの生物学的データを保存、分析、解釈します。
バイオインフォマティクスには具体的な改善が必要だが、コードインタープリタはユーザーが回答の正確性と、場合によっては誤解を招く可能性のあるいわゆる「幻想」、つまり架空の回答があるかどうかを判断するのに役立つと胡氏は述べた。。
「ChatGPT が多くの素晴らしいことを実行できることは人々に知られていますが、回答を裏付ける引用や参考文献を提供するのはあまり得意ではありません。回答を裏付けるためにどこから来たのかと問われれば、参考文献をでっち上げ始めるかもしれません」と Hu 氏は説明しました。「コードインタープリタは、幻覚を最小限に抑えるソリューションを提供します。プログラムで解決できる問題については、コード自体が情報源または引用として機能します。これは重要な進歩です。」
Hu氏の共同研究者には、ウェストバージニア大学微生物・免疫学・細胞生物学部のポスドク、Lei Wang氏、サウスダコタ州立大学のXijin Ge氏、アリゾナ州立大学のLi Liu氏が含まれる。
チームは、データをチャートやグラフに変換するコード インタープリターの機能で良い結果が得られたことを発見しました。
コードインタープリタへのアップグレードとしては、ゲノムデータをダウンロードするためのインターネットアクセスの提供、バイオインフォマティクス専用ソフトウェアのインストール、ストレージ容量の拡張、より多くのプログラミング言語のサポートなどが挙げられます。さらに、研究者らは、HIPAA などのプライバシーおよびセキュリティ アプリケーション規制への準拠が必要であることを発見しました。
データ分析をテストしているときに、いくつかの制限が見つかりました。このプラグインは、1 つのコンピューター プログラム Python (バイオインフォマティクス分析のための Python 実践演習 3 | ビデオ 21 ) のみをサポートし、バイオインフォマティクス専用の一部のソフトウェア パッケージのみをサポートします。また、インターネット上のデータにアクセスできず、大きなファイルを処理できません。この描画機能は本当に強力です、Muggle の ChatGPT 4.0 の初体験
コードインタープリタを使用してグラフを作成する 3 つの例
「100メガバイト程度のファイルの処理しか許可されていないが、我々はギガバイト範囲のファイルを処理している」と胡氏は語った。「また、大規模なデータセットに必要な並列処理がサポートされていないため、パフォーマンスが低下します。」胡氏は、来年のコースでこのプラグインを使用する予定だが、学生がデータを理解できるようにするため、コードインタープリタのさらなるアップグレードを期待していると述べた。視覚化。「人工知能は急速に発展している分野です。その時までにOpenAIがいくつかの制限を克服して、広範なバイオインフォマティクスプログラミングに使用できるようになることを願っています。」 最後に胡氏は、新しいAIプログラミングと機能の監視とテストを続けると述べた。この分野にはまだ多くの革新的な用途が発見されるのを待っているからです。
Shengxin Baodian: ChatGPT がプロンプトとコードを提供した後 (怠け者でも、ChatGPT を使用して生物学的情報コードの一部を書くのを手伝ってください)、ビッグデータをローカルで実行する必要があります。そうしないと、アップロード、ダウンロード、分析の速度に時間がかかりすぎます。リソース。