以下の内容は、ビッグデータ能力向上プロジェクトの必修科目「ビッグデータシステム基礎」の受講生の最終弁論報告書をまとめたものです。
私たちのレポートは次の 5 つのセクションに分かれています。
まず、前編はプロジェクトの背景と需要分析です。私たちのプロジェクトの背景にはデジタル医療の現場があります。デジタル医療は、情報技術と医療知識を組み合わせたものであり、現代医療の発展トレンドとして、精密医療と効率的な医療の実現に非常に重要です。当社が協力する蘇州宜多雲健康有限公司は、患者、医師、医療機関にスマート医療、インターネットサービス、デジタル医療製品を提供する企業です。彼は Hengrui Medicine と協力して腫瘍製品ラインの患者追跡プロジェクトを実施し、彼らが開発した 4 つの薬剤をカバーする数百万件の実際の患者データを蓄積しました。このようなデジタル医療問題の日常的な要件には、主に患者データの日常管理、がん患者に関連するデータの追跡と記録の実現、およびこれらの記録された追跡データに関連する分析要件が含まれます。この 2 つのニーズに応えるため、私たちのチームでは、イードゥオユン社から提供される追跡データを基に、患者の服薬後の副作用の程度や休薬との関係に着目した患者データの管理・分析体制の確立に努めています。得られた結果は、薬物の副作用の研究に役立ち、臨床投薬のさらなる指針となることが期待されています。
具体的なコンテンツは次の 3 つの部分に分けることができます。最初の部分はデータ管理部分であり、企業から提供されたデータを特定のデータ型に変換し、これらのファイルをアップロード、解析、保存する必要があります。次に、いくつかのユーザー管理タスク、データ操作を実行します。2 番目の部分はデジタル表示とデータ表示で、アップロードされたデータの関連フィールドの視覚的な表示を実現する必要があります。3 番目の部分はデータ分析です。さまざまな機械学習モデルを使用して、副作用と現場および医薬品の適用状況データの相関関係を分析し、ランク付けします。
2 番目の部分はシステム設計アーキテクチャです。まずWebページ部分についてご紹介しますと、Webページ部分のテクニカルステーションは主にHTML、CSS、JavaScriptの3つの部分で構成されています。HTML の最初の部分は Web ページの構造を定義し、CSS は Web ページのスタイルを定義し、JavaScript は Web ページに動的な対話性を提供します。可視化プロセスは主に次の 4 つのステップで構成されます。最初のステップはクリーンアップと分析であり、次にいくつかの処理と補足を行い、企業の要件に従ってデータをマージし、Web クローラーを通じて地理データを取得します。その後、適切な視覚化形式を選択し、使用するものを使用します。対応する形式のデータが必要です。次に、Echarts を使用してデータを視覚化し、それを当社のネットワーク ホームページに埋め込んでインタラクティブな観察を行います。
2 番目の部分では、DWF データ管理システムを採用しました。私たちの設計目標は主に、フォローアップ担当者がモジュール化され、構造化され、標準化されたフォローアップを実施し、フォローアップ プロセスを簡素化し、回答を容易にすることです。設計ロジックとしては、取得した医薬品データは 3 つあり、それぞれに求められる質問が異なるため、対応する 3 つのシステムに分割し、各システムは主に患者情報照会ページと、患者情報照会ページと、ページの 2 つのページに分かれています。患者情報編集ページ。クエリページでは各項目のテキスト情報を取得し、患者情報編集ページでは患者の基本情報、服薬状況、副作用などをモジュールごとに登録します。
最後に、分析セクションのアーキテクチャがあります。一部の Excel テーブルで深刻なデータの混乱が発生したため、重複する行を削除し、データを変換するために手動作業を行いました。多くの症状と高次元の副作用が含まれるため、米国公衆衛生福祉省の基準に従って、有害症状が属する身体システムに従って分類し、データ スクリーニングを実施しました。緊急などの理由で一部を削除しました。最終的に中止理由のデータをいくつかの機械学習モデルで分析しました。
以下に私たちが行ったことを示します。1 つ目は Web ページ部分で、ルート ディレクトリに HTML ファイルが格納され、その他のファイルが対応するフォルダーに格納されるコード構造になっています。当社のWebページは以下の4つのパートに分かれており、第1部はホームページの会社紹介、その後にフォローアップ情報やお問い合わせページを可視化しています。下の 3 つの写真は Web ページのスクリーンショットであり、視覚化の事例がここにリストされています。テーブルには患者のいくつかの都道府県情報が含まれているため、いくつかの書式設定を行ってから動的に視覚化します。Echarts の表形式の記憶視覚化を使用すると、さまざまな州の色合いがその州の患者数を表します。
次は DWF データ管理システムの部分で、既存のデータのインポートと新しいフォーム管理の 2 つの部分の実装に重点を置き、企業から提供されたデータをクリーンアップし、無関係な情報を削除し、空席を埋めました。データ フォームの追加と編集の部分 (右側の部分) では、アンケートのロジックにもいくつかの調整を加えました。これにより、より有用な情報を入手しやすくなります。
次は「分析結果」セクションです。私たちは、さまざまな統計学習モデルを使用して、独立した副作用と、身体システムおよび薬物離脱によって分類された副作用との関係を分析し、上図に示す結論を得ました。Aitan と Erica のデータに対して同様の分析を実行しました。
最後に、データ システムの表示です。まずウェブページを表示しましょう。地元のポートからアクセスできます。これは私たちのメイン ページで、いくつかの薬剤の紹介と私たちの役割分担が含まれています。企業情報インターフェイスには、Suzhou Yiduoyun Company に関するいくつかの情報が表示され、続いて連絡先情報ページが表示されました。そして、私たちが焦点を当てているのは、追跡データの視覚化です。さまざまなデータをさまざまなテーブルを通じて可視化します。
2 番目の部分は DWF 表示です。ここでは Aitan のビジュアル データ管理を例に挙げます。まず、クエリ ページでより正確なクエリを実行できます。ここでは、例として死亡時刻の範囲を使用していくつかのターゲットが選別されます。同様のクエリは、がんなどの情報に対しても実行できます。編集ページでは、当初の計画に従って必要なロジック管理も実装します。削除機能は実証されていませんが、実行できます。編集と追加は似ており、どちらも同様のロジックを実装できます。
編集者:ウェン・ジン
校正:コン・リー