OneHotコーディングは、寸法の問題を解決するために本番環境で使用されます - コードワールド

OneHotコーディングは、寸法の問題を解決するために本番環境で使用されます

その他 2020-10-30 12:17:07 訪問数: null

OneHotエンコーディングを使用する過程でこのような問題が発生したかどうかはわかりません。たとえば、トレーニングサンプルの特定の列の値（ディスクリート）は「緑」「赤」「黄」であり、ワンホットエンコードされています。、効果は次のとおりです。

実稼働環境で新しいデータをリアルタイムで読み取ると、「緑」、「青」など、トレーニングサンプルには見られなかったデータが表示され、そのワンホットエンコーディングは次のようになります。

したがって、この場合、データディメンションは不整合になりますが、トレーニングされたモデルの入力ディメンションが決定されるため、モデルが正常に計算されない可能性があります。この問題を解決するにはどうすればよいですか。

パンダでCategoricalを使用して、この問題を解決できます。具体的なコードは次のとおりです。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = 'Seven'
import pandas as pd

train_words = ['green', 'red', 'yellow']
product_words = pd.Series(['green', 'blue'])

product_words_op = pd.Categorical(product_words, categories=train_words)

print(pd.get_dummies(product_words_op))

実装効果は次のとおりです。

緑の既知のカテゴリのリストにあるため、緑のワンホットコードエントリはすべてゼロです。本番データで新しいデータを見つけた場合、対応する行はすべて0である必要があります。この方法は、実稼働環境の次元の問題をある程度解決することができ、モデルを計算することはできません。

おすすめ

転載: blog.csdn.net/gf19960103/article/details/102736828

OneHotコーディングは、寸法の問題を解決するために本番環境で使用されます

FLINK戦闘：どのように本番環境で技術的な問題を解決するには？

【開発経験】Javaサービス本番環境でのCPU使用率の問題を解決する方法

ポートは、問題を解決するためのポートを解決するために占有されて使用されています

グラデーションが消え、問題を解決するために表示されます

JavaWeb中国の問題を解決するためのコーディング方法

数独の問題を解決するための人工知能または量子コンピューティング？

[完全に解決されました] ヘルプのための scons 問題: コンパイル出力ディレクトリを設定する方法それを理解した後、一部のコンパイルされた出力 obj ファイルは、設定された出力ディレクトリではなくソースコードディレクトリにあります。

Linuxは、最も一般的に使用されるコマンドです：95％以上の問題を解決するために

ゴミ問題を解決するためのgcc / gで++コンパイラーWindows環境

この問題を解決するためのWin10 PowerShellはアナコンダ環境を起動することができません

依存性注入のパワー、.NETのコアの魅力：中国は、HTMLの問題をコーディングしているMVCのビューを解決するために：中国の問題を解決するためのMVCのビューでは、HTMLの依存性の注入のパワー、.NETのコアの魅力をコーディングしています

Vue は、ERR コード EEXIST 問題を解決するためにスキャフォールディングをインストールします

私は、本番環境およびまたは商業目的のためのJavaの無料バージョンを使用することができますか？

画像はマウスオーバーマスクレイヤーとマスキングレイヤーを実装します。画像コンポーネントは要素のテーブルでプレビュー拡大を実装するために使用されます。これにより、画像プレビュー拡大イベントをブロックするアイコンの問題が解決されます。

[問題記録] Ubuntu 22.04 環境で、プログラムがレポートします: セグメンテーション違反 (コアダンプ) コアファイルと GDB デバッガを使用して解決するにはどうすればよいですか?

TopIconsプラスアイコンは、問題を解決するためには表示されませんLinuxのインストール

IFRAMEの時点で問題を解決するために何の方法は、Cのフロントページ++やAndroidメソッドを呼び出すために使用されていないことを示唆しています

EclipseJSP /ビルド（JDKのインストールなど）へのサーブレット環境では問題を解決するために

Idea コンソールで [サービス] ウィンドウが表示されない問題を解決しました。個人テスト後に簡単に使用できます (設定ファイルを変更する必要はありません)。

[奇妙な問題] vue で複数の el-drawer がネストされたマスクの混乱を招く問題の解決策. Vue は <el-drawer> に <el-drawer> をネストするときにバグをマスクします. 問題を解決するために、単純なドロワーコンポーネントをカプセル化しました。

elasticsearch頭を解決するための容器のドッキングウィンドウは、他の問題は、接続されたelasticsearchすることはできません作成されます

JSのデバッグ環境は、生産上の問題を解決することはできません

[デバッグ]仮想マシンのVMwareツール灰色の問題を解決するためにはインストールできません

Jettyはプロジェクトの開始に失敗しましたか？すでに使用されているアドレスの問題を解決するための2つのコマンド

ASGD の「STALENESS」を解決するにはどうすればよいですか? 分散ディープラーニングのための古さを意識した Async-SGD が論文集中読解の説明を提供します

Javaでクロスドメインの問題を解決するために使用される方法は何ですか

COMコンポーネントは、WPFデザイナの名前空間でXXXの問題を解決するために存在していません

jsは=を使用して配列を直接割り当て、新しい配列が変更されたときに元の配列が変更されるという問題が解決されます（ディープコピー）

Windowsの - ゴミ問題を解決するためのCMDウィンドウUTF8エンコーディングです！

おすすめ

ランキング

Oracleのクエリ重複フィールド

An error occurred when ssm used count to query data

【Leyes de la Naturaleza】La sabiduría de las multitudes

JavaWebの研究では、（13）を締結 - セッションの使用は、重複送信フォームを防ぎます

Firebase増加サインアップクォータ

[MyBatisフレームワーク]mybatis入門

ハートレスの世界

Djangoのインストールと使用について

[转] UiPath展開アーキテクチャ

mybatis-plusは楽観的なロック変更を使用します

アーカイブ

もっと

2024-05-14(9)

2024-05-13(8)

2024-05-12(27)

2024-05-11(31)

2024-05-10(33)

2024-05-09(30)

2024-05-08(18)

2024-05-07(34)

2024-05-06(6)

2024-05-05(0)