各シーンの評価指標の概要の詳細な研究

次の表は、一般的なシナリオで使用される機械学習の評価指標をまとめたものです。

(PS:原稿が個人的なリソースへのアップロードのスクリーンショットが含まれています)

カテゴリ シーン シーン記述 シナリオ インデックス説明 
画像 画像分類  図は、単一の映像コンテンツのオブジェクト/状態/シナリオのクラスであるかどうかを識別し、あなたはシーン分類の全体像を必要とします   図1に示すように、画像コンテンツ検索:豊かな認識結果を表示するためにビジネス情報と組み合わせて、様々なオブジェクトを識別カスタマイズトレーニングの必要性、
2を、画像レビュー:例えばライブトレーニングや他の凹凸にシーンを喫煙としてカスタマイズされたイメージ監査ルール、
3ソーティングまたは製造品質:様々な製品のカスタムライン識別、自動仕分け品質又は実現するように
4、医療診断:カスタマイズされた医用画像を特定し、診断を目視医師を支援します 
正解率(サンプルの総数の比と正確に分類されたサンプルの数) 正解率(試料番号及びカテゴリのカテゴリ予測におけるサンプルの総数より正確な予測のためのカテゴリの点では、ここでは各カテゴリーの平均正解率です) (サンプルの総数の点で任意のクラスのサンプル数が正しくカテゴリとそのカテゴリは、この場合、各カテゴリの平均再現率であることが予測されるよりも)リコール F1スコア(精度と再現率の調和平均の観点カテゴリに、各クラスF1-スコアの平均数) F1スコアの異なるカテゴリー(非常に異なる状況下で、F1スコアの異なる分類が存在する場合、全体的な効果は、データが異なるラベルをターゲットトレーニングに例数を確認することが推奨され、低分類精度の影響のモデルをダウンする可能性があり、それが推奨されます可能な限りバランスの異なるカテゴリの目標数。) TOP1-TOP5精度率画像は、モデルの信頼度レベルに基づいて、各評価を、ファイルの(順番に認識結果TOP1-TOP5、TOP1最高信頼水準、以下TOP1の正確な値TOP5最低信頼度レベルが与えられます「認識のTOP1結果が正しい、それが正しいと判定された」精度与えられた値が用.top2精度の評価基準である「長い一つまたはTOP2正しい結果としてTOP1ヒット、すなわち、それが正しいと判断された」の評価基準を指し精度は、与えられた......など)。
物体検出  これは、ターゲットオブジェクトの名前、場所の内部にすべての画像を検出することができます。複数のオブジェクトを識別するために画像に適した、カウントはシーン内のオブジェクト。   1、ビデオ監視:オブジェクトとして凹凸があるかどうかを検出、行動が表示され
、このような絵ではマイナーな欠陥の数や位置検出など:2、工業用品質管理
3、医療診断:医療細胞数、ハーブ認識を 
マップ(MAP(平均平均精度)が検出対象(オブジェクト検出)であるアルゴリズムメトリック正確率(精度)を算出し、リコール(想起)、にすることができ、各クラスのオブジェクト、オブジェクト検出タスクのエフェクトアルゴリズムを計測各PRクラスは曲線を得ることができ、異なる閾値/被試験を複数回算出し、曲線下面積)の平均であります 精度比(0.2の最高閾値の結果を比較することによりF1-スコア。正確な閾値の予測対象物よりもオブジェクトの総数が正しく予測されました) リコール(0.2。リコール率の最も高い閾値によってF1スコア比較結果が正しく予測実オブジェクトの閾値数のオブジェクトの数よりも低いです)  異なる閾値でのF1-スコア   別のタグの平均精度は(有効な観測が異なるタグの平均精度を見て、別のタグの精度を比較することができる。次の偉大な精度の違いの存在は、全体的な効果は、ラベル推奨検査訓練の低精度の影響のモデルダウンする可能性がある場合場合のデータの異なるラベルの目標数、可能な限りバランスが異なるラベルの提案された目標数。)  異なるラベルの地図
画像分割  在图中包含多个目标时,识别每个目标的名称、位置(像素级),按目标名称计数。适合图中有多个目标、需用多边形标注或需识别目标轮廓的场景。   1、专业检测:应用于专业场景的图像分析,比如在卫星图像中识别建筑、道路、森林,或在医学图像中定位病灶、测量面积等
2、智能交通:识别道路信息,包括车道标记、交通标志等 
mAP 精确率 召回率  不同阈值下的F1-score   不同标签的平均精度  不同标签的mAP
文本 文本分类  基于自建分类体系的机器学习方法,可实现文本自动分类。   1、投诉信息分类:训练客服投诉信息的自动分类,将每个用户投诉的内容进行分类管理,节省大量客服人力
2、媒体文章分类:训练网络媒体文章的自动分类,进而实现各类文章的自动分类
3、文本审核:定制训练文本审核的模型,如训练文本中是否含有违规/偏激性质的描述
4、其他:尽情脑洞大开,训练你希望实现的文本分类模型 
准确率 精确率 召回率  F1-score   不同分类的F1-score  top1-top5准确率
短文本匹配  可判断两段短文本的相似度   在客服问答场景中,通过训练短文本匹配的模型,能够快速识别出知识库中与用户问题相似的相关问题,并推荐出相应的答案,快速提升客服问答效率  准确率 精确率 召回率  F1-score   各分类的F1-score/各分类的精确值/各分类的召回率   
序列标注  通过定制标签,实现对一串文本中的每个序列单元进行分类标注。能够实现分词,词性标注,命名实体识别,关键词抽取,词义角色标注等应用功能   可以用于金融场景、医疗场景等的关键信息抽取,或者对对话的关键词槽的识别应用    精确率 召回率  F1-score     
视频 视频分类  可以分析视频的内容,识别出视频内人体做的是什么动作,物体/环境发生了什么变化。   1、人体动作监控:定制监控人体特殊动作,比如特殊手势,工地/后厨人员行为等
2、环境变化监控:定制监控环境变化,比如山体塌方,泥石流等
3、视频内容分析:快速分析视频内容,可用于短视频APP和直播平台中
4、物体状态变化监控:定制识别特定物体的移动方向、形态变化等 
准确率 精确率 召回率  F1-score   不同分类的F1-score  top1-top5准确率
声音 声音分类  可以定制识别出当前音频是哪种声音,或者是什么状态/场景的声音   1、安防监控:定制识别不同的异常或正常的声音,进而用于突发状况预警。比如监控在工业生产场景中监控是否出现了异常噪音,从而辅助人工测试的时候判断是否出现bug。
2、科学研究:定制识别同一物种的不同个体的声音、或者不同物种的声音,协助野外作业研究。比如动物研究机构从野外采集的声音,借助于EasyDL声音分类模型,判断当前音频属于什么物种。 
准确率 精确率 召回率  F1-score   不同分类的F1-score  top1-top5准确率
发布了227 篇原创文章 · 获赞 94 · 访问量 54万+

おすすめ

転載: blog.csdn.net/wiborgite/article/details/104927944