算法的优劣评估选择-常用方法 - 代码天地

算法的优劣评估选择-常用方法

编程语言 2018-12-25 08:50:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zdlxml/article/details/85242260

（1）from <有效HTM L文本信息抽取方法的研究木>

为了评估选择算法的优劣，本文采用了两个指标进行评
价，分别是阴性率(false negatives rate，FN)与假阳性率(false
positives rate，FP)。设Ⅳ代表选择的总行数，rg、m分别代表结
果中非文本行的数量与漏选的文本行数量，FN与f'P的计算用
如下公式表示：
FN=m／n．F'P=n／N
‘
其中：FP表示选择过程中选择了错误行的比例；FN表示选择
过程中漏选了正确行的比例。这两个指标经常被用来衡量选
择一类算法的优劣，是非常重要的两个指标。这两个指标与被
用来评估信息检索和TOP·K查询技术的关键指标，即查全率
(precision)和查准率(recall)效果相同，所以选择这两个指标
具有较好的说明力。图3显示了Sina与Sohu两个网站网页的
阈值在0．4一O．6下的FP与FN的效果。

从图3中可以看出两个特征：
a)不同的阈值对选择的效果存在较大的差异。例如图3
(b)中FP在阈值0．42与0．6处相差0．06；(a)中FN在阈值
O．42与0．6处相差0．03。
b)如果选择恰当的阈值，那么可以简单得到较好的FP与
FN；但是每个网站网页的特征不同，阈值需要进行调整。
利用相对固定的阈值控制行的选择，在处理风格相近的网
页有较好的效果，但存在两个问题：a)需要对不同的网页选择
不同的阈值，才可能达到较好的效果；b)虽然选择阈值可以改
善选择效果，但是某些短文本还是被过滤掉了，同样较长的版
权、注释以及与其相关链接却被选择中。
分析固定阈值实验结果，可以触发两个想法：a)可以对网
页进行阈值的自动选择和输出，从丽提高查准率和查全率Ib)
固定的阈值难以处理较长的非文本行以及短文本行，如果针对
网页的上下文进行学习，利用智能方法直观上分析可以提高查
准率和查全率。

猜你喜欢

转载自blog.csdn.net/zdlxml/article/details/85242260

算法的优劣评估选择-常用方法

算法选择--模型选择与评估

评价算法优劣的思路与方法

数值评价评估图像质量分数算法的优劣

模型评估常用方法

常用的评估方法

分类算法的评估方法

常用模型评估方法总结

【AI】分类算法的评估方法

评估算法的优劣指标-时间复杂度-空间复杂度-常数操作

模型评估中测试集的选择方法

机器学习——模型选择和评估方法

恰西瓜 [ 1 ] 模型评估与选择方法

sklearn模型选择--模型评估方法

特征选择常用算法

数据资产价值评估常用方法及对比

常用的特征选择方法

机器学习算法中的模型选择与假设评估

Sklearn 使用方法—选择正确的评估器(estimator)

特征选择常用算法综述

常用的特征选择算法介绍

常用排序算法（选择排序）

周志华《机器学习》第二章模型评估与选择——模型评估方法

2023数学建模国赛常用算法-Topsis优劣解距离法

测量常用软件的优劣

特征选择常用方法整理

评估图像质量评价算法性能的几个常用的标准

机器学习算法性能评估常用指标总结

各种排序算法及其优劣

以聚类问题为例，假设没有外部标签数据，如何评估两个聚类算法的优劣？

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)