Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略 - 代码天地

Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

企业开发 2023-12-16 21:36:21 阅读次数: 0

Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

目录

scikit-surprise的简介

1、基准测试

scikit-surprise的安装

scikit-surprise的使用方法

1、基础用法

(1)、简单的示例，展示如何（下）载数据集，将其拆分为5折交叉验证，并计算SVD算法的MAE和RMSE

scikit-surprise的简介

Surprise，Simple Python RecommendatIon System Engine，是一个用于构建和分析处理显式评分数据的Python scikit推荐系统工具。Surprise的设计目的包括：

>> 为用户提供对实验的完全控制。为此，我们强调文档，试图通过指出算法的每个细节使其尽可能清晰和精确。

>> 缓解数据集处理的痛苦。用户可以使用内置数据集（Movielens、Jester）和自定义数据集。

>> 提供各种可用的预测算法，如基线算法、邻域方法、基于矩阵分解的算法（SVD、PMF、SVD++、NMF）等。此外，还内置了各种相似度度量（余弦、MSD、皮尔逊等）。

>> 使新算法思路的实现变得简单。

>> 提供评估、分析和比较算法性能的工具。可以使用强大的CV迭代器（受scikit-learn优秀工具启发）轻松运行交叉验证过程，以及对一组参数进行详尽搜索。

请注意，Surprise不支持隐式评分或基于内容的信息。

1、基准测试

以下是各种算法（使用默认参数）在5折交叉验证过程中的平均RMSE、MAE和总执行时间。数据集包括Movielens 100k和1M数据集，所有算法使用相同的折叠。所有实验在一台搭载Intel i5第11代2.60GHz处理器的笔记本电脑上运行。生成这些表格的代码可以在基准测试示例中找到。

Movielens 100k

Movielens 100k	RMSE	MAE	Time
SVD	0.934	0.737	0:00:06
SVD++ (cache_ratings=False)	0.919	0.721	0:01:39
SVD++ (cache_ratings=True)	0.919	0.721	0:01:22
NMF	0.963	0.758	0:00:06
Slope One	0.946	0.743	0:00:09
k-NN	0.98	0.774	0:00:08
Centered k-NN	0.951	0.749	0:00:09
k-NN Baseline	0.931	0.733	0:00:13
Co-Clustering	0.963	0.753	0:00:06
Baseline	0.944	0.748	0:00:02
Random	1.518	1.219	0:00:01

Movielens 1M

Movielens 1M	RMSE	MAE	Time
SVD	0.873	0.686	0:01:07
SVD++ (cache_ratings=False)	0.862	0.672	0:41:06
SVD++ (cache_ratings=True)	0.862	0.672	0:34:55
NMF	0.916	0.723	0:01:39
Slope One	0.907	0.715	0:02:31
k-NN	0.923	0.727	0:05:27
Centered k-NN	0.929	0.738	0:05:43
k-NN Baseline	0.895	0.706	0:05:55
Co-Clustering	0.915	0.717	0:00:31
Baseline	0.909	0.719	0:00:19
Random	1.504	1.206	0:00:19

scikit-surprise的安装

pip install numpy
pip install scikit-surprise
pip install -i https://mirrors.aliyun.com/pypi/simple scikit-surprise



或者利用conda
conda install -c conda-forge scikit-surprise



或者从最新的源代码构建
pip install numpy cython
git clone https://github.com/NicolasHug/surprise.git
cd surprise
python setup.py install

scikit-surprise的使用方法

1、基础用法

(1)、简单的示例，展示如何（下）载数据集，将其拆分为5折交叉验证，并计算SVD算法的MAE和RMSE


from surprise import SVD
from surprise import Dataset
from surprise.model_selection import cross_validate

# Load the movielens-100k dataset (download it if needed).
data = Dataset.load_builtin('ml-100k')

# Use the famous SVD algorithm.
algo = SVD()

# Run 5-fold cross-validation and print results.
cross_validate(algo, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)


Evaluating RMSE, MAE of algorithm SVD on 5 split(s).

                  Fold 1  Fold 2  Fold 3  Fold 4  Fold 5  Mean    Std     
RMSE (testset)    0.9367  0.9355  0.9378  0.9377  0.9300  0.9355  0.0029  
MAE (testset)     0.7387  0.7371  0.7393  0.7397  0.7325  0.7375  0.0026  
Fit time          0.62    0.63    0.63    0.65    0.63    0.63    0.01    
Test time         0.11    0.11    0.14    0.14    0.14    0.13    0.02

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/134971067

Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

Windows安装scikit-surprise

python 安装scikit-surprise报错

安装scikit-surprise库的方法最终解答！

windows环境下 anacoda 安装scikit-surprise

wordcloud、scikit-surprise软件包安装

推荐系统算法库scikit-surprise安装问题的解决

【笔记】surprise安装 conda install -c conda-forge scikit-surprise

Py之ipykernel：Python库之ipykernel简介、安装、使用方法之详细攻略

Py之pycurl：Python 库之pycurl的简介、安装、使用方法之详细攻略

Py之Queue：python库之Queue的简介、安装、使用方法之详细攻略

Py之PyMySQL：Python库之PyMySQL的简介、安装、使用方法之详细攻略

Py之BaseHTTPServer：Python库之BaseHTTPServer的简介、安装、使用方法之详细攻略

Py之xlwt：python库之xlwt的简介、安装、使用方法之详细攻略

Py之sip：Python库之sip的简介、安装、使用方法之详细攻略

Py之mglearn：python库之mglearn简介、安装、使用方法之详细攻略

Py之ipython：Python库之ipython的简介、安装、使用方法详细攻略——Jason Niu

Py之pyserial：Python的pyserial库的简介、安装、使用方法之详细攻略

Py之Pyinstaller：Python库之Pyinstaller简介、使用方法、安装详细攻略——Jason niu

Py之logging：logging的简介、安装、使用方法之详细攻略

Py之reprint：reprint的简介、安装、使用方法之详细攻略

Py之pyttsx：pyttsx/pyttsx3的简介、安装、使用方法之详细攻略

Py之pyttsx：wxPython的简介、安装、使用方法之详细攻略

Py之pydotplus：pydotplus的简介、安装、使用方法之详细攻略

Py之albumentations：albumentations库函数的简介、安装、使用方法之详细攻略

Py之torchvision：torchvision库的简介、安装、使用方法之详细攻略

Py之av：av库的简介、安装、使用方法之详细攻略

Py之portalocker：portalocker的简介、安装、使用方法之详细攻略

Py之yacs：yacs的简介、安装、使用方法之详细攻略

Py之fvcore：fvcore库的简介、安装、使用方法之详细攻略

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)