李宏毅机器学习中文课程作业二：预测赢家还是输家 - 代码天地

李宏毅机器学习中文课程作业二：预测赢家还是输家

其他 2020-03-25 11:54:06 阅读次数: 0

一、作业要求

给定训练集spam_train.csv，要求根据每个ID各种属性值来判断该ID对应角色是Winner还是Losser(收入是否大于50K)，这是一个典型的二分类问题。
训练集介绍：

CSV文件，大小为4000行X59列;
4000行数据对应着4000个角色，ID编号从1到4001;
59列数据中，第一列为角色ID，最后一列为分类结果，即label(0、1两种)，中间的57列为角色对应的57种属性值；

二、思路分析及代码实现

思路分析：

这是一个典型的二分类问题，结合课上所学内容，决定采用Logistic回归算法。
与线性回归用于预测不同，Logistic回归则常用于分类(通常是二分类问题)。Logistic回归实质上就是在普通的线性回归后面加上了一个sigmoid函数，把线性回归预测到的数值压缩成为一个概率，进而实现二分类（关于线性回归模型，可参考上一次作业）。
在损失函数方面，Logistic回归并没有使用传统的欧式距离来度量误差，而使用了交叉熵(用于衡量两个概率分布之间的相似程度)。

代码实现：

具体原理可参考：传送门

1. 数据预处理
读入文件，先将最后两列进行归一化操作。然后将文件分为训练集和验证集，并分布保存为python文件，方便调用。
在这里插入图片描述

2. 训练
定义激活函数sigmoid和损失函数compute_loss。
在这里插入图片描述
开始利用梯度下降法进行训练,并每隔三轮验证一下训练集的预测精度。

输出训练结果。

3. 预测
利用训练结果进行预测。

数据集和代码见：代码地址

idotc

发布了29 篇原创文章 · 获赞 120 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_21578849/article/details/102848144

李宏毅机器学习中文课程作业二：预测赢家还是输家

李宏毅机器学习中文课程作业一：预测PM2.5值

李宏毅2020机器学习课程笔记（二）

台大李宏毅机器学习课程

李宏毅机器学习课程

李宏毅机器学习作业1——预测COVID-19人数

李宏毅机器学习作业2——音位分类预测

李宏毅机器学习课程（2020）之课程简介

李宏毅-《深度学习/机器学习2020》中文视频课程及ppt分享

李宏毅-《深度学习/机器学习2020》中文视频课程及ppt分享

李宏毅2020深度学习课程作业

李宏毅机器学习课程学习笔记-overfit

李宏毅2020机器学习课程笔记（二）- 深度学习

李宏毅机器学习课程－Transfer Learning

李宏毅机器学习课程－Structured Learning

李宏毅机器学习课程从入门到放弃（一）

李宏毅2021春季机器学习课程-先导片

2021李宏毅机器学习课程笔记——Auto Encoder

李宏毅机器学习课程自测练习题

李宏毅2023春季机器学习课程

【机器学习李宏毅课程笔记】01.Regression

【李宏毅2021机器学习深度学习】作业讲解

使用kaggle跑李宏毅机器学习作业

李宏毅机器学习作业PM2.5

李宏毅机器学习2020春季作业二hw2（2）

线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)

李宏毅机器学习——无监督学习(二)

李宏毅机器学习——结构化学习(二)

【机器学习（李宏毅）】二、Regression: Case Study

李宏毅机器学习——循环神经网络(二)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)