【Kaggle从零开始】titanic简单生存预测 - 代码天地

【Kaggle从零开始】titanic简单生存预测

编程语言 2020-01-19 19:01:03 阅读次数: 0

PS(写到一半发现把博客写成了在学校的报告的模样…)

相信看到这篇博客的读者们应该知道kaggle是什么，不然也不会看到我这篇博客。

titanic作为kaggle官方入门题目，其地位堪比a+b problem在各大算法竞赛(*cpc)中的地位。
废话不多说，我们直接开始。

首先，我们可以观看一下小姐姐的视频(官方教程)，就是下面这个。
在这里插入图片描述
或者，我们可以直接开始。

将data下载下来后，阅读数据说明。(就是下图这个)
在这里插入图片描述
然后，观察一下提交的格式。(也就是下图这个)

查看完这些信息后，我们就可以开始做题了。
做题过程分为三部分：

读取数据，观察数据的格式。
分析数据，对数据进行处理。
选择合适的模型进行预测。

第一部分：读取数据，观察数据的格式
在这里插入图片描述
通过上图可以发现，数据中有不同类型的数据。

第二部分：分析数据，对数据进行处理

通过上图可以发现，训练集中有结果，也就是Survived列，(下文中称其为y值)，将y抽取出来作为结果集。
训练集中还有不是数值类型的数据，比如Name, Cabin, Ticket, Sex等等，需要对他们进行分析，并且处理，简单举个例子，对Sex这类数据，用数据标号就可以，对于Name这种数据，可以观察其称呼，将称呼抽取出，或者将名称长度做成新的属性。

第三部分：选择合适的模型进行预测
在这里插入图片描述
因为这个是入门题目，所以我们就用最简单的方法进行分类，直接用sklearn中的SVM对数据进行fit并预测。

最后提交数据即可。
在这里插入图片描述
发现直接随机的结果有43%的正确率，随便写的预测模型有59%的正确率。

以上就是kaggle入门的最简单的教程。

发布了159 篇原创文章 · 获赞 13 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/KIKO_caoyue/article/details/104044080

【Kaggle从零开始】titanic简单生存预测

【Kaggle】Titanic 生存预测模型

kaggle竞赛入门Titanic生存预测

Kaggle数据竞赛入门-Titanic生存预测

kaggle入门之Titanic生存预测

Titanic--kaggle竞赛入门-生存预测

Kaggle_Titanic生存预测 -- 详细流程吐血梳理

Kaggle入门Titanic生存预测 v1.0.0

Kaggle —— 泰坦尼克号Titanic生存预测

Titanic生存预测

Titanic 生存预测（上）

大神写的：Kaggle_Titanic生存预测 -- 详细流程吐血梳理

Python机器学习/数据挖掘项目实战泰坦尼克号Titanic生存预测 Kaggle入门比赛Titanic : Machine Learning from Disaster 随机森林分类器

从零开始的时间序列预测项目

如何预测Titanic生存率的流程

Kaggle Titanic数据分析和预测

机器学习及实践-----从零开始通往kaggle竞赛之路

从零开始学Pytorch（十八）之kaggle图像分类

Re:从零开始的机器学习 - Titanic: Machine Learning from Disaster

转载自https://blog.csdn.net/koala_tree/article/details/78725881 Kaggle_Titanic生存预测 -- 详细流程吐血梳理

kaggle Titanic

Kaggle Titannic生存预测 80%开源方案

Kaggle泰塔尼克号生存预测

从零开始学keras之预测房价

预测Titanic号上的乘客生存概率_01_code

Survival on the Titanic (泰坦尼克号生存预测)

kaggle入门项目：Titanic存亡预测（二）数据处理

[Kaggle实战] Titanic 逃生预测 (4) - 决策树建模

[Kaggle实战] Titanic 逃生预测 (1) - 项目起步

kaggle入门项目：Titanic存亡预测（五）验证与实现

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)