零经验找工作被拒?教你在首次就业前获得现实数据科学经验

全文共2144字,预计学习时长6分钟

图源:simplilearn

得到第一份工作向来不容易,在数据科学行业更是如此。数据科学入行很难,很多公司招聘时通常都要求硕士学位和至少2-3年的工作经验。

在本文中,我将介绍三种获得实际的数据科学经验的方法。通过完成这些项目,你将深入了解SQL、Pandas和机器学习建模:

· 首先是真实的SQL案例研究。在这些案例研究中,你将遇到一个业务问题,需要查询数据库来诊断问题并制定解决方案。

· 其次是几十个Pandas的练习问题,Pandas是Python中的一个用于数据操作和分析的库,这些问题将帮助提高数据整理和数据清理所需的技能。

· 最后是各种各样的机器学习问题,在这些问题中可以通过开发机器学习模型来进行预测。通过这些,你将会学到如何处理机器学习问题以及开发机器学习模型全程所需的基础步骤。

SQL 案例学习

成为一名数据科学家必须具备很强的SQL技能。Mode提供了三个模拟实际商业问题的实用SQL案例学习,且有着可以编写和运行的在线SQL编辑器。

若是不熟悉SQL,那么最好先从Mode的SQL教程开始,在其中你可以学到基本、中级和高级SQL技术。如果已经对SQL有了很好的了解,可以跳过此步骤。

· 案例研究1:用户参与度下降调查

链接到案例:https://mode.com/sql-tutorial/a-drop-in-user-engagement/

本案例的目的是确定Yammer项目用户参与度下降的原因。在深入研究数据之前,可以阅读Yammer的概述。有4个表格需要配合使用。该案例的链接将提供有关问题、数据和应回答的问题等更多详细信息。

· 案例研究2:了解搜索功能

链接到案例:https://mode.com/sql-tutorial/understanding-search-functionality/

该案例更侧重于产品分析。在这里需要深入研究数据并判断用户体验的好坏,你需要确定“好”和“坏”的含义以及用户体验的评估方法。

· 案例研究3:验证A / B测试结果

链接到案例:https://mode.com/sql-tutorial/validating-ab-test-results/

有一个最实用的数据科学应用程序,那就是执行A/B测试。本案例的研究将深入到A/B测试的结果,对照组和治疗组之间的差异为50%。在这种情况下,任务在于通过彻底分析来验证结果或使结果无效。

Pandas实践问题

刚开始开发机器学习模型时,我发现Pandas技能上的不足带给我很大限制。与Python和SQL不同,互联网上没有太多的资源来练习Panda技能。在几周前,我发现了一个专门针对Pandas的实践问题的资料库资源。完成这些练习问题,你将知道如何:

· 过滤和排序数据

· 分组和汇总数据

· 使用.apply()处理数据

· 合并数据集

如果能完成这些实践问题,那么你对数据科学项目中Pandas的应用已经掌握到位了,这也为你接下来的学习打好了基础。

机器学习建模

获得数据科学经验的最佳方法之一是创建自己的机器学习模型。你需要找到一个公共数据集,定义一个问题,并通过机器学习解决问题。Kaggle是全球最大的数据科学社区之一,拥有数百种数据集可供选择。以下是一些可用于入门的想法:

· 预测葡萄酒质量

图源:cellar

数据集在此处:https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009

该数据集包含有关各种葡萄酒及其成分和葡萄酒质量的数据。你可以用来分析回归问题或分类问题,具体取决于如何建构它,你可以查看是否可以通过输入11种数据(固定酸度,挥发性酸度,柠檬酸,残留糖,氯化物,游离二氧化硫,总二氧化硫,密度,pH,硫酸盐和酒精)来预测红酒的质量。

此数据集创建机器学习模型的指导:https://towardsdatascience.com/predicting-wine-quality-with-several-classification-techniques-179038ea6434

· 二手车价格估算器

数据集在此处:https://www.kaggle.com/austinreese/craigslist-carstrucks-data

Craigslist是全球待售二手车的最大聚集处。该数据集由Craigslist的抓取数据组成,每隔几个月更新一次。你可以试着用它创建一个预测汽车列表价格的数据集。

祝你数据科学之旅一帆风顺!

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

猜你喜欢

转载自blog.csdn.net/duxinshuxiaobian/article/details/107828825