蜡炬教育：如何处理机器学习中大型数据的加载问题？ - 代码天地

蜡炬教育：如何处理机器学习中大型数据的加载问题？

企业开发 2019-05-29 11:50:59 阅读次数: 0

原标题:蜡炬教育：如何处理机器学习中大型数据的加载问题？

蜡炬教育老师表示，在处理机器学习算法时，经常会因为数据库太大而导致无法放入内存中，而遇到这样几个问题：当运行数据集算法而导致崩溃时如何解决？当需要处理大容量数据文件时该如何加载？如何方便快捷的解决内存不足的问题？

针对以上问题，蜡炬教育老师给出7个建议：

蜡炬教育：如何处理机器学习中大型数据的加载问题？
1.分配更多内存
某些ML工具或数据库默认内存配置不合理，可以看看是否可以手动分配。

2.使用较小样本
确认是否需要处理所有数据？在对最终数据拟合前，使用随机抽取数据样本这个示例即可。

3.使用内存更大的设备
可以租用大内存的服务器，这样可以在物理手段上获取更大的计算能力。

4.更改数据格式
可以通过更改数据格式来加快数据加载并降低内存使用率，比如二进制格式。

5.流数据或使用渐进加载
可以将数据逐步加载到内存中进行使用。

6.使用关联数据库
从内部来看，存储在磁盘上的数据可以逐步加载，并可以使用标准语言（SQL）来进行查询。

7.使用大型数据平台
比如用Mahout机器学习库的Hadoop以及用MLLib库的Spark，它们是为处理非常大的数据集专门设计的平台。

蜡炬教育老师说到，如果遇到数据库太大无法放入内训的相关问题，可以从如上7个方法中寻找解决办法。

扫描二维码关注公众号，回复： 6299629 查看本文章

猜你喜欢

转载自blog.51cto.com/14355900/2401928

蜡炬教育：如何处理机器学习中大型数据的加载问题？

7 中方法处理 ML 中大型数据加载问题

图层中大型数据集的分块处理思路

从重采样到数据合成：如何处理机器学习中的不平衡分类问题？

【数据处理】如何处理机器学习中的非均衡数据集？

[转]如何处理机器学习中的不平衡类别

如何处理机器学习中的不平衡类别

机器学习和深度学习中如何处理数据不平衡问题

中大型网站架构演变之路

Laravel的中大型项目构架

中大型网站架构之路一

Laravel 的中大型专案架构

中大型公司的开发流程

Laravel 中大型项目架构

机器学习中如何处理缺失数据？

机器学习-如何处理数据集中的缺失值

机器学习如何处理数据中的缺失值

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据

Linux下开发调试中大型C语言代码-如何提高效率

新手学大数据、机器学习相关开发技术，蜡炬教育提醒会经历这几个阶段

浅谈中大型企业CMDB的建设

[分享]面向中大型应用的PHPWeb开发框架Ice

某中大型游戏公司面试题

中大型会议终端亿联MVC800

中大型网络拓扑图实验分析

中大型企业要怎么选择ERP系统？

数学建模之中大量地理数据如何处理以显示在地图之上？

开发智能客户数据平台（CDP），「创略科技」已服务300+中大型客户营销业务

慧数汽车大数据洞察：《车主评价白皮书2019》之中大型SUV篇

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)