python处理文本文件

初始的数据集一般存放在txt文件,如何将其从文本文件中提取出来进行处理。下面就刚学的一种方法,进行试探性总结:

这里我用下面的一个txt文件为例:

上图这个文本文件中一共有20行数据,每行数据有四列,前三列为属性列,最后一列为类别标签。

我想将这个文件最终划分为两个列表,一个是样本列表,只包含前三列数据,另一个是标签列表,只包含最后一列数据

首先看一看readline这个函数的用法:

输出为:

这里每一行之间为什么会空一行,我的看法是,文本文档中的每一行末尾都有一个换行符,输出的时候也会输出换行符,导致了这个结果

下面给出主要代码:

扫描二维码关注公众号,回复: 2417613 查看本文章

上述代码实现后,line内的元素将会呈现较为有秩序的状态

下面以第一行输出为准:

算是达到了预期效果

下面开始将其录入到我们的数据集中

返回的值为:

虽然看起来丑了点,但还是可以用的。

总的源码为:

下面我换个函数试一试:

总的来说没多大改变,直接贴代码和输出了

输出为:

这是第一行的输出,最终返回的是一样的,就不放了

猜你喜欢

转载自blog.csdn.net/weixin_39523628/article/details/81200142