Numpy多维数组保存文档时,解决报错TypeError: Mismatch 的方法

背景:

一个研究文本关键词提取的同学,最近在用自动编码器和word2vec以及pagerank三者结合时,想把中间产生的矩阵保存下来,结果直接报错TypeError: Mismatch between array dtype (‘float64’) and format specifier (‘%.18e %.18e’),然后另一个问题时把多维数组变成list的小数组,我后来搜了下才逐渐找到解决办法。

参考链接:
1、https://www.91r.net/ask/36552858.html
2、http://stackoverflow.com/questions/36552858/saving-numpy-array-to-csv-produces-typeerror-mismatch
3、http://blog.csdn.net/sunny2038/article/details/9002531

问题一:保存出错

1、保存numpy数组时,如果是多维(>=2)的话直接保存就容易出错,有的是数据格式错误,有的是维度太大(>=3)没法直接保存,我遇到的是后者。

2、针对维度太大,比如三维,可以先降成二维再保存,然后再次加载时在转换成三维,好吧,是有点麻烦。或者是三维时,一个个读取二维的再保存,代码如下:

import numpy

example = numpy.array([[[i for i in range(0, 5)],[0 for j in range(0, 5)]] for k in range(0, 10)])
f = open('exampleData.csv', 'ab')
for i in example:
    numpy.savetxt(f, i, fmt='%i',delimiter=',')

问题一:多维数组的转换

1、首先要知道多维数组和一维数组的很大区别:

>>> import numpy as np
>>> x=np.random.randn(3)
>>> x
array([-2.11348325,  1.0385824 ,  0.63850123])
>>> x.shape
(3,)

再看看三维的:

>>> y=np.random.randn(3,2)
>>> y
array([[ 1.57254639,  1.25326786],
       [-0.28991739,  0.93332943],
       [ 0.89652907, -1.33680267]])
>>> y.shape
(3, 2)
>>> 

那么当我想把一维或者多维变成list时,再看看区别是:

>>> list(x)
[-2.1134832519169735, 1.038582401341315, 0.6385012344173483]
>>> list(y)
[array([ 1.57254639,  1.25326786]), array([-0.28991739,  0.93332943]), array([ 0.89652907, -1.33680267])]
>>> 

如果有同学想获得下面这种数据时,可以试试list(多维数组)。
[array([ 1.57254639, 1.25326786]), array([-0.28991739, 0.93332943]), array([ 0.89652907, -1.33680267])]

参考的链接是:
http://blog.csdn.net/lanchunhui/article/details/50127857

发布了31 篇原创文章 · 获赞 41 · 访问量 13万+

猜你喜欢

转载自blog.csdn.net/circle2015/article/details/69784241
今日推荐