机器学习实战笔记

在<<机器学习实战>>的决策树的存储这方面内容学习过程中,进行代码调试时遇到以下两个错误:
(1)TypeError: write() argument must be str, not bytes

(2)UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence

初始代码如下:
#使用pickle模块存储决策树
#将inputTree存入文件
def storeTree(inputTree,filename):
    import pickle
    fw=open(filename,'w')
    pickle.dump(inputTree,fw)
    fw.close()
#读取文件中的inputTree
def grabTree(filename):
    import pickle
    fr=open(filename)
    return pickle.load(fr)

原因分析:
(1)造成问题一的原因在于pickle模块进行存储时默认为二进制存储,而我打开文件方式未调整为对应的二进制格式,应改为'wb+'

(2)造成问题二的原因类似,打开文件进行读取时应设为'rb'

修改后源码:

#使用pickle模块存储决策树
def storeTree(inputTree,filename):
    import pickle
    fw=open(filename,'wb+')
    pickle.dump(inputTree,fw)
    fw.close()

def grabTree(filename):
    import pickle
    fr=open(filename,'rb')
    return pickle.load(fr)

猜你喜欢

转载自blog.csdn.net/weixin_41797117/article/details/79777011