Python使用中常见问题总结(四)

尊敬的读者您好:笔者很高兴自己的文章能被阅读,但原创与编辑均不易,所以转载请必须注明本文出处并附上本文地址超链接以及博主博客地址:https://blog.csdn.net/vensmallzeng。若觉得本文对您有益处还请帮忙点个赞鼓励一下,笔者在此感谢每一位读者,如需联系笔者,请记下邮箱:[email protected],谢谢合作!

一、字符串中插入字符串

原始表all_available_features_plus_new.txt结构:用户id \001 特征...\001特征...特征 \001 label

问题:在原始特征表all_available_features_plus_new.txt中追加特征,即在label前一个特征后插入待追加特征,然后将构成好的新样本写入新特征表all_available_features_plus_new_add.txt中。

with open("all_available_features_plus_new.txt", 'r', encoding='utf-8') as f:
    lines = f.readlines()
    lines_new = ""
    for line in lines:
        line_tmp = ""
        line_cut = line.split('\001')
        l1 = len(line.strip())
        #获取所有待加入特征,并拼接成字符串line_tmp
        for i in user_time_new[line_cut[0]]:
          #  print(str(i))
            line_tmp = line_tmp + str(i) + '\001'
        ##将line_tmp字符串插入到label与前一个特征之间,形成新字符串line_new
        #先变成list,因为list才有insert功能
        line = list(line)
        #print(line_tmp)
        #插入line_tmp字符串
        line.insert(l1-1, line_tmp)
        #将list变回新字符串line_new
        line_new = ''.join(line)
        #构造追加新特征后的所有样本
        lines_new = lines_new + line_new
f.close()

将构成好的新样本写入新特征表all_available_features_plus_new_add.txt中

file_handle = open('all_available_features_plus_new_add.txt', 'w', encoding='utf-8')
file_handle.write(lines_new)
file_handle.close()

日积月累,与君共进,增增小结,未完待续。

发布了152 篇原创文章 · 获赞 147 · 访问量 11万+

猜你喜欢

转载自blog.csdn.net/Vensmallzeng/article/details/103993852