csv文件拆分 - 代码天地

csv文件拆分

其他 2020-07-27 12:12:34 阅读次数: 0

# ecoding=utf-8
import os
import time


def mkSubFile(lines, head, srcName, sub):
    [des_filename, extname] = os.path.splitext(srcName)
    filename = des_filename + '_' + str(sub) + extname
    print('make file: %s' % filename)
    fout = open(filename, 'w')
    try:
        fout.writelines([head])
        fout.writelines(lines)
        return sub + 1
    finally:
        fout.close()


def splitByLineCount(filename, count):
    fin = open(filename, encoding="utf-8")
    try:
        head = fin.readline()
        buf = []
        sub = 1
        for line in fin:
            buf.append(line)
            if len(buf) == count:
                sub = mkSubFile(buf, head, filename, sub)
                buf = []
        if len(buf) != 0:
            sub = mkSubFile(buf, head, filename, sub)
    finally:
        fin.close()


if __name__ == '__main__':
    begin = time.time()
    splitByLineCount('lidar40_list.json.csv', 600)
    end = time.time()
    print('time is %d seconds ' % (end - begin))

正则匹配字符

# -*- coding: utf-8 -*-
import xlrd
import re
import json
data = xlrd.open_workbook("result.xlsx")
table = data.sheets()[0]
cn_pattern = re.compile("[^a-zA-Z]*")
en_pattern = re.compile("^[a-zA-Z]*\s{0,}[a-zA-Z]*")
result = {}
nrows = table.nrows
ncols = table.ncols
for i in range(nrows):
	for j in range(0, ncols-1):
		cn = table.cell(i,j).value
		en = table.cell(i,j+1).value
		if re.findall(cn_pattern,cn)[0]!="" and re.findall(en_pattern,en)[0]!="":
			result[cn] = en
print(result)
with open("result.json", "w", encoding="utf-8") as f:
            json.dump(result, f, indent=4, ensure_ascii=False)

猜你喜欢

转载自blog.csdn.net/weixin_43746433/article/details/107380108

csv文件拆分

Python将大的csv文件拆分多个小的csv文件

Java csv 大文件拆分成多个小文件

利用python对CSV文件分组并拆分文件

R语言将一个CSV文件拆分

Python拆分大型CSV文件（亲测拆分178G）注释超全

java实现csv大文件拆分，每个小文件都有标题行

PHP拆分大csv文件为多个小文件，并按序号规律命名

CSV 拆分工具推荐

C语言读取CSV文件任意一行并拆分该行获取数据

使用Python拆分数据量大的CSV文件（亲测有效）

手把手教你利用Python轻松拆分Excel为多个CSV文件

Excel拆分多个表格，并保存多个文件，（xlsx或者csv格式）

文件拆分

csv文件

csv文件——写csv文件

解决使用CSV包，将写入字符串写入csv文件时字符串被拆分成很多单元的问题

如何在python中拆分.csv数据？

第十七篇：csv拆分、csv转excel方法

Python与CSV文件（CSV模块） Python与CSV文件（CSV模块）

文件读写 - csv文件

【pandas】将单元格中的多个数据拆分为多行数据(explode)，以csv文件为源文件进行处理

nmon文件拆分

文件拆分、合并

拆分成多个文件

jni 文件的拆分与合并

linux - 文件拆分

pdf文件怎么拆分

Linux文件拆分（split）

split - 拆分文件

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)