原始语料库

版权声明:转载注明博主:明天依旧可好;来源: https://blog.csdn.net/qq_38251616/article/details/84934644

第一步:
判断数据中是否存在重复数据
创建python文件–

代码框架

'''
author: kzb
time: 2018-12-10
'''

import pandas			as pd
import os,csv

dataPath = os.path.join("音译原始数据.csv")

def import_data(dataPath):
	'''
	导入文件中的数据
	return:dataFrame
	'''
	pass

def find_En_Cn_excess(dataFrame):
	'''
	查出EnName、CnName列中存在多余数据的项
	例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵称)”
	param:dataFrame
	return:dataFrame
	'''
	pass

def write_to_file(dataFrame):
	'''
	将数据写入文件中
	param:dataFrame
	'''
	pass

def main():
	'''
	程序入口
	'''
	pass

if __name__ == '__main__':
	main()

猜你喜欢

转载自blog.csdn.net/qq_38251616/article/details/84934644