antecedentes:
Alguien ha escrito un artículo y necesita averiguar el contenido de la información de referencia. El primer paso es usar el nombre y el año de la persona para consultar la literatura citada o el artículo y el doi del artículo. Si no es útil, también puede copiar el artículo en Baidu. Busque,
El segundo paso, obtenga el número doi y busque en el sitio web
Así que de ida y vuelta, si el artículo citaba más de 100 Jiao, tan pesado, aburrido y propenso a errores,
A continuación, usamos Python para escribir pasos, consultar automáticamente y luego guardar el valor en txt.
paso:
El primer paso: el número doi se mezcla con la información de referencia, como el nombre de la persona, el año, etc., y el valor debe extraerse primero, utilizando Excel.
Debido a que algunos son http: doi / org / y otros son directamente doi, busque y reemplace directamente en excl, * org reemplaza * doi y luego reemplaza * doi /
Obtenga el número doi,
La segunda parte, debe guardarlo en formato y luego en Excel, formato de texto; de lo contrario, el número se convertirá fácilmente en un número de punto flotante
La tercera parte, usa Python para leer Excel.
# coding:utf-8
import xlrd
class ExcelUtil():
def __init__(self, excelPath, sheetName):
self.data = xlrd.open_workbook(excelPath)
self.table = self.data.sheet_by_name(sheetName)
# 获取第一行作为key值
self.keys = self.table.row_values(0)
# 获取总行数
self.rowNum = self.table.nrows
# 获取总列数
self.colNum = self.table.ncols
def dict_data(self):
if self.rowNum <= 1:
print("总行数小于1")
else:
r = []
j=1
for i in range(self.rowNum-1):
s = {}
# 从第二行取对应values值
values = self.table.row_values(j)
for x in range(self.colNum):
s[self.keys[x]] = values[x]
r.append(s)
j+=1
return r
if __name__ == "__main__":
filepath = "D:\\test\\web-project\\5ke\\testdata.xlsx"
sheetName = "Sheet1"
data = ExcelUtil(filepath, sheetName)
print(data.dict_data())
el cuarto paso:
Al principio, intenté usar la interfaz, pero el valor devuelto era incorrecto. Cambia de opinión y usa la página web para obtenerlo directamente.
Paso 5: Ver el archivo txt generado
Ya terminaste
Puntos a tener en cuenta: al escribir txt al principio, se informó que no se pudo escribir gbk y, finalmente, se agregó encoding = utf-8 al final.
Como tomo el número doi cada vez, creo que necesito conducir en modo ddt
Artículo de referencia: https://www.cnblogs.com/zhongyehai/p/9560785.html