Utilice la secuencia de comandos de Python para consultar automáticamente la información de referencia de acuerdo con el número DOI

antecedentes:

       Alguien ha escrito un artículo y necesita averiguar el contenido de la información de referencia. El primer paso es usar el nombre y el año de la persona para consultar la literatura citada o el artículo y el doi del artículo. Si no es útil, también puede copiar el artículo en Baidu. Busque,

El segundo paso, obtenga el número doi y busque en el sitio web

 

Así que de ida y vuelta, si el artículo citaba más de 100 Jiao, tan pesado, aburrido y propenso a errores,

A continuación, usamos Python para escribir pasos, consultar automáticamente y luego guardar el valor en txt.

paso:

El primer paso: el número doi se mezcla con la información de referencia, como el nombre de la persona, el año, etc., y el valor debe extraerse primero, utilizando Excel.

Debido a que algunos son http: doi / org / y otros son directamente doi, busque y reemplace directamente en excl, * org reemplaza * doi y luego reemplaza * doi / 

Obtenga el número doi,

La segunda parte, debe guardarlo en formato y luego en Excel, formato de texto; de lo contrario, el número se convertirá fácilmente en un número de punto flotante

La tercera parte, usa Python para leer Excel.

# coding:utf-8
import xlrd
class ExcelUtil():
    def __init__(self, excelPath, sheetName):
        self.data = xlrd.open_workbook(excelPath)
        self.table = self.data.sheet_by_name(sheetName)
        # 获取第一行作为key值
        self.keys = self.table.row_values(0)
        # 获取总行数
        self.rowNum = self.table.nrows
        # 获取总列数
        self.colNum = self.table.ncols

    def dict_data(self):
        if self.rowNum <= 1:
            print("总行数小于1")
        else:
            r = []
            j=1
            for i in range(self.rowNum-1):
                s = {}
                # 从第二行取对应values值
                values = self.table.row_values(j)
                for x in range(self.colNum):
                    s[self.keys[x]] = values[x]
                r.append(s)
                j+=1
            return r

if __name__ == "__main__":
    filepath = "D:\\test\\web-project\\5ke\\testdata.xlsx"
    sheetName = "Sheet1"
    data = ExcelUtil(filepath, sheetName)
    print(data.dict_data())

el cuarto paso:

Al principio, intenté usar la interfaz, pero el valor devuelto era incorrecto. Cambia de opinión y usa la página web para obtenerlo directamente.

 

 

Paso 5: Ver el archivo txt generado

Ya terminaste

 

Puntos a tener en cuenta: al escribir txt al principio, se informó que no se pudo escribir gbk y, finalmente, se agregó encoding = utf-8 al final.

 Como tomo el número doi cada vez, creo que necesito conducir en modo ddt

Artículo de referencia: https://www.cnblogs.com/zhongyehai/p/9560785.html

Supongo que te gusta

Origin blog.csdn.net/qq_43422918/article/details/101166851
Recomendado
Clasificación