Pythonスクリプトを使用して、DOI番号に従って参照情報を自動的にクエリします

バックグラウンド:

       誰かが論文を書いたので、参考情報の内容を調べる必要があります。最初のステップは、その人の名前と年を使用して、引用文献または記事と記事のdoiを照会することです。役に立たない場合は、 Baiduの記事をコピーすることもできます。

2番目のステップは、doi番号を取得し、Webサイトで検索します

 

記事が100を超えるJiaoを引用している場合、非常に重く、退屈で、エラーが発生しやすいので、前後に移動します。

次に、Pythonを使用して足跡を記述し、自動的にクエリを実行して、値をtxtに保存します。

ステップ:

最初のステップ:土井番号は、人の名前、年などの参照情報と混合され、Excelを使用して最初に値を抽出する必要があります

一部はhttp:doi / org /であり、一部は直接doiであるため、exclで直接検索して置換するため、* orgは* doiを置き換えてから、* doi /を置き換えます。 

土井番号を取得し、

2番目の部分では、フォーマットで保存してから、Excelのテキスト形式で保存する必要があります。そうしないと、数値は簡単に浮動小数点数になります。

第三部、Pythonを使用してExcelを読む

# coding:utf-8
import xlrd
class ExcelUtil():
    def __init__(self, excelPath, sheetName):
        self.data = xlrd.open_workbook(excelPath)
        self.table = self.data.sheet_by_name(sheetName)
        # 获取第一行作为key值
        self.keys = self.table.row_values(0)
        # 获取总行数
        self.rowNum = self.table.nrows
        # 获取总列数
        self.colNum = self.table.ncols

    def dict_data(self):
        if self.rowNum <= 1:
            print("总行数小于1")
        else:
            r = []
            j=1
            for i in range(self.rowNum-1):
                s = {}
                # 从第二行取对应values值
                values = self.table.row_values(j)
                for x in range(self.colNum):
                    s[self.keys[x]] = values[x]
                r.append(s)
                j+=1
            return r

if __name__ == "__main__":
    filepath = "D:\\test\\web-project\\5ke\\testdata.xlsx"
    sheetName = "Sheet1"
    data = ExcelUtil(filepath, sheetName)
    print(data.dict_data())

4番目のステップ:

最初はインターフェースを使ってみましたが、戻り値が間違っていました。気が変わったら、ウェブページを使って直接入手してください。

 

 

ステップ5:生成されたtxtファイルを表示する

完了です

 

注意点:最初にtxtを書き込むと、gbkを書き込めないと報告され、最後にencoding = utf-8が追加されました。

 毎回土井番号が取られるので、ddtモードで運転する必要があると思います

参考記事:https//www.cnblogs.com/zhongyehai/p/9560785.html

おすすめ

転載: blog.csdn.net/qq_43422918/article/details/101166851