バックグラウンド:
誰かが論文を書いたので、参考情報の内容を調べる必要があります。最初のステップは、その人の名前と年を使用して、引用文献または記事と記事のdoiを照会することです。役に立たない場合は、 Baiduの記事をコピーすることもできます。
2番目のステップは、doi番号を取得し、Webサイトで検索します
記事が100を超えるJiaoを引用している場合、非常に重く、退屈で、エラーが発生しやすいので、前後に移動します。
次に、Pythonを使用して足跡を記述し、自動的にクエリを実行して、値をtxtに保存します。
ステップ:
最初のステップ:土井番号は、人の名前、年などの参照情報と混合され、Excelを使用して最初に値を抽出する必要があります
一部はhttp:doi / org /であり、一部は直接doiであるため、exclで直接検索して置換するため、* orgは* doiを置き換えてから、* doi /を置き換えます。
土井番号を取得し、
2番目の部分では、フォーマットで保存してから、Excelのテキスト形式で保存する必要があります。そうしないと、数値は簡単に浮動小数点数になります。
第三部、Pythonを使用してExcelを読む
# coding:utf-8
import xlrd
class ExcelUtil():
def __init__(self, excelPath, sheetName):
self.data = xlrd.open_workbook(excelPath)
self.table = self.data.sheet_by_name(sheetName)
# 获取第一行作为key值
self.keys = self.table.row_values(0)
# 获取总行数
self.rowNum = self.table.nrows
# 获取总列数
self.colNum = self.table.ncols
def dict_data(self):
if self.rowNum <= 1:
print("总行数小于1")
else:
r = []
j=1
for i in range(self.rowNum-1):
s = {}
# 从第二行取对应values值
values = self.table.row_values(j)
for x in range(self.colNum):
s[self.keys[x]] = values[x]
r.append(s)
j+=1
return r
if __name__ == "__main__":
filepath = "D:\\test\\web-project\\5ke\\testdata.xlsx"
sheetName = "Sheet1"
data = ExcelUtil(filepath, sheetName)
print(data.dict_data())
4番目のステップ:
最初はインターフェースを使ってみましたが、戻り値が間違っていました。気が変わったら、ウェブページを使って直接入手してください。
ステップ5:生成されたtxtファイルを表示する
完了です
注意点:最初にtxtを書き込むと、gbkを書き込めないと報告され、最後にencoding = utf-8が追加されました。
毎回土井番号が取られるので、ddtモードで運転する必要があると思います