【kimol君的无聊小发明】—用python写论文下载器(图形化界面)

【kimol君的无聊小发明】—用python写论文下载器(图形化界面)

前言

某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~
当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码。我拍腿正坐,一个想法油然而生:“生活已然很无聊,不如再无聊些叭”。
于是,我决定开一个专题,便称之为kimol君的无聊小发明
妙…啊~~~

在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文。可以说,SCI-HUB造福了众多科研人员,用起来也是“美滋滋”。

上一篇文章中介绍了分析过程以及相应的函数代码。根据小伙伴们的反映发现了一些问题,毕竟命令框的形式用起来难免没那么“丝滑”。为了让大家更方便地使用,可以“纵享丝滑”,kimol君决定写一个图形界面(GUI):
ここに画像の説明を挿入
(PS.由于近期实属忙到晕厥,这是kimol君用疯狂压榨出来的时间写的,所以界面比较简陋,还望大家多多体谅哦~)

一、使用说明

这个小玩意儿我们姑且称之为“SCI-Downloader”好了~
它支持单篇论文下载批量论文下载

  1. 单篇下载:在论文标题栏输入论文的标题、DOI号或PMID号,然后选择论文存储的目录,点击开始即可!
  2. バッチダウンロード:論文のタイトルで.txtテキストを選択します。テキストには、ダウンロードする必要のある各論文が含まれています。形式は次のとおりです
    ここに画像の説明を挿入

    やってみて、何を待ってるの?

2.コード分析

このグラフィカルインターフェイスの開発はPyQT5に基づいています。ここでは、主に関数の実装を説明するために、特定のインターフェイスのレイアウトをあまり紹介しません。

実際、アイデアは非常に単純です。以前に紙のダウンロードに関連する関数がすでに存在するため、ボタンを定義してダウンロード関数にバインドするだけで済みます。
これは何ですか?難しいことではありません。ただし、試してみると、インターフェイスがスタックしていることがわかります。これは、ダウンロード機能に時間がかかるためです。メインスレッドで直接実行すると、インターフェースを維持しているメインプログラムと競合し、フリーズします。したがって、QThreadを使用して機能関数を実行し、コールバック関数を使用してインターフェイスを更新します。スケマティックダイアグラムは次のとおりです。
ここに画像の説明を挿入
もちろん、このスケマティックダイアグラムはそれほど厳密ではなく、弁証法で見てください。このように、各関数は、Qthreadクラスの関数関数コールバック関数、およびスレッド生成関数(この関数はButtonに直接バインドされています)の3つの部分に分割できます。

1.機能機能

Qthreadクラスを継承し、その中のrun関数を再定義します。これは、特定の関数を実装するモジュールであり、シグナルによって状態をコールバック関数に渡します。

class runthread(QtCore.QThread):
    #  通过类成员对象定义信号对象
    _signal = QtCore.pyqtSignal(str)
    
    def __init__(self, titleText, saveText):
        super(runthread, self).__init__()
        self.titleText = titleText
        self.saveText = saveText
 
    def __del__(self):
        self.wait()
 
    def run(self):
        if self.titleText == '' or self.saveText == '': # 如果为空
            self._signal.emit('EMPTY')
            return
        headers = {
    
    'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',
                   'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
                   'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
                   'Accept-Encoding':'gzip, deflate, br',
                   'Connection':'keep-alive',
                   'Upgrade-Insecure-Requests':'1'}
        if not self.titleText.endswith('.txt'): # 如果不为目录(即单篇论文标题)
            self._signal.emit('SEARCH')
            downUrl = search_article(self.titleText)
            if downUrl == '': # 如果搜索结果为空
                self._signal.emit('NULL')
                return
            else:
                try:
                    self._signal.emit('DOWNLOAD')
                    res = requests.get(downUrl, headers=headers, stream=True)
                    fileSize = int(res.headers['Content-Length'])
                    print(fileSize)
                    savedSize = 0
                    saveName = change_title(self.titleText)
                    with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
                        for chunk in res.iter_content(chunk_size=1024):
                            if chunk:
                                f.write(chunk)
                                savedSize += len(chunk)
                                progress = int(savedSize/fileSize*100)
                                self._signal.emit('PRO-%d'%progress)
                    self._signal.emit('SUCCESS')            
                except:
                    self._signal.emit('FAILED')
        else:
            paperList = read_file(self.titleText)
            if paperList == '':
                self._signal.emit('FILEWRONG')
            else:
                error = [] # 用于记录失败的论文
                self._signal.emit('BATCH-%d'%len(paperList))
                for i in range(len(paperList)):
                    try:
                        downUrl = search_article(paperList[i])
                        print(downUrl)
                        pdf = download_article(downUrl)
                        saveName = change_title(paperList[i])
                        with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
                            f.write(pdf)
                    except:
                        error.append(paperList[i])
                    self._signal.emit('NUM-%d'%(i+1)) 
                with open('./errors.txt', 'w') as f:
                    for e in error:
                        f.write(e+'\n')
                self._signal.emit('COMPLETED-%d'%len(error))

2.コールバック機能

機能機能からの信号を聞いて、エラーリマインダーやダウンロード完了リマインダーなどのインターフェイスを適宜更新します。

def call_backrun(self, msg):
    if msg == 'EMPTY':
        QtWidgets.QMessageBox.warning(self.centralwidget, '警告', '标题或目录为空!')
    if msg == 'SEARCH':
        self.runButton.setVisible(False)
        self.quitButton.setVisible(False)
        self.searchLabel.setVisible(True)
    if msg == 'NULL':
        self.runButton.setVisible(True)
        self.quitButton.setVisible(True)
        self.searchLabel.setVisible(False)
        QtWidgets.QMessageBox.information(self.centralwidget, '提示', '未搜到相应论文!')
    if msg == 'DOWNLOAD':
        self.searchLabel.setVisible(False)
        self.progressBar.setVisible(True)
        self.progressBar.setFormat('%%p')
        self.progressBar.setValue(0)
    if 'PRO' in msg:
        pro = int(msg.split('-')[-1])
        self.progressBar.setValue(pro)
    if msg == 'SUCCESS':
        self.progressBar.setVisible(False)
        self.runButton.setVisible(True)
        self.quitButton.setVisible(True)
        self.titleEdit.setText('')
        QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!')
    if msg == 'FAILED':
        self.progressBar.setVisible(False)
        self.runButton.setVisible(True)
        self.quitButton.setVisible(True)
        QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载失败!')
    if msg == 'FILEWRONG':
        QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文列表错误!')
    if 'BATCH' in msg:
        sumNumber = msg.split('-')[-1]
        self.runButton.setVisible(False)
        self.quitButton.setVisible(False)
        self.progressBar.setVisible(True)
        self.progressBar.setFormat('【%v/'+sumNumber+'】')
        self.progressBar.setMinimum(0)
        self.progressBar.setMaximum(int(sumNumber))
        self.progressBar.setValue(0)
    if 'NUM' in msg:
        num = int(msg.split('-')[-1])
        self.progressBar.setValue(num)
    if 'COMPLETED' in msg:
        errorNum = int(msg.split('-')[-1])
        self.progressBar.setVisible(False)
        self.runButton.setVisible(True)
        self.quitButton.setVisible(True)
        self.titleEdit.setText('')
        QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!\n(%d个失败)'%errorNum)

3.スレッド生成機能

この関数は対応するボタン(Button)にバインドされ、トリガーされると、対応する関数スレッドが作成されます。

def run(self):
    titleText = self.titleEdit.text()
    saveText = self.saveEdit.text()
    # 创建线程
    self.runthread = runthread(titleText, saveText)
    # 连接信号
    self.runthread._signal.connect(self.call_backrun)  # 进程连接回传到GUI的事件
    # 开始线程
    self.runthread.start()

4.エフェクト表示

終わったら、スタートボタンをクリック
ここに画像の説明を挿入
して魂を入力してください:無数の論文が私に向かって急いでいます〜

最後に書く

簡単なテストで、基本的に機能に大きな問題はありません。つまり、インターフェースは比較的シンプルかもしれません。将来的に時間があれば、更新を続けます。もちろん、貴重なものを提供していただければ幸いです。意見〜

また、誰もが使いやすいように、コードをexe実行可能ファイルにパッケージ化し、ダブルクリックして新しい世界への扉を開いてみませんか?

完全なコードSCIダウンローダーが必要な場合は、以下の公開アカウントに注意を払い、バックグラウンドで「のダウンロード」と返信して入手できます。キモルはあなたの訪問を楽しみにしています〜
ここに画像の説明を挿入

キモルくんです、またね〜
ここに画像の説明を挿入
创作不易,大侠请留步… 动起可爱的双手,来个赞再走呗 (๑◕ܫ←๑)

おすすめ

転載: blog.csdn.net/kimol_justdo/article/details/112996678