[2020-09-22]医薬品情報の取得APP

免責事項:この記事は調査および研究のみを目的としており、違法な目的での使用は禁じられています。それ以外の場合は、自己責任で行ってください。違反がある場合は、通知して削除してください。ありがとうございます。

プロジェクトシーン:


住所:aHR0cDovL2FwcDEubm1wYS5nb3YuY24vZGF0YV9ubXBhL2ZhY2UzL2Jhc2UuanNwP3RhYmxlSWQ9MjUmdGFibGVOYW1lPVRBQkxFMjUmdGl0bGU9JUU1JTlCJUJEJUU0JUJBJUE3JUU4JThEJUFGJUU1JTkzJTgxJmJjSWQ9MTUyOTA0NzEzNzYxMjEzMjk2MzIyNzk1ODA2NjA0
  1. データインターフェイスには6SQk6G2z暗号化パラメータがあり、詳細ページにはc1SoYK0a暗号化パラメータがあります。これら2つのパラメータがどのように発生するかを知っている限り、サイト全体のデータ取得を解決できます。しかし、最近、ページのフロントエンドでデバッグして、彼を見つけました。リクエスト+ポストリクエストインターフェースで取得したデータです。途中のパラメータを暗号化するプロセスはプレーンテキストでは表示されません。JSコードの変数名と関数名は完全に混乱していて元に戻せません。たぶん私はそれを見つけるのがばかげています。誰かがそれを知っているなら、それができることを願っています。弟にやり方を教えて〜
    ここに写真の説明を挿入

  2. セレンを使用してデータを取得すると、いくつかの問題が発生します。長時間クロールするとページがクラッシュします。プロキシIPが必要です。クロール速度が遅いなど、...

問題の説明:

このように考えると、Webからデータを取得するのは良い方法ではないので、彼のAPPにアクセスし、リンクを取得して彼のAPPでデータを要求し、次のツールを準備して、操作を開始します。
  1. フィドラーパケットキャプチャツール。
  2. MuMuシミュレーターまたは携帯電話(ブロガーはシミュレーターを使用しているため、操作が不便な場合がありますので、携帯電話の使用をお勧めします〜)。
  3. 彼のAPP:リンクをシミュレーターまたは携帯電話にインストールします
  4. 電話のバッグをつかむことができませんか?良い〜リンクを投稿するhttps://www.jianshu.com/p/724097741bdf

解決:


1.ツールを設定したら、パケットのキャプチャを開始できます。まず、フィドラーによってキャプチャされたリクエストをクリアしてから、APPでドラッグをクリックします。

ここに写真の説明を挿入

2.非常に良いです、データは私たちによってキャプチャされました。リンクを投稿してください。最初に上の写真で丸で囲んだ円の右上を見てください。導入する必要のあるいくつかのパラメータがあります。
  1. tableId:薬剤タイプID(つまり、各列の一意のID)
  2. pageIndex:現在のページ番号
  3. pageSize:ページあたりのデータ量
次に、取得したjsonデータをフォーマットすると、各データのタイトルが表示されます。
# 链接--这里注意下,访问链接时需要使用安卓的请求头哦~
http://mobile.nmpa.gov.cn/datasearch/QueryList?tableId=25&searchF=Quick%20SearchK&pageIndex=1&pageSize=15
[
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟龙中风丸 (86901343001160 国药准字Z20020147 沈阳红药集团股份有限公司)",
        "ID":"109228"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟龄集 (86902884000629 国药准字Z14020687 山西广誉远国药有限公司)",
        "ID":"73590"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟黄补酒 (86901890000661;86901890000678;86901890000654 国药准字Z20026072 远大医药黄石飞云制药有限公司)",
        "ID":"102841"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾胶囊 (86905098000638 国药准字Z20123109 广西华天宝药业有限公司)",
        "ID":"120532"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾片 (86900427000075 国药准字Z20080217 广东心宝药业科技有限公司)",
        "ID":"41884"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾片 (86903249000087 国药准字Z20090420 郑州福瑞堂制药有限公司)",
        "ID":"133086"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾口服液 (86900291000263 国药准字Z44023432 广东华天宝药业集团有限公司(药品上市许可持有人))",
        "ID":"108891"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾丸 (86900415000308 国药准字Z44020148 广州花城药业有限公司)",
        "ID":"142930"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾丸 (86900291000294 国药准字Z44022779 广东华天宝药业集团有限公司)",
        "ID":"66724"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿补肾丸 (86900291000270 国药准字Z44022778 广东华天宝药业集团有限公司(药品上市许可持有人))",
        "ID":"114636"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿益肾胶囊 (86905004000028 国药准字B20020196 湖南康寿制药有限公司)",
        "ID":"155866"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿滋肾丸 (86900008000272 国药准字Z11020387 北京宝树堂科技药业有限公司)",
        "ID":"161886"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿滋肾丸 (86905156002598 国药准字Z45020433 广西梧州制药(集团)股份有限公司)",
        "ID":"158752"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿滋肾丸 (86905156002604 国药准字Z45020432 广西梧州制药(集团)股份有限公司)",
        "ID":"117237"
    },
    {
    
    
        "COUNT":162127,
        "CONTENT":"龟鹿滋肾丸 (86900256000413 国药准字Z44023076 国药集团冯了性(佛山)药业有限公司)",
        "ID":"73911"
    }
]

3. OK、次に詳細ページでパッケージを取得します。ここでは、次のパラメーターにも注意を払う必要があります。
  1. tableId:薬剤タイプID(つまり、各列の一意のID)
  2. searchK:リストページで取得したデータのID
# 链接
http://mobile.nmpa.gov.cn/datasearch/QueryRecord?tableId=25&searchF=ID&searchK=109228

ここに写真の説明を挿入

4.要求されたデータを見てください。データはウェブ上のデータと同じです。対応するデータを取得するには、要求リストページのURLを作成するだけです。(他の列のデータは賢いあなたが取得できると思います〜)
[
    {
    
    
        "NAME":"批准文号",
        "CONTENT":"国药准字Z20020147"
    },
    {
    
    
        "NAME":"产品名称",
        "CONTENT":"龟龙中风丸"
    },
    {
    
    
        "NAME":"英文名称",
        "CONTENT":""
    },
    {
    
    
        "NAME":"商品名",
        "CONTENT":""
    },
    {
    
    
        "NAME":"剂型",
        "CONTENT":"丸剂(水丸)"
    },
    {
    
    
        "NAME":"规格",
        "CONTENT":"每30丸重5g"
    },
    {
    
    
        "NAME":"上市许可持有人",
        "CONTENT":""
    },
    {
    
    
        "NAME":"生产单位",
        "CONTENT":"沈阳红药集团股份有限公司"
    },
    {
    
    
        "NAME":"生产地址",
        "CONTENT":"沈阳市大东区北大营西路2号"
    },
    {
    
    
        "NAME":"产品类别",
        "CONTENT":"中药"
    },
    {
    
    
        "NAME":"批准日期",
        "CONTENT":"2015-07-30"
    },
    {
    
    
        "NAME":"原批准文号",
        "CONTENT":""
    },
    {
    
    
        "NAME":"药品本位码",
        "CONTENT":"86901343001160"
    },
    {
    
    
        "NAME":"药品本位码备注",
        "CONTENT":""
    },
    {
    
    
        "NAME":"注",
        "CONTENT":"企业用户如对药品数据信息有疑问,请及时与我局信息中心数据整理组联系,来电前请备好相应的批件证明材料以备工作人员查询。电话:88331520(工作日);企业用户也可通过发邮件与我们联系:邮件地址[email protected],邮件主题请注明“药品批件问题”,邮件正文中请准确填写以下全部信息:1.药品批准文号/注册证号;2.药品批件号;3.药品批件类型(注册批件、补充批件、包材注册证、药品标准颁布件、再注册批件、其他);4.问题描述(500字以内);5.企业名称(全称);6.统一社会信用代码;7.联系人姓名;8.联系电话(手机和座机);9.电子邮件。以上内容请勿直接以电子邮件附件形式发送。",
        "DESCRIPTION":"企业用户如对药品数据信息有疑问,请及时与我局信息中心数据整理组联系,来电前请备好相应的批件证明材料以备工作人员查询。电话:88331520(工作日);企业用户也可通过发邮件与我们联系:邮件地址[email protected],邮件主题请注明“药品批件问题”,邮件正文中请准确填写以下全部信息:1.药品批准文号/注册证号;2.药品批件号;3.药品批件类型(注册批件、补充批件、包材注册证、药品标准颁布件、再注册批件、其他);4.问题描述(500字以内);5.企业名称(全称);6.统一社会信用代码;7.联系人姓名;8.联系电话(手机和座机);9.电子邮件。以上内容请勿直接以电子邮件附件形式发送。"
    }
]

注:リクエストで直接リクエストしてデータを取得することはできません。Cookieがないため、Cookieは主にneCYtZEjo8​​GmSとneCYtZEjo8​​GmTです。セレンを使用してCookie情報を取得することをお勧めします。数分で期限切れになります。

おすすめ

転載: blog.csdn.net/qq_26079939/article/details/108732969