R 言語で PubMed-RISmed パッケージをエレガントに使用する方法

 PubMed は最大のライフサイエンス文献データベースの 1 つであり、トピックのキーワードを使用して検索すると、多数の文献が検索されます。これらの文書をどのように選別するか? キーワードの組み合わせを巧みに使用するだけでなく、R を使用してワンクリックで関連文書情報を抽出し、文書を迅速に閲覧することもできます。RISmed は、PubMed データベースから医学文献データを取得して分析するための R パッケージです。文献検索の実行、文献要約のダウンロード、著者情報の取得などに役立ちます。具体的な用途は以下の通りです。

# 安装加载包
#install.packages("RISmed") #未安装的需要首先安装RISmed包
library(RISmed)
## Warning: package 'RISmed' was built under R version 4.2.3
#查看使用说明
help(package="RISmed")
# 限定检索主题,如“gestational diabetes"
search_topic<-"gestational diabetes"
search_query<-EUtilsSummary(search_topic,db="pubmed",type="esearch",mindate=2018,maxdate=2023)
## Warning in any(is.na(WhichArgs)) || sapply(WhichArgs, length) > 1: 'length(x) =
## 2 > 1' in coercion to 'logical(1)'

これにより、キーワード「糖尿病」を含むレコードが検索されます。

#查看检索内容
summary(search_query)
## Query:
## ("diabetes, gestational"[MeSH Terms] OR ("diabetes"[All Fields] AND "gestational"[All Fields]) OR "gestational diabetes"[All Fields] OR ("gestational"[All Fields] AND "diabetes"[All Fields])) AND 2018/01/01:2023/12/31[Date - Entry] 
## 
## Result count:  12775
#获取摘要信息
records<- EUtilsGet(search_query)

class(records)
## [1] "Medline"
## attr(,"package")
## [1] "RISmed"
#str(records)
# 获取作者信息
authors <- Author(records)

これにより、文献要約から著者情報が抽出されます。

##提取检索结果
pubmed_data <- data.frame('Title'=ArticleTitle(records),

                           'Year'=YearAccepted(records),

                          'journal'=ISOAbbreviation(records))



head(pubmed_data)
##                                                                                                                                                                                          Title
## 1                                                   Preconceptional and prenatal exposure to air pollutants and risk of gestational diabetes in the MADRES prospective pregnancy cohort study.
## 2                                                                                                                                   Mechanism and recent updates on insulin-related disorders.
## 3                                                                         Environmental tobacco smoke increased risk of gestational diabetes mellitus: A birth cohort study in Sichuan, China.
## 4 Development and feasibility of a theory-guided and evidence-based physical activity intervention in pregnant women with high risk for gestational diabetes mellitus: a pilot clinical trial.
## 5                                                                       Association between serum copper level and reproductive health of Women in the United States: a cross-sectional study.
## 6                                                          Prediction of large-for-gestational age at 36 weeks' gestation: two-dimensional vs three-Dimensional vs magnetic resonance imaging.
##   Year                   journal
## 1 2023      Lancet Reg Health Am
## 2 2023        World J Clin Cases
## 3 2023    Diabetes Metab Res Rev
## 4 2023  BMC Pregnancy Childbirth
## 5   NA  Int J Environ Health Res
## 6 2023 Ultrasound Obstet Gynecol
pubmed_data[1:3,1]
## [1] "Preconceptional and prenatal exposure to air pollutants and risk of gestational diabetes in the MADRES prospective pregnancy cohort study."
## [2] "Mechanism and recent updates on insulin-related disorders."                                                                                
## [3] "Environmental tobacco smoke increased risk of gestational diabetes mellitus: A birth cohort study in Sichuan, China."
write.csv(pubmed_data,file='diabetes.csv')
##可视化一下

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
# 提取发表年份和文章数
pub_years <- YearPubmed(records)
article_counts <- table(pub_years)

# 创建数据框
data_df <- data.frame(Year = as.factor(names(article_counts)), Counts = as.integer(article_counts))

p<-ggplot(data=data_df, aes(x=Year, y=Counts,fill=Year)) +

  geom_bar(stat="identity", width=0.5)+

  labs(y = "Number of articles",title="PubMed articles containing diabetes"

       )+

  scale_fill_brewer(palette="Dark2")

p

購読ニュースをタイムリーに入手したい場合は、公式アカウント「Single Cell Society」を検索してください。 

おすすめ

転載: blog.csdn.net/qq_42458954/article/details/133939035