【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)

目录

一、研究意义

二、数据来源

三、读取数据

读取数据代码

运行结果截图

四、数据分析绘制箱线图

建立箱线图代码

运行结果截图 

五、建立回归模型

扫描二维码关注公众号,回复: 17276859 查看本文章

建立回归模型代码

 运行结果截图

有关于相关系数的计算与检验

 六、回归分析

确定回归方程

七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间

数据可视化

八、总结


 一、研究意义

GDP作为衡量一个国家经济发展的重要指标,被赋予了非常重要的意义,深刻反映着当下经济发展的现状。中美作为当今世界前两大经济体,在世界经济上有着极大占比并且主导着世界经济的走向。我将两国近十几年GDP进行研究建模模拟预测未来两国GDP的发展趋势从而分析出世界经济格局的变化。

二、数据来源

中经数据CEIdata(https://ceidata.cei.cn/)

三、读取数据

数据为csv文件,大家自行复制,单位均为亿美元。

美国GDP如下:

time usa
2005 130366.4
2006 138146.1
2007 144518.6
2008 147128.5
2009 144489.3
2010 149920.5
2011 155425.8
2012 161970.1
2013 167848.5
2014 175271.6
2015 182383
2016 187450.8
2017 194796.2
2018 205271.6
2019 213725.7
2020 208937.4
2021 229961

中国GDP如下:

time CN
2005 22859.66
2006 27521.32
2007 35503.43
2008 45943.07
2009 51017.03
2010 60871.64
2011 75515
2012 85322.3
2013 95704.07
2014 104756.8
2015 110615.5
2016 112332.8
2017 123104.1
2018 138948.2
2019 142799.4
2020 146876.7
2021 177340.6

读取数据代码

GDP1<-read.csv("CNGDP1.csv",header = TRUE)#中国GDP
GDP2<-read.csv("USGDP1.csv",header = TRUE)#美国GDP
GDP1
GDP2

运行结果截图

 

 四、数据分析绘制箱线图

建立箱线图代码

boxplot(GDP1[,2],GDP2[,2],names = c("中国GDP","美国GDP"),col = colors()[10:11],main="中国、美国 2005-2021 年GDP箱线图",ylab="GDP总量(亿美元)")

运行结果截图 

从图中可以看出,没有异常值。

五、建立回归模型

通过建立回归模型从而推导出回归方程,利用回归方程中的数值对中国和美国两国未来几十年GDP的走势进行预测,找到转折点,对未来世界的经济走势进行预测。

建立回归模型代码

#线性回归分析
#数据分析,确定回归方程
GDP1 <- ts(GDP1,start = 2005)
GDP2 <- ts(GDP2,start = 2005)
library(car)
#首先确定年份和中国GDP的关系:
scatterplot(GDP1[,2]~GDP1[,1],ylim=c(0,200000),data = GDP1,pch = 19,xlab = "年份",ylab="中国历年GDP值(亿)",cex.lab=0.8)
#确定年份和美国GDP的关系:
scatterplot(GDP2[,2]~GDP2[,1],ylim=c(130000,230000),data = GDP2,pch = 19,xlab = "年份",ylab="美国历年GDP值",cex.lab=0.8)

 运行结果截图

  • 随着年份增加,中国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示中国的GDP值对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

  • 随着年份增加,美国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示美国的GDP值基本上呈对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

有关于相关系数的计算与检验

cor(GDP1[,1],GDP1[,2])#中国

r=0.9939131相关性很强的正线性相关 

cor(GDP2[,2],GDP2[,1])#美国

#r=0.9840649 相关性很强的正线性相关 

 六、回归分析

确定回归方程

x1 <- GDP1[,1]
y1 <- GDP1[,2]
y2 <- GDP2[,2]
model1 <- lm(y1~x1) 
model2 <- lm(y2~x1) 
summary(model1) 

根据 summary() 函数展示的 model1(年份和中国GDP值)回归拟合的详细结果,可以计算出回归方程:y=9099×年份-18230000

summary(model2) # 展示拟合的详细结果

根据 summary() 函数展示的 model2(年份和美国GDP值)回归拟合的详细结果,可以计算出回归方程:y=5823×年份-11570000

七、预测中国美国未来的GDP值、预测中国的GDP赶超美国的时间

m <- 1
data1 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
data2 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
for(i in 2022:2080){
    a5 <- data.frame(x1=i)
    result1 <- predict(model1,a5)
    result2 <- predict(model2,a5)
    data1[m,1] <- i
    data1[m,2] <- result1
    data2[m,1] <- i
    data2[m,2] <- result2
    m <- m+1
}
data1
data2

    

左图为未来中国GDP预测,有图为未来美国GDP预测,在截图中我只展示了35年以后的预测结果,其中我们可以看出来以纯数据形式展现,观察发现可知,预计2038年时,中国GDP超过美国。

数据可视化

data1 <- ts(data1,start = 2019) # 建立时间序列
data2 <- ts(data2,start = 2019) # 建立时间序列
plot(data1[,2],ylim=c(0,710000),lwd=2,xlab="年份",ylab="GDP总值(亿)",main="预测2022-2080年度中国、美国GDP总值趋势图",type="n")
grid(col = "black")
lines(data1[,2],type="l",lwd=3,col="red")
lines(data2[,2],type="l",lwd=3,lty=10,col="blue")
legend(x="topleft",legend = c("中国GDP总值","美国GDP总值"),lty=1:4,col=c("red","blue"))

 

八、总结

通过模型计算我国GDP将在2038年超越美国。彼时世界经济中心向欧亚大陆的回归,几千年来世界第一强国一直都是亚欧大陆的国家。只有近100多年来是一个例外,被北美大陆的国家美国占据了世界第一强国的位置。国民生活水平很有可能会有一次大幅提升,中国将快速收割全球优质资产和廉价原料。至于政治地位,需要一个漫长的过程,全球很可能进入一个两主共治的局面

猜你喜欢

转载自blog.csdn.net/m0_73866147/article/details/131328625