自定义标题
基本用法
library(ggplot2)
让样本可重复
set.seed(1410)
在diamonds
数据集中随机取100个数据
dsmall <- diamonds[sample(nrow(diamonds), 100), ]
画图,默认点图
qplot(carat, price, data = diamonds)
这张图显示出了变量之间很强的相关关系,以及一些很明显的异常值,此外,可以看出在竖直方向上有一些有趣的条纹。这种相关关系似乎是指数型的,因此我们应该首先对变量进行一些变换。由于qplot()
支持将变量的函数作为参数,因此我们可以画出log(price)
对log(carat)
的图形:
qplot(log(carat), log(price), data = diamonds)
现在这种关系就接近于线性了。然而,由于图中的元素有很大的重叠,所以我们在下结论时需要小心。
函数的参数同样可以是已有变量的某种组合。例如,如果我们对钻石的体积(用x×y×z
近似)和其重量之间的关系感兴趣,那么我们可以这样做:
qplot(carat, x * y * z, data = diamonds)
颜色、颜色、大小、形状和其他图形属性
将 color 变量映射到点的颜色 (上),cut 变量映射到点的形状 (下)
qplot(carat, price, data = dsmall, colour = color)
qplot(carat, price, data = dsmall, shape = cut)
将 alpha 值从 1/10(上) 变动到 1/100(中) 再到1/200(下),来看大部分的点在哪里 进行重叠。
qplot(carat, price, data = diamonds, alpha = I(1/10))
qplot(carat, price, data = diamonds, alpha = I(1/100))
qplot(carat, price, data = diamonds, alpha = I(1/200))