R语言 | 数据分析——统计绘图

这篇具有很好参考价值的文章主要介绍了R语言 | 数据分析——统计绘图。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、分类数据的图形描述

1.1 条形图barplot()函数

1.2 饼图pie()函数

 二、量化数据的图形描述

2.1 点图与dotchart()函数

2.2 绘图函数plot()

 2.2.1 绘制时间数列对象

​2.2.2 向量数据与plot()函数

2.2.3 数据框数据与plot()函数

2.2.4  因子型数据与plot()函数

​2.2.5 使用lines()函数绘制回归线

​2.2.6 使用abline()函数绘制线条

​2.2.7 控制其他绘图的参数说明

​三、在一个页面内绘制多张图表的应用

 四、新建窗口


一、分类数据的图形描述

分类(质化)数据的描述绘图,相对比较简单,主要有条形图与饼图,均可以直观地进行各个类别间次数或者量化多寡的比较。

1.1 条形图barplot()函数

条形图又可分为垂直条形图和水平条形图,主要是用来标示某变量的数据变化,我们可以使用barplot()函数。有关barplot()绘图函数的使用格式如下:

barplot(height,width=1,space=NULL,horiz=FALSE,xlim=NULL,ylim=NULL,legend.text=NULL,main=NULL,xlab=NULL,ylab=NULL)
  • height:可以为向量或者矩阵提供长条的高度值。
  • width:直方图每一长条的宽度。
  • space:直方图两相邻长条的间隔。
  • horiz:逻辑值,若为FALSE绘制的是直立式,反之则绘制水平式。
  • legend.text:一个文字向量作为图例说明。
  • main:绘图的抬头文字及副抬头文字。
  • xlab,ylab:x轴及y轴的标签。
  • xlim,ylim:x轴及y轴的数值界限。

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图 

可以看到部分岛屿的名称未显示,加大宽度即可显示如下图所示:

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

1.2 饼图pie()函数

饼图(也称圆瓣图)适合表示分类数据中各个不同类别的数据占总数的比例,因此可以说是分类数据下相对次数分布表的图示。

有关pie()绘图函数的使用格式如下:

pie(x,labels=names(x),radius=0.8,clockwise=FALSE,main=NULL,...)
  •  x:一个非负向量,决定饼图每一部分面积大小的比例。
  • labels:一个文字向量,决定饼图每一部分的名称说明。
  • radius:饼图的半径长度,数值在-1与1之间,超过1时会有部分图被切割。
  • clockwise:逻辑值,表示将所给数值按顺时针或逆时针绘图。
  • col:一组向量,表达饼图每一部分的颜色。
  • main:饼图的标题文字。

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 

 二、量化数据的图形描述

一般常见的单变量量化数据的统计图形有点图、直方图、箱形图等。它们都能够清楚地表达数据的分布情况。以下将使用点图、直方图与箱形图来描述量化数据。

2.1 点图与dotchart()函数

R语言中的点图是使用dotchart()函数来绘制的。水平轴是用来表示数值出现的额次数;垂直轴则是用来表示数值数据变量值的范围,每一点代表某一个数值出现了几次。所以由点图就能够了解书记实际出现在哪些数值即隐含的分配情形,也能够迅速地得到数值数据的众数。由于dotchart()绘图函数的使用格式如下:

dotchart(x,labels=NULL,groups=NULL,gdata=NULL,cex=par("cex"),pch=21,gpch=21,bg=par("bg"),color=par("fg"),gcolor=par("fg"),lcolor="gray",xlim=range(x[is.finite(x)]),main=NULL,xlab=NULL,ylab=NULL,...)
  • x:可以是向量或者矩阵(使用列)。
  • labels:数据的标签。
  • groups:列出数据如何分组,若为矩阵,则以列进行分组。
  • gdata:标示出使用什么样的统计方式作为绘图的依据。
  • cex:绘图字符的大小。
  • pch:绘图字符,默认是21,代表空心圆。
  • gpch:不同的分组分别使用什么字符绘图。
  • bg:背景颜色。
  • color:标签与绘图点的颜色。
  • gcolor:分组标签与值得颜色。
  • lcolor:绘制水平线得颜色。

R语言 | 数据分析——统计绘图 

R语言 | 数据分析——统计绘图在R语言系统中有一个系统内建的矩阵对象VADeaths,这个对象记录1940年美国Virginia州每1000人的死亡率,其中年龄层划分为50~54、55~59、60~64、65~69、70~74。同时区分乡村男性与女性,城市男性与女性。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 上述dotchart()函数,通过设定参数pch可设定点的形状,默认是"pch=19",代表实心圆,其他几个常用的数值及意义如下:

  • pch=20:项目符号,小一点的实现圆(约2/3大小)。
  • pch=21:空心圆。
  • pch=22:空心正方形。
  • pch=23:空心菱形。
  • pch=24:空心箭头向上的三角形。
  • pch=25:空心箭头向下的三角形。
  • 此外,还可以通过xlim参数设定x轴的区间大小。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

2.2 绘图函数plot()

plot()函数其实是一个通用函数,它会依据所输入的对象,自行分配适当的绘图函数执行需要的任务。此函数可绘制两数值变量的散点图,可以从中观察出两数值变量间的线性相关性。当然plot()函数也被用来绘制table、factor以及ts等对象的统计图,只是应用于不同的对象时绘制出来的图形也会有所不同。

有关plot()函数的使用格式如下:

plot(x,y,...)
  •  x:x数值向量数据,不同的对象可以绘制出不同的结果。
  • y:y数值向量数据,视x有无情况而定。
  • type:绘图的形式。"p"为点;"L"为线;"b"为两者;"o"为重叠;"h"为直方图;"s"为阶梯形;"n"为不绘图。
  • main,sub,xlab,ylab:标题、次标题、x轴标签、y轴标签。
  • asp:y/x(y对比与x)的比值。

 2.2.1 绘制时间数列对象

我们首先绘制时间序列(ts)图,也就是在图上依时间序列绘出唯一提供的数值向量。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图上述参数“type=",将直接影响所绘制的类型,预设type="l",表示各点间用直线连接。 

(1)type=p:点

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 (2)type=b:点和线

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

(3)type=c:"type=b"的线部分

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图(4)type=o:重叠"type=a"和"type=b"两种图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图

(5)type=h:垂直线图

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 2.2.2 向量数据与plot()函数

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 加上州名:

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

由上述执行结果可以看到,我们已经成功使用text()函数为数据标签加上州名称了。另外在text()函数内,参数adj的作用主要是指出标签数据的对齐方式。这是一个含两个元素的向量,它的可能值是0、0.5、1,分别表示靠左/靠下、中间、靠右/靠上对齐。

2.2.3 数据框数据与plot()函数

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图美国黄石国家公园有一个著名的景点老实泉,它会按固定时间喷发温泉。在R语言系统内有一个数据集faithful,这个数据集记录每次温泉喷发的时间长短和两次喷发之间的时间间隔,两个数据的单位均是分钟。

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图其实也可以设定标记符号的背景颜色,此时可以使用"bg='参数,以类似"col="的方式设定符号的背景色。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

2.2.4  因子型数据与plot()函数

另外一个常用的对象格式是factor,如果我们提供的数据是原始的类别,并使用了as.factor()函数,则plot()函数会自动汇总因子变量的数据分布,并绘制成为条形图,这对于分类数据的分析与绘图是相当有帮助的。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图当我们提供的x向量为因子变量,而y向量为数值向量,则所绘制的plot图形为各个因子变量的箱形图。

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 2.2.5 使用lines()函数绘制回归线

当我们了解如何绘制上述数据图后,也可以使用上述数据图绘制回归线,步骤如下:

(1)使用lm()函数可以建立最简单的线性模型。

(2)接着我们可以使用fitted()函数,从回归模型中获得拟合值。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 2.2.6 使用abline()函数绘制线条

 若在abline()函数内加上参数"v=",则可以绘制垂直线。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 若在abline()函数内加上参数"h="则可以绘制水平线。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 其实abline()函数也是一个通用函数,也可以直接绘出faithful数据图的回归线。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 2.2.7 控制其他绘图的参数说明

 R语言 | 数据分析——统计绘图

(1)las参数

las(label style),可用于设定坐标轴的标签角度,它的可能指如下所示:

  • 0:默认值,坐标轴的标签与坐标轴平行。
  • 1:坐标轴的标签保持水平。
  • 2:坐标轴的标签与坐标轴保持垂直。
  • 4:坐标轴的标签保持垂直。

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图 

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图 

R语言 | 数据分析——统计绘图 (2)bty参数

bty(box type),可用于设定外框类型,它的可能值如下:

  • "o":默认值,绘出完整的图表外框。
  • "n":不绘制图表外框。
  • "1" "7" "c" "u" "]":可根据这些参数对应的字符形状,绘出边框。

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 

(3)cex参数

cex(character expansion ratio),这个参数可用于设定图表标签、坐标轴标签和坐标轴刻度的文字大大小。它的默认值是1,若此值小于1则字缩小,若此值大于1则字放大。它的使用方式如下:

  • cex.main:设定图表标签大小。
  • cex.lab:设定坐标轴标签。
  • cex.axis:设定坐标轴刻度。

R语言 | 数据分析——统计绘图

  三、在一个页面内绘制多张图表的应用

如果想要在单张页面内放置多张图表,需使用两个参数,分别是mfrow和mfcol,由此设定一个页面要放置多少张图,mfrow可控制1行的图表数,mfcol可控制1列的图表数,这两个参数将接收一个含两个元素的向量。

如果想要设定1行有2张图,则其设定如下所示:

mfrow=c(1,2)

如果想要设定1列有2张图,则其设定如下所示:

mfcol=c(2,1)

如果想要设定一张页面有4张图,可以设定如下所示:

mfrow=c(2,2)

另外,我们还需要使用par()函数,将上述设定放入par()函数,若想结束目前单个页面放置多张图的状态,也需将上述设定放入par()函数。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图

 四、新建窗口

R语言系统允许新建一个窗口显示所建的数据文件,可以使用dev.new()函数,代码如下:

使用后应关闭窗口,如果没有关闭,则所有绘图均在此窗口显示。

关闭窗口使用函数dev.off()。

此时之前所建窗口关闭,未来又将在Rstudio右下方窗口显示所建的数据图。

R语言 | 数据分析——统计绘图

R语言 | 数据分析——统计绘图 R语言 | 数据分析——统计绘图文章来源地址https://www.toymoban.com/news/detail-443074.html

到了这里,关于R语言 | 数据分析——统计绘图的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • R语言生物群落(生态)数据统计分析与绘图实践技术应用

    R 语言作的开源、自由、免费等特点使其广泛应用于生物群落数据统计分析。生物群落数据多样而复杂,涉及众多统计分析方法。以生物群落数据分析中的最常用的统计方法回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法为主线,通过多个来自经典研究中

    2024年02月08日
    浏览(11)
  • 第3章-指标体系与数据可视化-3.2-描述性统计分析与绘图

    目录 变量的度量类型 变量的分布类型 正态分布 对数正态分布  伽马分布

    2024年02月07日
    浏览(21)
  • AI大语言模型GPT & R 生态环境领域数据统计分析

      自2022年GPT(Generative Pre-trained Transformer)大语言模型的发布以来,它以其卓越的自然语言处理能力和广泛的应用潜力,在学术界和工业界掀起了一场革命。在短短一年多的时间里,GPT已经在多个领域展现出其独特的价值,特别是在数据统计分析领域。GPT的介入为数据处理、

    2024年03月14日
    浏览(9)
  • 5.Python数据分析项目之文本分类-自然语言处理

    5.Python数据分析项目之文本分类-自然语言处理

    预测类数据分析项目 流程 具体操作 基本查看 查看缺失值(可以用直接查看方式isnull、图像查看方式查看缺失值missingno)、查看数值类型特征与非数值类型特征、一次性绘制所有特征的分布图像 预处理 缺失值处理(填充)拆分数据(获取有需要的值) 、统一数据格式、特征

    2024年02月03日
    浏览(26)
  • 【案例实践】R语言多元数据统计分析在生态环境中的实践应用

    【案例实践】R语言多元数据统计分析在生态环境中的实践应用

    查看原文R语言生物群落分析绘图、多元统计分析、CMIP6、遥感碳储量、GEE林业、InVEST等 生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是

    2023年04月12日
    浏览(11)
  • R语言-数据分析及建模(第1节)分类与预测问题简介

    R语言-数据分析及建模(第1节)分类与预测问题简介

    小伙伴们,今天我们学习R语言-数据分析及建模(第1节)分类与预测问题简介 01-分类与预测问题简介 ◆ 分类和预测 是预测问题的两种主要类型,分类主要是预测分类标号(离散属性) ,而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。 ◆ 分类 是构

    2024年02月16日
    浏览(1)
  • R语言 一种功能强大的数据分析、统计建模 可视化 免费、开源且跨平台 的编程语言

    R语言 一种功能强大的数据分析、统计建模 可视化 免费、开源且跨平台 的编程语言

    R语言是一种广泛应用于数据分析、统计建模和可视化的编程语言。它由新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发,并于1993年首次发布。R语言是一个免费、开源且跨平台的语言,它在统计学和数据科学领域得到了广泛的应用。 R语言具有丰富的数据处理、统计分

    2024年02月07日
    浏览(16)
  • R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享...

    R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享...

    综合社会调查(GSS)是由国家舆论研究中心开展的一项观察性研究。自 1972 年以来,GSS 一直通过收集当代社会的数据来监测社会学和态度趋势。其目的是解释态度、行为和属性的趋势和常量。从 1972 年到 2004 年,GSS 的目标人群是居住在家庭中的成年人(18 岁以上) ( 点击文

    2024年02月10日
    浏览(47)
  • R语言绘图:实现数据点的线性拟合,进行显著性分析(R-squared、p-value)、添加公式到图像

    R语言绘图:实现数据点的线性拟合,进行显著性分析(R-squared、p-value)、添加公式到图像

    最近在做关于数据点线性拟合相关的研究,感觉R语言在这方面很方便,而且生成的图片很漂亮,所以在这里和大家分享一下代码。 这是别人所绘制的拟合图像,很漂亮,自己也用iris鸢尾花数据集进行一个线性拟合看看: 拟合线性模型最基本的函数就是 lm() ,格式为:myfit

    2024年02月11日
    浏览(9)
  • pandas数据分析之数据绘图

    pandas数据分析之数据绘图

    一图胜千言,将信息可视化(绘图)是数据分析中最重要的工作之一。它除了让人们对数据更加直观以外,还可以帮助我们找出异常值、必要的数据转换、得出有关模型的想法等等。pandas 在数据分析、数据可视化方面有着较为广泛的应用。本文将通过实例介绍pandas的数据绘图

    2024年02月10日
    浏览(8)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包