pandas笔记:groupby整理

这篇具有很好参考价值的文章主要介绍了pandas笔记:groupby整理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

0 数据集

# Visual Python: Data Analysis > File
vp_df = pd.read_csv('https://raw.githubusercontent.com/visualpython/visualpython/main/visualpython/data/sample_csv/fish.csv')
vp_df

pandas笔记:groupby整理,pandas,笔记

 1 单列聚合

vp_df.groupby('Type')['Kg'].mean()
'''
Type
mackerel     1.417456
salmon       5.996645
tuna        18.038317
Name: Kg, dtype: float64
'''

按照Type 聚类,聚类后将同组的Kg属性合并,求均值

聚合的内容可以是 max, min, mean, unique(唯一值), nunique(唯一值数量),lambda 表达式

1.1 单列聚合多个操作

vp_df.groupby('Type')[['Kg']].agg(['mean','max'])

pandas笔记:groupby整理,pandas,笔记  

1.2 单列聚合多个属性

vp_df.groupby('Type')[['Kg','Depth']].mean()

 pandas笔记:groupby整理,pandas,笔记

 按照Type 聚类,聚类后将同组的Kg、Depth属性合并,求均值

1.3 单列聚合多个属性多个操作

vp_df.groupby('Type')[['Kg','Depth']].agg(['mean','max'])

pandas笔记:groupby整理,pandas,笔记

 1.4 多列聚合

vp_df.groupby(['Type','Depth']).agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

 pandas笔记:groupby整理,pandas,笔记

 2 对聚合结果重命名

重命名的名字=(需要操作的列名,需要的操作名)

vp_df.groupby('Type').agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

pandas笔记:groupby整理,pandas,笔记

 3 生成了多少个组 ngroups

vp_df.groupby(['Type','Depth']).ngroups
#1500

4 每一个不同的group 各有多少个元素

vp_df.groupby(['Type']).count()

 pandas笔记:groupby整理,pandas,笔记

4.1 使用reset_index

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count()
'''
LONCOL  LATCOL
36      63        3
        64        2
        65        1
        66        1
        67        8
                 ..
182     44        1
183     44        2
184     44        1
185     44        2
186     43        5
Name: VehicleNum, Length: 3382, dtype: int64
'''

 

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count().reset_index()

pandas笔记:groupby整理,pandas,笔记 

参考内容:Python数据分组处理必备:pandas groupby (qq.com) 文章来源地址https://www.toymoban.com/news/detail-602991.html

到了这里,关于pandas笔记:groupby整理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 【Python】Pandas Groupby操作的25个示例

    【Python】Pandas Groupby操作的25个示例

    在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在Pandas中,

    2024年02月03日
    浏览(7)
  • 分组聚合不再难:Pandas groupby使用指南

    分组聚合不再难:Pandas groupby使用指南

    处理大量数据时,经常需要对数据进行分组和汇总, groupby 为我们提供了一种简洁、高效的方式来实现这些操作,从而简化了数据分析的流程。 分组 是指根据一个或多个列的值将数据分成多个组,每个组包含具有相同键值(这里的键值即用来分组的列值)的数据行。 聚合

    2024年03月09日
    浏览(13)
  • pandas数据分析——groupby得到分组后的数据

    pandas数据分析——groupby得到分组后的数据

    Pandas怎样实现groupby聚合后字符串列的合并(四十) pandas—groupby如何得到分组里的数据 在处理时间序列的数据中,有时候会遇到有些日期的数据缺失的情况,这时候可以用pandas的 date_range 函数快速补齐缺失日期,再根据实际情况补齐缺失值。 常用参数为: start :指定生成时

    2024年02月11日
    浏览(9)
  • Pandas.DataFrame.groupby() 数据分组(数据透视、分类汇总) 详解 含代码 含测试数据集 随Pandas版本持续更新

    Pandas.DataFrame.groupby() 数据分组(数据透视、分类汇总) 详解 含代码 含测试数据集 随Pandas版本持续更新

    关于Pandas版本: 本文基于 pandas2.2.0 编写。 关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。 传送门: Pandas API参考目录 传送门: Pandas 版本更新及新特性 传送门: Pandas 由浅入深系列教程 DataFrame.groupby() 方法用于使用映射器或指定的列,对 D

    2024年01月16日
    浏览(10)
  • 【pandas基础】--数据整理

    pandas 进行数据整理的意义在于,它是数据分析、数据科学和机器学习的前置步骤。 通过数据整理可以提前了解数据的概要,缺失值、重复值等情况,为后续的分析和建模提供更为可靠的数据基础。 本篇主要介绍利用 pandas 进行数据整理的各种方法。 获取数据概要信息可以帮

    2024年02月04日
    浏览(8)
  • Matpoltlib && Pandas 学习笔记

    目录 Matplotlib matplotlib常用方法 散点图 饼图 直方图 Pandas pandas.Series(*args)参数说明 DataFrame 数据结构 CSV file 数据清洗 Matplotlib 定义: Matplotlib 是python的绘图库 Pyplot 是其子库,通用绘制2D图表, matplotlib常用方法 散点图 饼图 直方图 Pandas 全称: \\\'panel data\\\' and \\\'python data analysis\\\'

    2024年01月24日
    浏览(10)
  • pandas 笔记:高亮内容

    pandas 笔记:高亮内容

     1.1.1 默认情况 1.1.2  color 调整高亮的颜色(后同)  1.1.3 subset 指定操作的列(后同) 1.1.4 props  突出显示的CSS属性(后同)   subset color props 同1.1 2.1.1 axis 默认为0,表示列 axis=1,表示行  axis=None, dataFrame中最大的那个 参数和使用方法和max一样 2.2.1 链式调用min和max 还是使用

    2024年02月15日
    浏览(10)
  • pandas笔记

    pandas笔记

    如读取前13列所有行的值 原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed: 使用如下代码去掉原文件的第一行

    2024年02月08日
    浏览(23)
  • 【Python数据处理】-Pandas笔记

    【Python数据处理】-Pandas笔记

    Pandas是一个强大的Python数据处理库,它提供了高效的数据结构和数据分析工具,使数据处理变得简单而快速。本篇笔记将介绍Pandas中最常用的数据结构——Series和DataFrame,以及数据处理的各种操作和技巧。 (一)创建Series Series是Pandas中的一维数组,类似于带有标签的NumPy数组

    2024年02月12日
    浏览(12)
  • Python学习笔记(十七)——Pandas库

    Python学习笔记(十七)——Pandas库

    数组只能存储一种类型的数据, 同时, 数组提供了许多方便统计计算的功能 (如平均值 mean 、标准差 std 等) pandas 是基于 numpy 数组构的, 但 二者最大的不同是 pandas 是专门为处 理表格和混杂数据设计的,比较契合统 计分析中的表结构,而 numpy 更适合处 理统一的数值数组

    2024年02月04日
    浏览(16)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包