pandas笔记：groupby整理

这篇具有很好参考价值的文章主要介绍了pandas笔记：groupby整理。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

0 数据集

# Visual Python: Data Analysis > File
vp_df = pd.read_csv('https://raw.githubusercontent.com/visualpython/visualpython/main/visualpython/data/sample_csv/fish.csv')
vp_df

pandas笔记：groupby整理,pandas,笔记

1　单列聚合

vp_df.groupby('Type')['Kg'].mean()
'''
Type
mackerel     1.417456
salmon       5.996645
tuna        18.038317
Name: Kg, dtype: float64
'''

按照Type 聚类，聚类后将同组的Kg属性合并，求均值

聚合的内容可以是 max, min, mean, unique（唯一值）, nunique（唯一值数量），lambda 表达式

1.1 单列聚合多个操作

vp_df.groupby('Type')[['Kg']].agg(['mean','max'])

pandas笔记：groupby整理,pandas,笔记

1.2 单列聚合多个属性

vp_df.groupby('Type')[['Kg','Depth']].mean()

pandas笔记：groupby整理,pandas,笔记

按照Type 聚类，聚类后将同组的Kg、Depth属性合并，求均值

1.3 单列聚合多个属性多个操作

vp_df.groupby('Type')[['Kg','Depth']].agg(['mean','max'])

pandas笔记：groupby整理,pandas,笔记

1.4 多列聚合

vp_df.groupby(['Type','Depth']).agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

pandas笔记：groupby整理,pandas,笔记

2 对聚合结果重命名

重命名的名字=（需要操作的列名，需要的操作名）

vp_df.groupby('Type').agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

pandas笔记：groupby整理,pandas,笔记

3 生成了多少个组 ngroups

vp_df.groupby(['Type','Depth']).ngroups
#1500

4 每一个不同的group 各有多少个元素

vp_df.groupby(['Type']).count()

pandas笔记：groupby整理,pandas,笔记

4.1 使用reset_index

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count()
'''
LONCOL  LATCOL
36      63        3
        64        2
        65        1
        66        1
        67        8
                 ..
182     44        1
183     44        2
184     44        1
185     44        2
186     43        5
Name: VehicleNum, Length: 3382, dtype: int64
'''

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count().reset_index()

pandas笔记：groupby整理,pandas,笔记

参考内容：Python数据分组处理必备：pandas groupby (qq.com) 文章来源地址https://www.toymoban.com/news/detail-602991.html

到了这里，关于pandas笔记：groupby整理的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

pandas笔记：groupby整理

0 数据集

1　单列聚合

1.1 单列聚合多个操作

1.2 单列聚合多个属性

1.3 单列聚合多个属性多个操作

1.4 多列聚合

2 对聚合结果重命名

3 生成了多少个组 ngroups

4 每一个不同的group 各有多少个元素

4.1 使用reset_index

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2