- 合并 merge,join,append,concat
- 分组 groupby
- 透视 pivot_table,pivot
- 计算 cunsum,count,sum,eval()
- 行列转换melt
-
1.合并merge,concat
merge,concat,append,join
-
merge基本代码
pd.merge(left,right,how='left',on='key1') -
concat
-
append
-
join
-
2.分组 groupby
df.groupby('依据汇总的列')['column'].agg() df.groupby('依据汇总的列')['column'].sum() df.groupby(['Gender', 'Age']) df.groupby('依据汇总的列')['column'].agg{'a':sum(),a:mean()} df.groupby('name').agg(lambda x :)groupby文章分享 1. 语法 2. 几种用法 1. df.groupby('column')[list].mean() 2. df.groupby(''column')['list'].agg({"a":mean(),a:sum()}) 3. groupby.apply# 分类汇总 df.loc[(df['入库类型']=='进货入库')&(df['记账日期']>'2021-3-1'),['记账日期','货号','合格']].groupby('记账日期').sum()> 注意使用引号,不然会出 ```python res1 = cj_in.groupby(['货号','品名规格']) .agg({'合格':'sum','货号':'count'}).tail(5)- groupby.apply
g.apply(lambda x: x.max() - x.min())3.透视 pivot_table
pd.pivot_table(tb,columns=,row=,)
df.pivot_table(index='quyu',columns='c',values=['销售额','数量'],aggfunc='sum')df.pivot_table(index='quyu',columns='c',values=['销售额','数量'], aggfunc={ '销售额':'mean', '利润额':'sum' })#fill_value填充空值,margins=True进行汇总 pd.pivot_table(df,index=[u'主客场'],columns=[u'对手'],values=[u'得分'],aggfunc=[np.sum],fill_value=0,margins=1) -
4.计算
-
pd.value_count
-
5. 整理
-
pipe