1. 合并 merge,join,append,concat
  2. 分组 groupby
  3. 透视 pivot_table,pivot
  4. 计算 cunsum,count,sum,eval()
  5. 行列转换melt
  • 1.合并merge,concat

    merge,concat,append,join

  • merge基本代码

    pd.merge(left,right,how='left',on='key1') 
  • concat

  • append

  • join

    数据拼接merge、concat、append、join

  • 2.分组 groupby

    超好用的Pandas Groupby详解

    groupby代码

    df.groupby('依据汇总的列')['column'].agg()
    df.groupby('依据汇总的列')['column'].sum()
    df.groupby(['Gender', 'Age'])
    df.groupby('依据汇总的列')['column'].agg{'a':sum(),a:mean()}
    df.groupby('name').agg(lambda x :)
     
    groupby文章分享
    
    1. 语法
    2. 几种用法
    1. df.groupby('column')[list].mean()
    2. df.groupby(''column')['list'].agg({"a":mean(),a:sum()})
    3. groupby.apply
    
    
    # 分类汇总
    df.loc[(df['入库类型']=='进货入库')&(df['记账日期']>'2021-3-1'),['记账日期','货号','合格']].groupby('记账日期').sum()
    > 注意使用引号,不然会出
    
    ```python
    res1 = cj_in.groupby(['货号','品名规格'])
      .agg({'合格':'sum','货号':'count'}).tail(5)
    
    
    • groupby.apply
    g.apply(lambda x: x.max() - x.min())

    3.透视 pivot_table

    pd.pivot_table(tb,columns=,row=,)

    df.pivot_table(index='quyu',columns='c',values=['销售额','数量'],aggfunc='sum')
    df.pivot_table(index='quyu',columns='c',values=['销售额','数量'],
    aggfunc={
    '销售额':'mean',
    '利润额':'sum'
    })
    #fill_value填充空值,margins=True进行汇总
    pd.pivot_table(df,index=[u'主客场'],columns=[u'对手'],values=[u'得分'],aggfunc=[np.sum],fill_value=0,margins=1)

    img

  • 4.计算

  • pd.value_count

  • 5. 整理

  • pipe