sql >> データベース >  >> RDS >> Mysql

python pandasでグループ化して、一意のカウントといくつかの値のカウントを同じ列の集計として取得するにはどうすればよいですか?

    col4==3を含めて、前処理を行います 事前にコラムとして。次に、aggregateを使用します

    df.assign(result_col=df.col4.eq(3).astype(int)).groupby(
        ['col1', 'col2']
    ).agg(dict(col3='size', col4='nunique', result_col='sum'))
    
               col3  result_col  col4
    col1 col2                        
    1    4        2           2     1
         6        1           0     1
    

    古い回答

    g = df.groupby(['col1', 'col2'])
    g.agg({'col3':'size','col4': 'nunique'}).assign(
        result_col=g.col4.apply(lambda x: x.eq(3).sum()))
    
               col3  col4  result_col
    col1 col2                        
    1    4        2     1           2
         6        1     1           0
    

    少し並べ替え

    g = df.groupby(['col1', 'col2'])
    final_df = g.agg({'col3':'size','col4': 'nunique'})
    final_df.insert(1, 'result_col', g.col4.apply(lambda x: x.eq(3).sum()))
    final_df
    
               col3  result_col  col4
    col1 col2                        
    1    4        2           2     1
         6        1           0     1
    


    1. MySQL全文検索

    2. Oracle 10gが列のあいまいさについて文句を言わないのはなぜですか?

    3. 多くのCASEステートメントを使用したクエリ-最適化

    4. MySQLクエリ自体のJSON配列に格納されている値を取得するにはどうすればよいですか?