description |
---|
Count the occurrence of values in columns per groups |
danfo.Groupby.count() [source]
Parameters: None
Return: DataFrame
Examples
Obtain the number of rows per groups
{% tabs %} {% tab title="Node" %}
const dfd = require("danfojs-node")
let data ={A: ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
B: ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
C: [1,3,2,4,5,2,6,7],
D: [3,2,4,1,5,6,7,8]
}
let df = new dfd.DataFrame(data)
let grp = df.groupby(["A"])
let grpColumnC = grp.col(["C"])
grpColumnC.count().print()
{% endtab %} {% endtabs %}
╔═══╤═══════════════════╤═══════════════════╗
║ │ A │ C_count ║
╟───┼───────────────────┼───────────────────╢
║ 0 │ foo │ 5 ║
╟───┼───────────────────┼───────────────────╢
║ 1 │ bar │ 3 ║
╚═══╧═══════════════════╧═══════════════════╝
Obtain the count for two columns for each group, group by one column
{% tabs %} {% tab title="Node" %}
const dfd = require("danfojs-node")
let data ={A: ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
B: ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
C: [1,3,2,4,5,2,6,7],
D: [3,2,4,1,5,6,7,8]
}
let df = new dfd.DataFrame(data)
let grp = df.groupby(["A"])
grp.col(["C","D"]).count().print()
{% endtab %} {% endtabs %}
Shape: (2,3)
╔═══╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ C_count │ D_count ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ foo │ 5 │ 5 ║
╟───┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ bar │ 3 │ 3 ║
╚═══╧═══════════════════╧═══════════════════╧═══════════════════╝
Obtain the count for all columns for each group, group by one column
{% tabs %} {% tab title="Node" %}
const dfd = require("danfojs-node")
let data ={A: ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
B: ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
C: [1,3,2,4,5,2,6,7],
D: [3,2,4,1,5,6,7,8]
}
let df = new dfd.DataFrame(data)
let grp = df.groupby(["A"])
grp.count().print()
{% endtab %} {% endtabs %}
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B_count │ C_count │ D_count ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ foo │ 5 │ 5 │ 5 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ bar │ 3 │ 3 │ 3 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
Obtain the count for a column for each group, group by two columns
{% tabs %} {% tab title="Node" %}
const dfd = require("danfojs-node")
let data ={A: ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
B: ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
C: [1,3,2,4,5,2,6,7],
D: [3,2,4,1,5,6,7,8]
}
let df = new dfd.DataFrame(data)
let grp = df.groupby(["A","B"])
grp.col(["C"]).count().print()
{% endtab %} {% endtabs %}
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C_count ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ foo │ one │ 2 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ foo │ two │ 2 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ foo │ three │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ bar │ one │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 4 │ bar │ three │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 5 │ bar │ two │ 1 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╝
Obtain the count for two columns for each group, group by two columns
{% tabs %} {% tab title="Node" %}
const dfd = require("danfojs-node")
let data ={A: ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
B: ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
C: [1,3,2,4,5,2,6,7],
D: [3,2,4,1,5,6,7,8]
}
let df = new dfd.DataFrame(data)
let grp = df.groupby(["A","B"])
grp.col(["C","D"]).count().print()
{% endtab %} {% endtabs %}
╔════════════╤═══════════════════╤═══════════════════╤═══════════════════╤═══════════════════╗
║ │ A │ B │ C_count │ D_count ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 0 │ foo │ one │ 2 │ 2 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 1 │ foo │ two │ 2 │ 2 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 2 │ foo │ three │ 1 │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 3 │ bar │ one │ 1 │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 4 │ bar │ three │ 1 │ 1 ║
╟────────────┼───────────────────┼───────────────────┼───────────────────┼───────────────────╢
║ 5 │ bar │ two │ 1 │ 1 ║
╚════════════╧═══════════════════╧═══════════════════╧═══════════════════╧═══════════════════╝