在 Python Pandas 中删除多列中的所有重复行

pandasdrop_duplicates功能非常适合“唯一化”数据框。但是,要传递的关键字参数之一是take_last=Trueor

take_last=False,而我想删除在列子集中重复的所有行。这可能吗?

    A   B   C

0 foo 0 A

1 foo 1 A

2 foo 1 B

3 bar 1 A

例如,我想删除与列匹配的行AC因此这应该删除第 0 行和第 1 行。

回答:

现在使用drop_duplicates和

keep 参数在 pandas 中要容易得多。

import pandas as pd

df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})

df.drop_duplicates(subset=['A', 'C'], keep=False)

以上是 在 Python Pandas 中删除多列中的所有重复行 的全部内容, 来源链接: www.h5w3.com/z/755928.html

回到顶部