在 Python Pandas 中删除多列中的所有重复行
该pandas
drop_duplicates
功能非常适合“唯一化”数据框。但是,要传递的关键字参数之一是take_last=True
or
take_last=False
,而我想删除在列子集中重复的所有行。这可能吗?
A B C0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
例如,我想删除与列匹配的行A
,C
因此这应该删除第 0 行和第 1 行。
回答:
现在使用drop_duplicates和
keep 参数在 pandas 中要容易得多。
import pandas as pddf = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)
以上是 在 Python Pandas 中删除多列中的所有重复行 的全部内容, 来源链接: www.h5w3.com/z/755928.html