dask.bag.Bag.distinct

dask.bag.Bag.distinct

Bag.distinct(key=None)[源代码]

集合中的不同元素

无序且不重复。

参数
键: {callable,str}

通过在每个项目上调用 key 来定义包中项目的唯一性。如果传递了一个字符串,key 被视为 lambda x: x[key]

示例

>>> import dask.bag as db
>>> b = db.from_sequence(['Alice', 'Bob', 'Alice'])
>>> sorted(b.distinct())
['Alice', 'Bob']
>>> b = db.from_sequence([{'name': 'Alice'}, {'name': 'Bob'}, {'name': 'Alice'}])
>>> b.distinct(key=lambda x: x['name']).compute()
[{'name': 'Alice'}, {'name': 'Bob'}]
>>> b.distinct(key='name').compute()
[{'name': 'Alice'}, {'name': 'Bob'}]