dask.bag.Bag.distinct
dask.bag.Bag.distinct¶
- Bag.distinct(key=None)[源代码]¶
集合中的不同元素
无序且不重复。
- 参数
- 键: {callable,str}
通过在每个项目上调用
key
来定义包中项目的唯一性。如果传递了一个字符串,key
被视为lambda x: x[key]
。
示例
>>> import dask.bag as db >>> b = db.from_sequence(['Alice', 'Bob', 'Alice']) >>> sorted(b.distinct()) ['Alice', 'Bob'] >>> b = db.from_sequence([{'name': 'Alice'}, {'name': 'Bob'}, {'name': 'Alice'}]) >>> b.distinct(key=lambda x: x['name']).compute() [{'name': 'Alice'}, {'name': 'Bob'}] >>> b.distinct(key='name').compute() [{'name': 'Alice'}, {'name': 'Bob'}]