Weibw's World Weibw's World
首页
  • HTML
  • Python

    • Python基础知识
    • Python CookBook第三版
    • Flask
  • MySQL

    • MySQL基础知识
    • MySQL调优
    • MySQL面试题
算法
  • FineReport
  • Kettle
  • Git
  • 微信公众号文章
  • 优秀博客文章
  • 其他
收藏夹
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Weibw

一个没有梦想的咸鱼
首页
  • HTML
  • Python

    • Python基础知识
    • Python CookBook第三版
    • Flask
  • MySQL

    • MySQL基础知识
    • MySQL调优
    • MySQL面试题
算法
  • FineReport
  • Kettle
  • Git
  • 微信公众号文章
  • 优秀博客文章
  • 其他
收藏夹
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 《Flask》

  • 《Python Cookbook》第三版

    • 第一章:数据结构与算法

      • 解压序列赋值给多个变量
      • 解压可迭代对象赋值给多个变量
      • 保留最后 N 个元素
      • 查找最大或最小的 N 个元素
      • 实现一个优先级队列
      • 字典中的键映射多个值
      • 字典排序
      • 字典的运算
      • 查找两字典的相同点
      • 删除序列相同元素并保持顺序
        • 命名切片
        • 序列中出现次数最多的元素
        • 通过某个关键字排序一个字典列表
        • 排序不支持原生比较的对象
        • 通过某个字段将记录分组
        • 过滤序列元素
        • 从字典中提取子集
        • 映射名称到序列元素
        • 转换并同时计算数据
        • 合并多个字典或映射
      • 第二章:字符串和文本

      • 第三章:数字日期和时间

      • 第四章:迭代器与生成器

      • 第五章:文件与IO

      • 第六章:数据编码和处理

      • 第七章:函数

      • 第八章:类与对象

      • 第九章:元编程

      • 第十章:模块与包

      • 第十一章:网络与Web编程

      • 第十二章:并发编程

      • 第十三章:脚本编程与系统管理

      • 第十四章:测试、调试和异常

      • 第十五章:C语言扩展

    • Python基础

    • Python
    • 《Python Cookbook》第三版
    • 第一章:数据结构与算法
    weibw
    2021-12-19

    删除序列相同元素并保持顺序

    # 问题

    怎样在一个序列上面保持元素顺序的同时消除重复的值?

    # 解决方案

    提示

    如果序列上的值都是 hashable 类型,那么可以很简单的利用集合或者生成器来解 决这个问题。

    比如:

    def dedupe(items):
    	seen = set()
    	for item in items:
    		if item not in seen:
    			yield item
    			seen.add(item)
    
    
    1
    2
    3
    4
    5
    6
    7

    下面是使用上述函数的例子:

    >>> a = [1, 5, 2, 1, 9, 1, 5, 10]
    >>> list(dedupe(a))
    [1, 5, 2, 9, 10]
    >>>
    
    1
    2
    3
    4

    这个方法仅仅在序列中元素为 hashable 的时候才管用。如果你想消除元素不可哈 希(比如 dict 类型)的序列中重复元素的话,你需要将上述代码稍微改变一下,就像 这样:

    def dedupe(items, key=None):
    	seen = set()
    	for item in items:
    		val = item if key is None else key(item)
    		if val not in seen:
    			yield item
    			seen.add(val)
    
    1
    2
    3
    4
    5
    6
    7

    这里的 key 参数指定了一个函数,将序列元素转换成 hashable 类型。下面是它的 用法示例:

    >>> a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]
    >>> list(dedupe(a, key=lambda d: (d['x'],d['y'])))
    [{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]
    >>> list(dedupe(a, key=lambda d: d['x']))
    [{'x': 1, 'y': 2}, {'x': 2, 'y': 4}]
    >>>
    
    1
    2
    3
    4
    5
    6

    如果你想基于单个字段、属性或者某个更大的数据结构来消除重复元素,第二种方 案同样可以胜任。

    # 讨论

    如果你仅仅就是想消除重复元素,通常可以简单的构造一个集合。比如:

    >>> a
    [1, 5, 2, 1, 9, 1, 5, 10]
    >>> set(a)
    {1, 2, 10, 5, 9}
    >>>
    
    1
    2
    3
    4
    5

    然而,这种方法不能维护元素的顺序,生成的结果中的元素位置被打乱。而上面的 方法可以避免这种情况。

    在本节中我们使用了生成器函数让我们的函数更加通用,不仅仅是局限于列表处 理。比如,如果如果你想读取一个文件,消除重复行,你可以很容易像这样做:

    with open(somefile,'r') as f:
    	for line in dedupe(f):
    		...
    
    1
    2
    3

    上述 key 函数参数模仿了 sorted() , min() 和 max() 等内置函数的相似功能。可 以参考 1.8 和 1.13 小节了解更多。

    编辑 (opens new window)
    #Python
    上次更新: 2023/10/13, 17:39:25
    查找两字典的相同点
    命名切片

    ← 查找两字典的相同点 命名切片→

    最近更新
    01
    牛客网非技术快速入门SQL练习题
    03-08
    02
    其他日常SQL题
    03-07
    03
    用户与权限管理
    03-05
    更多文章>
    Theme by Vdoing | Copyright © 2021-2023 | Weibw | 辽ICP备18015889号
    • 跟随系统
    • 浅色模式
    • 深色模式
    • 阅读模式