Weibw's World Weibw's World
首页
  • HTML
  • Python

    • Python基础知识
    • Python CookBook第三版
    • Flask
  • MySQL

    • MySQL基础知识
    • MySQL调优
    • MySQL面试题
算法
  • FineReport
  • Kettle
  • Git
  • 微信公众号文章
  • 优秀博客文章
  • 其他
收藏夹
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Weibw

一个没有梦想的咸鱼
首页
  • HTML
  • Python

    • Python基础知识
    • Python CookBook第三版
    • Flask
  • MySQL

    • MySQL基础知识
    • MySQL调优
    • MySQL面试题
算法
  • FineReport
  • Kettle
  • Git
  • 微信公众号文章
  • 优秀博客文章
  • 其他
收藏夹
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 《Flask》

  • 《Python Cookbook》第三版

    • 第一章:数据结构与算法

    • 第二章:字符串和文本

      • 使用多个界定符分割字符串
      • 字符串开头或结尾匹配
      • 用 Shell 通配符匹配字符串
      • 字符串匹配和搜索
      • 字符串搜索和替换
        • 字符串忽略大小写的搜索替换
        • 最短匹配模式
        • 多行匹配模式
        • 将 Unicode 文本标准化
        • 在正则式中使用 Unicode
        • 删除字符串中不需要的字符
        • 审查清理文本字符串
        • 字符串对齐
        • 合并拼接字符串
        • 字符串中插入变量
        • 以指定列宽格式化字符串
        • 在字符串中处理html和xml
        • 字符串令牌解析
        • 实现一个简单的递归下降分析器
        • 字节字符串上的字符串操作
      • 第三章:数字日期和时间

      • 第四章:迭代器与生成器

      • 第五章:文件与IO

      • 第六章:数据编码和处理

      • 第七章:函数

      • 第八章:类与对象

      • 第九章:元编程

      • 第十章:模块与包

      • 第十一章:网络与Web编程

      • 第十二章:并发编程

      • 第十三章:脚本编程与系统管理

      • 第十四章:测试、调试和异常

      • 第十五章:C语言扩展

    • Python基础

    • Python
    • 《Python Cookbook》第三版
    • 第二章:字符串和文本
    weibw
    2021-12-22

    字符串搜索和替换

    # 问题

    你想在字符串中搜索和匹配指定的文本模式

    # 解决方案

    对于简单的字面模式,直接使用 str.replace() 方法即可,比如:

    >>> text = 'yeah, but no, but yeah, but no, but yeah'
    >>> text.replace('yeah', 'yep')
    'yep, but no, but yep, but no, but yep'
    >>>
    
    1
    2
    3
    4

    对于复杂的模式,请使用 re 模块中的 sub() 函数。为了说明这个,假设你想将形 式为 11/27/2012 的日期字符串改成 2012-11-27 。示例如下:

    >>> text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
    >>> import re
    >>> re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)
    'Today is 2012-11-27. PyCon starts 2013-3-13.'
    >>>
    
    1
    2
    3
    4
    5

    sub() 函数中的第一个参数是被匹配的模式,第二个参数是替换模式。反斜杠数字 比如 \3 指向前面模式的捕获组号。 如果你打算用相同的模式做多次替换,考虑先编译它来提升性能。比如:

    >>> import re
    >>> datepat = re.compile(r'(\d+)/(\d+)/(\d+)')
    >>> datepat.sub(r'\3-\1-\2', text)
    'Today is 2012-11-27. PyCon starts 2013-3-13.'
    >>>
    
    1
    2
    3
    4
    5

    对于更加复杂的替换,可以传递一个替换回调函数来代替,比如:

    >>> from calendar import month_abbr
    >>> def change_date(m):
    ... mon_name = month_abbr[int(m.group(1))]
    ... return '{} {} {}'.format(m.group(2), mon_name, m.group(3))
    ...
    >>> datepat.sub(change_date, text)
    'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.'
    >>>
    
    1
    2
    3
    4
    5
    6
    7
    8

    一个替换回调函数的参数是一个 match 对象,也就是 match() 或者 find() 返回 的对象。使用 group() 方法来提取特定的匹配部分。回调函数最后返回替换字符串。

    如果除了替换后的结果外,你还想知道有多少替换发生了,可以使用 re.subn() 来代替。比如:

    >>> newtext, n = datepat.subn(r'\3-\1-\2', text)
    >>> newtext
    'Today is 2012-11-27. PyCon starts 2013-3-13.'
    >>> n
    2
    >>>
    
    1
    2
    3
    4
    5
    6

    # 讨论

    关于正则表达式搜索和替换,上面演示的 sub() 方法基本已经涵盖了所有。其实 最难的部分就是编写正则表达式模式,这个最好是留给读者自己去练习了。

    编辑 (opens new window)
    #Python
    上次更新: 2023/10/13, 17:39:25
    字符串匹配和搜索
    字符串忽略大小写的搜索替换

    ← 字符串匹配和搜索 字符串忽略大小写的搜索替换→

    最近更新
    01
    牛客网非技术快速入门SQL练习题
    03-08
    02
    其他日常SQL题
    03-07
    03
    用户与权限管理
    03-05
    更多文章>
    Theme by Vdoing | Copyright © 2021-2023 | Weibw | 辽ICP备18015889号
    • 跟随系统
    • 浅色模式
    • 深色模式
    • 阅读模式