松本行弘的程序世界-文字编码-正则-整数小数-阅读笔记
发布于:2021-11-29 14:47:17
访问:
文字编码
文字编码的种类
程序中的文字处理
正则表达式
正则表达式基础
正则表达式的应用实例与鬼车
整数和浮点小数
深奥的整数世界
扑朔迷离的浮点小数时间
others
正则notes
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
| 正则表达式——是一个特殊的字符序列,一个字符串是否与我们所设定的字符序列相匹配 (爬虫) 快速检索文本,实现一些替换文本的操作
1.检查一串数字是否是电话号码 2.检测一个字符串是否符合email 3.把一个文本里指定的单词替换为另外一个单词】】】
JSON(XML)数据交互格式
a.index('Python') > -1 'python' in a
Import re
re.findall('Python',a)
所有字符串的问题都能用for in 循环解决
00:15:57
普通字符 'python' 元字符 '\d'
普通字符可以帮助定界 字符集 []或 [ ] 里面是或关系
[^]
[a-d]
00:31:32
概括字符集 \d \D \w 单词字符 [A-Za-z0-9_] \W \s 空白字符 \S . 匹配除换行符\n之外其他所有字符
匹配单一的字符
数量词:
[a-z]{3,6} 贪婪,非贪婪 默认倾向于贪婪的匹配方式
[a-z]{3,6}? 非贪婪
匹配*前的字符0次或者无限多次 匹配+前的字符1次或者无限多次 匹配?前的字符0次或者1次
边界匹配!!! ^ $
组 () 里面是且的关系
模式 模式参数 re.I | re.S
re.sub('a', 'b', language, 1)
第二个参数可以是函数(设计方式,开放逻辑编写给用户)
可以根据匹配内容的不同,做判断,做字符的重新组合
Value.group()
re.match re.search
.group() .span()
.group(0) 完整匹配结果
.groups()
很好用的工具
解决字符串相关的问题
爬虫,校验
|
感谢鼓励