文字编码

文字编码的种类

程序中的文字处理

正则表达式

正则表达式基础

正则表达式的应用实例与鬼车

整数和浮点小数

深奥的整数世界

扑朔迷离的浮点小数时间

others

正则notes

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
正则表达式——是一个特殊的字符序列,一个字符串是否与我们所设定的字符序列相匹配
(爬虫)
快速检索文本,实现一些替换文本的操作

1.检查一串数字是否是电话号码
2.检测一个字符串是否符合email
3.把一个文本里指定的单词替换为另外一个单词】】】

JSON(XML)数据交互格式


a.index('Python') > -1
'python' in a


Import re

re.findall('Python',a)

所有字符串的问题都能用for in 循环解决

00:15:57

普通字符 'python'
元字符 '\d'


普通字符可以帮助定界
字符集
[]或
[ ] 里面是或关系


[^]

[a-d]

00:31:32



概括字符集
\d \D
\w 单词字符 [A-Za-z0-9_] \W
\s 空白字符 \S
. 匹配除换行符\n之外其他所有字符

匹配单一的字符


数量词:

[a-z]{3,6}
贪婪,非贪婪
默认倾向于贪婪的匹配方式

[a-z]{3,6}? 非贪婪

匹配*前的字符0次或者无限多次
匹配+前的字符1次或者无限多次
匹配?前的字符0次或者1

边界匹配!!!
^ $


() 里面是且的关系



模式
模式参数
re.I | re.S

re.sub('a', 'b', language, 1)

第二个参数可以是函数(设计方式,开放逻辑编写给用户)

可以根据匹配内容的不同,做判断,做字符的重新组合

Value.group()


re.match
re.search

.group()
.span()

.group(0) 完整匹配结果

.groups()

很好用的工具

解决字符串相关的问题

爬虫,校验