松本行弘的程序世界-文字编码-正则-整数小数-阅读笔记 - 前端技术分享

文字编码

文字编码的种类

程序中的文字处理

正则表达式

正则表达式基础

正则表达式的应用实例与鬼车

整数和浮点小数

深奥的整数世界

扑朔迷离的浮点小数时间

others

正则notes

正则表达式——是一个特殊的字符序列，一个字符串是否与我们所设定的字符序列相匹配
（爬虫）
快速检索文本，实现一些替换文本的操作

1.检查一串数字是否是电话号码
2.检测一个字符串是否符合email
3.把一个文本里指定的单词替换为另外一个单词】】】

JSON（XML）数据交互格式


a.index('Python') > -1
'python' in a


Import re

re.findall('Python',a)

所有字符串的问题都能用for in 循环解决

00:15:57

普通字符 'python'
元字符 '\d'


普通字符可以帮助定界
字符集
[]或
[ ] 里面是或关系


[^]

[a-d]

00:31:32



概括字符集
\d \D 
\w 单词字符 [A-Za-z0-9_] \W
\s 空白字符 \S
. 匹配除换行符\n之外其他所有字符

匹配单一的字符


数量词：

[a-z]{3,6}
贪婪，非贪婪
默认倾向于贪婪的匹配方式

[a-z]{3,6}? 非贪婪

匹配*前的字符0次或者无限多次
匹配+前的字符1次或者无限多次
匹配？前的字符0次或者1次

边界匹配！！！
^ $

组
() 里面是且的关系



模式
模式参数
re.I | re.S

re.sub('a', 'b', language, 1)

第二个参数可以是函数(设计方式，开放逻辑编写给用户)

可以根据匹配内容的不同，做判断，做字符的重新组合

Value.group()


re.match
re.search 

.group()
.span()

.group(0) 完整匹配结果

.groups()

很好用的工具

解决字符串相关的问题

爬虫，校验