松本行弘的程序世界-文字编码-正则-整数小数-阅读笔记
    
    
        发布于:2021-11-29 14:47:17
        
        
        访问:
    
    
        文字编码
文字编码的种类
程序中的文字处理
正则表达式
正则表达式基础
正则表达式的应用实例与鬼车
整数和浮点小数
深奥的整数世界
扑朔迷离的浮点小数时间
others
正则notes
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
   | 正则表达式——是一个特殊的字符序列,一个字符串是否与我们所设定的字符序列相匹配 (爬虫) 快速检索文本,实现一些替换文本的操作
  1.检查一串数字是否是电话号码 2.检测一个字符串是否符合email 3.把一个文本里指定的单词替换为另外一个单词】】】
  JSON(XML)数据交互格式
 
  a.index('Python') > -1 'python' in a
 
  Import re
  re.findall('Python',a)
  所有字符串的问题都能用for in 循环解决
  00:15:57
  普通字符 'python' 元字符 '\d'
 
  普通字符可以帮助定界 字符集 []或 [ ] 里面是或关系
 
  [^]
  [a-d]
  00:31:32
 
 
  概括字符集 \d \D  \w 单词字符 [A-Za-z0-9_] \W \s 空白字符 \S . 匹配除换行符\n之外其他所有字符
  匹配单一的字符
 
  数量词:
  [a-z]{3,6} 贪婪,非贪婪 默认倾向于贪婪的匹配方式
  [a-z]{3,6}? 非贪婪
  匹配*前的字符0次或者无限多次 匹配+前的字符1次或者无限多次 匹配?前的字符0次或者1次
  边界匹配!!! ^ $
  组 () 里面是且的关系
 
 
  模式 模式参数 re.I | re.S
  re.sub('a', 'b', language, 1)
  第二个参数可以是函数(设计方式,开放逻辑编写给用户)
  可以根据匹配内容的不同,做判断,做字符的重新组合
  Value.group()
 
  re.match re.search 
  .group() .span()
  .group(0) 完整匹配结果
  .groups()
  很好用的工具
  解决字符串相关的问题
  爬虫,校验
 
   | 
 
        
            
    
        
    
    
        
         感谢鼓励