#视频演示 <video width="90%" controls=""><source src="http://other.iremaker.com/82e8bb2a68d92d0d55dc82b9071b6717251f91a7fd1e09becdeadc26bc577e9c.mp4?v=lrk7hTV51v" type="video/mp4">您的浏览器不支持 video 标签。</video> #文件讲解 <a style="text-decoration:none;" href="http://other.iremaker.com/f53ae25442db78d7fe36f12f2a6a20ce9cf7dd8e00c00680124d9b5d58cc1a23.docx?v=FluW8JUZEf">word文档下载 <img src="/static/images/download.png"/></a> ### 1、目标 (1)演示day2作业 (2)正则匹配的字符类型 ### 2、详解 ##### (1)day2作业 1、《第一本精品书》有多少个格式如下的三级标题: `<h3 class="sect3" id="txt005_4">一 作为地方文艺“飘逸一 派”的晚明越中乡贤</h3>` 分析:寻找共性,找出差别,差别用元字符表示即可。标黄即是共性: <div align=center>![](http://img.iremaker.com/68b512102594e21fe2db2546891939d782e944688735eec9176e405a5cb14339.jpg?v=FjIf2Z_DYC)</div> ------------ <div align=center>![](http://img.iremaker.com/b41adf141dded84e4c5d9f4df81c7522ffb21099f1789accbb138f22b5540f9e.jpg?v=Fkqn7EMiI2)</div> ------------ 2、查询《第一本精品书里》有多少张行内图?格式如下: `<img alt="img" class="picture_character" src="../Images/txt006_3.png" />` 分析共性如下标黄: <div align=center>![](http://img.iremaker.com/ec40dae66a5d3a91289200823742300d6ed834c4c21d48ec5e7b4c8ae543bfae.jpg?v=FjTfMPWym4)</div> ------------ <div align=center>![](http://img.iremaker.com/c7086004fb2f98596b3e49299c0ddb77381c5c3b6778396fbc00323772a23b37.jpg?v=FvRuFsqWq3)</div> ------------ ##### (2)正则匹配的字符类型 之前讲过.可以匹配除换行外的任一字符,如果我要匹配数字怎么办?比如: 我们只想匹配开头是数字的段落,若用 `<p.*>.*</p>`这样会把所有段落都匹配上,范围太大。处理这种场景,就是我们下面要讲的。 |代码|匹配类型|举例| | ------------ | ------------ | ------------ | |\d|任一数字|正则式\d+,可以匹配:0,9,18,50000等任意数字| |\D|任一非数字|正则式\D{5},可以匹配:where,锄禾日当午| |\w|任一英文字母、数字和下划线_(还有汉字)|正则式\w{2,5},可以匹配:what,Ad_12,DAYS,1123| |\W|非\w|正则式\W{2,},可以匹配:??——| |\s|任一空字符:空格、换行符、制表符等|正则式\w+\s+\w+,可以匹配:hello world| |\S|任一非空字符|正则式\S+\s+\S+,可以匹配:hello 王二| |[]|匹配中括号中的任一字符,支持范围|正则式[5asW]+,可以匹配:555,ssss,aW5sWss…(视频讲解这里有误)| |[^]|非中括号中的任一字符|正则式[^5asW]+,可以匹配:4367,ASV8,AAA…| |^|字符串开始位置|| |$|字符串结束位置|| |\b|单词边界|正则式\bthe\b,可以匹配:there is some water in the glass 中的the,而没有there| |\n|只匹配换行符|| |\|转义用字符|正则式\.,只能匹配英文的句号.| **几点注意:** `\d == [0-9]` `\w == [0-9a-zA-Z_]` `^`、`$`、`\b`匹配的是位置,不是具体的字符 查询任一汉字:`[\u4e00-\u9fa5]` **正则查询[、]、^、$、? 需要转义:\[、\]、\^、\$、\?** ### 3、作业 (1)找出《第一本快排书》中,没有“三”字的三级标题。 (2)找出年份有多少个,比如 1985年