1. 解释正则表达式 <a\\s+href\\s*=\\s*”"?([^"" >]+)”"?>(.+)</a>各部分代表的含义。
\n
【解答】 此正则表达式用于匹配源文件中类似于搜狐新闻的字符串,各部分表示的含义为:
\n
\\s+ 一个或多个空白字符
\n
href 后接 HTML 定位点中的确切文本
\n
\\s* 零个或多个空白字符
\n
= 后接 HTML 定位点中的确切文本
\n
\\s* 零个或多个空白字符
\n
”"? 零或无引号(转义的)
\n
( 定义子字符串(定位点 URL)的组的起始点。
\n
[^"" >]+ 任意字符的一个或多个匹配项,括号中的字符除外。
\n
) 定义子字符串的第一组的结束
\n
”"? 零或无引号(转义的)
\n
> 后接 HTML 定位点中的确切文本
\n
(.+) 与任意字符(定位点文本)匹配的组。
\n
结束 HTML 定位点的确切文本
\n
2. 下面是检查输入字符串是否为有效的电子邮件的正则表达式:
\n
^([\\w-]+\\.)*?[\\w-]+@[\\w-]+\\.([\\w-]+\\.)*?[\\w]+
\n
试解释各部分的含义。
\n
【解答】
\n
[\\w-]+
\n
一个或多个任意字符(a-z、A-Z、0-9 以及下划线)或短划线。在@字符两边,确保地址形式为name@domainname。
\n
\\.
\n
一个转义点号。(不带反斜杠,一个点号与除换行符外的任意单个字符匹配。)以此确保域名中至少有一个点号。
\n
*?
\n
对前面的表达式,非贪婪(non-greedy,即最小)地查找零次或多次匹配。
\n
([\\w-]+\\.)*?
\n
以上三个表达式的组合:
\n
对于包含一个或多个任意字符(a-z、A-Z、0-9 以及下划线)或短划线并且后面只跟一个点号的表达式,非贪婪地查找零次或多次匹配。
\n
3. 写出符合下列要求的正则表达式:
\n
1) 要求4-8个英文字母。
\n
2) 不能包含字母,至少1个字符。
\n
3) 至少3个数字。
\n
4) 至少3个字符。
\n
5) 至少3个英文字母。
\n
6) 任意字符。
\n
7) 3个字母或数字,如123,r3a等。
\n
8) 3个点。
\n
9) @前至少有1个字符,@后至少有3个字符。
\n
10) 必须输入左括号。
\n
【解答】
\n
1) [a-zA-Z]{4,8}
\n
2) [^a-zA-Z]{1,}
\n
3) [0-9]{3,}
\n
4) {3,}
\n
5) [a-zA-Z]{3,}
\n
6) .{0,}
\n
7) [A-Za-z0-9]{3}
\n
8) \\.{3}
\n
9) .{1,}@ .{3,}
\n
10) \\(
\n