正则表达式(regular expression,在**中常简写为regex、regexp或re)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了。
匹配双字节字符(包括汉字在内):[x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ascii字符计1)
匹配空白行的正则表达式:\s*
评注:可以用来删除空白行。
匹配html标记的正则表达式:<(s*?)
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力。
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式。
匹配email地址的正则表达式:\w+([w+)*w+([w+)*w+([w+)*
评注:表单验证时很实用。
匹配**url的正则表达式:[a-za-z]+:s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求。
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^a-za-z][a-za-z0-9_]$
评注:表单验证时很实用。
匹配国内**号码:\d-\d|\d-\d
评注:匹配形式如 0511-**或 021-**
匹配腾讯qq号:[1-9][0-9]
评注:腾讯qq号从10000开始。
匹配中国邮政编码:[1-9]\d(?!d)
评注:中国邮政编码为6位数字。
匹配身份证:\d|\d
评注:中国的身份证为15位或18位。
匹配ip地址:\d+\.d+\.d+\.d+
评注:提取ip地址时有用。
匹配特定数字:
^[1-9]\d*$ 匹配正整数。
^-[1-9]\d*$ 匹配负整数。
^-?1-9]\d*$ 匹配整数。
^[1-9]\d*|0$ /匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ /匹配非正整数(负整数 + 0)
^[1-9]\d*\.d*|0\.\d*[1-9]\d*$ 匹配正浮点数。
^-(1-9]\d*\.d*|0\.\d*[1-9]\d*)$匹配负浮点数。
^-?1-9]\d*\.d*|0\.\d*[1-9]\d*|0?\.0+|0)$ 匹配浮点数。
^[1-9]\d*\.d*|0\.\d*[1-9]\d*|0?\.0+|0$ /匹配非负浮点数(正浮点数 + 0)
^(-1-9]\d*\.d*|0\.\d*[1-9]\d*))0?\.0+|0$ /匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正。
匹配特定字符串:
^[a-za-z]+$匹配由26个英文字母组成的字符串。
^[a-z]+$匹配由26个英文字母的大写组成的字符串。
^[a-z]+$匹配由26个英文字母的小写组成的字符串。
^[a-za-z0-9]+$匹配由数字和26个英文字母组成的字符串。
^\w+$ 匹配由数字、26个英文字母或者下划线组成的字符串。
评注:最基本也是最常用的一些表达式。
常用正则表达式
2.d 非负整数 正整数 0 3.0 9 1 9 0 9 正整数。4.d 0 非正整数 负整数 0 5.0 9 1 9 0 9 负整数6.d 整数。7.d d 非负浮点数 正浮点数 0 8.0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 正浮点数。9.d d ...
常用正则表达式
表达式 0 9 功能 匹配1 20位数字。类型 数字。长度 1 20位。扩展 0 9 a za z0 9 功能 匹配5 20位以字母开头 可带数字 的字串。类型 以字母开头 可带数字 的字串。长度 5 20位。表达式 a za z 功能 匹配1 30位由大小写字母组成的串。类型 由大小写字母组成的串...
常用正则表达式
正则表达式用于字符串处理 表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。用户名 a z0 9 密码 a z0 9 十六进制值 a f0 9 a f0 9 电子邮箱 a z0 9da za z url httpsda za z w ip 地址 25 0 5 2 0 4 0 9 ...