正则表达式主要用来查询和替换符合某个模式(规则)的文本内容。例如,从一个文件中提取电话号码,查找一篇文章中重复的单词、替换文章中的敏感语汇等,这些地方都可以使用正则表达式。正则表达式强大且灵活,常用于非常复杂的查询。
MySQL 中,使用关键字指定正则表达式的字符匹配模式,其基本语法格式如下:
属性名 REGEXP ‘匹配方式’
其中,“属性名”表示需要查询的字段名称;“匹配方式”表示以哪种方式来匹配查询。“匹配方式”中有很多的模式匹配字符,它们分别表示不同的意思。下表列出了 REGEXP 操作符中常用的匹配方式。
选项 | 说明 | 例子 | 匹配值示例 |
---|---|---|---|
匹配文本的开始字符 | ‘^b’ 匹配以字母 b 开头的字符串 | book、big、banana、bike | |
匹配文本的结束字符 | ‘st$’ 匹配以 st 结尾的字符串 | test、resist、persist | |
匹配任何单个字符 | ‘b.t’ 匹配任何b 和 t 之间有一个字符 | bit、bat、but、bite | |
匹配零个或多个在它前面的字符 | ‘f*n’ 匹配字符 n 前面有任意个字符 f | fn、fan、faan、abcn | |
匹配前面的字符 1 次或多次 | ‘ba+’ 匹配以 b 开头,后面至少紧跟一个 a | ba、bay、bare、baTTLe | |
匹配包含指定字符的文本 | ‘fa’ 匹配包含‘fa’的文本 | fan、afa、faad | |
[字符集合] | 匹配字符集合中的任何一个字符 | ‘[xz]’ 匹配 x 或者 z | dizzy、zebra、x-ray、extra |
匹配不在括号中的任何字符 | ‘[^abc]’ 匹配任何不包含 a、b 或 c 的字符串 | desk、fox、f8ke | |
字符串{n,} | 匹配前面的字符串至少 n 次 | ‘b{2}’ 匹配 2 个或更多的 b | bbb、bbbb、bbbbbbb |
字符串{n,m} | 匹配前面的字符串至少 n 次, 至多 m 次 | ‘b{2,4}’ 匹配最少 2 个,最多 4 个 b |
查询以特定字符或字符串开头的记录
字符用来匹配以特定字符或字符串开头的记录。
例 1
在 tb_students_info 表中,查询 name 字段以“J”开头的记录,SQL 语句和执行过程如下。
mysql> SELECT * From tb_students_info-> WHERE name REGEXP '^J';+----+------+------+------+--------+-----------+| id | name | age| sex| height | course_id |+----+------+------+------+--------+-----------+|4 | Jane |22 | 男|162 |3 ||5 | Jim|24 | 女|175 |2 ||6 | John |21 | 女|172 |4 |+----+------+------+------+--------+-----------+3 rows in set (0.01 sec)
例 2
在 tb_students_info 表中,查询 name 字段以“Ji”开头的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '^Ji';+----+------+------+------+--------+-----------+| id | name | age| sex| height | course_id |+----+------+------+------+--------+-----------+|5 | Jim|24 | 女|175 |2 |+----+------+------+------+--------+-----------+1 row in set (0.00 sec)
查询以特定字符或字符串结尾的记录
字符用来匹配以特定字符或字符串结尾的记录。
例 3
在 tb_students_info 表中,查询 name 字段以“y”结尾的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP 'y$';+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|1 | Dany|25 | 男|160 |1 ||3 | Henry |23 | 女|185 |1 ||7 | Lily|22 | 男|165 |4 |+----+-------+------+------+--------+-----------+3 rows in set (0.00 sec)
例 4
在 tb_students_info 表中,查询 name 字段以“ry”结尾的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP 'ry$';+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|3 | Henry |23 | 女|185 |1 |+----+-------+------+------+--------+-----------+1 row in set (0.00 sec)
替代字符串中的任意一个字符
字符用来替代字符串中的任意一个字符。
例 5
在 tb_students_info 表中,查询 name 字段值包含“a”和“y”,且两个字母之间只有一个字母的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP 'a.y';+----+------+------+------+--------+-----------+| id | name | age| sex| height | course_id |+----+------+------+------+--------+-----------+|1 | Dany |25 | 男|160 |1 |+----+------+------+------+--------+-----------+1 row in set (0.00 sec)
匹配多个字符
字符和都可以匹配多个该符号之前的字符。不同的是,表示至少一个字符,而可以表示 0 个字符。
例 6
在 tb_students_info 表中,查询 name 字段值包含字母“T”,且“T”后面出现字母“h”的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '^Th*';+----+--------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+--------+------+------+--------+-----------+|9 | Thomas |22 | 女|178 |5 || 10 | Tom|23 | 女|165 |5 |+----+--------+------+------+--------+-----------+2 rows in set (0.00 sec)
例 7
在 tb_students_info 表中,查询 name 字段值包含字母“T”,且“T”后面至少出现“h”一次的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '^Th+';+----+--------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+--------+------+------+--------+-----------+|9 | Thomas |22 | 女|178 |5 |+----+--------+------+------+--------+-----------+1 row in set (0.00 sec)
匹配指定字符串
正则表达式可以匹配字符串。当表中的记录包含这个字符串时,就可以将该记录查询出来。指定多个字符串时,需要用隔开。只要匹配这些字符串中的任意一个即可。
例 8
在 tb_students_info 表中,查询 name 字段值包含字符串“an”的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP 'an';+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|1 | Dany|25 | 男|160 |1 ||4 | Jane|22 | 男|162 |3 ||8 | Susan |23 | 男|170 |5 |+----+-------+------+------+--------+-----------+3 rows in set (0.00 sec)
例 9
在 tb_students_info 表中,查询 name 字段值包含字符串“an”或“en”的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP 'an|en';+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|1 | Dany|25 | 男|160 |1 ||2 | Green |23 | 男|158 |2 ||3 | Henry |23 | 女|185 |1 ||4 | Jane|22 | 男|162 |3 ||8 | Susan |23 | 男|170 |5 |+----+-------+------+------+--------+-----------+5 rows in set (0.00 sec)
注意:字符串与之间不能有空格。因为,查询过程中,数据库系统会将空格也当作一个字符,这样就查询不出想要的结果。
匹配指定字符串中的任意一个
使用方括号可以将需要查询的字符组成一个字符集合。只要记录中包含方括号中的任意字符,该记录就会被查询出来。例如,通过“[abc]”可以查询包含 a、b 和 c 等 3 个字母中任意一个的记录。
例 10
在 tb_students_info 表中,查询 name 字段值包含字母“i”或“o”的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '[io]';+----+--------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+--------+------+------+--------+-----------+|5 | Jim|24 | 女|175 |2 ||6 | John|21 | 女|172 |4 ||7 | Lily|22 | 男|165 |4 ||9 | Thomas |22 | 女|178 |5 || 10 | Tom|23 | 女|165 |5 || 11 | LiMing |22 | 男|180 |7 |+----+--------+------+------+--------+-----------+6 rows in set (0.00 sec)
从查询结果可以看到,所有返回记录的 name 字段值都包含字母 i 或 o,或者两个都有。
方括号还可以指定集合的区间。例如,“[a-z]”表示从 a~z 的所有字母;“[0-9]”表示从 0~9 的所有数字;“[a-z0-9]”表示包含所有的小写字母和数字;“[a-zA-Z]”表示匹配所有字符。
例 11
在 tb_students_info 表中,查询 name 字段值中包含 1、2 或 3 的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '[123]';Empty set (0.00 sec)
匹配集合“[123]”也可以写成“[1-3]”,即指定集合区间。
匹配指定字符以外的字符
[^字符集合]
用来匹配不在指定集合中的任何字符。
例 12
在 tb_students_info 表中,查询 name 字段值包含字母 a~t 以外的字符的记录,SQL 语句和执行过程如下。
mysql> SELECT * FROM tb_students_info-> WHERE name REGEXP '[^a-t]' ;+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|1 | Dany|25 | 男|160 |1 ||3 | Henry |23 | 女|185 |1 ||7 | Lily|22 | 男|165 |4 ||8 | Susan |23 | 男|170 |5 |+----+-------+------+------+--------+-----------+4 rows in set (0.00 sec)
使用{n,}或者{n,m}来指定字符串连续出现的次数
字符串{n,}
表示字符串连续出现 n 次;
字符串{n,m}
表示字符串连续出现至少 n 次,最多 m 次。
例如,a{2,} 表示字母 a 连续出现至少 2 次,也可以大于 2 次;a{2,4} 表示字母 a 连续出现最少 2 次,最多不能超过 4 次。
例 13
在 tb_students_info 表中,查询 name 字段值出现字母‘e’ 至少 2 次的记录,SQL 语句如下:
mysql> SELECT * FROM tb_students_info WHERE name REGEXP 'e{2,}';+----+-------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+-------+------+------+--------+-----------+|2 | Green |23 | 男|158 |2 |+----+-------+------+------+--------+-----------+1 row in set (0.00 sec)
例 14
在 tb_students_info 表中,查询 name 字段值出现字符串“i” 最少 1 次,最多 3 次的记录,SQL 语句如下:
mysql> SELECT * FROM tb_students_info WHERE name REGEXP 'i{1,3}';+----+--------+------+------+--------+-----------+| id | name| age| sex| height | course_id |+----+--------+------+------+--------+-----------+|5 | Jim|24 | 女|175 |2 ||7 | Lily|22 | 男|165 |4 || 11 | LiMing |22 | 男|180 |7 |+----+--------+------+------+--------+-----------+3 rows in set (0.00 sec)
数据采集软件都有哪些?哪个比较好用?简单方便点的。
推荐你用熊猫采集吧。 我用采集也有两年多的时间了,两年里,换了好几个,基本上都不太满意,不是收费高,就是采集规则太繁琐,很头疼。 后来发现了熊猫采集软件,当时就觉得这个软件挺不错的,如果是一般采集的话,根本用不上正则表达式。 全程可视化鼠标操作,采集结果可以直接保存到你现有的数据库里,也可以保存到熊猫的数据库,然后直接发布到你的网站上,非常的方便。 如果你不想花钱买收费版的话,可以做做任务,一样能拿到采集量,很方便的。 这个软件还有一个优点就是,功能强大(可采集结构复杂的对象集合,和强大的抗干扰、抗防采集的功能),操作简单,基本点几下鼠标就完成设定了。 总的来说,这个软件是至今为止我最喜欢的一款采集软件了,相当不错的,几乎集合了其他同类软件的优点,软件本身自带的采集量,真心推荐你试用一下。 全手打,望采纳。
请懂得软件工程师考试的高人入内?
软件工程师证书,是有社会培训机构通过培训考核发给的有关证书。 与国家计算机软件水平资格考试不一样。 如JAVA如件工程师,其培训内容包括: 初级部分: 1. Java 面向对象程序设计、Java api使用、数据结构及算法基础、Java高级类特性、异常处理; 2. AWT及Swing图形程序设计、流、网络程序设计、对象序列化、Applet、多线程程序设计、Java应用国际化基础; 3. Java桌面系统项目开发; 4. Java编程基础提高课程:反射机制、设计模式(I)、正则表达式,Java SE5.0新特性等; 5. 基于Oracle的数据库开发及管理、数据库设计、标准SQL、PL/SQL编程; 6. JDBC、JSP2.0、Servlet2.4、JavaBean编程;Tomcat服务器使用、Jbuilder及Eclipse 等集成开发环境; 7. Linux操作系统中的Java程序开发、Linux系统管理; 8. Java Web编程提高课程:JDBC进阶、高效分页处理、过滤器使用技巧、Struts中动态表单验证、DispatchForm等; 高级部分 1. MVC设计模式、Struts架构核心工作机制、国际化、验证框架、Struts Taglib、ORM基础、基于Hibernate的企业级应用; 2. JavaME手机游戏设计、界面程序设计、数据库程序设计、手机短信、多媒体短信(彩信)开发; 3 核心技术、XML、Web Service、异构系统整合、分布式应用开发、WebLogic和JBoss等应用服务器; 4 、UML与系统建模和设计、Rational Rose、软件工程和软件过程模型、版本控制及设计模式; 6. Java 企业级应用开发提高课程:Hibernate使用技巧、设计模式(II)、Spring编程入门、提高Java EE应用的性能; 程序设计 架构、桌面和Web程序设计、与JavaEE平台应用的整合; 职业素质 IT职业规划、沟通技巧、团队合作、专业技术规范、面试技巧等职业技能培训。 完成以上培训课程后,通过考核就可以获得培训机构颁发的合格证书。 现在比较吃香的是JAVA,特别是J2EE,未来3G出来后,手机编程将成为热点,J2EE当然就会很吃香了。 关于证书的权威性,建议你要去知名的培训机构去,最好是像SUN这类国际大公司有关认证所指定的培训机构,这样权威性高些。 一般来讲,软件公司是非常喜欢通过了软件工程师的人员,学历对他们来说并不重要,而重要的是能力。 如果你的能力够强,在一个好的公司的话,这个月薪我想应该是可以拿到的。 其他方面的软件权威考试,在国内当然就是国家计算机软件水平资格考试了。 这是国家级的考试。 回答应该比较详细,应该能得旗了吧。 。
textarea中空格和换行怎么处理
用replace和正则表达式结合,一次替换所有的\r\n。 var reg=new RegExp(\r\n,g);str= (reg,);这样str中所有的\r\n就替换成<br>了.然后可以将其存入数据库。 在取出的时候 只用将值在替换回来即可var reg=new RegExp(<br>,g);stt= (reg,\r\n);(textarea)=str;2. EL表达式会将换行符转变成,<和>分别对应<和>,也就是说,到了页面上,还是显示为,为了补救这一点,需要使用jsp标签(<%= %>)来进行显示。 所以当需要在普通文本域中显示由提交的内容时,可以直接在数据库里存储不经过处理的字符串,而只在显示前将\r\n替换为,然后在页面上使用<%= %>来显示这些内容.
发表评论