从《我眼里的正则表达式(入门)》这个文章,到《深入正则表达式应用》,再到后来专门创建的正则QQ群“专精正则表达式”,到现在已经过去2年时间了。在文章和群里一直给其他人推荐正则表达式测试工具RegexBuddy(点击获取)作为唯一的权威的正则测试工具,却一直没有找到合适的文章,完整地介绍它的使用。因此,今天抽空整理一下,希望能够给刚接触使用RegexBuddy的新人带来一定的帮助。

官方手册:RegexBuddy User’s Guide

RegexBuddy参数页缩略图: RegexBuddy参数页缩略图

本文是一篇正则表达式高级教程,主要通过对正则表达式几个概念的介绍,深入探讨正则表达式高级功能,以期达到通俗化解释正则表达式高深概念的目的。

正则对于新人来说是一个头疼的名字,让人闻而生畏。但是,在我看来,正则,并没有那么神秘,希望能通过这篇正则表达式入门教程解除正则新人对于正则的畏惧感。

本文利用正则表达式实现检测页面id是否重复功能。
2014年03月21日 23:09:32

正则匹配html中的时间

源码:
<div class="artInfo">
	<span id="pub_date">2014年03月12日 20:20</span>  
	<span id="media_name">
		<a href=http://stock.caijing.com.cn/2014-03-12/114002955.html?_fin 
			target="_blank">财经网</a> 	
	</span> 

	<div class="font_change"  id="J_Font_Zoomer" data-sudaclick="font_change">
		<span font-size="14">
			<a class="J_Font_Zoomer_Trigger icon font_down font_down_disable" 
				action-type="fontZoom" action-data="type=down" 
				href="javascript:void(0);" title="减小字号"></a>
		</span>
	</div>  
</div>

正则:
<span[^>]*?id="pub_date"[^>]*?>(.*?)</span>

2014年03月21日 22:52:46

正则匹配IP地址

本文分析IP地址的正则匹配。
2014年03月21日 21:54:45

正则匹配td标签内容

源码:
<TD align="middle" bgColor="#FFFFFF">5</TD>
<TD align="left" bgColor="#ffffff">饶丽丽</TD>
<TD align="middle" bgColor="#ffffff">312</TD>

正则:
<td[^>]*?>(.*?)</td>\s*<td[^>]*?>(.*?)</td>\s*<td[^>]*?>(.*?)</td>

正则表达式是一个重用率比较低的东西,很多式子都是针对着需求写的,这也导致了很多时候都是写完就丢弃了,需要的时候再写,连回想的余地都没有,因此,有了本文,借此提醒自己,善待每一个写好的正则,无论简单、复杂。
2013年09月10日 04:01:32

解析html中的meta charset

源码:
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
	<title>匹配html中的meta charset - Zjmainstay</title>
	<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
	<meta http-equiv="Content-Language" content="zh-CN" />
</head>
<body>
</body>
</html>

正则:
<meta[^>]*?charset=(["'/>]?)([^"'\s/>]+)\1[^>]*?>

Page 2 of 2

1.PHP cURL群:PHP cURL高级技术
2.正则表达式群:专精正则表达式
3. QQ联系(加请说明):QQ联系博主(951086941)
4. 邮箱:zjmainstay@163.com
5. 打赏博主:

  1. 模拟登录后数据采集
  2. 网页内容数据采集
  3. 采集内容正则解析
  4. 数据采集难题咨询

阿里云幸运券分享
网站总访问量: