2014年10月22日 09:19:02

百度音乐XML正则匹配解析

  1. 数据来源链接:http://box.zhangmen.baidu.com/x?op=12&count=1&title=flower%20dance$$dj%20okawari$$$$&qq-pf-to=pcqq.group
  2. 正则:
  3. <encode><!\[CDATA\[(http://cdn\.y\.baidu\.com/yinyueren/data2/music/[^/]+/).*?<decode><!\[CDATA\[([^\]]*?)].*?</decode>
  4. 源码:
  5. <?xml version="1.0" encoding="gb2312" ?><result><count>1</count><url><encode><![CDATA[http://cdn.y.baidu.com/yinyueren/data2/music/75970/aGdsa2VkpKhkcauXpJqcdWRibGRsaGtolWiWmJZnZ2yWmGlnampwm5ZrbJlmZ2xpYmVsl2ZrnZxkl2NmaZlqnTE$]]></encode><decode><![CDATA[75970.mp3?xcode=30907240d6cda104ef63549ce99e1151139c15fd3e024c3e]]></decode><type>8</type><lrcid>0</lrcid><flag>0</flag></url><durl><encode><![CDATA[http://cdn.y.baidu.com/yinyueren/data2/music/75969/aGdsam5kpKhkcauXpJqcdWRibGRsaGtolWiWmJZnZ2yWmGlnampwm5ZrbJlmZ2xpl2hjmG1snJpqmJlrbJlnmzE$]]></encode><decode><![CDATA[75969.mp3?xcode=30907240d6cda104ef63549ce99e1151f60d86eb9ff77c0c]]></decode><type>8</type><lrcid>0</lrcid><flag>0</flag></durl></result>
2014年03月21日 23:09:32

正则匹配html中的时间

源码:
<div class="artInfo">
	<span id="pub_date">2014年03月12日 20:20</span>  
	<span id="media_name">
		<a href=http://stock.caijing.com.cn/2014-03-12/114002955.html?_fin 
			target="_blank">财经网</a> 	
	</span> 

	<div class="font_change"  id="J_Font_Zoomer" data-sudaclick="font_change">
		<span font-size="14">
			<a class="J_Font_Zoomer_Trigger icon font_down font_down_disable" 
				action-type="fontZoom" action-data="type=down" 
				href="javascript:void(0);" title="减小字号"></a>
		</span>
	</div>  
</div>

正则:
<span[^>]*?id="pub_date"[^>]*?>(.*?)</span>

2014年03月21日 22:52:46

正则匹配IP地址

本文分析IP地址的正则匹配。
2014年03月21日 21:54:45

正则匹配td标签内容

源码:
<TD align="middle" bgColor="#FFFFFF">5</TD>
<TD align="left" bgColor="#ffffff">饶丽丽</TD>
<TD align="middle" bgColor="#ffffff">312</TD>

正则:
<td[^>]*?>(.*?)</td>\s*<td[^>]*?>(.*?)</td>\s*<td[^>]*?>(.*?)</td>

正则表达式是一个重用率比较低的东西,很多式子都是针对着需求写的,这也导致了很多时候都是写完就丢弃了,需要的时候再写,连回想的余地都没有,因此,有了本文,借此提醒自己,善待每一个写好的正则,无论简单、复杂。

1.PHP cURL群:PHP cURL高级技术
2.正则表达式群:专精正则表达式
3. QQ联系(加请说明):QQ联系博主(951086941)
4. 邮箱:zjmainstay@163.com
5. 打赏博主:

  1. 模拟登录后数据采集
  2. 网页内容数据采集
  3. 采集内容正则解析
  4. 数据采集难题咨询

阿里云幸运券分享
网站总访问量: