正则表达式 (23)
本栏目主要讲解正则表达式知识,从正则表达式入门教程到高级教程,深入浅出地讲解正则语法,同时基于Windows正则测试工具Regexbuddy和Mac正则测试工具Regex101,以丰富的例子,分析正则表达式工作原理,让各阶段的正则研究者都能获得自己想要的内容,希望大家能够在本站学习到真知识。
js /[\u4e00-\u9fa5]+/
php /[\x7f-\xff]+/
特殊写法 /[一-龥]+/(注:对应[\u4e00-\u9fa5])
这是网上搜索关于正则表达式匹配中文的常见版本。
基于 https://www.regex101.com ,利用macgap打包了一个Mac app,以后在Mac测试正则表达式就方便多了。
从《我眼里的正则表达式(入门)》这个文章,到《深入正则表达式应用》,再到后来专门创建的正则QQ群“专精正则表达式”,到现在已经过去2年时间了。在文章和群里一直给其他人推荐正则表达式测试工具RegexBuddy(点击获取)作为唯一的权威的正则测试工具,却一直没有找到合适的文章,完整地介绍它的使用。因此,今天抽空整理一下,希望能够给刚接触使用RegexBuddy的新人带来一定的帮助。
RegexBuddy参数页缩略图:
本文是一篇正则表达式高级教程,主要通过对正则表达式几个概念的介绍,深入探讨正则表达式高级功能,以期达到通俗化解释正则表达式高深概念的目的。
数据来源链接:http://box.zhangmen.baidu.com/x?op=12&count=1&title=flower%20dance$$dj%20okawari$$$$&qq-pf-to=pcqq.group
正则:
<encode><!\[CDATA\[(http://cdn\.y\.baidu\.com/yinyueren/data2/music/[^/]+/).*?<decode><!\[CDATA\[([^\]]*?)].*?</decode>
源码:
<?xml version="1.0" encoding="gb2312" ?><result><count>1</count><url><encode><![CDATA[http://cdn.y.baidu.com/yinyueren/data2/music/75970/aGdsa2VkpKhkcauXpJqcdWRibGRsaGtolWiWmJZnZ2yWmGlnampwm5ZrbJlmZ2xpYmVsl2ZrnZxkl2NmaZlqnTE$]]></encode><decode><![CDATA[75970.mp3?xcode=30907240d6cda104ef63549ce99e1151139c15fd3e024c3e]]></decode><type>8</type><lrcid>0</lrcid><flag>0</flag></url><durl><encode><![CDATA[http://cdn.y.baidu.com/yinyueren/data2/music/75969/aGdsam5kpKhkcauXpJqcdWRibGRsaGtolWiWmJZnZ2yWmGlnampwm5ZrbJlmZ2xpl2hjmG1snJpqmJlrbJlnmzE$]]></encode><decode><![CDATA[75969.mp3?xcode=30907240d6cda104ef63549ce99e1151f60d86eb9ff77c0c]]></decode><type>8</type><lrcid>0</lrcid><flag>0</flag></durl></result>
正则对于新人来说是一个头疼的名字,让人闻而生畏。但是,在我看来,正则,并没有那么神秘,希望能通过这篇正则表达式入门教程解除正则新人对于正则的畏惧感。
<div class="artInfo"> <span id="pub_date">2014年03月12日 20:20</span> <span id="media_name"> <a href=http://stock.caijing.com.cn/2014-03-12/114002955.html?_fin target="_blank">财经网</a> </span> <div class="font_change" id="J_Font_Zoomer" data-sudaclick="font_change"> <span font-size="14"> <a class="J_Font_Zoomer_Trigger icon font_down font_down_disable" action-type="fontZoom" action-data="type=down" href="javascript:void(0);" title="减小字号"></a> </span> </div> </div>正则:
<span[^>]*?id="pub_date"[^>]*?>(.*?)</span>