URL匹配规则介绍

匹配规则 #

在Ptengine中,设定页面、事件、页面组、转化、优化引导Engage等信息,这些设置需要覆盖哪些URL或者在哪些URL上生效时,Ptengein提供以下5种匹配规则可供您选择使用。包含、头匹配、尾匹配、完全匹配、正则表达式。

包含 #

任何包含您特定字符串的URL。例如,如果您指定“abc.com”使用“包含”规则:那么“abc.com.contact”等类似的URL将被包含。

头匹配 #

头匹配是指只要开头部分满足规则即可匹配成功,从URL开头的第一个字符一直匹配到您特定的最后一个字符,不管其他后续的剩余字符。
例如,假设特定访问者所访问的网站为http://www.example.com/? page=1&id=9982251615 ,那么其他的所有用户的登录编号是不同的 。此时,将http://www.example.com/?page=1 设为目标URL,设定头匹配即可进行匹配检索。

尾匹配 #

尾匹配整好和头匹配相反,只要结尾满足规则即可匹配成功,从URL结尾的最后一个字符一直匹配到您特定的第一个字符,不管其他前面的字符。

例如,假设用户的目标网站为 http://www.example.com/index.html ,尾匹配URL设定为 /index.html

此时,即使像http://www.123.com/index.html这样网站的前面部分不同,其也是符合匹配要求的,属于是一致的,可以匹配成功。而http://www.example.com /index.html?wore=xxx 的话,因后方有?wore=xxx,从尾匹配角度来讲是不符合要求的,属于不一致的,无法匹配。

完全匹配 #

完全匹配是指从头到尾URL的字符完全一致,没有例外。

使用该模式的话,客户所设定的URL,数据必须与报告中出现的URL完全一致才行, URL查询参数中不得包含动态变化信息。

正则表达式 #

正则表达式会将特殊字符视为通配符,这是一种非常灵活的匹配方式。如果网站上同一网页网址的主体或后续参数会发生变化,或者两者都会发生变化,这个方式就相当实用。

正则表达式的语法

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种匹配逻辑。正则表达式字符主要包含:通配符、定位符、分组、其它。

通配符:可以用来代替一个或多个真正字符,以便根据您指定的参数变化的所有实例创建一个匹配。 下面是一些经常使用通配符说明。

定位符:创建基于固定点的匹配,通常在开始或结束的位置。

分组

注:正则表达式越简单越好,以便于您和同事接下来的方便使用。

正则表达式的常见用法

1.前方域名完全匹配 ,尾部带/或带?加参数

正则:^https:\/\/www.ptmind.com($|\/$|\/\?.*) 能匹配以下页面:

https://www.ptmind.com
https://www.ptmind.com/
https://www.ptmind.com/?WT.mc_id=xxxx

不能匹配以下页面:

https://www.ptmind.com/abc

2.头部匹配http或者https协议,并且匹配多个子域名正则:^(http|https):\/\/(sh|bj|tj).ptmind.com、匹配以下页面:

http://sh.ptmind.com
http://bj.ptmind.com/abc
http://tj.ptmind.com
https://sh.ptmind.com
https://bj.ptmind.com/?WT.mc_id=xxxx
https://tj.ptmind.com

不能匹配以下页面:

https://www.ptmind.com

3.指定头部匹配规则
正则:^http:\/\/ptmind\.com\/price.*$匹配以下页面:

http://ptmind.com/price/page
http://ptmind.com/price?sid=23fwe3r2&vid=345666
http://ptmind.com/price#top
http://ptmind.com/price

4.匹配 http 或 https开头链接,也可匹配不包含www或将www替换成其它由字母数字组合的子域名的情况正则:^(http|https):\/\/[a-z0-9][.]ptmind.com\/service\/mng_units\/lp03$匹配以下页面:

http://www.ptmind.com/service/mng_units/lp03
https://www.ptmind.com/service/mng_units/lp03
http://ptmind.com/service/mng_units/lp03
http://a123.ptmind.com/service/mng_units/lp03
https://ptmind.com/service/mng_units/lp03

5.匹配末尾数据必须在(6984604到6984783之间)
正则:^http:\/\/ptmind.com\/detail\/id=6984([6][1-9][0-9]|[6][0][4-9]|[7][0-7][0-9]|[7][8][0-3])$匹配以下页面:

http://ptmind.com/detail/id=6984604
http://ptmind.com/detail/id=6984783

不能匹配以下页面:

http://ptmind.com/detail/id=6984784
http://ptmind.com/detail/id=6984603

若您依然需要帮助,可以联系我们的在线客服寻求帮助。

正则表达式的校验工具

您可以使用下面链接中的正则表达式校验工具,验证您写的正则是否满足需求

https://www.regexpal.com

      本文是否对您有帮助?

  •            有帮助          
  •            无帮助                  

 

感谢您的反馈!

      非常抱歉未解决您的问题,请提出您宝贵的意见