草庐IT

regex_extract

全部标签

php - Python : extract . 将数据提交到具有机械化的表单后的 csv 结果

我刚开始使用Python从网络中提取数据。感谢其他一些帖子和这个webpage,我想出了如何使用模块mechanize将数据提交到表单。现在,我一直在寻找如何提取结果。提交表单时有很多不同的结果,但如果我可以访问csv文件,那将是完美的。我假设您必须使用模块re,但是您如何通过Python下载结果?运行作业后,csv文件在这里:Summary=>Results=>DownloadHeavyChainTable(您可以直接点击“loadexample”查看网页运行情况)。importreimportmechanizebr=mechanize.Browser()br.set_handle_

php - 问题(in-)greedy RegEx

考虑以下字符串:1:cccbbb2:cccaaabbb我想结束这样的比赛:1:Array([1]=>[2]=>bbb)2:Array([1]=>aaa[2]=>bbb)如何在一个RegExp中匹配两者?这是我的尝试:#(aaa)?(.*)$#我已经尝试了很多贪婪和非贪婪修改的变体,但都没有奏效。只要我添加“?”一切都在[2]中匹配。使[2]变得不贪婪无济于事。如果我省略“ccc”,我的RegExp会按预期工作,但我必须在开头允许其他字符... 最佳答案 /(aaa)?((.)\3*)$/不过会有一个额外的[3]。我认为这不是问题。

PHP/RegEx - 通过检测 .com/.net/.org/.edu 等将 URL 转换为链接

我知道有很多问题要求帮助将URL转换为字符串中的可点击链接,但我还没有找到我正在寻找的东西。我希望能够匹配以下任何示例并将它们变成可点击的链接:http://www.domain.comhttps://www.domain.nethttp://subdomain.domain.orgwww.domain.com/foldersubdomain.domain.netsubdomain.domain.edu/folder/subfolderdomain.netdomain.com/folder我不想匹配random.stuff.separated.with.periods。编辑:请记住,这

php - 在没有括号的 RegEx 中分组竖线分隔的选项?

是否可以在不使用括号的情况下对正则表达式的各个部分进行分组?或者,换句话说,不匹配某些括号语句?这就是我的意思——考虑以下正则表达式:$pattern='/^(what|where|who)(are|is)(.+)$/i';preg_match($pattern,$input,$matches);现在。注意前两个子查询——带有竖线的子查询。我如何防止这些出现?如果$input是“whoishe”,我希望“he”是唯一匹配的子查询。我明白,在这个例子中,我可以只获取$matches[3],这会给我正确的结果。然而,由于我的应用程序的性质,我正在动态生成正则表达式,并且结构不会总是像我在这

php - 使用 REGEX 验证带有 GET 参数的域名

我正在尝试验证一个域是否确实具有带有preg_match和REGEX的GET参数,我要求它具有我的目的。我的工作是验证没有GET参数的域,如下所示:if(preg_match("/^[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}$/",'domain.com')){echo'true';}else{echo'false';}我在这个测试中得到了正确的结果。到目前为止一切顺利。我遇到的问题是添加GET参数,在我尝试过的许多REGEX中,仍然没有运气如下:if(preg_match("/^[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.

php - 创建将从 url 中提取图像名称的 javascript RegEx

我希望你能帮我创建一个正则表达式,从url中提取图像名称。几天来我一直在尝试创建正则表达式,但我无法让它工作。案例:我有一个用phpThumb创建的图像url,如下所示:\bla\thumb\phpThumb.php?src=/bla/images/thisistheimage.jpg&fltr[]=wmt|40|B|FFFFFF|georgia.ttf|35&hash=b7412f04f09cd6b488435231651d61453/p>不,我需要提取以下内容:thisistheimage.jpg一些事实:图片名称前总有一个“/”;图像名称后面始终跟有一个amp(&);图片扩展名也

php - 如果使用 PHP 找不到,则使用默认值进行 RegEx 分组

这是一个示例字符串:$text='foo(20/50)bar()baz(11/30)';我需要的输出是这样的:$items=array(array("title"=>"foo","number"=>20),array("title"=>"bar","number"=>0)array("title"=>"baz","number"=>11));尝试到目前为止,我一直在使用$matches_title=array();$matches_number=array();preg_match_all('!([^\s]+)!',$text,$matches_title);preg_match_al

php - 使用 PHP 和 RegEX 返回多个匹配项,但仅限于第一次出现模式

我有一个看起来像的数据集I(0,123...789){A(0,567...999){.......n=Marc.....}B(2,655...265){..................}C(3,993...333){..................}M(8,635...254){.................;}}O(0,345...789){A(0,567...999){.......n=Marc.....}B(2,876...775){..................}C(3,993...549){..................}M(8,354...987){

php - 用 php regex 替换方括号之间的子字符串

这是我正在处理的子字符串[sitetree_link%20id=2]我需要用空格替换所有出现在[]之间的%20。但很明显,如果[]大括号外有%20s,请不要管它们......我现在正在学习正则表达式,但这个似乎很难。有人对此有一个super智能的正则表达式吗?谢谢:) 最佳答案 你可以试试这个$result=preg_replace('/(\[[^]]*?)(%20)([^]]*?\])/m','$1$3',$subject);解释(#Matchtheregularexpressionbelowandcaptureitsmatchi

php - 用于检查 URL 是否为短 URL 的 Regex/php 代码

我正在尝试创建一个php函数来检查传递的URL是否为短URL。像这样:/***CheckifaURLisashortURL**@paramstring$url*returnbool*/function_is_short_url($url){//Codegoeshere}我知道更简单和可靠的方法是检查301重定向,但此功能旨在保存外部请求仅用于检查。该函数也不应检查URL缩短器列表,因为这将是一种可扩展性较差的方法。我在想的一些可能的检查也是如此:URL总长度-最多30个字符最后一个“/”后的URL长度-最多10个字符协议(protocol)(http://)后“/”的数量-最多2主机的