草庐IT

关于 bash:Regex 在最后一个正斜杠后捕获和替换

codeneng 2023-03-28 原文

Regex capture and replace %20 after last forward slash

我有一个 tsv 文件,里面有很多 HTML。

我需要在非 .jpg 链接的 href 属性的最后一个正斜杠之后替换 %20
我正在命令行上使用 Perl,我需要正则表达式的帮助。

我尝试了一些正则表达式,这是在现场测试中(下面的链接):

1
]*href="([^"]+(%20)+)[^\\.jpg][^\\/]"[^>]?>

它只匹配一个 标记并且只捕获最后一次出现的 %20.

这是一个带有 tsv 样本的实时测试。

我本可以:

1
text

我必须匹配最后一个正斜杠之后的所有 %20 并用 - 替换它们。

或:

1
 <img border="0" src="http://example.com/path/to-some-folder/another%20folder/one%20more520folder/uploads/2012/02/some%20folder/another%20folder/09%20antichi%20egizi%20-%20Tomba%20di%20Tutankhamen%20ante.jpg" width="80" height="92" alt="09 antichi egizi - Tomba di Tutankhamen" />

我不能匹配 .jpg 的 href 属性,所以上面的最后一个例子需要保持不变。

我也试过这个匹配所有预期的 标签,但我不知道如何在最后一个斜杠之后只捕获所有 %20 以随后应用替换:

1
]*href="([^"]+)[^\\.jpg][^\\/]"[^>]?>

https://regex101.com/r/cS3iB6/2

  • 您需要使用 HTML 解析器仅提取 a 标签的 href 属性。必填链接
  • [^\\.jpg] 这并不意味着你认为它是什么..
  • 嘿 karthik - 如果我昨天从你的正则表达式中正确学习 - 它可能是 (?!\\\\\\\\.jpg) 代替。
  • @Falt4rm 是的……可能是……
  • @格伦杰克曼,谢谢你的链接,我是凯特林鸭舍伍德的例子,他准确地解释了我现在需要什么。


为了匹配某些分隔符内的 %20,您还可以使用 \\G 运算符(请参阅"您离开的地方:\\\\G 断言"):

You can use \\G to specify the position just after the previous match.

你可以使用的正则表达式是

1
()[^\\/"]*">)

替换为

1
\\1\\2-

这是我的演示

在类似 Perl 的符号中,它看起来像

1
s/()[^\\/"]*">)/\\1\\2-/g

  • 我认为这个解决方案不适用于大文本,但它是精确的。


replace %20 after last forward slash of href attributes of non .jpg links

您可以使用以下内容进行匹配:

1
%20(?=(?:(?!\\.jpg">)[^>\\/])*>)

并替换为 -

见演示

  • 这种方法的基本缺陷是您不检查是否在 标记中,而只是检查匹配后是否没有 .jpg。如果扩展名是 png 怎么办?您需要扩展替代列表。在某些标记内获取所有匹配项的真正方法是 \\G 运算符。
  • @stribizhev你是对的..我这样做是因为我们没有验证模式..只是从预先存在的模式中替换..所以我所做的假设没有问题..也.. OP想要 non .jpg 链接。 .为此我认为我的解决方案已经足够好了..
  • @stribizhev 在这种情况下,我只有 jpg 但会很有趣,看看您将如何处理 \\\\\\\\G 运算符?

有关关于 bash:Regex 在最后一个正斜杠后捕获和替换的更多相关文章

  1. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  2. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  3. ruby-on-rails - 渲染另一个 Controller 的 View - 2

    我想要做的是有2个不同的Controller,client和test_client。客户端Controller已经构建,我想创建一个test_clientController,我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集,然后呈现客户端Controller的索引View,以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>

  4. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

    在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

  5. ruby - 如何在 Ruby 中拆分参数字符串 Bash 样式? - 2

    我正在为一个项目制作一个简单的shell,我希望像在Bash中一样解析参数字符串。foobar"helloworld"fooz应该变成:["foo","bar","helloworld","fooz"]等等。到目前为止,我一直在使用CSV::parse_line,将列分隔符设置为""和.compact输出。问题是我现在必须选择是要支持单引号还是双引号。CSV不支持超过一个分隔符。Python有一个名为shlex的模块:>>>shlex.split("Test'helloworld'foo")['Test','helloworld','foo']>>>shlex.split('Test"

  6. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

    如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

  7. ruby - 为什么 SecureRandom.uuid 创建一个唯一的字符串? - 2

    关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion为什么SecureRandom.uuid创建一个唯一的字符串?SecureRandom.uuid#=>"35cb4e30-54e1-49f9-b5ce-4134799eb2c0"SecureRandom.uuid方法创建的字符串从不重复?

  8. ruby-on-rails - 在 ruby​​ 中使用 gsub 函数替换单词 - 2

    我正在尝试用ruby​​中的gsub函数替换字符串中的某些单词,但有时效果很好,在某些情况下会出现此错误?这种格式有什么问题吗NoMethodError(undefinedmethod`gsub!'fornil:NilClass):模型.rbclassTest"replacethisID1",WAY=>"replacethisID2andID3",DELTA=>"replacethisID4"}end另一个模型.rbclassCheck 最佳答案 啊,我找到了!gsub!是一个非常奇怪的方法。首先,它替换了字符串,所以它实际上修改了

  9. ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2

    我有一个正在构建的应用程序,我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是,在make_tires内部有一个错误,如果我为Tire尝试它,则没有用于创建或新建的activerecord方法。当我检查轮胎时,它没有这些方法。我该如何补救?错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发,它们都因相同的错误而失败。 最佳答案

  10. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

随机推荐