草庐IT

javascript - 正则表达式:解析 GitHub 用户名 (JavaScript)

coder 2024-12-15 原文

我正在尝试从一段文本中解析 GitHub 用户名(以 @ 开头),以便将它们链接到相关的个人资料。

GitHub 用户名限制是:

  • 带有单个连字符的字母数字(没有连续的连字符)
  • 不能以连字符开头或结尾(如果以连字符结尾,则匹配所有内容直到那里)
  • 最大长度为 39 个字符。

例如下面的文字:

Example @valid hello @valid-username: @another-valid-username, @-invalid @in--valid @ignore-last-dash- an@email.com @another-valid?

脚本...

应该匹配:

  • @有效
  • @有效用户名
  • @另一个有效用户名
  • @在
  • @ignore-last-dash
  • @另一个有效

应忽略:

  • @-无效
  • an@email.com

我通过以下方式逐渐接近 JavaScript:

/\B@((?!.*(-){2,}.*)[a-z0-9][a-z0-9-]{0,38}[a-z0-9])/ig

但这不是匹配具有单个字符(例如@a)的用户名。

这是我到目前为止的测试:https://regex101.com/r/rZ5eW1/2

当前的正则表达式是否有效?我如何匹配单个非连字符?

最佳答案

/\B@([a-z0-9](?:-(?=[a-z0-9])|[a-z0-9]){0,38}(?<=[a-z0-9]))/gi

注意:当此正则表达式遇到不能出现在用户名中的字符或字符集时(即 .-- ),它会从 @ 开始匹配直到那个停止点。 OP says that's fine所以我顺其自然。所以,如果下划线是匹配区域(不是捕获区域):

<b>@abc</b>.123
<b>@abc</b>--123
<b>@abc</b>-

这通过使用大量嵌套组来实现。 Regex101 has a fantastic breakdown ,但无论如何这是我的:

  1. \B :这是一个内置的意思是“不是单词边界”,这似乎可以解决问题,尽管如果像 someones.@email.com 这样的东西可能会有问题是一个有效的电子邮件地址。不过,在这一点上,它与标点符号后不加空格的人的文本没有什么区别[ 1 ] 当他们以 @reference 开始一个句子时。

感谢 Honore Doktorr 的 pointing out that negative lookbehinds don't exist in JS .

  1. @ : 只是文字 @象征。为数不多的几个地方之一,一个 Angular 色意味着它是什么。
  2. (...) : 捕获组。它的放置方式意味着它不会捕获 @符号,它只会匹配它,因此更容易获取用户名 -- 无需获取子字符串。
  3. [a-z0-9] : 匹配任何字母或数字的字符类。因为 i标志,这也匹配大写字母。因为它是第一个字母,所以它必须存在。
  4. (?:...) : 这是一个非捕获组。它将正则表达式 block 包装在一个组中而不捕获它。
  5. ...|...我们有两种选择,它们是...
  6. -(?=[a-z0-9]) : 一个连字符,紧跟一个非连字符有效字符。
  7. [a-z0-9] : 一个有效的非连字符。
  8. {0,38} :匹配非捕获组 0 到 38 次(含)。结合#4,这给了我们最多 39 个字母。超出此范围的任何内容都将被忽略。
  9. (?<=[a-z0-9]) : 这是一个 积极的 回顾,JS 确实支持。它确保最后一个字符不是 - -- 或者更确切地说,是除连字符之外的有效字符。

这可以通过几种方式“优化”,但老实说,我可能会使用很多更简单的正则表达式并在事后对其进行一些验证,例如:

// somehow get the prospective username into `user`
if (user.startsWith('-')) { /* reject */ }
if (user.endsWith('-')) { /* reject */ }
if (user.contains('--')) { /* reject */ }

至少,在您的代码中解释正则表达式。请随意复制粘贴我的作品。

关于javascript - 正则表达式:解析 GitHub 用户名 (JavaScript),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30281026/

有关javascript - 正则表达式:解析 GitHub 用户名 (JavaScript)的更多相关文章

  1. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

    在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

  2. ruby-on-rails - 使用 rails 4 设计而不更新用户 - 2

    我将应用程序升级到Rails4,一切正常。我可以登录并转到我的编辑页面。也更新了观点。使用标准View时,用户会更新。但是当我添加例如字段:name时,它​​不会在表单中更新。使用devise3.1.1和gem'protected_attributes'我需要在设备或数据库上运行某种更新命令吗?我也搜索过这个地方,找到了许多不同的解决方案,但没有一个会更新我的用户字段。我没有添加任何自定义字段。 最佳答案 如果您想允许额外的参数,您可以在ApplicationController中使用beforefilter,因为Rails4将参数

  3. ruby-on-rails - 简单的 Ruby on Rails 问题——如何将评论附加到用户和文章? - 2

    我意识到这可能是一个非常基本的问题,但我现在已经花了几天时间回过头来解决这个问题,但出于某种原因,Google就是没有帮助我。(我认为部分问题在于我是一个初学者,我不知道该问什么......)我也看过O'Reilly的RubyCookbook和RailsAPI,但我仍然停留在这个问题上.我找到了一些关于多态关系的信息,但它似乎不是我需要的(尽管如果我错了请告诉我)。我正在尝试调整MichaelHartl'stutorial创建一个包含用户、文章和评论的博客应用程序(不使用脚手架)。我希望评论既属于用户又属于文章。我的主要问题是:我不知道如何将当前文章的ID放入评论Controller。

  4. ruby - RVM "ERROR: Unable to checkout branch ."单用户 - 2

    我在新的Debian6VirtualBoxVM上安装RVM时遇到问题。我已经安装了所有需要的包并使用下载了安装脚本(curl-shttps://rvm.beginrescueend.com/install/rvm)>rvm,但以单个用户身份运行时bashrvm我收到以下错误消息:ERROR:Unabletocheckoutbranch.安装在这里停止,并且(据我所知)没有安装RVM的任何文件。如果我以root身份运行脚本(对于多用户安装),我会收到另一条消息:Successfullycheckedoutbranch''安装程序继续并指示成功,但未添加.rvm目录,甚至在修改我的.bas

  5. ruby - 正则表达式将非英文字母匹配为非单词字符 - 2

    @raw_array[i]=~/[\W]/非常简单的正则表达式。当我用一些非拉丁字母(具体来说是俄语)尝试时,条件是错误的。我能用它做什么? 最佳答案 @raw_array[i]=~/[\p{L}]/使用西里尔字符进行测试。引用:http://www.regular-expressions.info/unicode.html#prop 关于ruby-正则表达式将非英文字母匹配为非单词字符,我们在StackOverflow上找到一个类似的问题: https://

  6. ruby - 正则表达式在哪个位置失败? - 2

    我需要一个非常简单的字符串验证器来显示第一个符号与所需格式不对应的位置。我想使用正则表达式,但在这种情况下,我必须找到与表达式相对应的字符串停止的位置,但我找不到可以做到这一点的方法。(这一定是一种相当简单的方法……也许没有?)例如,如果我有正则表达式:/^Q+E+R+$/带字符串:"QQQQEEE2ER"期望的结果应该是7 最佳答案 一个想法:你可以做的是标记你的模式并用可选的嵌套捕获组编写它:^(Q+(E+(R+($)?)?)?)?然后你只需要计算你获得的捕获组的数量就可以知道正则表达式引擎在模式中停止的位置,你可以确定匹配结束

  7. ruby - 有没有办法从 ruby​​ case 语句中访问表达式? - 2

    我想从then子句中访问c​​ase语句表达式,即food="cheese"casefoodwhen"dip"then"carrotsticks"when"cheese"then"#{expr}crackers"else"mayo"end在这种情况下,expr是食物的当前值(value)。在这种情况下,我知道,我可以简单地访问变量food,但是在某些情况下,该值可能无法再访问(array.shift等)。除了将expr移出到局部变量然后访问它之外,是否有直接访问caseexpr值的方法?罗亚附注我知道这个具体示例很简单,只是一个示例场景。 最佳答案

  8. ruby - 正则表达式 - 排除一个字符 - 2

    这是一个例子:s="abcd+subtext@example.com"s.match(/+[^@]*/)Result=>"+subtext"问题是,我不想在其中包含“+”。我希望结果是“潜台词”,没有+ 最佳答案 您可以在正则表达式中使用括号来创建匹配组:s="abcd+subtext@example.com"s=~/\+([^@]*)/&&$1=>"subtext" 关于ruby-正则表达式-排除一个字符,我们在StackOverflow上找到一个类似的问题:

  9. ruby - 在没有基准或时间的情况下用 Ruby 测量用户时间或系统时间 - 2

    因为我现在正在做一些时间测量,我想知道是否可以在不使用Benchmark类或命令行实用程序time的情况下测量用户时间或系统时间。使用Time类只显示挂钟时间,而不显示系统和用户时间,但是我正在寻找具有相同灵active的解决方案,例如time=TimeUtility.now#somecodeuser,system,real=TimeUtility.now-time原因是我有点不喜欢Benchmark,因为它不能只返回数字(编辑:我错了-它可以。请参阅下面的答案。)。当然,我可以解析输出,但感觉不对。*NIX系统的time实用程序也应该可以解决我的问题,但我想知道是否已经在Ruby中实

  10. ruby - 如何遍历 Ruby 中所有正则表达式匹配的字符串? - 2

    我们有一个字符串:“”这个正则表达式://i如何从当前字符串中获取所有匹配项? 最佳答案 "".scan(//)参见scan在ruby​​-docs上 关于ruby-如何遍历Ruby中所有正则表达式匹配的字符串?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6857852/

随机推荐