草庐IT

regex_constants

全部标签

Java Regex 检查字符串是否包含 XML 标记

我正在尝试使用String.match()函数确定一个字符串是否包含至少一个XML标记。由于项目的设置方式,我希望不必使用Pattern。目前我使用这个正则表达式:这显然只检查字符串是否有包含文本的左右箭头括号。我需要的是一种检查字符串是否只有一个带有Regex的XML标记的方法,例如输入如下:blahblahblahblah但不是像这样输入:blahblahblahblah这可能吗? 最佳答案 这个:if(input.matches("(?s).*(]*>.*|]*/>).*"))匹配两种类型的标签(标准和自闭合):blah不匹配

regex - 删除 xml 文件中没有排序或唯一的重复连续行

我有一个xml文件,我需要在其中保持标签的顺序,但有一个名为media的标签,它具有连续顺序的重复行。我想删除一个重复的媒体标签,但想保留所有父标签——(它们也是连续的和重复的)。我想知道是否有awk解决方案仅在模式匹配时才删除。例如:OnelineOnelineAnotherLineAnotherLine........andsoon我想保留连续的故事和文章标签,只删除媒体标签的重复项。我已经尝试了一些awk脚本,但如果不对文件进行排序并破坏xml的顺序,似乎什么也做不了。非常感谢任何帮助。 最佳答案 awk脚本可以帮助您awk'

regex - 为 Perl 配置 Notepad++ "Function List"

我正在尝试在notepad++(v6.7.5)上使用类(或包,用perl的说法)为Perl工作的“功能列表”功能。默认情况下仅支持包外的常规子例程。下面是函数列表配置文件中的XML片段(位于我的Windows机器上的C:\Users\user\AppData\Roaming\Notepad++\functionList.xml)。我自己在默认的“函数”节点之上添加了“classRange”节点。编辑:下面是更正后的XML,感谢用户stribizhev更新:我已经注释掉了“正常”函数部分,因为它导致我的所有方法在函数列表中出现两次。$functionName">$functionName

java - 使用 Regex 修复 Java 中未转义的 XML 实体?

我有一些格式错误的XML,我必须对其进行解析。无法在上游解决问题。(当前)问题是&字符并不总是正确转义,所以我需要将&转换为&如果&已经存在,我不想将其更改为&。一般来说,如果任何结构良好的实体已经存在,我不想破坏它。一般来说,我认为不可能知道可能出现在任何特定XML文档中的所有实体,因此我想要一个解决方案,其中保留诸如&;之类的任何内容。其中是一些定义实体的字符集,介于初始&和结束;之间。特别是,和>不是表示XML元素的文字。现在,在解析时,如果我看到&,我不知道我会遇到;、(空格)、行尾还是另一个&。所以我认为我必须记住,因为我期待一个字符告诉我如何

c# - 从 XML 名称标签中删除无效字符 - RegEx C#

我有一个包含从网络服务中提取的xml数据的字符串。数据很难看,并且在xml的名称标签中有一些无效字符。例如,我可能会看到类似这样的内容:ScotttheCoderMyaddress地址名称字段中的#无效。我正在寻找一个正则表达式,它将从名称标签中删除所有无效字符,但将所有字符保留在xml的值部分中。换句话说,我想使用RegEx仅从开始名称标签和结束名称标签中删除字符。其他一切都应该保持不变。我还没有得到所有无效字符,但这会让我开始:#{}&()有没有可能做我想做的事? 最佳答案 如果您的目的只是检查Xml节点名称的有效性,我建议您看

regex - 如何在正则表达式中包含双引号(“)

有谁知道如何在正则表达式中包含双引号。我写了这个正则表达式但无法包含双引号 最佳答案 尝试在"后面加上反斜杠(\)。那将是正确的XML。 关于regex-如何在正则表达式中包含双引号(“),我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9809049/

regex - 从未知(对我来说)编码中删除不可打印的空格

所以我使用以下代码使用rXML包解析了一些XML文件library(XML)data一切正常,我得到了预期的结果dim(data)##[1]55456013唯一的问题是我的一些条目如下所示x试图识别编码(没有成功)Encoding(x)##[1]"unknown"library(stringi)stri_enc_detect(x)#[[1]]#[[1]]$Encoding#[1]"UTF-8""Shift_JIS""GB18030""EUC-JP""EUC-KR""Big5"##[[1]]$Language#[1]"""ja""zh""ja""ko""zh"##[[1]]$Confid

.net - 我可以在 XPath 表达式中使用 Regex 吗?

像.//div[@id='foo\d+]这样的东西来捕获带有id='foo123'的div标签。如果重要的话,我正在使用.NET。 最佳答案 正如其他答案所指出的,XPath1.0不支持正则表达式。尽管如此,您有以下选择:使用XPath1.0表达式(注意starts-with()和translate()函数),如下所示:.//div[starts-with(@id,'foo')and'foo'=translate(@id,'0123456789','')andstring-length(@id)>3]使用EXSLT.NET-有一种方

regex - 如何使用正则表达式验证带有可选百分比符号的小数?

作为问题的标题,我需要使用以下值来验证正则表达式:(最多2位小数和9位整数)带有可选的百分号。有效:10%0%1111111.12%15.2%102.3无效:.%12.%.02%%123456789123.123我试过:^[0-9]{0,9}([\.][0-9]{0,2})\d[\%]{0,1}?$但它并没有像我想要的那样工作。 最佳答案 试试这个^\d{1,9}(\.\d{1,2})?%?$我在rubular上测试过,你的例子集没问题。 关于regex-如何使用正则表达式验证带有可选百

regex - 为什么这个正则表达式匹配返回一个 HashMap ?

我有一个HashMap,我正在对每个键执行正则表达式。匹配后,我想将此信息存储到列表(而不是HashMap)中。这是我正在做的:$listOfStuff=$myArray.keys|%{if($_.FullName-match'KB[0-9]{7}'){$matches}}这将返回以下内容:NameValue--------0KB12345670KB01234560KB00123450KB0001234我怎样才能让它返回:KB1234567KB0123456KB0012345KB0001234 最佳答案 一种方式:$listOfSt