草庐IT

REGEX_EXTRACT

全部标签

Java Regex 检查字符串是否包含 XML 标记

我正在尝试使用String.match()函数确定一个字符串是否包含至少一个XML标记。由于项目的设置方式,我希望不必使用Pattern。目前我使用这个正则表达式:这显然只检查字符串是否有包含文本的左右箭头括号。我需要的是一种检查字符串是否只有一个带有Regex的XML标记的方法,例如输入如下:blahblahblahblah但不是像这样输入:blahblahblahblah这可能吗? 最佳答案 这个:if(input.matches("(?s).*(]*>.*|]*/>).*"))匹配两种类型的标签(标准和自闭合):blah不匹配

regex - 删除 xml 文件中没有排序或唯一的重复连续行

我有一个xml文件,我需要在其中保持标签的顺序,但有一个名为media的标签,它具有连续顺序的重复行。我想删除一个重复的媒体标签,但想保留所有父标签——(它们也是连续的和重复的)。我想知道是否有awk解决方案仅在模式匹配时才删除。例如:OnelineOnelineAnotherLineAnotherLine........andsoon我想保留连续的故事和文章标签,只删除媒体标签的重复项。我已经尝试了一些awk脚本,但如果不对文件进行排序并破坏xml的顺序,似乎什么也做不了。非常感谢任何帮助。 最佳答案 awk脚本可以帮助您awk'

regex - 为 Perl 配置 Notepad++ "Function List"

我正在尝试在notepad++(v6.7.5)上使用类(或包,用perl的说法)为Perl工作的“功能列表”功能。默认情况下仅支持包外的常规子例程。下面是函数列表配置文件中的XML片段(位于我的Windows机器上的C:\Users\user\AppData\Roaming\Notepad++\functionList.xml)。我自己在默认的“函数”节点之上添加了“classRange”节点。编辑:下面是更正后的XML,感谢用户stribizhev更新:我已经注释掉了“正常”函数部分,因为它导致我的所有方法在函数列表中出现两次。$functionName">$functionName

xml - Oracle 的 EXTRACT 函数是否打破了 XMLELEMENT 中的 NOENTITYESCAPING?

甲骨文11g。我发现如果我将NOENTITYESCAPING添加到XMLELEMENT函数,它会很好地关闭实体转义。但是,当我将结果传递给EXTRACT时,转义似乎又回来了。selectxmlelement(NOENTITYESCAPINGe,id,'->')from(selectlevelasidfromdualconnectbylevel')---------------------------------------1->2->3->4->5->现在,添加EXTRACT:selectxmlelement(NOENTITYESCAPINGe,id,'->').extract('//

java - 使用 Regex 修复 Java 中未转义的 XML 实体?

我有一些格式错误的XML,我必须对其进行解析。无法在上游解决问题。(当前)问题是&字符并不总是正确转义,所以我需要将&转换为&如果&已经存在,我不想将其更改为&。一般来说,如果任何结构良好的实体已经存在,我不想破坏它。一般来说,我认为不可能知道可能出现在任何特定XML文档中的所有实体,因此我想要一个解决方案,其中保留诸如&;之类的任何内容。其中是一些定义实体的字符集,介于初始&和结束;之间。特别是,和>不是表示XML元素的文字。现在,在解析时,如果我看到&,我不知道我会遇到;、(空格)、行尾还是另一个&。所以我认为我必须记住,因为我期待一个字符告诉我如何

c# - 从 XML 名称标签中删除无效字符 - RegEx C#

我有一个包含从网络服务中提取的xml数据的字符串。数据很难看,并且在xml的名称标签中有一些无效字符。例如,我可能会看到类似这样的内容:ScotttheCoderMyaddress地址名称字段中的#无效。我正在寻找一个正则表达式,它将从名称标签中删除所有无效字符,但将所有字符保留在xml的值部分中。换句话说,我想使用RegEx仅从开始名称标签和结束名称标签中删除字符。其他一切都应该保持不变。我还没有得到所有无效字符,但这会让我开始:#{}&()有没有可能做我想做的事? 最佳答案 如果您的目的只是检查Xml节点名称的有效性,我建议您看

regex - 如何在正则表达式中包含双引号(“)

有谁知道如何在正则表达式中包含双引号。我写了这个正则表达式但无法包含双引号 最佳答案 尝试在"后面加上反斜杠(\)。那将是正确的XML。 关于regex-如何在正则表达式中包含双引号(“),我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9809049/

sql - XML 甲骨文 : Multiple Child Node extract

我有一个xml代码:gordon100213214user1user2Jl.jalanpelan-pelankeBekasi,IndonesiamarkJl.jalancepet-cepetkeJakarta,Indonesia我的代码:FORrIN(SELECTVALUE(p)col_val,EXTRACT(VALUE(P),'/entry/codelist')AScode,EXTRACT(VALUE(P),'/entry/login')ASloginFROMTABLE(XMLSequence(Extract(x,'/begin/entry')))p)LOOPIFr.col_val.

regex - 从未知(对我来说)编码中删除不可打印的空格

所以我使用以下代码使用rXML包解析了一些XML文件library(XML)data一切正常,我得到了预期的结果dim(data)##[1]55456013唯一的问题是我的一些条目如下所示x试图识别编码(没有成功)Encoding(x)##[1]"unknown"library(stringi)stri_enc_detect(x)#[[1]]#[[1]]$Encoding#[1]"UTF-8""Shift_JIS""GB18030""EUC-JP""EUC-KR""Big5"##[[1]]$Language#[1]"""ja""zh""ja""ko""zh"##[[1]]$Confid

xml - 甲骨文 10g : Extract data (select) from XML (CLOB Type)

我是Oracle的新手,我在选择中遇到了一个问题——也许是微不足道的。(我使用的是Oracle10g快捷版)。我有一个带有字段CLOB的数据库:mytab.xml此列有一个像这样的XML:954954FaustoAnonimo040000000040000001我正在尝试进行“简单”选择以获取例如“传真”标签的值。但是我有点问题,我无法理解我的错误。例如:selectextract(xml,'//fax').getStringVal()frommytab;ORA-00932:inconsistentdatatypes:expected-gotselectextract(xmltype(