草庐IT

get_shortcode_regex

全部标签

regex - 删除 xml 文件中没有排序或唯一的重复连续行

我有一个xml文件,我需要在其中保持标签的顺序,但有一个名为media的标签,它具有连续顺序的重复行。我想删除一个重复的媒体标签,但想保留所有父标签——(它们也是连续的和重复的)。我想知道是否有awk解决方案仅在模式匹配时才删除。例如:OnelineOnelineAnotherLineAnotherLine........andsoon我想保留连续的故事和文章标签,只删除媒体标签的重复项。我已经尝试了一些awk脚本,但如果不对文件进行排序并破坏xml的顺序,似乎什么也做不了。非常感谢任何帮助。 最佳答案 awk脚本可以帮助您awk'

python - 元素树 : Can't build root tree when getting XML from webpage

我正在尝试解析从Web下载的XML页面。importrequestsurl="http://www.w3schools.com/xml/cd_catalog.xml"XML=requests.get(url)printXML.contenttree=ET.ElementTree(XML)root=tree.getroot()printroot.tag,root.attrib当我尝试这样做时,我遇到了两个错误之一对于上面的示例网页AttributeError:'Response'对象没有属性'tag'对于我正在查看的实际XML站点AttributeError:'str'对象没有属性'ta

xml - XSLT : getting the prefix of an element?

在XSLT1.0中,您可以使用以下函数获取XML元素的本地名称或namespaceUri:stringlocal-name(node)和stringnamespace-uri(node)但是是否有一个标准的函数来获取具有限定名称的元素的前缀? 最佳答案 据我所知没有。如果你确定节点名称有前缀,你可以使用这个:substring-before(name(),':')或者这个,如果你不确定:substring-before(name(),concat(':',local-name()))后一种表达是基于substring-before(

xml - eclipse 3.5 : How to get file name from Editor?

谁能告诉我如何从编辑器中获取文件名?我只是制作了自己的编辑器来打开xml文件并创建几个部分来显示数据。现在我想读书XML文件并将其放在该部分内。我想我现在如何读取xml数据,但我不知道如何访问文件名以便将其打开。谢谢 最佳答案 我意识到这是旧的,但由于我在寻找完全相同问题的解决方案时偶然发现了它,所以我想在VonC的答案中添加注释:IFileEditorInput隐藏在org.eclipse.ui.ide插件中,因此为了使解决方案正常工作,您的插件需要将其声明为依赖项。 关于xml-ec

regex - 为 Perl 配置 Notepad++ "Function List"

我正在尝试在notepad++(v6.7.5)上使用类(或包,用perl的说法)为Perl工作的“功能列表”功能。默认情况下仅支持包外的常规子例程。下面是函数列表配置文件中的XML片段(位于我的Windows机器上的C:\Users\user\AppData\Roaming\Notepad++\functionList.xml)。我自己在默认的“函数”节点之上添加了“classRange”节点。编辑:下面是更正后的XML,感谢用户stribizhev更新:我已经注释掉了“正常”函数部分,因为它导致我的所有方法在函数列表中出现两次。$functionName">$functionName

xml - Groovy XmlSlurper : get value of attribute that has an associated namespace

我有一个XML文档,其中包含具有限定名称的属性。我想使用XmlSlurper获取属性值,但尝试在不指定命名空间的情况下访问属性不起作用(下面是一个最小示例)。defrootNode=newXmlSlurper().parseText('''Sometext!''')assertrootNode.one[0].@a1.text()=='uno!'rootNode.one[0].@a1.text()将产生一个空字符串。如果使用rootNode.one[0].'@ex:a1'.text()我们会得到正确的值,但这取决于文档中使用的namespace前缀-并且不能依赖于其他文档相同,关联的命名

java - 使用 Regex 修复 Java 中未转义的 XML 实体?

我有一些格式错误的XML,我必须对其进行解析。无法在上游解决问题。(当前)问题是&字符并不总是正确转义,所以我需要将&转换为&如果&已经存在,我不想将其更改为&。一般来说,如果任何结构良好的实体已经存在,我不想破坏它。一般来说,我认为不可能知道可能出现在任何特定XML文档中的所有实体,因此我想要一个解决方案,其中保留诸如&;之类的任何内容。其中是一些定义实体的字符集,介于初始&和结束;之间。特别是,和>不是表示XML元素的文字。现在,在解析时,如果我看到&,我不知道我会遇到;、(空格)、行尾还是另一个&。所以我认为我必须记住,因为我期待一个字符告诉我如何

c# - 从 XML 名称标签中删除无效字符 - RegEx C#

我有一个包含从网络服务中提取的xml数据的字符串。数据很难看,并且在xml的名称标签中有一些无效字符。例如,我可能会看到类似这样的内容:ScotttheCoderMyaddress地址名称字段中的#无效。我正在寻找一个正则表达式,它将从名称标签中删除所有无效字符,但将所有字符保留在xml的值部分中。换句话说,我想使用RegEx仅从开始名称标签和结束名称标签中删除字符。其他一切都应该保持不变。我还没有得到所有无效字符,但这会让我开始:#{}&()有没有可能做我想做的事? 最佳答案 如果您的目的只是检查Xml节点名称的有效性,我建议您看

regex - 如何在正则表达式中包含双引号(“)

有谁知道如何在正则表达式中包含双引号。我写了这个正则表达式但无法包含双引号 最佳答案 尝试在"后面加上反斜杠(\)。那将是正确的XML。 关于regex-如何在正则表达式中包含双引号(“),我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9809049/

regex - 从未知(对我来说)编码中删除不可打印的空格

所以我使用以下代码使用rXML包解析了一些XML文件library(XML)data一切正常,我得到了预期的结果dim(data)##[1]55456013唯一的问题是我的一些条目如下所示x试图识别编码(没有成功)Encoding(x)##[1]"unknown"library(stringi)stri_enc_detect(x)#[[1]]#[[1]]$Encoding#[1]"UTF-8""Shift_JIS""GB18030""EUC-JP""EUC-KR""Big5"##[[1]]$Language#[1]"""ja""zh""ja""ko""zh"##[[1]]$Confid