我需要从给定的HTML页面中提取一部分HTML。到目前为止,我使用带有tagsoup的XmlSlurper来解析HTML页面,然后尝试使用StreamingMarkupBuilder获取所需的部分:importgroovy.xml.StreamingMarkupBuilderdefhtml="atest"defdom=newXmlSlurper(neworg.ccil.cowan.tagsoup.Parser()).parseText(html)printlnnewStreamingMarkupBuilder().bindNode(dom.body)但是,我得到的结果是atest这看起
我在groovy中有以下代码片段:s='''MytitleThisisbody!'''newXmlSlurper().parse(s)它给出以下异常:java.net.MalformedURLException:noprotocol:MytitleThisisbody!atjava.net.URL.(URL.java:586)atjava.net.URL.(URL.java:483)atjava.net.URL.(URL.java:432)atcom.sun.org.apache.xerces.internal.impl.XMLEntityManager.setupCurrentEnt
我在groovy中有以下代码片段:s='''MytitleThisisbody!'''newXmlSlurper().parse(s)它给出以下异常:java.net.MalformedURLException:noprotocol:MytitleThisisbody!atjava.net.URL.(URL.java:586)atjava.net.URL.(URL.java:483)atjava.net.URL.(URL.java:432)atcom.sun.org.apache.xerces.internal.impl.XMLEntityManager.setupCurrentEnt
我正在编写一个HTML解析器,它使用TagSoup将格式良好的结构传递给XMLSlurper。这是通用代码:defhtmlText="""Heading2href1linktextextrastuffHereistheaddressTelephonenumber:telephonehref2linktextextrastuffHereisanotheraddressAnothertelephone:08451111111"""defhtml=newXmlSlurper(neworg.ccil.cowan.tagsoup.Parser()).parseText(htmlText);htm