草庐IT

java - 使用 Jsoup 选择没有类的 HTML 元素

考虑像这样的html文档...............我们如何选择所有的p元素,但不包括具有random_class_name类的p元素? 最佳答案 Elementsps=body.select("p:not(.random_class_name)");你可以使用伪选择器:not如果不知道类名,你仍然可以使用类似的表达式:Elementsps=body.select("p:not([class])");在第二个示例中,我使用了属性选择器[],在第一个示例中,我使用了类的正常语法。参见Jsoupdocuaboutcssselector

java - 如何使用 jsoup 从这个 html 标签中获取文本?

我在使用jsoup提取数据时遇到了一个问题。像这样的数据:Thisisastrongnumber2013我想获取这样的数据:这是一个数字我该怎么做?谁能帮帮我? 最佳答案 您可以将html解析为Document,选择body-Element并获取其文本。示例:Documentdoc=Jsoup.parse("Thisisastrongnumber2013");StringownText=doc.body().ownText();Stringtext=doc.body().text();System.out.println(ownTe

java - 如何使用 jsoup 从这个 html 标签中获取文本?

我在使用jsoup提取数据时遇到了一个问题。像这样的数据:Thisisastrongnumber2013我想获取这样的数据:这是一个数字我该怎么做?谁能帮帮我? 最佳答案 您可以将html解析为Document,选择body-Element并获取其文本。示例:Documentdoc=Jsoup.parse("Thisisastrongnumber2013");StringownText=doc.body().ownText();Stringtext=doc.body().text();System.out.println(ownTe

javascript - Jquery 删除除粗体以外的所有内容

我有这样的html:BoldtextItalictextBoldtext2Italictext2Boldtext3我想删除所有不是粗体的元素。我试过这段代码:$('*:not(b)').remove();和其他一些变体,但它们要么出错,要么删除所有内容。顺便说一句,jquery选择器和jsoup选择器是100%兼容的吗?我也想在jsoup中使用这个问题的答案。 最佳答案 您当前的代码删除文档以及所有包含的s标签。如果您只想保存粗体文本,那么Shih-EnChou的解决方案效果很好。如果你想保存的结构标签也在里面,你可以这样做:$("

javascript - Jquery 删除除粗体以外的所有内容

我有这样的html:BoldtextItalictextBoldtext2Italictext2Boldtext3我想删除所有不是粗体的元素。我试过这段代码:$('*:not(b)').remove();和其他一些变体,但它们要么出错,要么删除所有内容。顺便说一句,jquery选择器和jsoup选择器是100%兼容的吗?我也想在jsoup中使用这个问题的答案。 最佳答案 您当前的代码删除文档以及所有包含的s标签。如果您只想保存粗体文本,那么Shih-EnChou的解决方案效果很好。如果你想保存的结构标签也在里面,你可以这样做:$("

android - Jsoup.parse() 方法的替代方法

我使用Jsoup.parse()来解析thisdata.一切都很好,但需要很多时间。例如,此数据需要20秒。用于解析。还有其他解决方案可以满足我的需求吗?代码:rezult=Jsoup.parse(res.parse().outerHtml(),"UTF-8").text();res是来自link的文本.===========更新=============我将此变量与Jsoup.parse()分开,并了解到这是问题的根源。它需要20秒,而不是Jsoup.parse()。Stringtmp=res.parse().outerHtml();这个只需要1秒:rezult=Jsoup.pars

android - Jsoup.parse() 方法的替代方法

我使用Jsoup.parse()来解析thisdata.一切都很好,但需要很多时间。例如,此数据需要20秒。用于解析。还有其他解决方案可以满足我的需求吗?代码:rezult=Jsoup.parse(res.parse().outerHtml(),"UTF-8").text();res是来自link的文本.===========更新=============我将此变量与Jsoup.parse()分开,并了解到这是问题的根源。它需要20秒,而不是Jsoup.parse()。Stringtmp=res.parse().outerHtml();这个只需要1秒:rezult=Jsoup.pars

java - 使用Jsoup获取没有属性的元素

我有以下html,使用Jsoup我试图提取p部分中没有任何属性的文本(文本“Sometext2”而不是“Sometext1”)。Sometext1Sometext2我尝试使用以下Jsoup表达式:div[id=intro]>p:not(:has(@*))但它不起作用。感谢您的帮助。 最佳答案 我想你可以使用JSOUPCSSselectorp:not([^]),它将选择任何不匹配的具有以任何内容开头的属性的p。Stringhtml=""+""+""+"Sometext1"+""+""+"SometextA"+""+""+"Somete

java - 使用Jsoup获取没有属性的元素

我有以下html,使用Jsoup我试图提取p部分中没有任何属性的文本(文本“Sometext2”而不是“Sometext1”)。Sometext1Sometext2我尝试使用以下Jsoup表达式:div[id=intro]>p:not(:has(@*))但它不起作用。感谢您的帮助。 最佳答案 我想你可以使用JSOUPCSSselectorp:not([^]),它将选择任何不匹配的具有以任何内容开头的属性的p。Stringhtml=""+""+""+"Sometext1"+""+""+"SometextA"+""+""+"Somete

java - Jsoup 404错误

我是Jsoup的新手,但我不明白为什么在尝试获取页面时收到404错误,即使该页面可以从浏览器访问并且我没有使用任何代理。我试过以下代码:privatestaticDocumentconnect(){Stringurl="http://www.transfermarkt.co.uk/real-madrid/startseite/verein/418";Documentdoc=null;try{doc=Jsoup.connect(url).get();}catch(NullPointerExceptione){//TODOAuto-generatedcatchblocke.printSta