JSoup_草庐IT

java - 使用 Jsoup 选择没有类的 HTML 元素

考虑像这样的html文档...............我们如何选择所有的p元素，但不包括具有random_class_name类的p元素？最佳答案 Elementsps=body.select("p:not(.random_class_name)");你可以使用伪选择器:not如果不知道类名，你仍然可以使用类似的表达式:Elementsps=body.select("p:not([class])");在第二个示例中，我使用了属性选择器[]，在第一个示例中，我使用了类的正常语法。参见Jsoupdocuaboutcssselector

java - 如何使用 jsoup 从这个 html 标签中获取文本？

我在使用jsoup提取数据时遇到了一个问题。像这样的数据:Thisisastrongnumber2013我想获取这样的数据:这是一个数字我该怎么做？谁能帮帮我？最佳答案您可以将html解析为Document，选择body-Element并获取其文本。示例:Documentdoc=Jsoup.parse("Thisisastrongnumber2013");StringownText=doc.body().ownText();Stringtext=doc.body().text();System.out.println(ownTe

jsoup java strong code section html

java - 如何使用 jsoup 从这个 html 标签中获取文本？

我在使用jsoup提取数据时遇到了一个问题。像这样的数据:Thisisastrongnumber2013我想获取这样的数据:这是一个数字我该怎么做？谁能帮帮我？最佳答案您可以将html解析为Document，选择body-Element并获取其文本。示例:Documentdoc=Jsoup.parse("Thisisastrongnumber2013");StringownText=doc.body().ownText();Stringtext=doc.body().text();System.out.println(ownTe

jsoup java strong code section html

javascript - Jquery 删除除粗体以外的所有内容

我有这样的html:BoldtextItalictextBoldtext2Italictext2Boldtext3我想删除所有不是粗体的元素。我试过这段代码:$('*:not(b)').remove();和其他一些变体，但它们要么出错，要么删除所有内容。顺便说一句，jquery选择器和jsoup选择器是100%兼容的吗？我也想在jsoup中使用这个问题的答案。最佳答案您当前的代码删除文档以及所有包含的s标签。如果您只想保存粗体文本，那么Shih-EnChou的解决方案效果很好。如果你想保存的结构标签也在里面，你可以这样做:$("

javascript Jquery code section gt html selector jsoup

javascript - Jquery 删除除粗体以外的所有内容

我有这样的html:BoldtextItalictextBoldtext2Italictext2Boldtext3我想删除所有不是粗体的元素。我试过这段代码:$('*:not(b)').remove();和其他一些变体，但它们要么出错，要么删除所有内容。顺便说一句，jquery选择器和jsoup选择器是100%兼容的吗？我也想在jsoup中使用这个问题的答案。最佳答案您当前的代码删除文档以及所有包含的s标签。如果您只想保存粗体文本，那么Shih-EnChou的解决方案效果很好。如果你想保存的结构标签也在里面，你可以这样做:$("

javascript Jquery code section gt html selector jsoup

android - Jsoup.parse() 方法的替代方法

我使用Jsoup.parse()来解析thisdata.一切都很好，但需要很多时间。例如，此数据需要20秒。用于解析。还有其他解决方案可以满足我的需求吗？代码:rezult=Jsoup.parse(res.parse().outerHtml(),"UTF-8").text();res是来自link的文本.===========更新=============我将此变量与Jsoup.parse()分开，并了解到这是问题的根源。它需要20秒，而不是Jsoup.parse()。Stringtmp=res.parse().outerHtml();这个只需要1秒:rezult=Jsoup.pars

android Jsoup 043 0435 code html json parsing

android - Jsoup.parse() 方法的替代方法

我使用Jsoup.parse()来解析thisdata.一切都很好，但需要很多时间。例如，此数据需要20秒。用于解析。还有其他解决方案可以满足我的需求吗？代码:rezult=Jsoup.parse(res.parse().outerHtml(),"UTF-8").text();res是来自link的文本.===========更新=============我将此变量与Jsoup.parse()分开，并了解到这是问题的根源。它需要20秒，而不是Jsoup.parse()。Stringtmp=res.parse().outerHtml();这个只需要1秒:rezult=Jsoup.pars

android Jsoup 043 0435 code html json parsing

java - 使用Jsoup获取没有属性的元素

我有以下html，使用Jsoup我试图提取p部分中没有任何属性的文本(文本“Sometext2”而不是“Sometext1”)。Sometext1Sometext2我尝试使用以下Jsoup表达式:div[id=intro]>p:not(:has(@*))但它不起作用。感谢您的帮助。最佳答案我想你可以使用JSOUPCSSselectorp:not([^])，它将选择任何不匹配的具有以任何内容开头的属性的p。Stringhtml=""+""+""+"Sometext1"+""+""+"SometextA"+""+""+"Somete

Jsoup java 34 code section html

java - 使用Jsoup获取没有属性的元素

我有以下html，使用Jsoup我试图提取p部分中没有任何属性的文本(文本“Sometext2”而不是“Sometext1”)。Sometext1Sometext2我尝试使用以下Jsoup表达式:div[id=intro]>p:not(:has(@*))但它不起作用。感谢您的帮助。最佳答案我想你可以使用JSOUPCSSselectorp:not([^])，它将选择任何不匹配的具有以任何内容开头的属性的p。Stringhtml=""+""+""+"Sometext1"+""+""+"SometextA"+""+""+"Somete

Jsoup java 34 code section html

java - Jsoup 404错误

我是Jsoup的新手，但我不明白为什么在尝试获取页面时收到404错误，即使该页面可以从浏览器访问并且我没有使用任何代理。我试过以下代码:privatestaticDocumentconnect(){Stringurl="http://www.transfermarkt.co.uk/real-madrid/startseite/verein/418";Documentdoc=null;try{doc=Jsoup.connect(url).get();}catch(NullPointerExceptione){//TODOAuto-generatedcatchblocke.printSta

Jsoup java printStackTrace catch HttpConnection html connection http-status-code-404