beautifulSoup_草庐IT

python - 使用 BeautifulSoup 在 Python 中查找非递归 DOM 子节点

有没有办法使用BeautifulSoup在Python中找到非递归DOM子节点？？例如考虑解析一个pom.xml文件:com.parentparent1.0-SNAPSHOT../pom.xml2.0.0com.parent.somemodulesome_modulejar1.0-SNAPSHOTSomeModule...如果我想在顶层获取groupId(特别是project->groupId，而不是project->parent->groupId)，我使用:withopen(pom)aspomHandle:soup=BeautifulSoup(pomHandle)groupId=so

python - 抓取 href 链接

尝试使用正确的关键字收集此页面上的特定链接，到目前为止我有:frombs4importBeautifulSoupimportrandomurl='http://www.thenextdoor.fr/en/4_adidas-originals'r=requests.get(url)soup=BeautifulSoup(r.text,'lxml')raw=soup.findAll('a',{'class':'add_to_compare'})links=raw['href']keyword1='adidas'keyword2='thenextdoor'keyword3='uncaged'f

python href 39 thenextdoor section xml web-scraping beautifulsoup

python - 将结果集转换为字符串并放入列表中

我正在尝试将列表中的值转换为普通字符串，例如listy=[['value1','value2','value3'],['value1','value2','value3'],[我初始化了一个空列表listy=[]并找到所有使用find_all('a')并将其生成为输出listy=[[...value1,value2,value3,...],[...value4,value5,value6,...],[]]我尝试使用item.find_all('a').string但是我得到了这个错误。AttributeError:'ResultSet'objecthasnoattribute'stri

放入 python code value 39 xml unicode beautifulsoup

python - 在 Beautiful Soup 中向 p 标签添加文本

我想知道是否有人知道如何将文本添加到标签(p、b——任何您可能想要包含字符数据的标签)。该文档没有提到您可以在哪里执行此操作。最佳答案我不确定这是否是您想要的，但也许这是一个开始...fromBeautifulSoupimportBeautifulSoup,NavigableStringhtml=""soup=BeautifulSoup(html)ptag=soup.find('p')ptag.insert(0,NavigableString("new"))printptag输出new文档显示了更多类似的示例:http://ww

Beautiful python section BeautifulSoup code html xml

python - BeautifulSoup 寻找 xml 标签

我有一些快餐店的OSM数据，我使用Xapi检索了这些数据,和here是一些示例结果:我正在尝试在python中使用BeautifulSoup从中提取纬度、经度、名称和美食。我可以通过这段代码获取纬度和经度，没有问题:soup=BeautifulSoup(results)takeaways=soup.findAll('node')foreachtakeawayintakeaways:longitude=str(eachtakeaway['lon'])lattitude=str(eachtakeaway['lat'])但是我不知道名字:name=str(eachtakeaway['name

BeautifulSoup python 34 code tag xml openstreetmap

python - 等效于 lxml 中 Beautiful Soup 的 renderContents() 方法？

在lxml中是否有与BeautifulSoup的tag.renderContents()方法等效的方法？我试过使用element.text，但它不会呈现子标签，以及''.join(etree.tostring(child)forchildinelement)，但这不会呈现子文本。我能找到的最接近的是etree.tostring(element)，但它呈现了我不想要的element的开始和结束标记。我是否忽略了另一种方法(或实现此目的的替代方法)？最佳答案您的最初想法已基本完成。element.text为您提供元素的第一个文本子元

等效 renderContents code gt section python xml rendering beautifulsoup lxml

python - 将修改后的 Beautiful Soup 树写入文件，同时保持原始 XML 格式

我们有一个XML文档，其中有一个我们希望更改的标签:...1.0...它深埋在XML文件中，但我们成功地使用BeautifulSoup将其内容替换为命令行参数。问题是在修改树之后，我们需要写回我们从中读取它的文件。但是，我们希望保持文档的原始格式。当我使用时:fileForWriting=open(myXmlFile,'w')fileForWriting.write(soup.prettify())prettify()调用破坏了格式，我最终得到:1.0有没有办法在替换单个标记文本的同时保持XML文档的原始格式？注意:简单使用:fileForWriting.write(str(soup)

Beautiful python code strong fileForWriting xml xml-parsing beautifulsoup

xml - BeautifulSoup 不使用 utf-8 以外的其他编码解析 xml

我可以读取所有以开头的xmls文件但我无法读取以开头的文件.具体来说，我有两个文件:xml_iso.xml:ToveJaniReminderxml-utf.xml:ToveJaniReminder使用以下代码我可以找到note对于带有utf-8的文件但我无法在其他编码的文件中找到它。我该如何解决？示例代码:importunittestfrombs4importBeautifulSoupasSoupclassTestEncoding(unittest.TestCase):deftest_iso(self):withopen('tests/xml-iso.xml','r')asf_in:x

utf-8 BeautifulSoup xml code 39 python-3.x encoding

python - BeautifulSoup 中的 selfClosingTags

使用BeautifulSoup解析我的XMLimportBeautifulSoupsoup=BeautifulSoup.BeautifulStoneSoup("""hello""")#selfClosingTags=['alan'])printsoup.prettify()这将输出:hello即，anne标签是alan标签的子标签。如果我在创建汤时传递selfClosingTags=['alan']，我会得到:hello太棒了!我的问题:为什么不能使用/>来指示自闭标签？最佳答案你问的是作者在注意到他给类/模块命名如Beauti

selfClosingTags BeautifulSoup gt 34 code python xml

python - 如何在 Python 和 LXML 中解析 XML？

这是我的项目:我正在使用RRDTool从WeatherBug绘制天气数据图表。我需要一种简单、高效的方法来从WeatherBug下载天气数据。我使用的是一个非常低效的bash-script-scraper，但后来转向了BeautifulSoup。性能太慢(它在RaspberryPi上运行)所以我需要使用LXML。我目前拥有的:fromlxmlimportetreedoc=etree.parse('weather.xml')printdoc.xpath("//aws:weather/aws:ob/aws:temp")但是我收到一条错误消息。Weather.xml是这样的:http://w

何在 python aws 34 gt xml parsing beautifulsoup lxml