xpath

html - 使用 XPath 解析 HTML 中的数据(在 shell 脚本中)

我正在尝试解析一个相当简单的网页以获取shell脚本中的信息。我现在使用的网页生成了here.例如，我想将有关Internet服务提供商的信息提取到一个shell变量中。为此，使用xmllint、XMLStarlet或xpath程序之一可能是有意义的。我非常熟悉shell脚本，但我对XPath语法和用于实现XPath语法的实用程序不熟悉，所以我希望能得到一些正确方向的指示。这是shell脚本的开头:HTMLISPInformation="$(curl--user-agent"Mozilla/5.0"http://aruljohn.com/details.php)"#ISP="$()"为

html - 使用 XPATH 使用 HTML Agility Pack 获取元标记属性

METAHTTP-EQUIV="Content-Type"CONTENT="text/html;charset=iso-8859-1"/>TITLE>MicrosoftCorporationMETAhttp-equiv="PICS-Label"content="(PICS-1.1"http://www.rsac.org/ratingsv01.html"lgentruer(n0s0v0l0))"/>METANAME="KEYWORDS"CONTENT="products;headlines;downloads;news;Website;what'snew;solutions;servic

Agility XPATH 34 section CONTENT html html-agility-pack

php - 将 HTML 文本转换为 Leet (1337) Speak with XPath

我想将网页转换为leet(1337)speakwithXPath和PHP。它可以仅使用PHP来完成，但随后HTML节点也被leetspeak替换。示例($html是网页):$find=array("a","b","c","d","e","f","g","h","i","j"."k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z");$repl=array("4","b","c","d","3","f","g","h","1","j","k","1","m","n","0","p","9","r","5","7","

Speak XPath 39 34 code php html domdocument

python - 获取 xpath() 以返回空值

我有很多的情况标签:121314121如您所见，倒数第二个标签是空的。当我打电话时:sel.xpath('b/text()').extract()这给了我:['12','13','14','121']我想要:['12','13','14','','121']有没有办法获取空值？我目前的解决方法是调用:sel.xpath('b').extract()然后自己解析每个html标签(空标签在这里，这就是我想要的)。最佳答案这是可以手动剥离标签并获取文本的地方。您可以使用remove_tags()w3lib提供的功能:>>>fromw3

python xpath code 39 section html web-scraping scrapy

html - 使用 XPath 选择 following-sibling 的 href 属性

我正在尝试抓取以下网站:http://www.hudson211.org/zf/profile/service/id/659837我正在尝试选择“网址”文本旁边的href。下面的xpath选择器获取我之后的标签:$x("//th[contains(text(),'WebAddress')]/following-sibling::td/a")返回www.co.sullivan.ny.us但是，当我专门尝试使用@href提取href时，返回值是一个空数组:$x("//th[contains(text(),'WebAddress')]/following-sibling::td/a/@hre

following-sibling following code 34 href html google-chrome xpath web-scraping

c# - XPath/HtmlAgilityPack : How to find an element (a) with a specific value for an attribute (href) and find adjacent table columns?

我非常绝望，因为我不知道如何实现我在问题中所说的。我已经阅读了无数类似的例子，但没有找到一个在确切情况下有效的例子。所以，假设我有以下代码:textAidAimgAtextBidBimgBtextCidCimgC现在，我已经拥有的是url-a的一部分。我基本上想知道如何获得idA和imgA。我正在尝试使用XPath来“找到”该行，但我无法找到使其工作的方法。此外，也可能根本不存在该信息。这是我最近的尝试(说真的，我已经修改了3个多小时，现在尝试了许多不同的方法):if(htmlDoc.DocumentNode.SelectSingleNode(@"/a[contains(@href,'

c#find lt gt strong html visual-studio xpath html-agility-pack

html - 用于在跨度内检索文本的 XPath

我正在尝试找出将从以下HTML片段中检索“文本数据3”的XPathText-data1TextData2textData3到目前为止，我已经尝试了以下Xpath，它引导我进入带有“inner-span”类的跨度/html/body/div/div[4]/div[2]/div[2]/div/div[2]/div/span[@class="inner-span"]但不知道要向Xpath添加更多内容，这只会给我上面Html片段中的文本“文本数据3”。谢谢最佳答案对于您的特定情况，此XPath查询将起作用:normalize-space

跨度 XPath section span inner-span html xpath-2.0

python - 如何选择所有子文本但不包括带有 Scapy 的 XPath 的标签？

我有这个html:Title1Sub-Title1Description1.Description2.Sub-Title2Description1Description2InformationTitleLongInformationText我想获取中的所有文本在Scrapy中使用XPath但不包括的内容，所以预期的结果是这样的:Title1Sub-Title1Descripton1.Descripton2.Sub-Title2Descripton1.Descripton2.但我还没有达到排除部分，我还在努力从中获取文本.我试过这个:response.xpath('//*[@id="co

python Scapy code Description content html xpath scrapy

javascript - 如何通过单击 html 元素获取 xpath

我是编程新手，必须在单击html元素时生成Xpath。例如:如果我点击了用户名的文本框，那么它应该给我xpath之类的html/head/body/tr[1]/table[2].....等等。主要是我不能使用firebug，因为我的应用程序完全可以在IE上运行。我已经看到很多fxn获取xpath并尝试集成它，但我没有得到返回值。我使用jqueryclick()函数检索值的简单代码片段不起作用。问题是我无法在函数中传递html元素。我仅从该站点获取的xpath函数。我的代码如下。clickdemop{color:red;margin:5px;cursor:pointer;}p:hover

javascript xpath element gt jquery html

html - 混合内容 html 跨度的 selenium xpath 抓取

我正在尝试抓取具有混合内容的span元素boldtitletextherethatIwanttograb....这是识别跨度的抓取代码片段。它可以毫无问题地拾取它，但是网络元素的文本字段是空白的。IWebDriverdriver=newFirefoxDriver();driver.Navigate().GoToUrl("http://page-to-examine.com");varquery=driver.FindElement(By.XPath("//span[@id='span-id']"));我已经尝试将/text()添加到同样不返回任何内容的表达式中。如果我添加/b我确实得到

跨度 html code span strong selenium selenium-webdriver xpath

209 210 211212213 214 215