草庐IT

html - Xpath 和 innerHTML

我可以使用什么Xpath表达式来查找其实际文本(innerHTML)为注销的所有anchor(只是“a”)元素。有点像//a[@innerHTML='Logout']这样对吗? 最佳答案 不,这是不正确的。innerHTML是属性,是对象模型的一部分,而XPath对标记和属性进行操作。除非您的a标签实际上有一个名为innerHTML的属性,否则这是行不通的。如果要比较标签本身的值,可以使用.(点)来引用标签:a[.='Logout']但是,我必须补充一点,以防万一您使用的是jQuery:我不确定它是否适用于jQuery。jQuery

html - 是否有类似 "CSS selector"或 XPath grep 的东西?

我需要在一堆HTML文件中找到位于以下结构(CSS)中的所有位置:div.aul.b或XPath://div[@class="a"]//div[@class="b"]grep在这里帮不了我。是否有一个命令行工具可以返回符合此条件的所有文件(以及其中的所有位置)?即,如果文件匹配特定的HTML或XML结构,则返回文件名。 最佳答案 试试这个:安装http://www.w3.org/Tools/HTML-XML-utils/.Ubuntu:aptitudeinstallhtml-xml-utils苹果操作系统:brewinstallht

python - 为 html 表提取 lxml xpath

我有一个类似于以下的html文档:CodeNameHighLowAAInc.45.4444.26BBInc.18.2917.92我需要从表中提取code/name/high/low信息。我使用了StackOverFlow中类似示例之一的以下代码:#############################importurllib2fromlxmlimporthtml,etreewebpg=urllib2.urlopen(http://www.eoddata.com/stocklist/NYSE/A.htm).read()table=html.fromstring(webpg)forrow

html - XPath:你如何在 xpath 中进行小写调用

我正在使用Firefox的XPath-checker,但语法不正确。我有一个链接:LinkName然后我尝试做://a[lower-case(child::text())='linkname']但是我有一个语法错误。我做错了什么?谢谢 最佳答案 在XPath1.0(Firefox中使用的XPath版本)中没有名为lower-case的函数。你需要使用丑陋的translate函数来代替:-translate(text(),'ABCDEFGHIJKLMNOPQRSTUVWXYZ','abcdefghijklmnopqrstuvwxyz'

html - 获取所有节点的 XPATH

是否有一个库可以为我提供HTML页面中所有节点的XPATH? 最佳答案 isthereanylibrarythatcangivemeXPATHforallthenodesinHTMLpage是,如果此HTML页面是格式正确的XML文档。取决于您对“节点”的理解...//*选择文档中的所有元素。/descendant-or-self::node()选择所有元素、文本节点、处理指令、注释节点和根节点/。//text()选择文档中的所有文本节点。//comment()选择文档中的所有注释节点。//processing-instructio

html - 从 IMG 标签解析 "SRC"的 XPath?

现在我成功地从HTML页面中获取了完整的元素://img[@class='photo-large']例如它会返回这个:但我只需要SRCurl(http://example.com/img.jpg)。有帮助吗? 最佳答案 你自己很接近回答这个问题,我有点不愿意为你回答。但是,以下XPath应该提供您想要的内容(当然前提是源是XHTML)。//img[@class='photo-large']/@src有关更多提示,请查看W3Schools.他们有关于此类事情的优秀教程和很好的引用。 关于h

HTML XPath 按类和文本搜索

我想按类和文本查找xpath中的所有元素。我已经试过了,但它不起作用。//*[contains(@class,'myclass')]//*[text()='qwerty']我正在尝试查找具有“myclass”类且文本为“qwert”的所有元素(这些将是跨度元素) 最佳答案 //span[contains(@class,'myclass')andtext()='qwerty']或//span[contains(@class,'myclass')andnormalize-space(text())='qwerty']

html - 层次结构中具有可选元素的 XPath

如本StackOverflowanswer假设您需要选择一个特定的表,然后选择它的所有行。由于HTML的宽松性,以下所有三个都是合法的标记:............您担心表格嵌套在表格中,因此不想使用像这样的XPath表[@id="foo"]//tr。如果您可以将所需的XPath指定为正则表达式,它可能类似于:表[@id="foo"](/tbody)?/tr一般来说,如何指定允许选择器层次结构中的可选元素的XPath表达式?明确地说,我并不是要解决现实世界的问题或选择特定文档的特定元素。我正在寻求解决一类问题的技术。 最佳答案 我不

html - 用于选择具有包含指定文本的单元格的表行的 XPath

如何使用XPath选择包含指定文本的单元格的表格行? 最佳答案 使用:ExpressionSelectingTable/tr[td//text()[contains(.,'targetString')]]这意味着:选择每个tr,它是表达式ExpressionSelectingTable选择的任何表的子代,并且(tr)至少有一个td子节点,它至少有一个包含字符串'targetString'的文本节点后代 关于html-用于选择具有包含指定文本的单元格的表行的XPath,我们在StackOv

c# - 让 xpath 函数 ends-with() 工作而 contains() 工作正常时出现问题

我正在尝试获取具有以特定ID结尾的属性的标签。喜欢我想获取ID以“国家/地区”结尾的跨度我尝试以下xpath//span[ends-with(@id,'Country')]但我得到以下异常“需要命名空间管理器或XsltContext。此查询具有前缀、变量或用户定义的函数。”奇怪的是contains工作正常所以下面的xpath有效//span[contains(@id,'Country')]任何想法为什么会这样?谢谢 最佳答案 函数ends-with()没有为XPath1.0定义但仅限XPath2.0和XQuery.您正在使用.NET