xpath

php - XPath递归删除空的DOM节点？

我正试图找到一种方法来清理来自如下html源的一堆空dom元素： good但是，我不想伤害有效元素或换行符。结果应该是这样的：good到目前为止，我试过一些类似这样的解释：$xpath=newDOMXPath($dom);//$x='//*[not(*)andnot(normalize-space(.))]';//$x='//*[not(text()ornode()orself::br)]';//$x='not(normalize-space(.)orself::br)';$x='//*[not(text()ornode()orself::br)]';while(($node

php - 使用 DOMXPath 提取隐藏输入元素的属性值

我有一段HTML代码:Submit如何在PHP中使用DOMXPath提取隐藏输入的值？我试过这样的事情://$site-thehtmlcode$doc=newDOMDocument();$doc->loadHTML($site);$xpath=newDOMXpath($doc);$kod=$xpath->query("//input[@name='example-name']");foreach($kodas$node)$values[]=$node->nodeValue;return$values;但它返回一个空数组。哪里错了？最佳答案

DOMXPath php code section example xml dom xpath

PHP:如何获取 HTML 元素的正确结束标记

假设我有一个HTML页面如下:TitleAuthorNameSomecomplicatedHTMLelementscorrectlyvalidatedSomemoretextmoreandmoretext如何获取带有class="content_text"的div开头与其正确的结束标记之间的内容？我尝试了正则表达式，但找不到任何简单甚至困难的方法。我试过了XPath,但我仍然无法获取内容。相反，我在外部div中获取了文本。最佳答案您可以使用PHPSimpleHTMLDOMParser像DOMDocument解析XML一样解析HT

HTML PHP section div lt regex xpath domdocument

PHP 和 xPath 问题

我正在使用PHP和xPath抓取我拥有的网站(只是抓取html而不是进入服务器)但我收到此错误:Catchablefatalerror:ObjectofclassDOMNodeListcouldnotbeconvertedtostringinC:\wamp\www\crawler.phponline46我已经尝试只回显那一行以查看我得到了什么，但我也会得到同样的错误我也尝试谷歌搜索错误但我最终在php文档中找到并发现我的示例是与php文档中的完全一样，只是我使用的是HTML而不是XML...所以我不知道出了什么问题...这是我的代码...loadHTML($html);//create

xPath PHP code section elements

php xpath : query within a query result

我正在尝试解析一个html文件。想法是使用title和desc类获取跨度，并在每个具有属性class='thebest'的div中获取它们的信息。这是我的代码:testmoshe1haimmoshe2moshe3title1desc1spanclass="title">title2desc2KFIR;$doc=newDOMDocument();@$doc->loadHTML($example);$xpath=newDOMXPath($doc);$expression="//div[@class='thebest']";$arts=$xpath->query($expression);f

query within gt class title php xpath

php - 使用 PHP 遍历 SVG 元素

这个问题在这里已经有了答案:HowtogetSVGtagcontentwithPHP(2个答案)关闭9年前。如何使用PHP遍历SVG元素？';$svg=newSimpleXMLElement($svgString);$result=$svg->xpath('//image');echocount($result);for($i=0;$icount($result)返回0，因此循环被省略。我做错了什么？

php 34 section width xml xpath svg

html - 当它因 'htmlParseEntityRef: no name' 错误而失败时如何加载 HTMLFile()？

我正在尝试从以下位置获取字符串“hinsonlouann”:hinsonlouann当我运行以下命令时:$html="http://gisapps.co.union.nc.us/ws/rest/v2/cm_iw.ashx?gid=12339";$doc=newDOMDocument();$doc->loadHTMLFile($html);$xpath=newDOMXpath($doc);$elements=$xpath->query("*/div[@class='owner-name']");if(!is_null($elements)){foreach($elementsas$ele

htmlParseEntityRef amp code 34 section html dom xpath php

php - 使用 XPath 远程抓取页面并获取最相关的图像标题或描述

我正在做的事情与Tweet按钮或Facebook分享/点赞按钮所做的本质上是一样的，那就是抓取页面和最相关的数据片段标题。我能想到的最好的例子是当你在一个有很多文章的网站的首页上，你点击了一个FacebookLike按钮。然后它将获得与(最近的)“赞”按钮相关的帖子的正确信息。有些网站有OpenGraph标签，但有些没有，但它仍然有效。由于这是远程完成的，我只能控制我想要定位的数据。在这种情况下，数据是图像。而不是只检索在页面的顶部，我希望以某种方式从每个图像的起点反向遍历dom，并找到最近的“标题”。问题是并非所有标题都出现在图像之前。然而，在这种情况下，图像出现在标题之后的可能性似

XPath php html section code facebook html-parsing scrape

php - cloneNode 与 namespace 不一致 - 跨环境？

当尝试克隆DOMNode对象(DOMNode::cloneNode)时，我在不同环境中运行它时遇到不一致，特别是当我打印nodeName属性时克隆无法复制namespace，例如$cloneNode=$origNode->cloneNode(true);echo("oldnodename=".$origNode->nodeName);echo("newnodename=".$cloneNode->nodeName);结果(本地-mac操作系统)“旧节点名称=命名空间:你好”“新节点名称=命名空间:你好”结果(本地-centos):“旧节点名称=命名空间:你好”“新节点名称=你好”在对节

cloneNode namespace origNode gt section php dom xpath

php - XPATH - 选择具有特定属性的所有子节点

从具有特定属性值的节点开始查找具有特定属性值的所有子节点的xpath查询是什么？这与我之前发布的关于解析rdfxml文件的问题有点相关-我以为我已经解决了它，但还没有完全解决。例如，我正在尝试解析并获取所有rdf:about属性值。我有这个工作正常。不过，我需要添加以下条件-解析需要在找到特定的rdf:about值后开始。我正在使用PHP并使用DomDocument并使用以下xpath查询:$xpath->query('//@rdf:about');它正在查找所有rdf:about属性。我需要扩展它以仅查找rdf:about属性等于某物的节点之后的那些属性。如何？

XPATH php code section about xml rdf

160 161 162163164 165 166