草庐IT

NT-DOM-NV

全部标签

php - 如何获取网页 DOM 结构的快照?

我需要在不同的点比较网页的DOM结构。有哪些检索和快照的方式。我需要服务器端的DOM进行处理。我基本上需要跟踪网页的结构变化。例如删除div标签或插入p标签。更改这些标签上的数据(innerHTML)不应被视为差异。 最佳答案 $html_page=file_get_contents("http://awesomesite.com");$html_dom=newDOMDocument();$html_dom->loadHTML($html_page);使用PHPDOM。非常简单,实际上使用起来有点有趣。Reference编辑:澄清后

php - DOM 解析器突出显示无效的关键字

这个问题和我做的一个有关before但是因为这个话题现在已经结束了,我需要进一步问一些问题,我会开始一个新的问题,希望没问题。在我之前的回答中,我充分简化了问题并得出了简单但不完全有效的解决方案。这些天我在实现我的代码时意识到了这一点。上一篇文章中的解决方案存在的问题是HTML标签被替换函数破坏了。我在该站点的许多帖子中都读到了我需要使用DOM解析器。我对此很不熟悉,我尝试了这个post中用户“ircmaxell”建议的代码,但这对我不起作用。这是我所做的示例:echo'.ht{background-color:yellow;}';/*takenfromuserircmaxellath

PHP Dom 文档 html 更快还是 preg_match_all 函数更快?

我有一个疑问,哪个处理速度更快?domdocumentorpreg_match_allwithcurlfunctionisfasterinhtmlpageparsing??dom文档功能会像curl功能一样在其他服务器上留下痕迹吗?例如,在curl函数中,我们使用用户代理来定义谁在访问,但在dom文档中什么都没有。 最佳答案 如果结果不正确,哪个更快重要吗?与正则表达式匹配以从文档中获取一点数据比解析整个HTML文档要快。但正则表达式无法在所有情况下正确解析HTML。参见http://htmlparsing.com/regexes.

php - 简单的 HTML DOM 解析器 - 发送 post 变量

我有适用于PHP的简单HTMLDOM解析器,我正在使用以下标记:$html=file_get_html('http://www.google.com');但是,我如何将发布变量(如cURL)发送到该页面并获得响应?例如$html=file_get_html('http://www.google.com',array("Item"=>"Value","Item2"=>"Value2")); 最佳答案 据我所知,文档没有提到它,但在查看源代码后,我注意到您使用的函数接受streamcontext。作为它的第三个参数。您可以像这样使用此P

php - 如何在没有 Zend FW 的情况下使用 Zend Dom Query?

是否可以在没有ZendFramework的情况下使用ZendDomQuery?如果是:在哪里下载ZendDomQuery以及如何在没有ZendFramework的情况下使用它? 最佳答案 您可以使用一些包管理器(如thisone)提取单独的ZF文件,它将告诉您需要哪些文件并为您压缩它们。Zend_Dom_Query只需要Zend/Dom/Query.phpZend/Dom/Query/Css2Xpath.phpZend/Dom/Query/Result.phpZend/Dom/Exception.phpZend/Exception.

php - 缓存 PHP 简单 HTML DOM 解析器

我正在使用PHPHTMLDOMParser从外部网站提取数据。为了减少负载并加快页面渲染时间,我想缓存我拉取的数据一段时间。我该怎么做? 最佳答案 我编写了这个文件缓存函数,它基本上只是替换了file_get_contents。您可以在$offset中指定缓存应该持续的时间量,或者使用$override完全覆盖缓存。如果您不想使用/tmp/,只需将该目录更改为您可以读/写的目录即可。functioncache_get_contents($url,$offset=600,$override=false){$file='/tmp/fil

一文吃透JavaScript中的DOM知识及用法

文章目录一、前言二、DOM框架三、认识DOM节点四、JS访问DOM1、获取节点2、改变HTML3、改变CSS4、检测节点类型5、操作节点间的父子及兄弟关系6、操作节点属性7、创建和操作节点五、快速投票一、前言  DOM:DocumentObjectModel(文档对象模型),定义了用户操作文档对象的接口,可以说DOM是自HTML将网上相关文档连接起来后最伟大的创新。它使得用户对HTML有了空前的访问能力,并使开发者将HTML作为XML文档来处理。本文知识导图如下:二、DOM框架  DOM是网页的核心结构,无论是HTML、CSS还是JavaScript,都和DOM密切相关。HTML的作用是构建D

php - XPath递归删除空的DOM节点?

我正试图找到一种方法来清理来自如下html源的一堆空dom元素: good但是,我不想伤害有效元素或换行符。结果应该是这样的:good到目前为止,我试过一些类似这样的解释:$xpath=newDOMXPath($dom);//$x='//*[not(*)andnot(normalize-space(.))]';//$x='//*[not(text()ornode()orself::br)]';//$x='not(normalize-space(.)orself::br)';$x='//*[not(text()ornode()orself::br)]';while(($node

php - 简单的html dom字符编码问题

我正在使用简单的htmldom从另一个网站检索内容,但问题是使用简单的htmldom检索的内容存在字符编码问题。字符显示为带有问号的小菱形。字符编码问题只发生在检索到的内容上,我网站上的所有其他文本都显示正常。如果有人能提供帮助那就太好了。 最佳答案 尝试使用iconv将抓取文本的字符集转换为您在页面上使用的字符集。签名:stringiconv(string$in_charset,string$out_charset,string$str)例子:echoiconv("ISO-8859-1","UTF-8",$text);

php - DOM:获取文档中的所有文本节点 (PHP)

我有以下(PHP)代码,它遍历整个DOM文档以获取所有文本节点。这是一个有点丑陋的解决方案,我相信一定有更好的方法……那么,有吗?$skip=false;$node=$document;$nodes=array();while($node){if($node->nodeType==3){$nodes[]=$node;}if(!$skip&&$node->firstChild){$node=$node->firstChild;}elseif($node->nextSibling){$node=$node->nextSibling;$skip=false;}else{$node=$node