对于一个公司项目,我需要使用PHP和JavaScript(包括jQuery)创建一个网络抓取应用程序,该应用程序将从我们客户网站的每个页面中提取特定数据。抓取应用程序需要为每个页面获取两种类型的数据:1)确定是否存在具有特定ID的某些HTML元素,以及2)提取特定JavaScript变量的值。每个页面的JS变量名称相同,但值通常不同。我相信我知道如何获得第一个数据要求:使用PHPfile_get_contents()函数获取每个页面的HTML,然后使用JavaScript/jQuery解析该HTML并搜索具有特定ID的元素。但是,我不确定如何获取第二条数据——JavaScript变量值
有没有办法用PHP制作静态网站(如Jekyll)?它会在post文件上呈现yamlblock。我很困惑如何弄清楚。 最佳答案 Phrozn看起来像一个类似于Jekyll的静态站点生成器,但它是用PHP构建的。希望对您有所帮助! 关于php-使用PHP的静态网页,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/7846839/
我正在尝试让PHP脚本工作,它将人的IP与文本文件(每行一个IP)进行比较。如果此人的IP不在文本文件中,那么他将被重定向到declined.html。我知道我可以为此使用.htaccess,但IP列表可能会变得非常非常长。这是我目前的代码:我希望能够在我只希望某些IP看到的每个页面中调用此脚本,这就是我尝试调用它的方式:当我的IP不在ip.txt中时,当我在HTML页面中调用PHP脚本时,它不会将我重定向到/declined.html!我怎样才能解决这个问题?同样,我的问题不是如何使用.htaccess,而是如何修复我的脚本!谢谢。 最佳答案
我一直在寻找有关在页面中查找内容的问题,很多答案都建议在解析网页时使用DOM而不是REGEX。为什么会这样?它是否会缩短处理时间或其他什么。 最佳答案 DOM解析器实际上是在解析页面。正则表达式是在搜索文本,而不是理解HTML的语义。可以证明,HTML不是一种常规语言;因此,不可能创建一个正则表达式来解析HTML文档中任意元素模式的所有实例,而不匹配一些不是该元素模式实例的文本。p>您可能能够设计一个适用于您的特定用例的正则表达式,但准确预见将提供给您的HTML(以及它如何打破您的限制)-用例正则表达式)非常困难。此外,与XPath
我需要一些xpath方面的帮助,才能从html页面中提取值$283。这是我的PHP$html=file_get_contents("https://test.com/testpage.php");$html=tidy_repair_string($html);$doc=newDomDocument();$doc->loadHtml($html);$xpath=newDomXPath($doc);$avg=$xpath->evaluate('string(//*[@id="Average"]/@value)');echo$avg;这是HTMLAvg$283提前致谢。
我有一组bash和Perl脚本来开发在linuxbox上部署所需的目录结构(可选)从svn导出代码从这个源构建一个包这在终端上运行良好。现在,我的客户请求此过程的Web界面。例如,某个页面上的“创建新包”按钮将一个接一个地调用上述步骤,并将输出作为脚本回显返回给用户,而不是在整个脚本执行时。是否可以将bash脚本的即时输出发送到通过程序执行函数(系统、exec、passthru...或任何其他适合此流程的其他东西)调用它的网页或php脚本?优雅为什么要这样做?在做这样的事情时我应该采取哪些安全预防措施(如果可能)?编辑经过一番搜索,我找到了部分解决方案,但仍然无法正常工作:$cmd='
我有两个网页。一个是main.php,另一个是combo.php。combo.php包含一个下拉列表,我已将此页面包含在我的main.php中。我想做的是当有人在我的下拉列表中选择一个选项时,应该有一个警告框指示我选择的项目。主.php//someelements组合.php//someelementsAmericaEnglandIndiaJapan//someelements我无法对我的combo.php进行任何更改。onChange事件和脚本应该在我的main.php中。我不知道该怎么做,我什至不知道这是否可能。任何有关此事的帮助将不胜感激。谢谢。 最佳
任何人都可以帮我计算当我打开我的网站时必须发出多少HTTP请求CricketNews我正在尝试提高所有浏览器的性能和更好的加载。还有1个问题1)为了获得更好的性能,多少Http请求更好? 最佳答案 Firefox扩展Firebug与YSlow是确定此类指标的绝佳方法。YSlow会根据它从您网站上看到的内容为您提供额外的优化建议。编辑:要回答您的第二个问题,HTTP请求越少越好。没有神奇的数字。您必须在尽可能少的请求中完成您需要做的所有事情与代码的可维护性之间取得平衡。 关于java-我们
实际上我正在运行一个网站www.webmaggu.com主要是用户提交的各种有趣的链接和网站的目录。我想在链接旁边生成缩略图。所以尝试了webnapr、picoshot和许多其他人,但他们不会提供更长天数的免费缩略图。所以我想生成自己的缩略图生成器。我在网站上使用IEcapt似乎有各种代码,但我不知道为什么它们在我的网站上不起作用www.webmaggu.com实际上,我的托管服务提供商是基于linux的,但他们说他们在不同的服务器上运行GDI,支持linux和windows用户...因此,如果任何机构可以提供代码或某些链接方面的帮助...... 最佳答案
我需要在不同的点比较网页的DOM结构。有哪些检索和快照的方式。我需要服务器端的DOM进行处理。我基本上需要跟踪网页的结构变化。例如删除div标签或插入p标签。更改这些标签上的数据(innerHTML)不应被视为差异。 最佳答案 $html_page=file_get_contents("http://awesomesite.com");$html_dom=newDOMDocument();$html_dom->loadHTML($html_page);使用PHPDOM。非常简单,实际上使用起来有点有趣。Reference编辑:澄清后