草庐IT

网页采集

全部标签

javascript - 使用htmlunit抓取动态网页

我正在使用HtmlUnit从动态网页中抓取数据,它使用无限滚动来动态获取数据,就像facebook的新闻源一样。我用下面这句话来模拟向下滚动事件:webclient.setJavaScriptEnabled(true);webclient.setAjaxController(newNicelyResynchronizingAjaxController());ScriptResultsr=myHtmlPage.executeJavaScript("window.scrollBy(0,600)");webclient.waitForBackgroundJavaScript(10000);m

javascript - 为网页中的特定内容指定不同的声音

我试图找到有关编写盲人可以访问的网页的信息,但还没有找到太多有用的信息。具体来说,我正在寻找的是如何向一般屏幕阅读器提供有关如何阅读我的页面内容的具体说明。我知道覆盖屏幕阅读器的用户设置可能会被认为是一种烦恼,但我希望提供的内容是诗歌、戏剧、故事和其他类型的创意写作。由于同一份文档中经常有许多不同的Angular色在说话,如果我有一种方法可以指定屏幕阅读器声音的不同特征,以便让盲人(或任何人)有机会听到声音,那就太好了区分单独的说话字符。现在,我正在做的是用解说员告诉听众谁在说话,这是非常不自然和分散注意力的。内容示例可以是:Brenda:HeyJimmy!What'sup?Jimmy

javascript - 如何判断网页资源何时被缓存?

在JavaScript中有没有一种方法可以让我判断资源是否已经在浏览器缓存中?我们正在对一小部分客户端页面浏览量进行检测,以便我们可以更好地了解用户的页面加载速度。用户第一次访问我们的网站时,浏览器会缓存一些资源(JS、CSS、图像),因此他们的初始页面浏览量会比后续页面慢。现在,这些数据混合在一起,因此很难区分初始页面加载与由于其他原因而缓慢的后续页面浏览。我喜欢一种跨浏览器的方式来检查缓存是否已经准备就绪,这样我就可以隔离这两种网页浏览并分别进行分析。 最佳答案 你应该使用TransferSize:window.performa

javascript - 代码中防止网页在iPad上拖动

我目前正在制作一个可以在iPad上查看的网页。它使用jquery-ui库来显示slider。但是,当用户尝试拖动slider时,整个页面都会拖动。有谁知道是否可以在jquery或html中指定任何类型的覆盖以防止浏览器在触摸拖动事件时拖动iPad上的页面? 最佳答案 您可能还想查看这篇文章:AdaptinganInterfaceforTouchDevices.它讨论了如何检测你是否在触摸环境中运行,但它也(在文章的后面)讨论了覆盖touchstart事件的默认行为......“通过捕获手指移动并劫持它,我们可以使用jQuery的ev

javascript - 使用 Knockout : Visible changes not saved 控制网页

尝试使用ExcelVBA编辑网站。编辑似乎有效,但当我使用保存按钮时,没有任何内容被保存。为什么不保存屏幕上可见的更新数据?此代码在InternetExplorer中打开一个网页,导航到我想要的位置,填写数据,所有这些都显示在屏幕上,使用各种方法,例如:ForEachobjElementInobjElementCollExtractedName=objElement.outerHTMLIfInStr(ExtractedName,"NewPermit")>0ThenobjElement.Checked=True和SetDropDown=objHTML.getElementById("Pr

javascript - 如何修复加载时在网页上显示翻译键的 Angular 翻译?

我正在使用angular-translate对于我的项目中的i8n。我正在使用异步url-loader来加载我的翻译表。$translate.useUrlLoader(myUrl)翻译指令和过滤器都返回我正在翻译的key,直到加载翻译表。以上都在网页上显示'translation.key',直到加载翻译表。注意:我有理由不监听$translationChangeSuccess事件。IamlookingforeitherofthetwosolutionsSynchronouslyloadtranslationtablesfromURL.Don'tshowtranslatedtextunt

javascript - 如何使用 Tableau JavaScript API 将 Tableau 嵌入到网页中?

我是一名尝试将Tableau可视化嵌入到我的网页中的初学者,这样只要单击链接,就会在页面上呈现可视化。但是浏览器加载tableauSoftware对象时出现错误。我该如何初始化这个对象?我使用的是TableauServer试用版functioninitializeViz(){varplaceholderDiv=document.getElementById("tableauViz");varurl2="http://localhost:85/views/test_page/Sheet1?:embed=y&:display_count=no";viz=newtableauSoftware

javascript - 如何使用 jQuery 从网页中删除复制内容的内联样式?

例如,我从维基百科复制了一些内容/段落,然后我想动态地将代码粘贴到我的网页中,但它显示了很多内联样式。我想要干净,需要适当的html格式的代码。我尝试了很多方法,但它正在删除所有标签,或者我只想删除额外的内联样式和额外的标签。我放在这里的示例代码。请帮助我实现这一目标。示例代码:<spanstyle="color:rgb(34,34,34);font-family:sans-serif;font-size:14px;font-style:normal;font-variant-ligatures:normal;font-variant-caps:normal;font-w

javascript - 网页可以检测到篡改用户脚本吗?

我的问题有两个方面。首先,沙箱模型如何工作,如何影响用户脚本,从网页和用户脚本的Angular可以访问/看到的内容,以及如果使用其他沙箱模型也会影响页面,从而能够注意到您的脚本已注入(inject)到页面(或没有)。第二个,如何将脚本注入(inject)到页面中,并且页面可以检测到它?第一据我所知,当您使用@grantnone时,沙箱被禁用,您将可以访问该网页及其javascript。如果您对javascript和/或DOM进行了任何更改,则该页面可能会检测到它。我的理解是,如果您使用@grantunsafeWindow,您的脚本将被隔离在其自己的js上下文中,您对window所做的任

javascript - 检测网页中重复的 javascript 函数名称的工具?

背景我们有一个Web应用程序,其中几个开发人员编写了几个操作DOM的.js文件,并且重复函数名称的问题已经悄悄进入我们的应用程序。问题谁能推荐一个工具,当我们不小心编写了一个包含两个同名javascript函数的网页时,它会警告我们?示例HTML页面functionfoo(){alert('bar');}test.jsfunctionfoo(){alert('foo');}由于foo()在页面中被声明了两次,显然只有优先的那个被加载。我使用的工具似乎忽略了这一点。Firebug只显示加载的函数。Netbeans将在导航器中显示这两个功能(没有警告),但一次只查看一个文件(即,我不能将它