2年前,我搁置了一个可以工作的Ruby网络scraper,它可以一次自动下载电视电影列表1周。今天又开始动手,发现Ruby既不能访问正在显示的网页的控件,也不能访问数据。调试显示脚本现在正在生成加载后续网页的文档。此外,初始脚本在运行时会修改当前文档(删除链接)。使用任何url都会导致加载相同的初始网页。我正在寻找有关如何继续访问所显示网页中的数据的建议。我对javascript不是很了解,但如果我有明确的计划,我会继续追求。我相信我找到了加载第二个网页的href,但它只会再次加载初始页面,因此其他机制正在发挥作用(即脚本中提到的cookie)。要下载信息,至少需要28个网页,通常下载
在python中,我必须实例化某个类,知道它在字符串中的名称,但是这个类“存在”在一个动态导入的模块中。下面是一个例子:加载类脚本:importsysclassloader:def__init__(self,module_name,class_name):#bothargsarestringstry:__import__(module_name)modul=sys.modules[module_name]instance=modul.class_name()#obviouslythisdoesn'tworks,hereismymainproblem!exceptImportError:
在python中,我必须实例化某个类,知道它在字符串中的名称,但是这个类“存在”在一个动态导入的模块中。下面是一个例子:加载类脚本:importsysclassloader:def__init__(self,module_name,class_name):#bothargsarestringstry:__import__(module_name)modul=sys.modules[module_name]instance=modul.class_name()#obviouslythisdoesn'tworks,hereismymainproblem!exceptImportError: