草庐IT

python - 我应该从哪里开始使用 python 制作刮板或机器人?

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭7年前。Improvethisquestion我对编程语言(python)不是那么陌生,但我不知道从哪里开始使用python制作机器人或爬虫?我应该学习cgi编程吗?还是爬虫只使用python脚本运行?我应该为此构建一个服务器吗?对此一无所知...感谢您的帮助

javascript - Node.js 刮板中的内存泄漏

这是一个用Node.js用Ja​​vaScript编写的简单抓取工具,用于从Wikipedia中抓取元素周期表元素数据。依赖关系是jsdom用于DOM操作和chain-gang用于排队。它在大多数情况下都可以正常工作(它不会优雅地处理错误),而且代码也不算太糟糕,我敢说for尝试,但它有一个严重的错误-它会泄漏内存可怕的是,每个元素占用计算机内存的0.3%到0.6%不等,因此当它开始领先时,它将使用接近20%的地方,这显然是NotAcceptable。我尝试过使用分析器,但要么发现它们没有帮助,要么难以解释数据。我怀疑它与processElement的传递方式有关,但我很难将队列代码重