草庐IT

记一次博客园随笔被爬经历

木三百川 2023-03-28 原文

上篇随笔发布后,一天内,十几个爬虫网站爬取了我的随笔,有些网站非但没有注明来源,反而将自己标为博文的原创者,并更改了图像水印,这篇被爬的随笔虽浏览量不大,但好歹是自己一字一字认真码出来的,被偷实在令人心情不爽,在本篇随笔记录一下。

目录

1 爬取事件时间线

1.1 【2022-11-21 09:39】本人发布随笔 C++ using 编译指令与名称冲突

该随笔地部分节选如下图。

2022-11-23 晚上心血来潮,百度了一下自己的这篇随笔标题,发现在搜索结果的前几页没找到自己的随笔,反而看到了这些网站。

1.2 【2022-11-21 09:47】被1024搜爬取 C++ using 编译指令与名称冲突

这个网站没注明来源,也没注明原文作者,光秃秃地爬取博客原文。

1.3 【2022-11-21 10:02】被copyfuture爬取 C++ using 编译指令与名称冲突

这个网站注明了来源,并给出了原文链接以及原作者的版权声明,符合转载规范。由于防盗链的设置,图片没有被盗取。

1.4 【2022-11-21 10:02】被soolco爬取 C++ using 编译指令与名称冲突

这网站没注明来源,也没注明原作者,图片没有被盗取,谷歌浏览器访问这个网站还会提示存在风险。

1.5 【2022-11-21 10:05】被脚本之家爬取 C++ using 编译指令与名称冲突

这个网站注明了原作者,但没有给出原文链接。图片链接地址的格式为 https://img.jbzj.com/file_images/article/202211/xxxxx.png,他将图片盗取后放在了自己的网站上。

1.6 【2022-11-21 10:13】被秒客网爬取 C++ using 编译指令与名称冲突

这个网站没注明来源,也没注明原文作者,光秃秃地爬取博客原文。

1.7 【2022-11-21 10:39】被易采站长站爬取 C++ using 编译指令与名称冲突

这网站不仅没注明来源,还将文章作者以及图像水印都改为“易采站长站”。本人博客图片使用的是阿里云OSS,并设置了防盗链,图片依然被这个网站盗取,经查发现他把图片弄到了自己的网站上,图片链接地址的格式为 https://www.easck.com/d/file/p/2022/11-21/xxxxxxx.jpg,看来为了盗取完整的博客,这个网站还是下了一番功夫的。

1.8 【2022-11-21 10:50】被编程客栈爬取 C++ using 编译指令与名称冲突

这网站只注明了原作者,但没有给出原文链接,图片也被爬取后放在了自己的网站上。

1.9 【2022-11-21 11:46】被凤凰社爬取 C++ using 编译指令与名称冲突

这网站没注明来源,将作者更改为“凤凰社小编”,并将图片爬取后放在了自己的OSS上。

1.10 【2022-11-21 11:48】被IT大王爬取 C++ using 编译指令与名称冲突

这网站也没注明来源,还将文章作者改为“IT大王”,甚至写了个版权声明,要求转载注明他是原作者。不过原博文的图片没有被偷,查看丢失的图片链接地址,发现就是自己的阿里云OSS地址,看来设置的图片防盗链起到了作用。

1.11 【2022-11-21 时刻不明】被易学编程网爬取 C++ using 编译指令与名称冲突

这网站也没注明来源,文章作者被写为 admin,原博文的图片也被他偷了,不过水印还在,查看图片链接地址,发现是自己的阿里云OSS地址,按 F12 查看请求图片时的 Referer,发现并没有设置 Referer,即 Referer 为空,由于设置的防盗链与 Referer 有关,因此防盗链没有起到作用。

1.12 【2022-11-21 时刻不明】被BBSMAX爬取 C++ using 编译指令与名称冲突

这网站也没注明来源,将原作者写在了很不起眼的地方,原博客的图片没有被偷,图片链接地址的格式为 https://pic.ikafan.com/imgp/xxxxxx.jpg,看来这个盗图的技术不如易采站长站,图片没有被偷过去。

1.13 【2022-11-21 时刻不明】被IT学院爬取 C++ using 编译指令与名称冲突

这个网站注明了来源,并给出了原文链接,符合转载规范。图片链接地址的格式为 https://imgs.itxueyuan.com/xxxxxxx.png,同易采站长站一样,将博客图片弄到了自己的网站上。

1.14 【2022-11-21 时刻不明】被花朝爬取 C++ using 编译指令与名称冲突

这个网站注明了来源,并给出了原文链接,符合转载规范,图片没有被爬取。

1.15 【2022-11-21 时刻不明】被云海天教程爬取 C++ using 编译指令与名称冲突

这个网站连带着博文的签名也爬取了,同时额外地给出了原文链接,符合转载规范,图片链接地址的格式为 https://www.yht7.com/upload/image/2022/11/21/xxxx.png,同易采站长站一样,将博客图片弄到了自己的网站上。

1.16 【2022-11-21 时刻不明】被爱码网爬取 C++ using 编译指令与名称冲突

这个网站注明了来源,并给出了原文链接,符合转载规范,图片没有被爬取。

1.17 【2022-11-21 时刻不明】被Johngo学长爬取 C++ using 编译指令与名称冲突

这个网站注明了来源,并给出了原文链接,符合转载规范,图片链接地址的格式为 https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20221121/xxxxx.png,图片被爬取到了站长的阿里云OSS。

1.18 【2022-11-21 时刻不明】被我爱编程爬取 C++ using 编译指令与名称冲突

这个网站既没有注明来源,也没有注明原作者,并将图片爬取后放在了自己的网站上,叠加添加水印。

1.19 【时间不明】被编程宝库爬取 C++ using 编译指令与名称冲突

这网站没注明来源,也没注明原作者,图片链接地址的格式为 http://static.codebaoku.com/pics/24/fd/xxx.png,他将图片盗取后放在了自己的网站上。

2 维权事件时间线

2.1 【2022-11-24 11:29】 将侵权网站反馈给博客园团队

2.2 【2022-11-24 16:58】 博客园团队反馈

2.3 【2022-11-27 15:16】 放弃维权

由于上面都是一些爬虫网站,非个人博客,对于这些爬虫网站,排版较乱,非原创的特征十分明显,若要维权,一个个处理很麻烦,性价比不大,遂放弃

有关记一次博客园随笔被爬经历的更多相关文章

  1. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  2. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

    在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

  3. ruby-on-rails - Rake 任务仅调用一次时执行两次 - 2

    我写了一个非常简单的rake任务来尝试找到这个问题的根源。namespace:foodotaskbar::environmentdoputs'RUNNING'endend当在控制台中执行rakefoo:bar时,输出为:RUNNINGRUNNING当我执行任何rake任务时会发生这种情况。有没有人遇到过这样的事情?编辑上面的rake任务就是写在那个.rake文件中的所有内容。这是当前正在使用的Rakefile。requireFile.expand_path('../config/application',__FILE__)OurApp::Application.load_tasks这里

  4. ruby - 我怎样才能只写一次 "Text"并同时检查 path_info 是否包含 'A' ? - 2

    -if!request.path_info.include?'A'%{:id=>'A'}"Text"-else"Text"“文本”写了两次。我怎样才能只写一次并同时检查path_info是否包含“A”? 最佳答案 有两种方法可以做到这一点。使用部分,或使用content_forblock:如果“文本”较长,或者是一个重要的子树,您可以将其提取到一个部分。这会使您的代码变干一点。在给出的示例中,这似乎有点矫枉过正。在这种情况下更好的方法是使用content_forblock,如下所示:-if!request.path_info.inc

  5. ruby-on-rails - 使用 Ruby 正确处理 Stripe 错误和异常以实现一次性收费 - 2

    我查看了Stripedocumentationonerrors,但我仍然无法正确处理/重定向这些错误。基本上无论发生什么,我都希望他们返回到edit操作(通过edit_profile_path)并向他们显示一条消息(无论成功与否)。我在edit操作上有一个表单,它可以POST到update操作。使用有效的信用卡可以正常工作(费用在Stripe仪表板中)。我正在使用Stripe.js。classExtrasController5000,#amountincents:currency=>"usd",:card=>token,:description=>current_user.email)

  6. ruby - 如何在 Ruby 中只执行一次方法?有静态变量吗? - 2

    我写了一个脚本,其中包含一些方法定义,没有类和一些公共(public)代码。其中一些方法执行一些非常耗时的shell程序。然而,这些shell程序只需要在第一次调用该方法时执行。现在在C中,我会在每个方法中声明一个静态变量,以确保这些程序只执行一次。我怎么能在Ruby中做到这一点? 最佳答案 ruby中有一个成语:x||=y。defsomething@something||=calculate_somethingendprivatedefcalculate_something#somelongprocessend但是如果您的“长时间

  7. ruby - 格式化数字以每隔三位数拆分一次 - 2

    我想在格式化数字时每隔三个字符放置一个空格。根据这个规范:it"shouldformatanamount"dospaces_on(1202003).should=="1202003"end我想出了这段代码来完成这项工作defspaces_onamountthousands=amount/1000remainder=amount%1000ifthousands==0"#{remainder}"elsezero_padded_remainder='%03.f'%remainder"#{spaces_onthousands}#{zero_padded_remainder}"endend所以我

  8. ruby-on-rails - 你如何编写一个只为测试文件执行一次的设置方法? - 2

    我希望有一种方法可以针对每个文件运行一次,而不是针对每个测试运行一次。我已经看到一些对“之前”方法的引用,但似乎不适用于MiniTest。理想情况下,像这样:classMyTest 最佳答案 Before用于minitest使用specdsl时,相当于setup。您可以使用setup,如果您在test_helper.rb文件中使用setup,它将在所有测试之前执行一次。设置也可以在测试类中声明。使用设置,放置一个标志并在第一次更新标志。x=0setupdoifx==0x=x+1puts"Incrementedinx=#{x}"end

  9. ruby - 如何让 Ruby 每 10 分钟运行一次任务? - 2

    我想每10分钟执行一次cron作业,但我的系统只执行1小时。所以我正在寻找一种方法来做到这一点。我看过Timer和sleep但我不确定如何执行此操作,甚至不知道如何实现此操作。 最佳答案 看看http://rufus.rubyforge.org/rufus-scheduler/rufus-scheduler是一个用于调度代码片段(作业)的Rubygem。它了解在特定时间、在特定时间、每x次或仅通过CRON语句运行作业。rufus-scheduler不能替代cron/at,因为它在Ruby内部运行。

  10. ruby-on-rails - ByeBug 调试器只工作一次 [Rails 4] - 2

    我遇到的问题是byebug类在第一个之后被忽略了。这很奇怪。我启动服务器。每当有byebug语句时,如果它是服务器启动后的第一个语句,它就会起作用。如果没有,它会显示此消息:***Byebug已经启动。忽略byebugcall.并且调试器工作的唯一方法是重新启动服务器(它只会工作一次)。非常感谢任何帮助。顺便说一句,每个项目都会发生这种情况。谢谢。 最佳答案 这是reportedandfixed,但尚未发布。现在要解决这个问题,请使用以下内容更新Gemfile:gem'byebug',github:'deivid-rodriguez

随机推荐