我们的 SEO 团队希望向蜘蛛程序开放我们的主要动态搜索结果页面,并从元标记中删除“nofollow”。蜘蛛目前可以通过允许 robots.txt 中的路径访问它,但在元标记中使用“nofollow”子句可防止蜘蛛超越第一页。
<meta name="robots" content="index,nofollow">
我担心,如果我们删除“nofollow”,对我们的搜索系统的影响将是灾难性的,因为蜘蛛将开始抓取结果集中的所有页面。我将不胜感激关于以下方面的建议:
1) 有没有办法从元标记中删除“nofollow”,同时防止蜘蛛只跟踪页面上的某些链接?我读过关于 rel="nofollow"的不同意见,这是一个可行的选择吗?
<a rel="nofollow" href="http://www.mysite.com/paginglink" >Next Page</a>
2) 有没有办法控制蜘蛛会走多远的“深度”?如果他们打开了几页,然后就停止了,那就不会太糟糕了。
3) 我们的搜索结果页面有标准的下一个/上一个链接,这在理论上会导致蜘蛛递归无限地访问页面,这对 SEO 有什么影响?
我知道不同的爬虫行为不同,但主要关注大玩家,如谷歌、雅虎、MSN。
注意我们的搜索结果页面和分页链接对机器人不友好,因为它们没有被重写并且有一个 ?name=value 查询字符串,但从我看到的蜘蛛程序来看当他们看到“?”时不再只是中止因为结果页面正在以良好的页面排名编入索引。
最佳答案
老实说,您对 nofollow 的看法是错误的。搜索蜘蛛很可能已经在搜索 nofollow 页面,尤其是 Google、Yahoo 和 MSN,因为它们仍然必须访问这些页面以查看它们是否有 noindex。
真正的问题是 nofollow 实际上并不意味着不关注,它只是意味着不要将我的声誉传递给这个链接。因此,除非您积极阻止机器人(听起来不像您),否则更改链接上的 ROBOTS 元标记和机器人命令不会影响性能,因为它们已经在访问您的站点。要确认这一点,只需查看您的 HTTP 服务器日志。
所以我的投票是您不会看到取消机器人限制有任何问题。
关于seo - 可以防止搜索引擎蜘蛛无限爬取搜索结果中的分页链接吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/344721/
总的来说,我对ruby还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题
我脑子里浮现出一些关于一种新编程语言的想法,所以我想我会尝试实现它。一位friend建议我尝试使用Treetop(Rubygem)来创建一个解析器。Treetop的文档很少,我以前从未做过这种事情。我的解析器表现得好像有一个无限循环,但没有堆栈跟踪;事实证明很难追踪到。有人可以指出入门级解析/AST指南的方向吗?我真的需要一些列出规则、常见用法等的东西来使用像Treetop这样的工具。我的语法分析器在GitHub上,以防有人希望帮助我改进它。class{initialize=lambda(name){receiver.name=name}greet=lambda{IO.puts("He
使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta
我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何
查看Ruby的CSV库的文档,我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列,但我没有成功运行它。 最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer