我有这样的网址:/产品/:product_id/交易/新/products/:product_id/deals/index我想在我的robots.txt文件中禁用“交易”文件夹。[编辑]我想禁止Google、Yahoo和BingBots使用此文件夹。有谁知道这些机器人是否支持通配符并支持以下规则?Disallow:/products/*/deals还有...关于robots.txt规则,您有什么真正好的教程吗?因为我没能找到一个“真正”好的,所以我可以使用一个......最后一个问题:robots.txt是处理此问题的最佳方法吗?或者我应该更好地使用“noindex”元数据?谢谢大家!
是否反转中的属性到削弱或以任何方式影响搜索引擎索引页面的能力?谢谢:) 最佳答案 我们不可能知道。搜索引擎可能有错误。但从HTML规范的角度来看,不,属性顺序不影响含义。 关于html-颠倒<metaname=robots...>标签中的属性顺序会影响搜索引擎索引吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/21387423/
关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion嗨,我是seo的初学者,谁能告诉我如何为我的网站创建xml站点地图和robots.txt文件。有没有适合他们的发电机?谢谢你的帮助问候朱迪
我需要一些帮助。我不确定mod_rewrite和robots.txt请求的顺序。一些url属于重写规则:/index.php?id=123to/home其他网址没有重写:/index.php?id=444我在我的robots.txt中做了这个条目:User-agent:*Disallow:/index.php?id带有/home的网站会被搜索引擎收录吗? 最佳答案 robots.txt文件由客户端(蜘蛛)解释,他们不知道你的系统有什么重写。因此,如果蜘蛛程序看起来像robots.txt中的模式,它们就不会从您的站点获取URL,但如果
我正在为我的网站创建一个robots.txt文件,但查看我的项目结构后,我不确定要禁止什么。我是否需要禁止标准.NETMVC目录和文件,例如/App_Data、/web.config、/Controllers、/Models、/Global.asax?或者那些还没有被编入索引?像/bin和/obj这样的目录呢?如果我想禁止某个页面,我是禁止/Views/MyPage/Index.cshtml还是/MyPage?此外,在robots.txt文件中指定站点地图时,我可以使用我的Web.sitemap吗,还是需要使用不同的xml文件? 最佳答案
我正在使用名为SearchEngineOptimization(SEO)Toolkit1.0的软件测试我的网站,它显示此错误:Thecontenttypefortheresponsefrom"htpp://mysite.com/robots.txt"is"text/html".TheWebservershouldreturn"text/plain"asthecontenttypeforaRobots.txtfile.我的robots.txt文件就是这样的:User-agent:*Allow:/使用不带BOM编码的UTF-8保存。这是错的吗?默认的、无害的robots.txt文件应该是什
我需要禁止下一个URL:serviceapi/_s/user,/_s/place,...都以/_s/开头保存表格:/{language}/save。例如/{en}/save,/{ru}/save,...注意:大多数URL开头都有语言参数:/en/event,……我不想屏蔽它们。应该是这样的:(但是robots.txt格式不允许这样做)Disallow:/_s/*Disallow:/:lang/save 最佳答案 在robots.txt中,匹配是从左边开始的,因此它匹配任何以/pattern开头的内容。像/*pattern这样的通配符
我想在我的Meteor应用程序(位于*.meteor.com)的暂存部署中包含一个public/robots.txt文件,基本上是为了完全避免抓取该版本的网站。我怎样才能做到这一点?我正在使用meteordeploy命令部署到暂存区。 最佳答案 我想出了一个(希望是临时的?)解决方案,在调用meteordeploy之前使用创建public/robots.txt的部署脚本,最后删除public/robots.txt。脚本:#!/usr/bin/envpythonimportsubprocessimportos.pathdpath=os
如何创建一个有效的robots.txt文件来阻止除根以外的所有爬虫请求,也就是登陆http://www.mysite.com 最佳答案 假设根目录的默认页面名为index.htm,我相信这会实现您的要求。User-agent:*Allow:/index.htmDisallow:/Google的网站管理员工具有一些greathelp用于制定robots.txt,如果您使用网站站长工具,您还会获得一个robots.txt生成器/测试器。 关于html-你如何创建一个robots.txt文件来
我在谷歌上搜索了很多文章,也阅读了很多文章,但react不一。如果我想阻止网站的某个部分被搜索引擎编入索引,我对哪个更好的选择感到有点困惑。基本上我对我的网站做了很多更新,也为客户设计,我不希望我为预览上传的所有“测试数据”都被编入索引以避免重复内容问题。我应该使用子域并阻止整个子域吗或创建一个子目录并使用robots.txt阻止它。我是网页设计的新手,对使用子域有点不安全(在某处读到这是一个有点高级的过程,即使是一个小错误也可能导致严重后果,而且MattCutts也提到了类似的东西(source):"I’drecommendusingsubdirectoriesuntilyousta