我在Google、Bing等网站上收到了一些目录查询,我不一定希望全世界都看到这些目录。如何防止它抓取这些页面/目录?另外,如何删除以前的条目? 最佳答案 友好网络爬虫(Google、Bing、Yahoo、Baidu等)会尊重您的robots.txtfile.来自非常有用的示例http://www.robotstxt.org/:User-agent:*Disallow:/cgi-bin/Disallow:/tmp/Disallow:/junk/当然,如果您真的想要限制您的私有(private)内容,您最好使用网络服务器的authen
我一直在为一个客户重新设计一个网站,我正在努力找出使我的客户的新网站尽可能具有响应性的最佳方法,同时又不影响他良好的搜索引擎排名。客户想要向网站添加一堆新内容以及一些新页面。当前网站使用过渡性html,新网站将需要一些html5。我很想为新设计使用像bootstrap这样的响应式框架,但我担心的是在我启动新网站时完全搞砸了他的良好排名。我要考虑的另一件事是现有网站是一个旧的Dreamweaver模板。由于缺乏更好的术语,很多标记和代码都很糟糕。维护全新的文件对我来说会容易得多。但同样,我不想搞乱他的排名。那么,在我发布时重新开始并希望最好的结果会更好,还是删除他不想要的内容,添加新内容
关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭9年前。Improvethisquestion先说说我的情况:我有一个博客网站,其中的博客条目存储在MySQL数据库中,然后在用户访问该网站时加载。每篇博文都有可用于搜索博文的标签。我希望用户在使用Google等搜索引擎搜索帖子标签或标题中的相关词时,能够将我的个人博客帖子作为结果。例如,如果我有一篇标题为“在URL中包含博客文章标题以进行搜索引擎优化?”的帖子,并且用户搜索类似“urlseo中的博客文章标题”之类的内容,那么我希望我的帖子
关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我正在构建的网络应用程序有一个JavaScript支持的界面,并使用AJAX从服务器获取数据。每个人都在同一个“页面”上,但URL中hashtag之后的数据用于确定要加载的数据,然后显示在页面上。我的Web应用程序中的URL示例可能是http://www.myapp.com/#/user/stackmaster.JavaScript看到hashtag之后的数据(在本例中为“user”和“sta
我有一个大量使用AngularJS/AJAX的网络应用程序,我希望它可以被Google和其他搜索引擎抓取。我的理解是我需要做一些特别的事情才能让它工作,如下所述:https://developers.google.com/webmasters/ajax-crawling不幸的是,这看起来很讨厌,我不想引入散列标签。我想做的是直接或通过向其发送302重定向向Googlebot(基于用户代理)提供静态页面。这样,Web应用程序就可以相同,并且整个Googlebot变通办法都很好地隔离,直到不再需要它为止。我担心的是Google可能会错误地认为我在试图欺骗Googlebot,而我的目标是帮助
如果您想使用Silex实现SEO友好的单页ajax网站,最好的方法是什么?我想使用路由(无硬编码url)并通过hashbangs或HTML5pushState支持后退按钮(浏览器历史记录)。我想这可以通过JavascriptRoutingServiceProvider的组合来完成和pathjs或类似的东西。但我想有人已经解决了这个问题,所以我很想听听您的经验。 最佳答案 我将专注于SEO友好部分。如果您和您的网站访问者对此没有任何问题,您可以在您的网站中使用尽可能多的“花哨的东西”。但请记住,您添加的“花哨的东西”越多,谷歌和其他搜
例如,当您使用Google“stackoverflow”时,第一个结果链接到http://stackoverflow.com带有描述,“一个独立于语言的协作编辑的程序员问答网站”。StackOverflow或任何其他网站如何设置该描述?我即将建立一个网站,并希望获得对我网站的良好描述的索引。我需要采取哪些步骤才能实现这一目标? 最佳答案 实现此目的的一种方法是使用标记如下:在SO上,该标记似乎仅在您使用与爬虫相关的用户代理时出现。 关于indexing-搜索引擎网站索引说明?,我们在St
正如标题所说,我需要一个搜索引擎...用于mysql搜索。我的网站是基于PHP的。我打算使用sphinx,但我的托管公司不支持全文索引!所以一个没有全文的搜索引擎!它应该是相当强大的,并且必须至少包括以下这些功能:当搜索“bmw520”时,仅匹配这两个词完全按此顺序出现的位置。不匹配仅“bmw”或仅“520”。当搜索“bmw330ci”时,将返回上述结果,但是,带有和不带有ci扩展名。众所周知,汽车中有许多扩展名(i、ci、si、fi等)。我想要“减号”来“排除”所有包含符号后单词的返回,例如:“bmw-330”将返回所有“bmw”结果,但不包含“330”结果。(用NOT代替减号也可以
我为所有静态Assets(static.example.com)创建了一个新的子域,方法是创建一个新的A记录并将其指向具有新IP地址的同一服务器,然后创建一个具有与DocumentRoot相同的虚拟主机主要的www.example.com站点。我们已将静态资源的所有引用指向静态子域,但是所有网站资源都可以通过static.example.com或www.example.com访问。问题是谷歌已经开始索引static.example.com子域上的html文件。阻止Google索引该域上的文件的最佳方法是什么? 最佳答案 有几种方法可
当他们发现不同的状态码时会做什么搜索?302301404等...我知道他们会忽略带有404状态代码的页面,但其他状态呢搜索引擎是抓取源页面还是目标页面? 最佳答案 来自"301RedirectsandSearchEngineOptimization":Fromasearchengineperspective,301redirectsaretheonlyacceptablewaytoredirectURLs.Inthecaseofmovedpages,searchengineswillindexonlythenewURL,butwil