草庐IT

GoogleBot

全部标签

seo - Googlebot 会自动尝试索引 sitemap.xml 吗?

如果我的sitemap.xml文件没有提交给Google,Googlebot会自动尝试索引sitemap.xml吗?例如,Googlebot是否会尝试索引http://www.example.com/sitemap.xml如果碰巧文件在那里?Google的资源说要提交,但Googlebot所做的是一个单独的问题。http://support.google.com/sites/bin/answer.py?hl=en&answer=100283 最佳答案 站点地图文件可以有任何名称和路径。所以,如果robots.txt中没有明确指定,我

web-applications - 如何在谷歌搜索结果中显示缩略图

我想知道为什么Google在一个网站的搜索结果中显示缩略图,而另一个网站不显示?例如。当我谷歌kfcchickenrecipe我可以看到www.food.com的缩略图,但看不到www.tastyappetite.net的缩略图。我试图用谷歌搜索这个问题,但我只找到了thisarticle上面说Google会自动执行此操作,我无需担心。有什么建议可以提示Google这是该页面的缩略图吗? 最佳答案 谷歌显示的这种信息称为“微数据”。您可以在您的代码中告知谷歌必须了解的内容。正如CarteCole所说,schema.org向您展示微数

seo - 如何防止 Googlebot 抓取我的 Underscore 客户端模板?

在Google网站站长工具中,在“抓取错误/其他”下,我们看到400错误的网址如下:/family-tree//这不是真实的网址,也不是我们打算抓取的网址。它是一个Underscore/Backbone模板:/"rel="nofollow">为什么Google在script内部抓取阻止?为什么Google会忽略rel="nofollow"属性?我们还能做些什么来让Googlebot远离我们的Underscore模板?更新:如果我能找到能够保留好页面并阻止坏页面的正确模式,我愿意使用robots.txt。例如,我想保留/surnames/Jones/queries同时阻止/surname

image - seo如何优化一堆相似的图片?

例如我有一个网站包含1000张图片,主题相似(例如:卧室装饰设计)。当定义元标记、替代文本和图像文件名时,逻辑上1000张图像中的许多图像将具有相似的文件名、标记、替代文本和...此问题是否会影响Google机器人将我的网站检测为包含许多重复内容的网站?如果是,解决方案是什么?图像定义示例:image1:name:bedroom-decoration-design-1.jpgalttext:bedroomdecorationdesigndescription:newdecorationdesignsforyourbedroom...image2:name:bedroom-decorat

javascript - Googlebot 和其他抓取工具正在点击 javascript 链接

我们在我们的一个应用程序上运行Vue.js,并用它生成anchor标记。谷歌正在抓取这个,正如我们从搜索结果中看到的那样。然而,它也在使用禁用了JavaScript的机器人进行爬行,并遇到如下链接:这会在我们的Laravel应用程序中产生错误,因为它们以以下方式进入我们的网络服务器:/electronica/%7B%7B%20auction.main_image_big%20%7D%7D防止未启用JavaScript的爬虫点击这些链接的最佳方法是什么。将它们重定向到另一个页面?请记住,我们仍然希望Googlebot在启用JavaScript时抓取这些链接,因为这些链接指向我们的所有产品

indexing - 如何检查 googlebot 是否会索引给定的 url?

我们正在做一个白标签网站,它不能被谷歌索引。有谁知道一种工具可以检查googlebot是否会为给定的url编制索引?我输入了在所有页面上,因此不应将其编入索引-但是我宁愿通过测试来110%确定。我知道我可以使用robots.txt,但是robots.txt的问题如下:我们的主站点应该被索引,它是IIS(ASP.Net)上与白标签站点相同的应用程序-唯一的区别是url。我无法根据传入的url修改robots.txt,但我可以从我的代码隐藏中向所有页面添加元标记。 最佳答案 您应该添加一个Robots.txt到您的网站。但是,防止搜索引

seo - 这是黑帽 SEO 技术吗?

我有一个完全用Flash开发的网站。现在网站所有者不想转移到更多基于文本/html的网站。因此,我计划创建一个替代的基于html/文本的站点,googlebot将被重定向到该站点。(通过检查用户代理)。我的问题是,谷歌官方允许这样做吗?如果不是,那么为什么会有许多基于订阅的网站向谷歌显示与用户不同的数据集?允许吗?非常感谢。 最佳答案 我已经为一个大型电子商务网站处理过这种情况,而Google基本上忽略了该网站。Google认为它隐藏了真实内容并直接解决了它here并说:Cloakingreferstothepracticeofpr

seo - 谷歌网络工具 : Fetch and Render

我有一个关于谷歌网络工具的问题-FetchasGoogle->FetchandRender。我在使用资源时遇到一些错误。如果我只使用Fetch,我会得到“完成”状态,这很好。但是,如果我使用Fetch和Render,我的某些图像会出现“暂时无法访问”状态,但如果我单击图像链接,则它是可以访问的。我的页面上可能有很多图像,我认为此功能对加载以呈现屏幕截图图像的外部资源数量有限制。你怎么看?有没有人遇到过这个问题?另外,我想知道此功能与真正的goolgebot引擎之间有多少共同之处?googlebot是否也会出现此错误..我是否应该担心..谷歌说:关于“部分”状态-“您可以通过单击丢失的资

seo - 我如何让 Googlebot 相信两个以前使用别名的网站现在是分开的?

这需要一些设置。相信我,这是一个很好的理由。背景我的一个friend经营了一个非盈利公益网站两年了。该网站旨在消除有关某个公众人物的错误信息。当然,在过去的两年里,我们这些支持他所做的事情的人一直坚持不懈地链接到该网站,以便在谷歌中提升它,以便当你搜索这个公众人物的名字时,它会出现在非常高的位置。(事实上​​,它是排名第二的结果,就在公众个人网站的下方)。他确实没有得到这个公众人物的支持,但他所做的一切都是为了公众利益和利益。这位friend最近中风了。巧合的是,当他在医院时,域名需要续订,而他的妻子错过了有关该域名的电子邮件。域名抢注者抢购了该域名,并发布了与他的意图截然相反的内容。

java - 我可以阻止蜘蛛访问带有特定 GET 参数的页面吗?

我们有一个页面可以选择将ID作为GET参数。如果提供的ID无效,页面将抛出错误并发出通知,告知有人错误地访问了该页面。火上浇油的是ID可以有效期一段时间,然后过期。我们遇到了一个问题,即搜索引擎机器人使用旧的、过期的ID访问页面。这意味着我们每次被抓取时都会收到一堆“误报”警报。我很想有一些方法告诉机器人继续抓取页面,但不使用GET参数——只是索引无参数的页面。这甚至可以通过robots.txt文件或类似文件实现吗?注意:我知道解决此问题的最佳方法是更改​​页面的行为,事实上,这将在几周内发生。在此期间,我只是在寻找解决方案。 最佳答案