草庐IT

composite-index

全部标签

indexing - 搜索引擎网站索引说明?

例如,当您使用Google“stackoverflow”时,第一个结果链接到http://stackoverflow.com带有描述,“一个独立于语言的协作编辑的程序员问答网站”。StackOverflow或任何其他网站如何设置该描述?我即将建立一个网站,并希望获得对我网站的良好描述的索引。我需要采取哪些步骤才能实现这一目标? 最佳答案 实现此目的的一种方法是使用标记如下:在SO上,该标记似乎仅在您使用与爬虫相关的用户代理时出现。 关于indexing-搜索引擎网站索引说明?,我们在St

indexing - <noscript> 会向 Google 爬虫隐藏其余的静态内容吗?

这对某些人来说应该很简单:请问元素导致HTML页面仅提供中的内容将自己标记为谷歌爬虫并隐藏我所有其余的静态内容导致它不被编入索引?谢谢! 最佳答案 没有。爬虫将看到您的所有内容,都在中。元素和其他任何地方。爬虫的行为很像关闭了JavaScript的浏览器-它们会看到所有静态内容以及内容,但不依赖于JavaScript。 关于indexing-会向Google爬虫隐藏其余的静态内容吗?,我们在StackOverflow上找到一个类似的问题: https://st

indexing - 网站页面如何被搜索引擎索引?

网站页面如何被搜索引擎编入索引?这是否取决于页面被访问的次数?我有一个站点,其默认页面已编入索引,但与默认页面处于同一级别的其他页面却没有! 最佳答案 规则#1:耐心。世界上有数十亿个网页,每天可能会创建数百万个网页。搜索引擎索引页面需要时间。至于方法:搜索引擎会跟踪从其他页面到您的页面(例如主页)的链接。然后它将跟随从该页面到其他页面的链接等等。您可以像其他人所说的那样手动添加您的站点,但快速索引的最佳方法是从各种来源获得尽可能多的链接(当然是道德的)。一个就足够了,但SE会更快地为“热门”页面编制索引。确保您的链接是普通的HTM

wordpress - 使用 Nginx 重写仅在 root 上从 URL 中删除 index.php

我使用Wordpress作为我网站的根目录,使用InvisionPowerBoards作为论坛。http://localhost->Wordpresshttp://localhost/forum->IPB我已经使用Nginx-rewrite成功地从WordpressURL中删除了“index.php”,但是当我尝试在IPB上使用SEO友好URL时,nginx只是返回到Wordpress的404页面。我的配置是这样的:#Thisremoves"index.php"fromWordpressURLslocation/{indexindex.phpindex.htmlindex.htm;tr

.htaccess - 重定向到 index.html

为了遵守SEO指令,我想重定向来自以下位置的所有流量:http://www.mywebsite.comhttp://mywebsite.comwww.mywebsite.commywebsite.com到http://wvw.mywebsite.com/index.html目前我使用这段代码,但它不能正常工作:RewriteCond%{HTTP_HOST}!^www.mywebsite.com$[NC]RewriteRule^(.*)$http://www.mywebsite.com/$1[L,R=301]一切正常,但在www.mywebsite.com的情况下仍然不会重定向到www.

indexing - 为什么谷歌在限制后停止抓取

我在1-2个月前提交了站点地图。谷歌在几天内开始非常快速地抓取并索引了大约25%的页面然后它突然停止并且不再抓取了。我为新抓取的页面创建了一个Google提醒。我每天都会收到一些页面已被抓取的警报(只有新页面)。Robots.txt的设置为允许所有这是屏幕截图,正如您在开始时看到的曲线陡峭但随后变得停滞不前。 最佳答案 这个问题的官方答案可以在这里找到:https://support.google.com/webmasters/answer/34441我个人也经历过一次,它可以追溯到(有时)缓慢的网络服务器响应时间,之后Google

indexing - 阻止谷歌索引站点/内容的方法

我手头有一个案例,我必须super确定google(或任何yahoo/bing就此而言)不会索引特定内容,所以冗余越多越好。据我所知,有3种方法可以实现这一点,我想知道是否还有更多方法(冗余是这里的关键):将元标记设置为无索引在robots.txt中禁止受影响的url结构post通过ajax加载内容所以如果这就是所有方法,那很好,但是如果有人有一些想法如何更加确定,那就太棒了:D(我知道这有点疯狂,但如果内容以某种方式出现在google中,我的公司会变得非常昂贵:'-() 最佳答案 呃,还有很多a)识别googlebot(与其他机器

nginx - 在没有 301 重定向的情况下访问文件夹中的 index.html

我在一个文件夹中有一些index.html文件来获取一些不错的url-site.com/aboutindex.html位于about文件夹中。但是我看到我的site.com/about被301重定向到site.com/about/我不确定301是从哪里生成的。它不在配置中。/about/也有一个301结果。我想这是有道理的,因为我正在重定向到index.html文件,但它不应该重写吗?有没有办法为/about返回200,而不是为about/返回301?我正在使用nginx服务器block:server{listenIP;server_namesite.com;rewrite/$sche

indexing - 为谷歌机器人爬虫提供不同的页面

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎不是关于aspecificprogrammingproblem,asoftwarealgorithm,orsoftwaretoolsprimarilyusedbyprogrammers的.如果您认为这个问题是关于anotherStackExchangesite的主题,您可以发表评论,说明问题可能在哪里得到解答。关闭6年前。Improvethisquestion我有一个SPA,里面有很多图片。我想将这些图像公开给搜索引擎。所以我想创建只会被机器人看到的“特殊”页面。这些页面将包含有关图像的元

seo - 在网站链接中同时拥有 www.sitename.com 和 www.sitename.com/index.php 会影响 SEO 吗?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭9年前。Improvethisquestion这是一位同事告诉我的,我很好奇这是不是真的。他们要求我将网站上指向主页的任何链接更改为“index.php”,我假设是因为他们认为它将处理两个不同的URL(www.sitename.com和www.sitename.com/index.html)。php)作为重复内容。但是,我认为情况并非如此。你怎么说,StackOverflow?