草庐IT

content-indexing

全部标签

wordpress - 使用 Nginx 重写仅在 root 上从 URL 中删除 index.php

我使用Wordpress作为我网站的根目录,使用InvisionPowerBoards作为论坛。http://localhost->Wordpresshttp://localhost/forum->IPB我已经使用Nginx-rewrite成功地从WordpressURL中删除了“index.php”,但是当我尝试在IPB上使用SEO友好URL时,nginx只是返回到Wordpress的404页面。我的配置是这样的:#Thisremoves"index.php"fromWordpressURLslocation/{indexindex.phpindex.htmlindex.htm;tr

html - 我可以将部分页面标记为 "duplicated content"

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭9年前。Improvethisquestion我有一家网店。我产品的制造商允许我复制他们的描述。为了获得一些有值(value)的内容,我还添加(可选)我自己的描述和用户评论。但在某些产品页面上,大部分文本可能是复制粘贴的描述。我可以明确地将部分文档标记为重复内容吗?伪代码:ProductDescriptionblahblahblah...ManufacturerDescriptionblahblahblah...Usercommentsbl

.htaccess - 重定向到 index.html

为了遵守SEO指令,我想重定向来自以下位置的所有流量:http://www.mywebsite.comhttp://mywebsite.comwww.mywebsite.commywebsite.com到http://wvw.mywebsite.com/index.html目前我使用这段代码,但它不能正常工作:RewriteCond%{HTTP_HOST}!^www.mywebsite.com$[NC]RewriteRule^(.*)$http://www.mywebsite.com/$1[L,R=301]一切正常,但在www.mywebsite.com的情况下仍然不会重定向到www.

indexing - 为什么谷歌在限制后停止抓取

我在1-2个月前提交了站点地图。谷歌在几天内开始非常快速地抓取并索引了大约25%的页面然后它突然停止并且不再抓取了。我为新抓取的页面创建了一个Google提醒。我每天都会收到一些页面已被抓取的警报(只有新页面)。Robots.txt的设置为允许所有这是屏幕截图,正如您在开始时看到的曲线陡峭但随后变得停滞不前。 最佳答案 这个问题的官方答案可以在这里找到:https://support.google.com/webmasters/answer/34441我个人也经历过一次,它可以追溯到(有时)缓慢的网络服务器响应时间,之后Google

ruby-on-rails - friendly_id/content_url 没有范围

classContenttrueend我怎样才能创建类似/about-us而不是/contents/about-us的链接?我应该修改content_url方法,还是有更好的方法? 最佳答案 我刚刚为我正在处理的网站完成了此操作。它实际上是指定正确路线的问题。由于您的模型称为Content,我假设您已经将Content映射为这样的资源(在您的routes.rb中):map.resources:content这将处理如下url:http://example.com/content/my-special-content-page像这样处

indexing - 阻止谷歌索引站点/内容的方法

我手头有一个案例,我必须super确定google(或任何yahoo/bing就此而言)不会索引特定内容,所以冗余越多越好。据我所知,有3种方法可以实现这一点,我想知道是否还有更多方法(冗余是这里的关键):将元标记设置为无索引在robots.txt中禁止受影响的url结构post通过ajax加载内容所以如果这就是所有方法,那很好,但是如果有人有一些想法如何更加确定,那就太棒了:D(我知道这有点疯狂,但如果内容以某种方式出现在google中,我的公司会变得非常昂贵:'-() 最佳答案 呃,还有很多a)识别googlebot(与其他机器

nginx - 在没有 301 重定向的情况下访问文件夹中的 index.html

我在一个文件夹中有一些index.html文件来获取一些不错的url-site.com/aboutindex.html位于about文件夹中。但是我看到我的site.com/about被301重定向到site.com/about/我不确定301是从哪里生成的。它不在配置中。/about/也有一个301结果。我想这是有道理的,因为我正在重定向到index.html文件,但它不应该重写吗?有没有办法为/about返回200,而不是为about/返回301?我正在使用nginx服务器block:server{listenIP;server_namesite.com;rewrite/$sche

javascript - 搜索引擎优化 : Move content with javascript?

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion出于SEO的原因,我在html代码的前面放置了一段文本,但从视觉上看,这段文本应该位于页面底部。我不能只用CSS做到这一点。我的问题:如果我用javascript移动DOM中的文本,这对SEO有问题吗?没有隐藏或删除,只是移动了。谢谢!

seo - robots.txt 错误 : Content Type should be text/plain

我正在使用名为SearchEngineOptimization(SEO)Toolkit1.0的软件测试我的网站,它显示此错误:Thecontenttypefortheresponsefrom"htpp://mysite.com/robots.txt"is"text/html".TheWebservershouldreturn"text/plain"asthecontenttypeforaRobots.txtfile.我的robots.txt文件就是这样的:User-agent:*Allow:/使用不带BOM编码的UTF-8保存。这是错的吗?默认的、无害的robots.txt文件应该是什

indexing - 为谷歌机器人爬虫提供不同的页面

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎不是关于aspecificprogrammingproblem,asoftwarealgorithm,orsoftwaretoolsprimarilyusedbyprogrammers的.如果您认为这个问题是关于anotherStackExchangesite的主题,您可以发表评论,说明问题可能在哪里得到解答。关闭6年前。Improvethisquestion我有一个SPA,里面有很多图片。我想将这些图像公开给搜索引擎。所以我想创建只会被机器人看到的“特殊”页面。这些页面将包含有关图像的元