我即将更新我的网站以使用CakePHP而不是旧的自制框架。我需要编写HTAccess文件以将旧的PHP参数URL重定向到新的CakePHPSEO友好URL,但我无法让它工作。我的htacess文件(在app/webroot中的那个)现在看起来像这样:RewriteEngineOnRewriteRule^index.php?action=view&item=172$index.php?url=item/172[R=301,L]RewriteCond%{REQUEST_FILENAME}!-dRewriteCond%{REQUEST_FILENAME}!-fRewriteRule^(.*)
我需要根据用户生成的wiki内容生成seometa关键字标签。假设我有一篇文章和一个预定义的关键字/短语列表,是否有一些好的方法来获取匹配的文章关键字?关键字可能不是一个词的长度,并且将被赋予关于首先使用哪些关键字的预定义权重。Nokogiri的一些实现似乎是显而易见的选择,但我想知道是否有更完整的东西适用于这个确切的场景。 最佳答案 由于语义API,您可以处理您的文本,它会为您提供潜在关键字列表+相关分数。我已经开始开发这个gem:https://github.com/apneadiving/SemExtractor它在错误处理方
我正在开发一个医疗产品搜索网站。每当用户尝试搜索[COMPANYNAME]药物[DISEASE]时,我需要在搜索引擎中显示我的网站。为此,我在我的站点中创建了一个页面,该页面从url中读取公司名称和疾病并列出所有产品。现在我需要给这个页面一个url,比如www.sitename.com/[COMPANYNAME]_medicine_[DISEASE].html我正在使用Cakephp框架进行开发。无论如何在routes.php中实现这个url格式?或者还有其他方法吗?请帮忙。 最佳答案 用斜线分隔它们怎么样?//www.sitena
我已经建立了一个电子商务网站,并且正在慢慢研究SEO。我的问题很简单,我是否应该不关注“条款和条件”、“交付条款”、“联系页面”等页面。我问的原因是,我的条款和条件与其他网站非常相似,我认为这将是80%的重复内容——此外,与我的产品页面相比,这些网站不相关(在我看来)。在我的网站上我也有一些DIY指南,我不会不关注,因为它是原创内容并且与我的网站非常相关。所以我只讨论像上面提到的页面。我应该还是不应该不关注这样的页面(只有独特内容非常有限的页面)?做这两者的优缺点是什么? 最佳答案 MattCutts(Google的搜索/质量小组)
众所周知,在IIS7中,您可以选择将URL更改为最终用户(可能还有googlebots、yahoobots等)会看到的内容。例如,如果我可以更改url--www.mysite.com/aboutuss.aspx是否(推荐)将其更改为www.mysite.com/aboutuss?这有值(value)吗,还是只是浪费时间?此外,将www.mysite.com/products/default.aspx更改为www.mysite.com/products/exclusive_products是否值得?这样更专业?改变这对搜索引擎更好吗?default.aspx是一堆垃圾,我应该用SE的关键
我已禁止某些页面对所有抓取工具使用robots.txt。我是否必须为这些文件编写元标记,或者网络爬虫会跳过它们,所以没有必要这样做? 最佳答案 如果您要限制的爬虫遵守robots.txt那么您没问题,但如果它不遵守,那么您可能就完蛋了,因为它很可能也会忽略meta。所有主要的搜索引擎爬虫都会遵守它,所以您可能没问题。 关于seo-robots.txt禁止属性,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.c
我正在设计一个网站,就像Reddit,有许多用于首页的过滤器,例如'new','top','historic','active'...如果您点击过滤器"new",我们的网址将从www.mywebsite.com/main/到www.mywebsite.com/main/new并且显示的数据会更改其顺序以显示“最新”内容。但是,我听说出于SEO的目的,指向您网站的链接越多越好,我认为即使在您点击过滤器后也保持URI不变是个好主意,所以您会点击“新建”并且URI仍会显示www.mywebsite.com/main/这样做,如果4个人分享我的网站,它会更好地显示在谷歌上,对吗?因为谷歌会看到
我的网站上有各种分页,我想阻止谷歌和其他搜索引擎抓取我的分页索引。抓取页面示例:http://www.mydomain.com/explore/recently-updated/index/12如何使用robots.txt拒绝机器人抓取任何包含/index/的页面? 最佳答案 Disallow:/*?page=Disallow:/*&page= 关于seo-如何使用robots.txt阻止机器人抓取分页?,我们在StackOverflow上找到一个类似的问题:
我有一个博客www.MY_BLOG_NAME.com,托管在blogger.com上,已经快4岁了,搜索引擎排名更好。大部分流量来自谷歌。现在我正在用drupal重新设计我的网站,但我想保留旧博客。新站点在www.MY_BLOG_NAME.com中,旧站点在old.MY_BLOG_NAME.com中。还有吗? 最佳答案 让您的旧博客和新博客同时运行是个坏主意-Google会将此视为重复内容,并且您的排名会下降。如果您在旧博客上放置一个nofollow标签,您就可以做到这一点,这样机器人就无法将其编入索引。
关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我要创建一个网站,其中的内容会在网站上保留15天,然后会被删除。我不太了解SEO,但我担心的是搜索引擎将“内容”编入索引对SEO的影响,然后有一天它突然消失并留下404。要以对SEO最友好的方式应对来来去去的内容,我能做的最好的事情是什么?