我有一个关于Google抓取的页面数量的“双重”问题,它可能与可能的重复内容(或不重复)以及对SEO的影响有关。关于我的页面数量和被Google抓取的页面的事实我在两个月前推出了一个新网站。今天,它有近150页(每天都在增加)。无论如何,这是我的站点地图中的页面数。如果我查看Google网站管理员的“抓取统计信息”,我可以看到Google每天抓取的页面数量要大得多(见下图)。我不确定它是否真的好,因为它不仅让我的服务器更忙(一天下载903页5.6MB),而且我担心它也会产生一些重复的内容。我在Google(site:mysite.com)上查看过,它给了我1290页(但只有191页显示
我想销售一些在另一家网上商店也有售的产品。他们提供有关产品的所有信息的数据源,并且他们不反对我将信息发布到我的网上商店。问题是我应该担心重复的内容吗?产品数量太多,不值得重写它们的描述。谷歌会认为我窃取了内容吗? 最佳答案 视情况而定。我个人会通过将此添加到...来阻止Google索引DC页面:有问题的URL无论如何都不会排名。因此(通常)让它们完全远离Google的视线是可以的,并且不必再担心所有算法更新。或者,如果我有很多的页面并且需要更多的Crawl-Budget,我会使用robots.txt文件:User-agent:*Di
我试图找到语义上正确的方式来描述代表获取帮助(例如帮助图标)及其帮助内容的方式的HTML元素。我试图搜索此主题,但在帮助中搜索帮助并非易事。这是我的想法的一个简单示例(使用一个简单的脚本来显示/隐藏帮助内容以及利用“title”属性):PleaseenteryourpasswordYourpasswordmusthave5characters.有没有更好的方式来表示这个(以这种格式)。这个想法是用一种可访问且SEO友好的方式来描述“可切换的帮助内容”。问题是关于HTML/HTML5和WAI-ARIA属性(不是JavaScript)——我正在寻找我的示例的最佳元素表示(如果这样的概念存在
我在每天执行一个php脚本的cron中思考。该脚本将为我分配的一个url创建一个file_get_contents()。我可以这样做来模拟用户的访问吗?它像访问一样有效吗?$page=file_get_contents('http://www.example.com/');echo$page; 最佳答案 你可以“模拟”这种Action,但最好用curl来完成。另外要做到这一点,我建议您浏览thisstackoverflowpost,它解释了所有需要通过服务器端请求提供的变量,而不是通过浏览器打开页面并加载分析js。
我们网站的一个部分呈现分页随机内容。新用户第一次访问该站点时,她会被分配一个新的随机种子,该种子传入URL,并且为了持久性也存储在cookie中。问题是URL中的种子混淆了Googlebot(和其他索引服务);它提示有太多URL指向相同的内容。我们可以不在URL中传递种子,但即使我们只使用cookie,在我看来,在某些时候我们必须决定访问者是索引蜘蛛还是人以非随机方式呈现内容。我的主要问题是:在这种情况下检测最常见的索引蜘蛛并以非随机方式为它们提供内容有多糟糕?我知道搜索优化的首要规则是不优化,如果有的话,为用户优化,并确保内容对每个人都是一样的。但在这种情况下,我们实际上不会更改内容
我想在yii中使用自定义动态seo友好url。我看了各种各样的文章,他们都说了同样的话。这是我目前设法找到的,它不符合我的需要:'urlManager'=>array('urlFormat'=>'path','rules'=>array('/'=>'/view','//'=>'/','/'=>'/',或array('//'=>'/','/'=>'/view','s/*'=>'/list',)我不需要这样的网址:domain.com/a/b/c/d我需要:domain.com/here-goes-the-article-title-ACTION-ID我需要一个可以识别文章标题的表达式。这
有没有办法将H1的内容转移到TITLE标签,同时使其对SEO友好?我不会详细说明为什么我想要这个,但我宁愿给你一个明确的例子。我有这个:Sitename/Category/Pagetitle我想将其复制到该特定页面的TITLE:Sitename/Category/Pagetitle对我来说最简单的方法是使用jQuery,但我想这对搜索引擎机器人来说并不安全? 最佳答案 您是对的:机器人不会注意到,因为它们只会查看您服务器响应中的html。请改用PHP。 关于php-最好是jQuery/可
我最近在我的一个站点上安装了SSL证书。我注意到Google现在已经为每个页面的http和https版本编制了索引。到目前为止,我还没有真正注意到任何排名问题,但我意识到重复内容可能会出现问题。我该如何克服这个问题?只有少数页面会使用https,网站上的大部分页面最好只使用http,事实上,如果有必要,我可以暂时完全不使用https页面。我遇到的一些想法是:301重定向,使用.htaccess将所有https重定向到http。用于ssl页面的Robots.txt,再次使用.htaccess。这里的问题是https页面已经被索引,我希望它们被取消索引。我不确定robots.txt是否足够
可以告诉我Ektron是否可以在SEO中做这些事情吗?XHTML兼容-以开箱即用的XHTML兼容标记呈现规范URL-能够为单页SEO指定规范URL友好的URL-能够创建和配置SEO友好的URL和格式XMLSiteMap-能够动态自动生成XMLSiteMapGranular站点地图优先级-能够在页面管理中设置XML站点地图优先级语义菜单-使用语义标记的菜单系统GoogleAnalytics集成-GoogleAnalytics脚本的完全集成搜索引擎提交-允许您从管理界面将网站提交给各种搜索引擎XHTML兼容控件-使用的所有控件(菜单、网格等)呈现XHTML兼容标记
关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭9年前。Improvethisquestion我有一家网店。我产品的制造商允许我复制他们的描述。为了获得一些有值(value)的内容,我还添加(可选)我自己的描述和用户评论。但在某些产品页面上,大部分文本可能是复制粘贴的描述。我可以明确地将部分文档标记为重复内容吗?伪代码:ProductDescriptionblahblahblah...ManufacturerDescriptionblahblahblah...Usercommentsbl