我用两种语言运行一个多语言网页。我想知道如何准备对Google搜索引擎友好的sitemap.xml文件。对于主站点地址example.com,默认语言是pl-PL。简单的语言代码是pl。第二种语言是en-GB,带有简单代码en。所以默认语言的第一个地址是:example.com第一个lang代码:example.com/pl/(带简单语言代码的域名)是同一个页面。同样的页面也适用于example.com/pl/home-page/(language-code/site-code)所以使用默认语言的主页有3个副本。第二种语言是en,地址为example.com/en/和example.c
看完Jeff'sarticle关于站点地图的重要性,所以我决定为我的动态网站生成一个。我看过一些关于如何使用ASP.NET实现它的文章,但我看到的每个解决方案都显示了如何动态生成它withanHTTPHandler.但该解决方案意味着每次有人请求该文件时,我的代码都必须遍历我的所有条目以重新生成一个?增量生成它不会消耗更少的资源吗?例如在stackoverflow上,每次用户添加问题时,附加新的URL节点? 最佳答案 您可能希望缓存生成的XML并在网站结构发生变化时使缓存失效。这可能会导致您的网站组件具有发布/订阅机制,但如果应用程
我只想在一个搜索引擎中获得...http://mysite.com/indexed,not...http://mysite.com/index.phpIonlywanttoallowindexingofthemainpageofthewebsite,andnothingmore.Idonotwantthebottofollowanyofthelinksonthemainpage.Mymetatagsincludethefollowing::我的robot.txt包括以下内容::User-agent:GooglebotAllow:/index.phpDisallow:/User-agen
我是PHP编码、Web开发和搜索优化方面的新手-总的来说是个新手。在学习php和web开发的过程中,我一直在尝试不同的网站架构和布局。我正在研究的一种方法使用如下方法:我有一个index.php页面,它总是加载header.php、sidebar.php和footer.php。index.php还包含一个开关,以便根据传递的index.php页面变量加载不同的核心内容。因此,例如examplesite.com/index.php?page=photos和examplesite.com/index.php?page=stories都具有相同的页眉、页脚和侧边栏,但其中一个有照片,一个有故
http://www.example.com/foo.htmlhttp://www.example.com/sitemap1.xml.gz2004-10-01T18:23:17+00:00http://www.example.com/sitemap2.xml.gz2005-01-01我可以在同一个站点地图XML文件中包含url和sitemapindex吗?我的网站上有大约300K多个页面。还有将近50个静态HTML页面。所以我想直接在url标签下添加这些静态URL,对于动态URL,我创建了一个站点地图索引。 最佳答案 不,那行不通。
在下面的Google语言指示中,我使用了href="/"而不是href="index.html"。然而,这似乎在网站管理员工具中给我警告。有人知道这里发生了什么吗?网站站长工具告诉我:有包含错误的Hreflang标签。es-ES网页和替代网页的网址不包含返回标记。 最佳答案 在你的hreflang中你可以输入你的网站url或 关于html-使用href="/"而不是href="index.html"作为起始页?,我们在StackOverflow上找到一个类似的问题:
如何从http://localhost/dashboard/index/create中删除index我的urlManager设置如下:'urlManager'=>array('urlFormat'=>'path','showScriptName'=>false,'rules'=>array('/'=>'/view','//'=>'/','/'=>'/',),),这给了我像这样的干净的URLhttp://localhost/dashboard其中dashboard是一个模块,带有一个名为indexController的默认Controller.现在,我遇到的问题是,如果不先放置index
如果我想让搜索引擎遵循我的robots.txt规则,我有点困惑是否应该删除robots元标记。如果页面上存在机器人元标记(索引、跟随),搜索引擎是否会忽略我的robots.txt文件并在我的robots.txt中索引指定的不允许的URL?我问这个问题的原因是,搜索引擎(主要是Google)仍在索引我网站上不允许的页面。 最佳答案 如果搜索引擎的漫游器支持您的robots.txt,而您禁止抓取/foo,那么漫游器将永远不会抓取URL路径以/foo开头的页面.因此,机器人永远不会知道有meta-robots元素。相反,这意味着如果您想禁
关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion你能推荐什么工具吗?我们应该建立自己的吗?我们应该手动创建站点地图吗?
我的站点有以下问题http://huti.ru.尝试在http://webmaster.yandex.ru/addurl.xml中添加其任何页面时(Yandex-俄罗斯搜索引擎)写道“服务器返回状态代码http405(预期代码200)。”是什么导致brawusers和yandex爬虫出现如此不同的行为?(谷歌索引正常)环境:tomcat,java6 最佳答案 您的服务器不允许HEAD请求。似乎机器人在实际GET之前先尝试HEAD。作为http://www.w3.org/Protocols/rfc2616/rfc2616-sec9.h