草庐IT

机器指令

全部标签

spring - 他们是使用 spring mvc 生成站点地图和机器人 txt 的现有工具吗

我的网站有安全页面和一些公共(public)目录。它们是基于Controller请求映射及其安全访问级别/请求类型生成站点地图和/或robots.txt的内置机制还是现有库? 最佳答案 不,没有生成站点地图和/或robots.txt的内置机制或现有库但是您可以自己构建它:因为可以读取映射。@查看:Howtoshowallcontrollersandmappingsinaview 关于spring-他们是使用springmvc生成站点地图和机器人txt的现有工具吗,我们在StackOver

javascript - 根据过滤器的值有条件地添加 ng-animate 指令

我正在使用AngularJS开发单页应用。使用ng-animate="{enter:'appear',leave:'disappear'}".我想让这个SPA可以被搜索机器人抓取,所以我使用headless浏览器(PhantomJS)呈现页面[同时解释javascript],然后将该结果发送回搜索机器人。我遇到的问题是PhantomJS在View仍在动画时发回结果,因此一些div在渲染回来时仍然是“透明的”(甚至有时仍在opacity:0-这在SEOimo方面很糟糕。我的解决方案是在检测到headless浏览器时禁用动画。我的问题是如何根据过滤器的值有条件地添加ng-animate指令

html - 在字体上使用描边和填充来创建图层时,如何隐藏屏幕阅读器和搜索引擎机器人的重复文本?

我正在尝试构建一个h1,其排版分为两种字体:描边字体和填充字体:重叠两个图层我可以控制填充和描边颜色:问题是,在HTML标记中,我需要复制内容。像这样:LoremIpsumLoremIpsum我要求一些方法将其中一个隐藏在机器人和盲人设备的DOM中。可能吗? 最佳答案 aria-hidden似乎是您所需要的。Insupportingbrowsersinconjunctionwithsupportingassistivetechnologythecontentisnotconveyedtotheuserviatheassistivet

seo - 限制机器人访问(特定)查询字符串(参数)值?

使用robot.txt是否可以限制机器人对(特定)查询字符串(参数)值的访问?即http://www.url.com/default.aspx#allowhttp://www.url.com/default.aspx?id=6#allowhttp://www.url.com/default.aspx?id=7#disallow 最佳答案 User-agent:*Disallow:/default.aspx?id=7#disallowDisallow:/default.aspx?id=9#disallowDisallow:/defau

seo - 阻止滥用机器人爬行?

这是个好主意吗??http://browsers.garykeith.com/stream.asp?RobotsTXT滥用抓取是什么意思?这对我的网站有什么坏处? 最佳答案 不是真的。大多数“坏机器人”无论如何都会忽略robots.txt文件。滥用爬取通常意味着抓取。这些机器人的出现是为了收集电子邮件地址或更常见的内容。至于如何阻止他们?这真的很棘手,而且通常不明智。反爬网技术往往不够完美,会给普通人带来麻烦。遗憾的是,就像零售业的“缩水”一样,这是在网络上开展业务的成本。 关于seo-

asp.net - 检测您的站点是否正在被机器人访问

我有一些地理定位代码,如果网站被机器人抓取,我希望以特定方式运行,例如谷歌等有什么办法可以推断出这一点吗? 最佳答案 向搜索引擎爬虫和人类访问者呈现不同的内容-称为cloaking-是一件有风险的事情,如果被发现可能会受到搜索引擎的惩罚。就是说,查看thisSOanswer有几个链接到维护良好的“机器人列表”。您必须解析USER_AGENT字符串并将其与此类机器人列表进行比较。 关于asp.net-检测您的站点是否正在被机器人访问,我们在StackOverflow上找到一个类似的问题:

php - 如何识别客户端是搜索机器人?

我已经使用AJAX(实际上是GWT)构建了我的整个网站。我还实现了Google提出的AJAX抓取。然而,实现之后,我发现雅虎、必应、百度都没有实现该方案!我想知道是否有一种方法可以识别网络客户端是搜索机器人。如果是,他们将看到我创建的HTML快照。如果我能在APACHE级别识别它们,那将是最好的,然后我就可以做一个mod_rewrite。但如果我能用PHP或GWT做到这一点,那还是没问题的。 最佳答案 这很棘手,因为有这么多不同的搜索引擎。我想这不能在一个类轮内完成。如果PHP没问题,我建议使用php_browscap.ini(适用

seo - 我在哪里可以获得 SEO 机器人的用户代理列表?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion我正在对未注册用户可以访问多少网站实现简单的过滤器。自然地,我想让SEO机器人免费统治/访问大部分网站。我知道这很简单。但它不值得做任何更复杂的事情。我需要编制一个我允许的用户代理名称列表,为此,我需要一个机器人名称列表,从Googlebot开始(我什至不知道这是否是Gogles网络爬虫机器人的官方拼写).任何人我想要一个链接到一个明确的资源,它给出了SEO索引机器人

php - 索引您网站的蜘蛛(谷歌机器人...)是否有 "culture"?

这是一个SEO问题:我可以选择根据访问者的文化显示页面标题。如果是英文:getCulture()=='en'):?>Hello,thisisanenglishwebsiteBonjour,ceciestunsitefrançais机器人/蜘蛛有文化吗?这是否意味着在Googleuk上我的网站页面将是:“您好,这里是……”在谷歌法国这将是“你好……”谢谢编辑:任何访问我网站的人都会看到英文版,法国、比利时和加拿大除外。这是可以做到的,因为getCulture()返回浏览器接受的和首选的语言编辑2:当用户打开我的网站时(基于HTTP_ACCEPT_LANGUAGE):getPreferre

seo - 我应该摆脱访问我网站的机器人吗?

我一直在我的追踪器上注意到机器人经常访问我的网站。我应该更改或编辑我的robots.txt还是更改某些内容?不确定那是否好,因为它们正在编制索引还是什么? 最佳答案 Shouldichangeoreditmyrobots.txtorchangesomething?取决于机器人。有些机器人会尽职尽责地忽略robots.txt。18个月前,我们的谷歌广告机器人遇到了类似的问题,因为我们的客户购买了太多广告。GoogleAD机器人将(如文档所述)忽略通配符(*)排除项,但听取明确的忽略。请记住,支持robots.txt的机器人不会抓取您的