草庐IT

new_index

全部标签

indexing - 为什么 Google(或 Googlebot)会索引一个返回 500 错误的页面?

Googlebot偶尔会使用错误的查询字符串参数为我们的网站之一编制索引。我不确定它是如何获取此查询字符串参数的(似乎没有任何网站通过错误链接链接到我们,并且我们网站中没有任何内容插入错误值)。如我们所料,错误的参数会导致站点抛出500错误。我的印象是Google不会为返回500错误的页面编制索引,但事实证明确实如此。所以现在我有两个问题:1)为什么Googlebot会随机插入错误的查询字符串值?(我真的不关心这个问题的答案,但如果我们能做些什么来避免这种情况,它就会解决我们的问题。)2)为什么Google会将返回500错误的页面编入索引?这是Googlebot创建并已编入索引的错误链

seo - 如何允许爬虫只访问 index.php,使用 robots.txt?

如果我只想让爬虫访问index.php,这行得通吗?User-agent:*Disallow:/Allow:/index.php 最佳答案 是的,它会起作用。这是来自GoogleWebmasterTool的测试结果.Urlhttp://www.example.org/index.phpGooglebotAllowedbyline3:Allow:/index.phpGooglebot-MobileAllowedbyline3:Allow:/index.php但是,请记住,如果使用此配置,您的网站主页将不会被抓取,除非使用完全限定路径访

indexing - 有没有办法阻止 Googlebot 将页面的某些部分编入索引?

是否可以将对Google的指令微调到忽略页面的一部分但仍将其余部分编入索引的程度?我们遇到了几个不同的问题,这些问题会得到帮助,例如:页面上显示外部来源内容的RSS提要/新闻行情类型文本输入联系电话等详细信息的用户希望他们在网站上可见但不希望他们无法通过谷歌搜索我知道以上两个问题都可以通过其他技术解决(例如用JavaScript编写内容),但我想知道是否有人知道Google是否已经提供了更简洁的选项?我一直在对此进行一些挖掘,并提到了googleonandgoogleofftags,但这些似乎是GoogleSearchAppliances独有的。有谁知道是否有一组类似的标签可供Goog

seo - 对 sitemap_index.xml 的困惑

我已经阅读了有关站点地图格式的Google文档,但有一件事他们没有说清楚:搜索引擎会自动寻找并找到/sitemap_index.xml还是您必须通过/robots.txt或主/sitemap.xml告诉他们?您是否可以不拥有/sitemap.xml并仍然依赖/sitemap_index.xml来找到和收获? 最佳答案 在您的robots.txt中,您可以使用相同的语法指向站点地图或站点地图索引文件:Sitemap:搜索引擎会通过查看文件知道它是什么类型。还值得注意的是,sitemap.xml和sitemap_index.xml只是建

Ajax 爬行 : old way vs new way (#! )

老方法当我以前在需要内容被搜索引擎索引的项目中异步加载页面时,我使用了一种非常简单的技术,那就是Page$('#example').click(function(){$.ajax({url:'ajax/page.html',success:function(data){$('#content').html(data);}})});编辑:我曾经实现haschange事件来支持javascript用户的书签。新方式最近Google提出了ajax抓取的想法,请在此处阅读:http://code.google.com/web/ajaxcrawling/http://www.asual.com/

indexing - "blog"子域是否有助于提高主站点的网页排名?

我有我的主要申请网站https://drchrono.com,我在http://blog.drchrono.com下有一个博客子域.一些博主告诉我,您网站的博客子域有助于提高主网站的网页排名。您的博客子域的流量是否有助于您网站的GooglePageRank并计入您的主网站的流量? 最佳答案 我认为Google不会对名为“blog”的子域给予任何特殊待遇。如果他们这样做了,那将为虐待敞开大门,而且他们足够聪明,可以意识到这一点。我曾一度认为将您的博客放在一个单独的子域中是有好处的。如果您的博客的网页排名不错,那么从您的博客到主站点的链

c++ - malloc/new 是否从缓存或 RAM 返回内存块?

我想知道malloc/new是否从缓存或RAM返回内存块。提前致谢。 最佳答案 当作为操作系统中的进程生活时,您对所有这些都是抽象的,您只获得内存。您不必为此担心,操作系统会为您管理所有这些,而内存单元会将事物从一个转移到另一个。但是您仍然看到一个单一的虚拟内存布局。 关于c++-malloc/new是否从缓存或RAM返回内存块?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1

c++ - 使用常量长度时 char[] 和 new char[] 之间的区别

所以这似乎是一个得到广泛回答的问题,但我更感兴趣的是两者之间到底发生了什么不同的内部结构。除了第二个示例不仅创建了内存,还创建了指向内存的指针这一事实,当发生以下情况时内存会发生什么:chara[5];charb*=newchar[5];与为什么我问这个问题更直接相关,我怎么能做constintlen=5;char*c=newchar[len];但不是constintlen=5;chard[len];//CompilererrorEDIT应该提到我在VC++上遇到了这个编译器错误(去计算...)1>.\input.cpp(138):errorC2057:expectedconstant

c++ - 为什么不在 placement new 中隐式调用析构函数”?

如本网站所引用...http://www.parashift.com/c++-faq-lite/dtors.html#faq-11.10但是我没有找到原因,为什么我们要显式调用析构函数? 最佳答案 您可以将其视为对delete的调用,但由于您使用了placementnew,因此您不想使用delete,因为那样会尝试释放内存。如果你想让它自动调用,你可以使用RAII://Coulduseatemplatedversion,orfindanexistingimplsomewhere:voiddestroy_fred(Fred*f){f-

c++ - new操作分配的内存是连续的吗?

如题所示,我想知道在c++中,一个new操作分配的内存是否连续... 最佳答案 BYTE*data=newBYTE[size];在此代码中,无论给定大小,返回的内存区域都是连续。如果堆管理器不能分配size的连续内存,则失败。将返回异常(或malloc中的NULL)。程序员总是会在进程的地址空间中看到连续(是的,无限:-)内存的错觉。这就是虚拟内存为程序员提供的。请注意,程序员(少数嵌入式系统除外)总是看到虚拟内存。然而,几乎连续的内存可以以任意方式映射到物理内存中(以“页面”大小为粒度,通常为4KB)。该映射您看不到,而且大多数情