我想知道当排名页面不是主页时,是否有一种方法可以将来自Google搜索的用户重定向到我的主页,而不会影响该页面的良好排名。我需要一个php条件来了解网页是否来自来自Google搜索的用户,而不是来自Google抓取工具的用户。我需要Google抓取工具继续为该页面编制索引,同时将用户重定向到主页。这是我的意思的伪代码:if($_SERVER['HTTP_REFERER']=='onlyusersfromaGooglesearch')header('location','index.php'); 最佳答案 不要使用任何这些技术,您应该
我已经搜索了很多并且找到了足够的相关信息,但我无法应用它。我有一个Ajaxhandler请求:..test.ashx?pagenumber=1我想让它可抓取。 最佳答案 您必须采用的方法是呈现一个基于纯HTML导航的寻呼机。然后加载(使用javascript...jquery会很好)将所有寻呼机链接转换为ajax。这样,当googlebot查询页面时,它将能够导航所有最初呈现的链接。 关于c#-如何在.NET中使Google可抓取AJAX分页,我们在StackOverflow上找到一个类
我一直在开发一个大量使用jQuery并通过AJAX加载内容的网站,如下所示:$('#newPageWrapper').load(newPath+'.pageWrapper',function(){//onloadlogic}现在我注意到Google不会通过Javascript为任何动态加载的内容编制索引,因此我一直在寻找解决该问题的方法。我已通读Google的MakingAJAXApplicationsCrawlable似乎记录了100次,但我仍然不明白如何实现它(主要是由于我对服务器的了解有限)。所以我的第一个问题是:是否有您知道的从头到尾记录这一切的体面的分步教程?我尝试用Goog
我有一个包含5个页面的基本网站。这5页代表一个5步过程。每个步骤都需要来自上一页的数据,这些数据保存在session中。如果在任何步骤中缺少所需数据,页面将重定向到主页。当爬虫爬取主页时,它不能超越第1步,因为在接下来的步骤中缺少所需的数据。此类页面的SEO方法应该是什么? 最佳答案 为什么您需要搜索引擎索引的额外步骤?无论如何,某人可能搜索的所有相关信息都应该在第一页上可用,而且这是搜索引擎唯一要编制索引的信息(因为爬虫没有指向其他页面的HTML链接跟随)。如您所说,页面上为接下来的4个步骤提供的信息是专门针对步骤1中提供的输入量
根据thisspec,使AJAX站点可被Googlebot抓取意味着您必须在其中使用hashbang(#!)链接,这意味着它不会在JS关闭时正常降级(或在打开时逐渐增强)。这可能意味着在这种情况下,可爬行性和优雅降级/渐进增强是相互排斥的。事实上是这样吗?有什么办法可以解决这个问题吗?注意:为了透明起见,我会注意到这个问题也是asked在ProWebmasters网站上,但从纯粹的编程Angular来看,我认为它也很有趣。 最佳答案 如果可能,我喜欢只在history.pushState可用时使用AJAX加载新页面。当history
我有一堆URL目前已在Google中编入索引。给定这些URL,有没有办法弄清楚Google上次抓取它们是什么时候?如果我手动检查Google中的链接并检查“缓存”链接,我会看到它被抓取的日期。有没有办法自动执行此操作?某种GoogleAPI?谢谢你:) 最佳答案 Google不为此类数据提供API。跟踪最后爬取信息的最佳方法是挖掘服务器日志。在您的服务器日志中,您应该能够通过其典型的用户代理来识别Googlebot:Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.googl
当他们发现不同的状态码时会做什么搜索?302301404等...我知道他们会忽略带有404状态代码的页面,但其他状态呢搜索引擎是抓取源页面还是目标页面? 最佳答案 来自"301RedirectsandSearchEngineOptimization":Fromasearchengineperspective,301redirectsaretheonlyacceptablewaytoredirectURLs.Inthecaseofmovedpages,searchengineswillindexonlythenewURL,butwil
我不太了解SEO和网络蜘蛛的工作原理,所以请原谅我的无知。我正在创建一个站点(使用ASP.NET-MVC),其中包含显示从数据库检索到的信息的区域。数据对用户来说是唯一的,因此没有真正的服务器端输出缓存在进行。但是,由于数据可能包含用户可能不希望从搜索引擎结果中显示的内容,因此我想阻止任何蜘蛛程序访问搜索结果页面。我应该采取什么特殊措施来确保搜索结果目录不被抓取吗?此外,蜘蛛甚至会抓取动态生成的页面吗?阻止某些目录被搜索的任何操作是否会扰乱我的搜索引擎排名?编辑:我应该补充一点,我正在阅读robots.txt协议(protocol),但它依赖于网络爬虫的合作。但是,我还想防止任何忽略r
我知道这取决于谷歌,但由于网络已经发展,所以我认为那里可能有一些东西。问题来了。我在jQuery.ready(...)上有一个jQuery.ajax({})页面加载后,我使用一些json数据填充内容.我只是认为可以有一个参数让google知道当他们抓取时有一个填充页面内容的ajax请求。原因...SEO我需要一个比请稍等...更好的机会 最佳答案 大多数爬虫不解释JavaScript。我不确定谷歌是否对它有合理的支持,但我想如果他们支持任何JS,那将是非常有限的。因此,使用AJAX加载主要内容本质上不是一个好主意。相反,您应该在将内
我有一个安全站点。Google(和其他搜索引擎)会抓取网站上的页面吗? 最佳答案 是的,Google会索引HTTP和HTTPS页面。如果您尝试使用搜索,这是显而易见的,尽管我目前似乎无法从任何“官方”来源找到确认。 关于search-Google会抓取HTTPS链接吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9980613/