抓取

php - 如何重定向来自 Google 搜索的用户，而不是同一页面的 Google 抓取工具？

我想知道当排名页面不是主页时，是否有一种方法可以将来自Google搜索的用户重定向到我的主页，而不会影响该页面的良好排名。我需要一个php条件来了解网页是否来自来自Google搜索的用户，而不是来自Google抓取工具的用户。我需要Google抓取工具继续为该页面编制索引，同时将用户重定向到主页。这是我的意思的伪代码:if($_SERVER['HTTP_REFERER']=='onlyusersfromaGooglesearch')header('location','index.php'); 最佳答案不要使用任何这些技术，您应该

Google php section 39 seo google-search google-ranking

c# - 如何在 .NET 中使 Google 可抓取 AJAX 分页

我已经搜索了很多并且找到了足够的相关信息，但我无法应用它。我有一个Ajaxhandler请求:..test.ashx?pagenumber=1我想让它可抓取。最佳答案您必须采用的方法是呈现一个基于纯HTML导航的寻呼机。然后加载(使用javascript...jquery会很好)将所有寻呼机链接转换为ajax。这样，当googlebot查询页面时，它将能够导航所有最初呈现的链接。关于c#-如何在.NET中使Google可抓取AJAX分页，我们在StackOverflow上找到一个类

c#何在 section 寻呼机寻呼 .net javascript ajax seo

javascript - 如何让 Google 抓取我的 AJAX 内容？

我一直在开发一个大量使用jQuery并通过AJAX加载内容的网站，如下所示:$('#newPageWrapper').load(newPath+'.pageWrapper',function(){//onloadlogic}现在我注意到Google不会通过Javascript为任何动态加载的内容编制索引，因此我一直在寻找解决该问题的方法。我已通读Google的MakingAJAXApplicationsCrawlable似乎记录了100次，但我仍然不明白如何实现它(主要是由于我对服务器的了解有限)。所以我的第一个问题是:是否有您知道的从头到尾记录这一切的体面的分步教程？我尝试用Goog

javascript Google section noreferrer ajax seo web-crawler htmlunit

session - 如何让谷歌抓取需要 session 数据的页面？

我有一个包含5个页面的基本网站。这5页代表一个5步过程。每个步骤都需要来自上一页的数据，这些数据保存在session中。如果在任何步骤中缺少所需数据，页面将重定向到主页。当爬虫爬取主页时，它不能超越第1步，因为在接下来的步骤中缺少所需的数据。此类页面的SEO方法应该是什么？最佳答案为什么您需要搜索引擎索引的额外步骤？无论如何，某人可能搜索的所有相关信息都应该在第一页上可用，而且这是搜索引擎唯一要编制索引的信息(因为爬虫没有指向其他页面的HTML链接跟随)。如您所说，页面上为接下来的4个步骤提供的信息是专门针对步骤1中提供的输入量

session 如何 section strong 爬虫 seo

javascript - 是否可以在关闭 JS 的情况下使 AJAX 站点可抓取并优雅地降级？

根据thisspec，使AJAX站点可被Googlebot抓取意味着您必须在其中使用hashbang(#!)链接，这意味着它不会在JS关闭时正常降级(或在打开时逐渐增强)。这可能意味着在这种情况下，可爬行性和优雅降级/渐进增强是相互排斥的。事实上是这样吗？有什么办法可以解决这个问题吗？注意:为了透明起见，我会注意到这个问题也是asked在ProWebmasters网站上，但从纯粹的编程Angular来看，我认为它也很有趣。最佳答案如果可能，我喜欢只在history.pushState可用时使用AJAX加载新页面。当history

雅地 javascript section code noreferrer ajax seo progressive-enhancement graceful-degradation

seo - Google 上次抓取我的网站时的 API，提供 URL？

我有一堆URL目前已在Google中编入索引。给定这些URL，有没有办法弄清楚Google上次抓取它们是什么时候？如果我手动检查Google中的链接并检查“缓存”链接，我会看到它被抓取的日期。有没有办法自动执行此操作？某种GoogleAPI？谢谢你:) 最佳答案 Google不为此类数据提供API。跟踪最后爬取信息的最佳方法是挖掘服务器日志。在您的服务器日志中，您应该能够通过其典型的用户代理来识别Googlebot:Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.googl

Google seo section Googlebot google-search

html - 使用301,302重定向时，搜索引擎是抓取源页面还是目标页面？

当他们发现不同的状态码时会做什么搜索？302301404等...我知道他们会忽略带有404状态代码的页面，但其他状态呢搜索引擎是抓取源页面还是目标页面？最佳答案来自"301RedirectsandSearchEngineOptimization":Fromasearchengineperspective,301redirectsaretheonlyacceptablewaytoredirectURLs.Inthecaseofmovedpages,searchengineswillindexonlythenewURL,butwil

html 301 section strong noreferrer http search seo

asp.net-mvc - 防止机器人抓取网站的某些区域

我不太了解SEO和网络蜘蛛的工作原理，所以请原谅我的无知。我正在创建一个站点(使用ASP.NET-MVC)，其中包含显示从数据库检索到的信息的区域。数据对用户来说是唯一的，因此没有真正的服务器端输出缓存在进行。但是，由于数据可能包含用户可能不希望从搜索引擎结果中显示的内容，因此我想阻止任何蜘蛛程序访问搜索结果页面。我应该采取什么特殊措施来确保搜索结果目录不被抓取吗？此外，蜘蛛甚至会抓取动态生成的页面吗？阻止某些目录被搜索的任何操作是否会扰乱我的搜索引擎排名？编辑:我应该补充一点，我正在阅读robots.txt协议(protocol)，但它依赖于网络爬虫的合作。但是，我还想防止任何忽略r

net-mvc asp section 的上实 asp.net-mvc seo search-engine bots web-crawler

jquery - 如何延迟谷歌抓取直到页面准备好

我知道这取决于谷歌，但由于网络已经发展，所以我认为那里可能有一些东西。问题来了。我在jQuery.ready(...)上有一个jQuery.ajax({})页面加载后，我使用一些json数据填充内容.我只是认为可以有一个参数让google知道当他们抓取时有一个填充页面内容的ajax请求。原因...SEO我需要一个比请稍等...更好的机会最佳答案大多数爬虫不解释JavaScript。我不确定谷歌是否对它有合理的支持，但我想如果他们支持任何JS，那将是非常有限的。因此，使用AJAX加载主要内容本质上不是一个好主意。相反，您应该在将内

jquery 如何 section code strong seo google-search

search - Google 会抓取 HTTPS 链接吗？

我有一个安全站点。Google(和其他搜索引擎)会抓取网站上的页面吗？最佳答案是的，Google会索引HTTP和HTTPS页面。如果您尝试使用搜索，这是显而易见的，尽管我目前似乎无法从任何“官方”来源找到确认。关于search-Google会抓取HTTPS链接吗？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/9980613/

search Google section stackoverflow seo search-engine

26 27 282930 31 32