seo - 机器人.txt : how to disallow subfolders of dynamic folder

coder 2024-02-27 原文

我有这样的网址: /产品/:product_id/交易/新 /products/:product_id/deals/index

我想在我的 robots.txt 文件中禁用“交易”文件夹。

[编辑] 我想禁止 Google、Yahoo 和 Bing Bots 使用此文件夹。有谁知道这些机器人是否支持通配符并支持以下规则？

Disallow: /products/*/deals

还有...关于 robots.txt 规则，您有什么真正好的教程吗？因为我没能找到一个“真正”好的，所以我可以使用一个......

最后一个问题: robots.txt 是处理此问题的最佳方法吗？或者我应该更好地使用“noindex”元数据？

谢谢大家! :)

最佳答案

是的，所有主要搜索引擎都支持基本通配符 *，您的解决方案将禁止您的 deals 目录。

了解 robots.txt 的最佳位置确实是 Google Developer page .它提供了大量示例，说明哪些有效，哪些无效。例如，许多人不知道 robots.txt 文件是特定于协议(protocol)的。因此，如果您想阻止 https 连接上的页面，您需要确保在 https://yoursite.com/robots.txt 处有一个 robots.txt。

您还可以在通过 Google Webmaster Tools 应用之前测试新的 robots.txt 文件。 .基本上，您可以在部署之前通过搜索引擎验证它是否真的有效。

关于使用 robots.txt 阻止某些内容或仅向页面添加 noindex，我更倾向于在大多数情况下使用 noindex，除非我知道我不希望搜索引擎抓取我网站的该部分完全没有。

有一些折衷。当您完全阻止搜索引擎时，您可以节省一些“抓取预算”。因此，搜索引擎会抓取其他页面，然后将时间“浪费”在您不希望他们访问的页面上。但是，这些 URL 仍会出现在搜索结果中。

如果您绝对不希望这些页面有任何搜索引荐流量，最好使用 noindex 指令。此外，如果您经常链接到交易页面，则 noindex 不仅会将其从搜索结果中删除，而且任何链接值/PageRank 都可以流经这些页面并可以进行相应计算。如果你阻止它们被抓取，那就有点像黑洞了。

关于seo - 机器人.txt : how to disallow subfolders of dynamic folder，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17068876/

有关seo - 机器人.txt : how to disallow subfolders of dynamic folder的更多相关文章

ruby - 在 Windows 机器上使用 Ruby 进行开发是否会适得其反？ - 2
这似乎非常适得其反，因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误，一个名为UnixSocket的类显然在Windows机器上不能正常工作，等等)。我只是在浪费时间吗？我应该转向不同的脚本语言吗？最佳答案我在Windows上使用Ruby的经验很少，但是当我开始使用Ruby时，我是在Windows上，我的总体印象是它不是Windows原生系统。因此，在主要使用Windows多年之后，开始使用Ruby促使我切换回原来的系统Unix，这次是Linux。Rub
ruby - 我的 Ruby IRC 机器人没有连接到 IRC 服务器。我究竟做错了什么？ - 2
require"socket"server="irc.rizon.net"port="6667"nick="RubyIRCBot"channel="#0x40"s=TCPSocket.open(server,port)s.print("USERTesting",0)s.print("NICK#{nick}",0)s.print("JOIN#{channel}",0)这个IRC机器人没有连接到IRC服务器，我做错了什么？最佳答案失败并显示此消息::irc.shakeababy.net461*USER:Notenoughparame
机器学习——时间序列ARIMA模型(四)：自相关函数ACF和偏自相关函数PACF用于判断ARIMA模型中p、q参数取值 - 2
文章目录1、自相关函数ACF2、偏自相关函数PACF3、ARIMA(p,d,q)的阶数判断4、代码实现1、引入所需依赖2、数据读取与处理3、一阶差分与绘图4、ACF5、PACF1、自相关函数ACF自相关函数反映了同一序列在不同时序的取值之间的相关性。公式：ACF(k)=ρk=Cov(yt,yt−k)Var(yt)ACF(k)=\rho_{k}=\frac{Cov(y_{t},y_{t-k})}{Var(y_{t})}ACF(k)=ρk=Var(yt)Cov(yt,yt−k)其中分子用于求协方差矩阵，分母用于计算样本方差。求出的ACF值为[-1,1]。但对于一个平稳的AR模型，求出其滞
建模分析 | 平面2R机器人(二连杆)运动学与动力学建模(附Matlab仿真) - 2
目录0专栏介绍1平面2R机器人概述2运动学建模2.1正运动学模型2.2逆运动学模型2.3机器人运动学仿真3动力学建模3.1计算动能3.2势能计算与动力学方程3.3动力学仿真0专栏介绍?附C++/Python/Matlab全套代码?课程设计、毕业设计、创新竞赛必备！详细介绍全局规划(图搜索、采样法、智能算法等)；局部规划(DWA、APF等)；曲线优化(贝塞尔曲线、B样条曲线等)。?详情：图解自动驾驶中的运动规划(MotionPlanning)，附几十种规划算法1平面2R机器人概述如图1所示为本文的研究本体——平面2R机器人。对参数进行如下定义：机器人广义坐标
智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2
2022年底，OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发，他展现的惊人能力将人工智能的研究和应用热度推向高潮，网上也充斥着和ChatGPT的各种聊天，他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复：人命关天的坑：写歌，留给词作者的机会不多了。。。回答人类怎么样面对人工智能：什么是ChatGPT？借用网上的一段介绍，ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型，一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动
ruby - AWS 上远程机器上的进程计数 - 2
我正在为在AmazonEC2实例上运行的应用程序设计一个AutoScaling系统。应用程序从SQS读取消息并对其进行处理。AutoScaling系统将监控两件事:SQS中的消息数量，所有EC2机器上运行的进程总数。例如，如果SQS中的消息数量超过3000，我希望系统自动缩放，创建一个新的EC2实例，在其上部署代码，当消息数量低于2000时，我希望系统终止EC2实例.我正在用Ruby和Capistrano做这件事。我的问题是:我无法找到一种方法来确定在所有EC2机器上运行的进程数并将该数字保存在变量中。你能帮帮我吗？最佳答案您可
ruby - 在 ruby 中下载多个 FTP 文件，如 d*.txt - 2
我需要连接到一个ftp站点并下载一堆名为D*.txt的文件(最多6个)。你能帮我用Ruby编写代码吗？下面的代码就ftp=Net::FTP::new("ftp_server_site")ftp.login("user","pwd")ftp.chdir("/RemoteDir")fileList=ftp.nlstftp.getbinaryfile(edi,edi)ftp.close谢谢最佳答案最简单的方法是遍历fileList中的文件列表。这是一个例子(未经测试):ftp=Net::FTP::new("ftp_server_sit
ruby - 如何让 Selenium/Ruby 机器人在执行操作之前等待？ - 2
我正在构建一个点击元素的Selenium/Ruby网络机器人。问题是，有时在机器人决定找不到元素之前没有足够的时间加载页面。让Selenium在执行操作之前等待的Ruby方法是什么？我更喜欢显式等待，但我也接受隐式等待。我尝试使用wait.until方法:require"selenium-webdriver"require"nokogiri"driver=Selenium::WebDriver.for:chromewait=Selenium::WebDriver::Wait.new(:timeout=>15)driver.navigate.to"http://google.com"dr
ruby - 是否可以使用机器人打开浏览器，手动操作页面，然后继续使用机器人？ - 2
我正在使用Ruby、SeleniumWebDriver和Nokogiri从网页中检索数据。加载正确的HTML后，我打印某个类的内容。例如，require"selenium-webdriver"require"nokogiri"browser=Selenium::WebDriver.for:chromebrowser.get"https://jsfiddle.net"doc=Nokogiri::HTML.parse(browser.page_source)doc.css('.aiButton').map(&:text).join(',')到目前为止，我发现最困难的部分是正确加载正确的HT
ruby-on-rails - 使用 Rails 的 Messenger 机器人 : setup for multiple pages - 2
我想创建一个供不同用户用于其Facebook页面的MessengerBot。我创建了一个Rails应用程序并使用facebook-messengergem.我成功创建了机器人，当我为一个页面设置时它可以工作。现在，我按照说明让我的机器人在多个Facebook页面上运行(请参阅"Makeaconfigurationprovider"section)。我是Rails的新手，我不确定将类ExampleProvider放在哪里？我把它放在我的config/application.rb文件中:require_relative'boot'require'rails/all'#Requiretheg

seo - 机器人.txt : how to disallow subfolders of dynamic folder

有关seo - 机器人.txt : how to disallow subfolders of dynamic folder的更多相关文章

随机推荐