我需要生成一个 href到一个 URI。除了需要百分比编码的保留字符外,一切都很容易,例如链接到 /some/path;element应显示为 <a href="/some/path%3Belement"> (我知道 path;element 代表一个实体)。
最初我正在寻找一个 Java 库来执行此操作,但我最终自己写了一些东西(在下面查看 Java 失败的原因,因为这个问题不是特定于 Java 的)。
因此,RFC 3986 does suggest when NOT to encode .正如我所读,当角色属于 unreserved (ALPHA / DIGIT / "-" / "." / "_" / "~") 时,这应该会发生。类(class)。到目前为止,一切都很好。但是相反的情况呢? RFC 只提到百分比( % )总是需要编码。但是其他人呢?
问题:假设所有非未保留的内容都可以/应该进行百分比编码是否正确?例如,左括号 (不一定需要编码而是分号;做。如果我不对其进行编码,我最终会寻找 /first * 当关注 <a href="/first;second"> 时.但是关注 <a href="/first(second">我总是最终寻找 /first(second , 正如预期的那样。令我困惑的是 (和 ;都在同一个sub-delims类就 RFC 而言。正如我想象的那样,对所有非保留的内容进行编码是一个安全的选择,但是当涉及到本地化 URI 时,SEO 能力、用户友好性又如何呢?
现在,Java 库失败了。我试过这样做
new java.net.URI("http", "site", "/pa;th", null).toASCIISTring()
但这给出了 http://site/pa;th这是不好的。观察到类似的结果:
javax.ws.rs.core.UriBuilder encodePath(String, String)和 encodePathSegment(String, String) [*] /first是调用 HttpServletRequest.getServletPath() 的结果在服务器端点击 <a href="/first;second">
编辑:我可能需要提到这种行为是在 Tomcat 下观察到的,我已经检查了 Tomcat 6 和 7 的行为方式相同。
最佳答案
Is it correct to assume that everything that is not unreserved, can/should be percent-encoded?
没有。 RFC 3986 是这样说的:
"Under normal circumstances, the only time when octets within a URI are percent-encoded is during the process of producing the URI from its component parts. This is when an implementation determines which of the reserved characters are to be used as subcomponent delimiters and which can be safely used as data. "
这意味着您可以根据上下文决定哪些分隔符(即 <delimiter> 字符)需要编码。那些不需要编码的不应该编码。
例如,您不应该对 / 进行百分号编码如果它出现在路径组件中,但当它出现在查询或片段中时,您应该对其进行百分比编码。
所以,事实上,一个 ;字符(属于 <reserved> 的成员不应自动进行百分号编码。事实上,Java URL 和 URI 类不会这样做;请参阅 URI(...) javadoc,特别是第 7 步)以了解 <path> 的处理方式。组件被处理。
这一段加强了这一点:
"The purpose of reserved characters is to provide a set of delimiting characters that are distinguishable from other data within a URI. URIs that differ in the replacement of a reserved character with its corresponding percent-encoded octet are not equivalent. Percent- encoding a reserved character, or decoding a percent-encoded octet that corresponds to a reserved character, will change how the URI is interpreted by most applications. Thus, characters in the reserved set are protected from normalization and are therefore safe to be used by scheme-specific and producer-specific algorithms for delimiting data subcomponents within a URI."
所以这表示一个 URL 包含一个百分比编码的 ;与包含原始 ; 的 URL 不同.最后一句话暗示它们不应该自动进行百分比编码或解码。
这给我们留下了一个问题 - 为什么您想要 ;要进行百分比编码?
Let's say you have a CMS where people can create arbitrary pages having arbitrary paths. Later on, I need to generate href links to all pages in, for example, site map component. Therefore I need an algorithm to know which characters to escape. Semicolon has to be treated literally in this case and should be escaped.
抱歉,分号不应该被转义。
就 URL/URI 规范而言,;没有特殊意义。它可能对特定的网络服务器/网站有特殊意义,但一般(即没有网站的具体知识)你无法知道这一点。
如果;在特定的 URI 中确实有特殊的含义,那么如果你对它进行百分号转义,那么你就破坏了那个含义。例如,如果网站使用 ;允许将 session token 附加到路径,然后百分比编码将阻止它识别 session token ......
如果;只是一些客户端提供的数据字符,然后如果你对它进行百分比编码,你可能会改变 URI 的含义。这是否重要取决于服务器做什么;即是否解码作为应用程序逻辑的一部分。
这意味着了解“正确的事情”需要深入了解 URI 对最终用户和/或站点的意义。这将需要先进的读心技术来实现。我的建议是让 CMS 通过在将 URI 路径传送到您的软件之前适本地转义任何定界符来解决它。该算法必然特定于 CMS 和内容交付平台。它/他们将响应对由 URL 标识的文档的请求,并且需要知道如何解释它们。
(支持任意人使用任意路径有点疯狂。必须有一些限制。例如,甚至 Windows 都不允许您在文件名组件中使用文件分隔符。所以您是将不得不在某处有一些边界。这只是决定它们应该在哪里的问题。)
关于java - RFC3986 - 哪些 pchars 需要进行百分比编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5913623/
当我使用Bundler时,是否需要在我的Gemfile中将其列为依赖项?毕竟,我的代码中有些地方需要它。例如,当我进行Bundler设置时:require"bundler/setup" 最佳答案 没有。您可以尝试,但首先您必须用鞋带将自己抬离地面。 关于ruby-我需要将Bundler本身添加到Gemfile中吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4758609/
我注意到像bundler这样的项目在每个specfile中执行requirespec_helper我还注意到rspec使用选项--require,它允许您在引导rspec时要求一个文件。您还可以将其添加到.rspec文件中,因此只要您运行不带参数的rspec就会添加它。使用上述方法有什么缺点可以解释为什么像bundler这样的项目选择在每个规范文件中都需要spec_helper吗? 最佳答案 我不在Bundler上工作,所以我不能直接谈论他们的做法。并非所有项目都checkin.rspec文件。原因是这个文件,通常按照当前的惯例,只
我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby,并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121
我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/
我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www
我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Rubysyntaxquestion:Rational(a,b)andRational.new!(a,b)我正在阅读ruby镐书,我对创建有理数的语法感到困惑。Rational(3,4)*Rational(1,2)产生=>3/8为什么Rational不需要new方法(我还注意到例如我可以在没有new方法的情况下创建字符串)?
什么是ruby的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
这篇文章是继上一篇文章“Observability:从零开始创建Java微服务并监控它(一)”的续篇。在上一篇文章中,我们讲述了如何创建一个Javaweb应用,并使用Filebeat来收集应用所生成的日志。在今天的文章中,我来详述如何收集应用的指标,使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值,然后一切都回到一个请求。这也意味着这些指标可能不准确,你还想提取最小/
HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候