草庐IT

java - 字符串不可变的非技术优势

coder 2023-05-27 原文

我想知道从程序员的角度来看字符串类型不变的好处。

技术优势(在编译器/语言方面)可以概括为,如果类型是不可变的,则更容易进行优化。阅读here以获得相关问题。

同样,在可变的字符串类型中,要么您已经内置了线程安全性(然后又很难进行优化),要么您必须自己进行。无论如何,您都可以选择使用具有内置线程安全性的可变字符串类型,因此这并不是可变字符串类型的真正优势。 (同样,更容易进行处理和优化以确保不可变类型上的线程安全,但这不是重点。)

但是,不可变字符串类型在用法中有什么好处?某些类型不可变的意义何在?这对我来说似乎很矛盾。

在C++中,如果我想使某些字符串不可变,则将其作为对函数的const引用(const std::string&)传递。如果我想要原始字符串的可变副本,请将其作为std::string传递。仅当我想使其可变时,才将其作为引用传递(std::string&)。因此,我只能选择自己想做的事情。我可以使用所有可能的类型来做到这一点。

在Python或Java中,某些类型是不可变的(大多数都是原始类型和字符串),而其他则不是。

在像Haskell这样的纯函数式语言中,一切都是不可变的。

有充分的理由使这种不一致有意义吗?还是仅出于技术上的低级原因?

最佳答案

What is the point of having some types immutable and others not?



没有一些可变的类型,您将不得不全力以赴地进行纯函数式编程-与目前最流行的OOP和过程方法完全不同的范例,并且尽管功能非常强大,但对许多程序员来说显然具有挑战性(当您确实需要一种无法改变的语言带来的副作用时,会发生什么?当然,在现实世界中编程不可避免地会做这是挑战的一部分-Haskell的Monads是一种非常优雅的方法,例如,但是有多少种方法程序员是否知道您完全自信地理解它们,并且可以将它们以及典型的OOP构造使用?-)。

如果您不了解拥有多个范式的巨大值(value)(FP范式和关键依赖可变数据的范式),我建议您学习Haridi和Van Roy的杰作Concepts, Techniques, and Models of Computer Programming-“21世纪的SICP”,因为我一旦描述过;-)。

大多数程序员,无论是否熟悉Haridi和Van Roy,都会轻易地承认,至少一些可变数据类型对他们很重要。尽管我从您的Q中引用了上面的句子,但该观点的观点截然不同,但我相信这可能也是您困惑的根源:不是“为什么每个都有些”,而是“为什么有些不可变的” 。

在Fortran实现中曾经(偶然地)获得了“彻底可变”的方法。如果有的话
  SUBROUTINE ZAP(I)
  I = 0
  RETURN

然后是一个程序段,例如
  PRINT 23
  ZAP(23)
  PRINT 23

会先打印23,然后打印0-的数字23 已被更改,因此程序其余部分对23的所有引用实际上都将引用0。从技术上讲,这不是编译器中的错误:Fortran对于哪些内容有微妙的规则您的程序是否可以将常量与变量传递给分配给其参数的过程,并且此代码段违反了那些鲜为人知且不可编译的规则,因此这是程序中的一个问题,而不是编译器中的问题。当然,实际上,以这种方式引起的错误数量高得令人难以接受,因此,典型的编译器很快会在这种情况下切换到破坏性较小的行为(如果操作系统支持,则将只读段中的常量获取运行时错误;或者,尽管开销很大,但传递常量的新副本而不是常量本身;依此类推),即使从技术上讲它们是程序错误,允许编译器“正确地”显示未定义的行为;-)。

在其他一些语言中强制执行的替代方法是增加参数传递的多种方式的复杂性-最值得注意的是在C++中,带有按值,按引用,按常量引用,按指针,按常量指针等等的东西。然后当然会看到程序员对诸如const foo* const bar的声明感到困惑(如果const是某个函数的参数,则最右边的bar本质上无关紧要……但如果bar是局部变量,则至关重要)。

实际上,Algol-68可能沿着这个方向走得更远(如果您可以有一个值和一个引用,为什么不引用一个引用呢?还是引用一个引用呢?&c-Algol 68对此没有限制,并且规则定义正在发生的事情可能是“打算用于实际用途”编程语言中发现的最微妙,最困难的组合)。早期的C语言(只有按值和明确的指针,没有const,没有引用,没有并发症),对它的 react 无疑是部分的,就像最初的Pascal一样。但是const很快流行起来,并且复杂性又开始增加。

Java和Python(以及其他语言)以强大的简化方式突破了这个丛林:所有参数传递和所有赋值都是“按对象引用”(从不引用变量或其他引用,从不包含语义隐式副本,&c) 。将数字定义为(至少)语义上不可变的,可以避免上面的Fortran代码所展示的“麻烦”,从而保留了程序员的理智(以及语言简单性的这一宝贵方面)。

将字符串像数字一样对待为基本体与语言预期的较高语义水平是完全一致的,因为在现实生活中,我们确实需要与数字一样简单易用的字符串。将字符串定义为字符列表(Haskell)或字符数组(C)之类的替代方案对编译器(在这种语义下保持高效的性能)和程序员(有效地忽略这种任意结构以使字符串使用简单)都构成了挑战(例如,现实生活中的编程经常需要)。

Python进一步增加了一个简单的不可变容器(tuple),并将散列与“有效不可变性”联系在一起(这避免了对程序员的某些惊喜,例如在Perl中发现的那样,其哈希允许可变字符串作为键)那么为何不?一旦有了不变性(这是一个宝贵的概念,可以使程序员不必学习关于赋值和参数传递的N种不同的语义,随着时间的流逝,N会逐渐增加;-),您也可能会从中获得全部 yield ;-) 。

关于java - 字符串不可变的非技术优势,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3584945/

有关java - 字符串不可变的非技术优势的更多相关文章

  1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  2. Ruby 解析字符串 - 2

    我有一个字符串input="maybe(thisis|thatwas)some((nice|ugly)(day|night)|(strange(weather|time)))"Ruby中解析该字符串的最佳方法是什么?我的意思是脚本应该能够像这样构建句子:maybethisissomeuglynightmaybethatwassomenicenightmaybethiswassomestrangetime等等,你明白了......我应该一个字符一个字符地读取字符串并构建一个带有堆栈的状态机来存储括号值以供以后计算,还是有更好的方法?也许为此目的准备了一个开箱即用的库?

  3. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

    我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

  4. ruby-on-rails - unicode 字符串的长度 - 2

    在我的Rails(2.3,Ruby1.8.7)应用程序中,我需要将字符串截断到一定长度。该字符串是unicode,在控制台中运行测试时,例如'א'.length,我意识到返回了双倍长度。我想要一个与编码无关的长度,以便对unicode字符串或latin1编码字符串进行相同的截断。我已经了解了Ruby的大部分unicode资料,但仍然有些一头雾水。应该如何解决这个问题? 最佳答案 Rails有一个返回多字节字符的mb_chars方法。试试unicode_string.mb_chars.slice(0,50)

  5. ruby - 将差异补丁应用于字符串/文件 - 2

    对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl

  6. ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2

    大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje

  7. ruby - 如何以所有可能的方式将字符串拆分为长度最多为 3 的连续子字符串? - 2

    我试图获取一个长度在1到10之间的字符串,并输出将字符串分解为大小为1、2或3的连续子字符串的所有可能方式。例如:输入:123456将整数分割成单个字符,然后继续查找组合。该代码将返回以下所有数组。[1,2,3,4,5,6][12,3,4,5,6][1,23,4,5,6][1,2,34,5,6][1,2,3,45,6][1,2,3,4,56][12,34,5,6][12,3,45,6][12,3,4,56][1,23,45,6][1,2,34,56][1,23,4,56][12,34,56][123,4,5,6][1,234,5,6][1,2,345,6][1,2,3,456][123

  8. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

    我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

  9. ruby - 如何使用文字标量样式在 YAML 中转储字符串? - 2

    我有一大串格式化数据(例如JSON),我想使用Psychinruby​​同时保留格式转储到YAML。基本上,我希望JSON使用literalstyle出现在YAML中:---json:|{"page":1,"results":["item","another"],"total_pages":0}但是,当我使用YAML.dump时,它不使用文字样式。我得到这样的东西:---json:!"{\n\"page\":1,\n\"results\":[\n\"item\",\"another\"\n],\n\"total_pages\":0\n}\n"我如何告诉Psych以想要的样式转储标量?解

  10. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

    在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

随机推荐