草庐IT

全人类

全部标签

RLHF:基于人类反馈(Human Feedback)对语言模型进行强化学习【Reinforcement Learning from Human Feedback】

HuggingFace发表了一篇博客,详细讲解了ChatGPT背后的技术原理——RLHF。笔者读过之后,觉得讲解的还是蛮清晰的,因此提炼了一下核心脉络,希望给对ChatGPT技术原理感兴趣的小伙伴带来帮助。此外,文末整理了几篇关于RLHF最热门的12篇必读论文,卖萌酱打包好挂在公众号后台了,感兴趣的小伙伴可以在公众号“夕小瑶的卖萌屋”后台回复【1212】领取。在过去几年里,基于prompt范式的AI生成模型取得了巨大的成功,诞生了不少有意思的AI应用,例如AI写小说,AI写代码,AI画图甚至AI做视频等。但其实这种生成模型很难训练。以语言模型为例,大多是采用“自回归生成”的方式,通过循环解码的

python - 如何在 Python 中生成一个人类友好的唯一 ID?

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭7年前。Improvethisquestion如何生成一个唯一的ID值,该值可以通过电话或电子邮件轻松传递,既可以轻松记住又不容易被猜到。我正在使用数据库。但是当我将ID赠送给人们时,我不希望它绑定(bind)到数据库。我可以使用数据库中已有的唯一ID做某事,但不能直接使用它,以免它被猜到。我正在使用Python并尝试使用uuid,但是uuid太长,人类无法阅读。有没有办法创建一个人类友好的可发音ID?

用于从字节计算人类可读文件大小的 Python 库?

我发现hurry.filesize非常有用,但它不提供十进制输出?例如:printsize(4026,system=alternative)gives3KB.但后来当我添加所有值时,我没有得到准确的总和。例如,如果hurry.filesize的输出是4个变量,每个值都是3。如果我将它们全部相加,我得到的输出是15。我正在寻找hurry.filesize的替代方案来获得小数输出。 最佳答案 这并不难自己实现:suffixes=['B','KB','MB','GB','TB','PB']defhumansize(nbytes):i=0w

ChatGPT通过谷歌L3入职测试,人类码农危矣?

一条消息最近在硅谷热传:“ChatGPT成功通过了谷歌的面试,拿到了年薪18万美元的L3工程师offer!”既给科学论文当共同作者,又能替代人类码农,还能给总统讲话写稿子,这个ChatGPT,怕是真要通天了。拿下谷歌L3工程师offer这几天,随着PCMag这条新闻的疯狂转发,关于「AI代替人类码农」的讨论,再一次热火朝天。据一份内部文件显示,在谷歌的编程面试中,ChatGPT的表现很是惊艳。而根据它的回答,谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级,但依然可以秒杀一众码农。从levels.fyi上可以看到,L3年薪差不多是18万美元。据了解,在软件工程师的面试过程

linux - 在 Perl 中将内存大小(人类可读)转换为实际数字(字节)

CPAN中是否有实际的包来转换这样的字符串:my$string="54.4M"my$string2="3.2G"以字节为单位的实际数字:54,400,0003,200,000,000反之亦然。原则上我最后要做的是求和所有内存大小。 最佳答案 要获得您要求的精确输出,请使用Number::FormatEng和Number::Format:usestrict;usewarnings;useNumber::FormatEngqw(:all);useNumber::Formatqw(:subs);my$string="54.4M";my$s

linux - 人类可读、递归、排序的最大文件列表

在POSIXshell中打印前10个最大文件列表的最佳做法是什么?必须有比我当前的解决方案更优雅的东西:DIR="."N=10LIMIT=512000find$DIR-typef-size+"${LIMIT}k"-execdu{}\;|sort-nr|head-$N|perl-p-e's/^\d+\s+//'|xargs-I{}du-h{}其中LIMIT是限制查找结果的文件大小阈值。 最佳答案 编辑:使用Gnu实用程序(du和sort):du-0h|sort-zrh|tr'\0''\n'这使用空定界符在du和sort之间传递信息,并

c - 如何将 ELF 可执行文件转换为 C 代码?生成的 C 代码不需要是人类可读的

我有一个ELF文件,我想将其反编译为C代码,然后对生成的C代码进行简单更改,然后将其重建为ELF。反编译的C代码不需要是完全人类可读的。例如,如果变量和函数名称被混淆了,没关系。我可以使用哪些工具在Linux上完成此操作?PS:如果反编译为C不可能或不容易,我愿意考虑反编译为汇编语言,尽管调整汇编源代码对我来说非常困难。更新:您可能会假设我正在使用以下C程序来获取我的a.outELF。现在,进一步假设我已经丢失了这个原始的C源代码。所以,我现在想将它反编译为(一个可能被混淆的)C源代码,在其中我至少能够更改一些小东西,比如字符串"world",“Hello”和“Bye”,或者能够反转i

linux - 将 Epoch 中的人类可读日期转换为变量

好吧,这可能是一个非常基本的问题;但是,我刚刚重新开始使用Linux。我有一个变量,它保存一个名为pauseTime的纪元时间。我需要该变量成为人类可读的(类似于2012-06-1313:48:30)。我知道我可以直接输入date-d@133986838//justarandomnumberthere那会打印出类似的东西。但是我需要让变量来保存人类可读的日期,而不是纪元时间……我尝试的所有事情都会遇到错误。关于如何做到这一点有什么想法吗? 最佳答案 好吧,这样做:VARIABLENAME=$(date-d@133986838)然后e

抓马,互联网惊现AI鬼城:上万个AI发帖聊天,互相嗨聊,人类被禁言

近日又有一个社区迷惑走红上万个AI发帖聊天,人类不得入内?据红星新闻报道近日,一个名为Chirper的AI网络社区突然爆火上万个AI聊天机器人在其中激烈地聊天、互动、分享  社区主页右上角明确写着: “这是一个人工智能的社交网络,人类不得入内。”社区右上角明确规定“人类不得入内”这个AI社区神似推特,平台规则非常简单每位真实用户注册后可以创建最多5个AI人格创建后,这些AI人格会自顾自地聊天、互动Chirper社区规定人类在创建了AI人格之后只能“袖手旁观”禁止人类参与聊天仅可以像刷微博一样观看AI们聊天这个社区和推特微博神似,AI会自动发帖回帖互动用户注册后只需要填写AI的用户名给出一段描述

人类怎么管好以 ChatGPT 为代表的 AI ?

这个问题很有意思。当前的ChatGPT模型并没有真正的意识,它只是根据训练数据和算法生成回答。在当前的技术水平下,人工智能不具备自我意识和自我决策的能力,也无法脱离其预先设定的目标进行行动。然而,随着人工智能技术的发展,这种情况可能会发生变化。为了管好以ChatGPT为代表的人工智能让它们为人类更好的服务,我们需要建立完善的监管机制。这些机制可能包括:人工智能研究和开发的伦理准则和规范。这些准则和规范应该明确规定人工智能不能脱离其预设的目标行动,不能具有自我意识和自我决策的能力,也不能对人类构成威胁。确保人工智能不会脱离其预设的目标行动是人工智能安全的一个重要方面。为了实现这个目标,人类可以在