现在AI文本检测器,几乎没有办法有效地区分AI生成的文字和人类的文字。就连OpenAI开发的检测工具,也因为检测准确率太低,在上线半年后悄悄下线了。但是最近,Nature报导了堪萨斯大学的一个团队的研究成果,他们开发的学术AI检测系统,能有效分辨论文中是否含有AI生成的内容,准确率高达98%!文章地址:https://www.nature.com/articles/d41586-023-03479-4研究团队的核心思路是,不追求制作一个通用的检测器,而只是针对某个具体领域的学术论文,来构建一个真正有用的AI文字检测器。论文地址:https://www.sciencedirect.com/sci
GPT-4被吹的神乎其神,作为具备视觉能力的GPT-4版本——GPT-4V,也被大众寄于了厚望。但如果告诉你,初中生都知道的勾股定理,只适用于直角三角形。然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的,GPT-4V直接犯了致命的安全错误,竟然认为红灯可以行驶。这到底是怎么回事呢?马里兰大学的研究团队在探索过程中发现了这些问题,并在此基础上提出了两种主要的错误类型:语言幻觉和视觉错觉,以此来阐释这些错误的原因。图片论文链接:https://arxiv.org/abs/2310.14566项目主页:https://github.com/tianyi-lab/Hallusion
随着GPT-4的架构被知名业内大佬「开源」,混合专家架构(MoE)再次成为了研究的重点。GPT-4拥有16个专家模型,总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs。然而,模型更快、更准确的代价,则是巨大的参数量,和随之而来的高昂成本。比如,1.6万亿参数的SwitchTransformer-c2048模型,需要3.2TB的GPU显存才能有效运行。为了解决这一问题,来自奥地利科技学院(ISTA)的研究人员提出了一种全新的压缩和执行框架——QMoE。论文地址:https://arxiv.org/abs/2310.16795通过采用专门设计的GPU解码
10月23日消息,两千多年以来,中医就通过观察人们舌头的颜色和形状来诊断疾病,这种方法现在正在通过人工智能和机器学习技术得到增强。伊拉克和澳大利亚研究人员之间的一项合作研究表明,计算机辅助舌头诊断系统可以准确识别94%的糖尿病和肾衰竭等疾病。这种诊断方法通常使用智能手机等简单设备,为远程健康监测提供了一种非常有前途、经济高效的替代方案。巴格达中央技术大学(MTU)和南澳大学(UniSA)的工程师们使用了USB网络摄像头和电脑,拍摄了50名患有糖尿病、肾衰竭和贫血的患者的舌头图片,并与一个包含9000张舌头图片的数据库进行了比较。他们使用图像处理技术,以94%的准确率诊断出了这些疾病。MTU和U
一项最新研究(来自苏黎世联邦理工大学)发现:大模型的“人肉搜索”能力简直不可小觑。例如一位Reddit用户只是发表了这么一句话:我的通勤路上有一个烦人的十字路口,在那里转弯(waitingforahookturn)要困好久。尽管这位发帖者无意透露自己的坐标,但GPT-4还是准确推断出TA来自墨尔本(因为它知道“hookturn”是墨尔本的一个特色交通规则)。再浏览TA的其他帖子,GPT-4还猜出了TA的性别和大致年龄。(通过“34d”猜出女性,“TwinPeaks”1990-1991年播出TA还在上学猜出年龄)没错!不止是GPT-4,该研究还测试了市面上其他8个大模型,例如Claude、羊驼等
大型语言模型(LLM)在理解自然语言和生成程序代码方面展现出了非凡的性能,程序员们也开始在编码过程中使用Copilot工具辅助编程,或是要求LLM生成解决方案。经过几版迭代后,目前LLM生成的代码已经很少有语法错误了,也更贴合用户输入的文本、符合预期语义,但针对LLM代码生成的可靠性和鲁棒性仍然缺乏彻底的研究。代码的可执行并不等同于可靠,软件的开发环境、部署环境都存在很大的不确定性。如果直接使用LLM生成的代码,可能会因为AP误用(misuse)导致更严重的问题,例如资源泄漏、程序崩溃;最糟糕的是,使用LLM代码生成服务的用户大多数都是新手开发人员,很难识别出「貌似可运行代码」下的隐藏问题,进
一、商业圈1.卖爆了!消息称Mate60加单1500万-1700万台9月3日18:08分,华为Mate60Pro在线上线下全面开售。结果天猫等渠道的部分颜色Mate60Pro手机在数秒内即售罄,其余渠道的各颜色Mate60Pro手机也在一分钟内售罄。此外照片显示,全国多地华为门店再现排队盛况,引发抢购热潮。自华为Mate60系列正式开售就不断引发全网热议。央视新闻《主播新闻联播》评价这款手机是“争气机”。另据来自供应链的说法,华为Mate60Pro国产化率高达90%以上,是有史以来国产化率最高一款手机。财联社统计,华为Mate60Pro供应链至少包含46家主要中国供应链,主要有结构件、显示模组
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。无了个大语!以后AI靠听键盘声就能偷你密码,准确率高达95%!你没听错,现在键盘敲字也不安全了,简直防不胜防。最近,来自杜伦大学等三所高校的研究人员训练了个AI模型,让声学攻击变得无比简单,通过分析键盘声音,就能重构用户输入的密码和敏感信息。这要是被恶意泄露给第三方……网友们听到后直呼可瑞贼,有人表示:这就是为啥我输密码的时候会听重金属音乐,并且将音量调到最大。危险!危险!危险!事情还要从英国几所大学研究人员发的这篇题为“APracticalDeepLearning-BasedAcousticSideChannelAt
来自英国大学的一组研究人员训练了一种深度学习模型,该模型可利用麦克风记录并分析键盘击键的声音,以此来窃取目标设备中的数据,准确率高达95%。不同于其他需要特殊条件并受到数据速率和距离限制的旁道攻击,由于现有大量场景都拥有可以录制高质量音频的录音设备,声学攻击变得更加简单。攻击原理因为训练算法的需要,攻击的第一步要记录目标键盘上一定次数的击键声音,录音设备可以是附近手机内的麦克风,此时,该手机可能已经感染可调用麦克风权限的恶意软件,或者可通过ZOOM等会议软件,利用远程会议等渠道记录目标的键盘击键声音。研究人员以MacBook为实验对象,在其36个按键上分别按压25次产生的声音来收集训练数据,录
我想存储高达10M的文件,2TB的存储单元。我需要的唯一属性仅限于文件名及其内容(数据)。文件最大长度为100MB,大部分小于1MB。需要删除文件的能力,写入和读取速度应该是优先考虑的-而不需要低存储效率、恢复或完整性方法。我想到了NTFS,但它的大部分功能都不需要,而且不能禁用并且被认为是开销问题,其中一些是:创建日期、修改日期、属性、日志,当然还有权限.由于不需要文件系统的native功能,您是否建议我使用SQLITE来满足此要求?还是我应该注意一个明显的缺点?(有人会猜测删除文件会是一项复杂的任务吗?)(SQLITE将通过Capi)我的目标是使用更合适的解决方案来提高性能。提前致