爆火_草庐IT

从 ChatGPT 爆火回溯 NLP 技术

ChatGPT火遍了全网，多个话题频频登上热搜。见证了自然语言处理（NLP）技术的重大突破，体验到通用技术的无限魅力。GPT模型是一种NLP模型，使用多层变换器（Transformer）来预测下一个单词的概率分布，通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。而NLP技术是人工智能领域的重要研究分支，被视为人工智能皇冠上的明珠。图灵测试的假设就是针对自然语言处理技术而设计的。本质上说，自然语言处理技术就是为了让计算机理解人类语言。NLP技术其实由来已久从1940年代WarrenWeaver提出机器翻译的思想以来，NLP经历了70多年的发展，从技术的角度大致可分为三个阶段：NLP

从 AI 的爆火聊聊用户界面（UI）的演进

目录用户界面的起源与发展用户界面的设计原则与趋势用户界面未来的方向小结用户界面（UserInterface，简称UI）是人与计算机系统交互的媒介，用户可以通过用户界面向计算机发送指令，同时计算机可以通过用户界面向用户展示信息。用户界面的设计和演进不仅反映了技术的进步，还体现了人类与机器交互方式的不断变化。从早期的命令行界面到现在的自然用户界面，用户界面的设计经历了翻天覆地的变化。在当今这个数字化飞速发展的时代，人工智能（AI）已经成为了技术进步的一个重要标志。AI（特别是以ChatGPT为代表的大模型的出现）不仅改变了我们的工作方式、学习方式，也在不断地影响着用户界面的设计和演进。用户界面的起

AIGC爆火一年来，哪些应用令人眼前一亮？

一年前，ChatGPT4.0推出，人工智能在理解和创造复杂信息方面的能力达到了新的高度。紧随其后，众多科技公司也纷纷推出了自己的大语言模型。“百模大战”一触即发，这场竞争不仅推动了技术的快速发展，也激发了公众对人工智能潜力的广泛兴趣。在这样的背景下，AIGC（人工智能生成内容）迅速成为网络热词。IT技术爱好者、寻求商机的决策者、投资者以及创业者们纷纷投入到大语言模型的应用探索中。他们利用这些模型进行内容创作、数据分析、客户服务、教育辅导等多个领域的创新尝试。然而，一年过去了，哪些应用既满足了人们的需求预期，又带来科幻照进现实的“赛博朋克之感”？笔者了解了一些优秀的AIGC应用案例，以下列出几例

文旅爆火的背后，是元宇宙数智化

作者|涂承烨审校|重楼一、龙年春节文旅新趋势：智慧旅游、沉浸体验随着2024年甲辰龙年春节“8+1”长假收官，国内文旅市场展现出惊人的消费潜力，被称作“史上最火”春节。各地大打文旅牌，南北互换过冬、体验特色小城、庙会赏灯祈福、博物馆沉浸打卡......催生出丰富多元的旅游方式。4.74亿，这是文化和旅游部数据中心测算的今年春节假期全国国内旅游出游人次。这个数字，不仅同比增长34.3%，按可比口径较2019年同期也增长19.0%。故宫博物院、南京博物院等文博场馆在各大平台的搜索、预订热度居前。不少文博场馆通过“文化+科技”，主打智慧旅游、沉浸式体验。重视文化软实力、加强科技赋能，仍是未来文旅高质

由于AI的爆火，黑客攻击将严重影响美国选举

美国联邦调查局（FBI）局长克里斯托弗·雷2月29日表示，由于人工智能和其他技术的进步，美国预计今年的选举将面临复杂多变的威胁。雷特意强调人工智能，认为“无论是复杂程度高低的外国黑客都更容易利用它来对选举产生恶意影响”。他指出，美国政府正不断担忧那些难以察觉且能塑造公众舆论的攻击，且这种行为正在加剧。但目前美国并未拿出外国政府直接影响选举结果的成功案例，雷建议FBI在今年分享有关其发现的威胁信息，他声称”作为情报专业人员，我们必须以具体的、基于证据的方式强调威胁，以便我们有效地武装我们的合作伙伴——特别是公众，抵御他们可能面临的各种外国影响行动。“2016年，美国指控俄罗斯特工试图通过窃取和泄

Reddit NFT爆火，全球最大社区论坛成为Web3大规模应用前哨站

这是白话区块链的第1804期原创作者|火火出品｜白话区块链（ID：hellobtc）据DuneAnalytics最新数据显示，Reddit于Polygon网络发行的NFT系列RedditCollectibleAvatar销售总量已突破9万笔，在12月7日达到94,338笔，交易总额超1100万美元。此外，当前RedditAvatarNFT持有地址总量为4,079,425个，单一NFT持有地址为3,794,908个，RedditCollectibleAvatar总量为4,811,062个，多次达到了日榜第一。随着加密货币市场暴跌，NFT的交易量和加密钱包活动也在全面下降。尽管如此，但在过去4个

微软6页论文爆火：三进制LLM，真香！

这就是由微软和中国中科院大学在最新一项研究中所提出的结论——所有的LLM，都将是1.58bit的。具体而言，这项研究提出的方法叫做BitNetb1.58，可以说是从大语言模型“根儿”上的参数下手。将传统以16位浮点数（如FP16或BF16）形式的存储，统统变成了三进制，也就是 {-1,0,1}。值得注意的是，这里的“1.58bit”并不是指每个参数占用1.58字节的存储空间，而是指每个参数可以用1.58位的信息来表示。在如此转换之后，矩阵中的计算就只会涉及到整数的加法，因此会让大模型在保持一定精度的同时，显著减少所需的存储空间和计算资源。例如BitNetb1.58在3B模型大小时与Llama做

首席分析师揭秘爆火Groq，每小时要烧168美元！10倍H100拥有成本，老黄笑而不语

最近爆火的AI初创公司Groq，推出了比目前常见GPU推理系统快4倍，成本低70%的大模型推理解决方案。他们提供的运行MistralMixtral8x7b的API演示，让大部分习惯了其他LLM「娓娓道来」的用户直呼，简直是魔法！Groq在处理单个数据序列方面展现出了惊人的性能优势，这可能使得「思维链」等技术在现实世界中变得更加实用。虽然Groq有如此之多的好处，但评估某款硬件是否真的具有革命性的核心标准是性能与总成本的比值。为此，SemiAnalysis首席分析师DylanPatel和分析师DanielNishball写了一篇万字长文，对Groq进行了深度地剖析。「推理速度打破纪录，但代价是什

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如VAEs的后验分布对齐问题、GANs的不稳定性、EBMs的计算量大和NFs的网络约束问题。因此，扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成：前向过程和反向过程。前向过程把数据转化为简单的先验分布，而反向过程则逆转这一变化，用训练好的神经网络模拟微分方程来生成数据。与其他模型相比，扩散模型提供了更稳定的训练目标和更好的生成效果。不过，扩散模型的采样过程伴随反复推理求值。这一过程面临着不稳定性、高维计算需求和复杂的似然性

爆火Sora的背后 | 聊聊什么是world models！

本文经自动驾驶之心公众号授权转载，转载请联系出处。随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是“worldsimulator”，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是worldsimulator。什么是worldmodels/世界模型当AI领域中讲到世界/world、环境/environment这个词的时候，通常是为了与智能体/agent加以区分。研究智能体最多的领域，一个是强化学习，一个是机器人领域。因此可以看到，worldmodels、worldmodeling最早也最常出现在机器人领域的论文中。而今天worl