草庐IT

词元化模型

全部标签

java - 在数据模型中使用 javafx 属性和绑定(bind)

javafx属性是将数据模型连接到javafxgui的好方法,因为它们的绑定(bind)模型实现了强大的通知更新机制。属性和绑定(bind)并不严格与图形用户界面相关,而是对javabean的扩展。因此人们希望在应用程序模型类中使用它们而不引入对包javafx.beans.property.StringProperty的依赖,通常来自javafx.*.换句话说:(更新)我可能需要将应用程序分成两个模块。一个模块应该只包含操作数据的类(模型类,MVC说话)。第二个模块将包含所有图形gui的东西,即javafx。如果我的数据类使用javafx绑定(bind),我会引入一个importjav

大模型时代,新一代向量数据库的探索应用-DingoDB

一、DingoDB 的设计理念2015年前,数据架构以数据仓库(DataWarehouse)为主,专注于结构化数据的统一存储。到2016-2022年期间,流行数据湖(DataLake)的概念,扩展了数据维度并管理了更多类型的数据。最近一年,AIGC飞速发展,数据生态随之演进到了新的数据栈时代,随着数据分析复杂度的不断提升,由最初的查询处理需求,扩展到机器学习和深度学习,又发展到了现在的自助分析、生成式内容创作(AIGC)、自动化机器学习平台(AutoML、GPT)等场景。这些都离不开对现实世界中的结构化、半结构化和非结构化数据的高效管理。需求的增长催生了新的数据生态。在新的数据栈时代,原有数据

大语言模型(LLM)最常见的十大安全风险

开放式Web应用程序安全项目(OWASP,OpenWebApplicationSecurityProject)是一个组织,它提供有关计算机和互联网应用程序的公正、实际、有成本效益的信息。其目的是协助个人、企业和机构来发现和使用可信赖软件,其最近提出了LLM(大语言模型,代表是GPT)十大安全风险。图:LLM的10大安全风险在语言模型开发周期中的位置LLM01:Prompt注入Prompt注入是一种经常讨论也是最为常见的的LLM攻击方式,当攻击者通过精心设计的输入直接或间接操纵受信任的LLM时,LLM会忽略预设定的审核准则,执行黑客指令。例如,攻击者利用LLM对包含恶意提示注入的网页进行汇总,导

LimSim++:多模态大模型在自动驾驶中的新舞台

本文经自动驾驶之心公众号授权转载,转载请联系出处。论文名称:LimSim++:AClosed-LoopPlatformforDeployingMultimodalLLMsinAutonomousDriving项目主页:https://pjlab-adg.github.io/limsim_plus/仿真器简介随着多模态大语言模型((M)LLM)在人工智能领域掀起研究热潮,其在自动驾驶技术中的应用逐渐成为关注的焦点。这些模型通过强大的广义理解和逻辑推理能力,为构建安全可靠的自动驾驶系统提供了有力支持。虽然已有闭环仿真平台如HighwayEnv、CARLA和NuPlan等,能够验证LLM在自动驾驶中

参照人类大脑,学会忘记会让AI大模型变得更好?

计算机科学家团队近期开发出一种更敏捷更具弹性的机器学习模型,它们可以周期性忘记已知信息,而现有大语言模型不具备忘却能力。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高今天的AI语言引擎大多都是人工神经网络驱动的。网络中的每一个“神经元”都是一个数学函数,它会从其它神经元接收信号,它会运算,然后通过多层神经元发送信号。最开始时信息流或多或少都是随机的,当网络不断与训练数据匹配,神经元之间流动的信息会不断优化。例如,

刚刚,马斯克xAI官宣开源自家大模型Grok!网友:现压力给到了OpenAI

马斯克又给OpenAI上压力了!今天,马老板郑重宣布要在本周开源自己的大模型Grok。毕竟马斯克起诉OpenAI的理由是「OpenAI违背了最初对开源、非营利人工智能的承诺」,这节骨眼上把Grok开源算是成功占领道德高地。这下我再说你是「ClosedAI」就更加理直气壮了,——我的承诺实现了,你的承诺呢?你的担架呢?本次开源的Grok基于Grok-1,是马老板的x.AI公司的第一个大语言模型,开发大约花了四个月的时间(包括两个月的训练),上下文长度为8192,训练数据截至2023年第三季度。Grok-1的实力与GPT-3.5相当,但特点是啥都敢说,甚至还会反讽。目前尚不清楚Grok会开源哪些组

350亿参数、开放权重,Transformer作者创业后推出新大模型

今天,由Transformer作者之一AidanGomez参与创立的人工智能初创公司Cohere迎来了自家大模型的发布。Cohere推出的模型名为「Command-R」,参数量为35B,它是一个针对大规模生产工作负载的全新大语言模型研究版本。该模型属于「可扩展」模型类别,能够平衡高效率和高精度,使企业用户超越概念验证,进入生产阶段。作为一种生成模型,Command-R针对检索增强生成(RAG)等长上下文任务以及使用外部API和工具进行了优化。该模型旨在与自家行业领先的嵌入(Embed)和重新排序(Rerank)模型配合使用,为RAG应用程序提供一流的集成,并在企业用例中具有出色表现。就其架构而

谷歌承认“窃取”OpenAI模型关键信息:成本低至150元,调用API即可得手

什么?谷歌成功偷家OpenAI,还窃取到了gpt-3.5-turbo关键信息???是的,你没看错。根据谷歌自己的说法,它不仅还原了OpenAI大模型的整个投影矩阵(projectionmatrix),还知道了确切隐藏维度大小。而且方法还极其简单——只要通过API访问,不到2000次巧妙的查询就搞定了。成本根据调用次数来看,最低20美元以内(折合人民币约150元)搞定,并且这种方法同样适用于GPT-4。好家伙,这一回奥特曼是被将军了!这是谷歌的一项最新研究,它报告了一种攻击窃取大模型关键信息的方法。基于这种方法,谷歌破解了GPT系列两个基础模型Ada和Babbage的整个投影矩阵。如隐藏维度这样

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导

假设你跟朋友通过打赌投篮来打赌一万块。你们找到一个篮球框,然后约定轮流投篮,谁先投进谁赢。假设你投进的概率是p,也就是投不进的概率是1-p,你对手投进的概率是q,投不进的概率是1-q,如果由你先投,那么你取胜的概率是多少。在上面问题中我们把事情进行了理想化假设。也就是你和对手的准度不会变,不管你们投了10次还是100次,你们状态都保持一致,投入的概率永远不变。这个问题涉及到概率论中一个大类问题,那就是成功率为p的情况下,我们需要执行多少次试验才能获得第一次成功。要解决这个问题,我们首先需要了解几何不等式:假设|r|假设你在第n次投篮时,你投进获得了胜利,我们看基于n如何推导出取胜的规律来。如果

Stable diffusion不同模型变量的work pipeline:checkpoint、lora、vae等等到底是怎么work together的?

SD里面有很多不同种类的模型参数,比如embedding、vae、checkpoint、hypernetwork、controlNet、clip还有lora,我看了很多博客,发现它们都是言语寥寥几句说什么改变风格,用于调整和改善生成图片的色彩之类的有点废话的废话。那么我这里从原理层面阐述这几个种类的参数模型在整个SD作图过程是怎么发挥作用的,这些不同的可调节的参数/模型是怎么worktogether的。省流版:声明:不一定对!这些都是本人从很多不同博客and论文整理理解的。​OK,现在慢慢展开讲解。​图书馆的比喻首先第一部分我们先对这几个参数变量有一个感性认识。模型checkpoint:把它想