LLM-Blender_草庐IT

至少8篇顶会！英伟达LLM研究科学家岗位门槛狂卷，震惊前谷歌大脑科学家

机器学习领域的童鞋求职有多卷？英伟达大模型研究科学家毕业生要求，最低8篇顶会论文。一位华人研究员近来想申请英伟达工作，没想到岗位要求直接让她傻了眼。她表示，「这难道是对机器学习专业应届毕业生的『低』要求吗？」没想到，这个帖子瞬间引爆舆论。就连前谷歌大脑、StabilityAI的前高管DavidHa为之震惊。2023年大学毕业新生要求：「在知名会议（如CVPR、IEEE、NeurIPS等）上发表至少8篇论文」。可能事情发酵的太大了，英伟达也意识到了不对劲，立马删除了原职位的申请入口。有趣的是，没过多久，英伟达再次重发了关于这一职位申请的要求。现在的长这样：最近获得计算机科学/工程、电气工程等领域

在Windows10平台安装Blender 3D建模软件并调用Python API接口

要在Windows上安装Blender（https://www.blender.org/），请按照以下步骤操作：首先，从Blender官网下载最新版本的Blender。请确保选择适用于您的操作系统的版本，例如Windows64位。下载完成后，打开安装程序。按照向导的指示进行操作，包括选择安装位置和添加快捷方式等选项。安装完成后，您可以打开Blender并开始使用它。方法1：要使用PythonAPI，请按照以下步骤操作：打开Blender，然后单击顶部菜单栏中的“Edit”选项。在下拉菜单中，选择“Preferences”。在弹出的窗口中，选择“Add-ons”选项卡。搜索“Python”或“A

在 ZBrush、Blender 和 Substance 3D Painter 中重新创建 Bowser

今天瑞云渲染小编给大家带来一篇ÜmralIsmayilov作者Bowser项目背后的工作流程，展示了头发是如何修饰的，并解释了纹理化过程。简介大家好，我是尤姆拉尔-伊斯马伊洛夫，是一名3D角色艺术家和动作设计师，在阿塞拜疆的巴库工作。从年轻的时候起，我就对3D行业和动画充满了热情，这使我在这个领域追求职业发展，学习三维世界和设计的基本原理和原则是我人生中的一个关键决定，我之前的绘画和素描经验使我能够迅速理解建模和雕刻的概念。为了不断提高我的技能，我每天都在练习，观看各种技术和教程，因此，几年来我一直以自由职业者的身份从事各种项目，包括游戏开发、预告片制作、角色开发、NFT项目等等，这些经验使我

LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：GitHub-ymcui/Chinese-LLaMA-Alpaca:中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署(ChineseLLaMA&AlpacaLLMs)中文LLaMA模型中文LLaMA模型在原版的基础上扩充了中文词表，使用了中文通用纯文本数据进行二次预训练。模型名称训练数据重构模型[1]大小[2]LoRA下载[3]Chinese-LLaMA-7B通用20G原版LLaMA-7B770M[百度网盘][GoogleDrive]Chinese-LLaMA-Plus-7B ⭐️通用120G原版LLaMA-7B790M

LLM-Blender：大语言模型也可以进行集成学习

最近在看arxiv的时候发现了一个有意思的框架：LLM-Blender，它可以使用Ensemble的方法来对大语言模型进行集成。官方介绍如下：LLM-Blender是一个集成框架，可以通过利用多个开源大型语言模型(llm)的不同优势来获得始终如一的卓越性能。LLM集成我们都知道集成学习是一种机器学习方法，旨在提高预测模型的性能和鲁棒性。它通过将多个不同的学习器（如决策树、神经网络等）结合成一个整体，来取得比单个学习器更好的预测效果。比如最常见的Kaggle比赛中就广泛的使用了这种方法。那么大语言模型有必要进行集成吗论文给出了以下观点：由于数据、架构和超参数的变化，LLM表现出不同的优势和劣势，

LLM-分布式训练工具（一）：DeepSpeed【微软】【大模型分布式训练工具，实现ZeRO并行训练算法】【zero3配置将模型参数切分后分配到不同的显卡中，突破单张显卡容量不足以加载模型参数的限制】

DeepSpeed是微软推出的大规模模型分布式训练的工具，主要实现了ZeRO并行训练算法。原始文档链接：DeepSpeed一、DeepSpeed目前支持的功能Optimizerstatepartitioning(ZeROstage1)Gradientpartitioning(ZeROstage2)Parameterpartitioning(ZeROstage3)CustommixedprecisiontraininghandlingArangeoffastCUDA-extension-basedoptimizersZeRO-OffloadtoCPUandNVMe二、DeepSpeed的使用2.

大模型LLM领域，有哪些可以作为学术研究方向？

清湛人工智能研究院 2023-05-3109:23 发表于江苏编者：本文转载了清华大学计算机系刘知远教授对大模型的一些思索，以飨读者。刘知远CCF高级会员，CCCF前编委。清华大学计算机系副教授、博士生导师。已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文80余篇，GoogleScholar统计引用超过1万次。承担多项国家自然科学基金。曾获中文信息学会青年创新奖，入选国家青年拔尖人才支持计划，智源研究院青年科学家，中国科学青年人才托举工程。正文如下：感觉有责任回答这个问题，恰好在高铁上写下回答。2022年初我做过一个报告题目是《大模型十问》，分享我们认为大模型值得

谷歌创始人正式回归，加入LLM大战！指导Gemini研发，与OpenAI、Meta混战一触即发

已辞职四年的谷歌联合创始人，终于回归了！根据华尔街日报报道，谢尔盖·布林（SergeyBrin）已经重返工作岗位，协助谷歌的AI研究人员建立强大的Gemini系统。图片联合创始人，重返大模型战场最近几个月，身家过亿万的谢尔盖·布林每周三到四天都会到访加州山景城的谷歌办公室，与研究人员一起推动谷歌的下一个大型AI系统。图片在2019年，谢尔盖·布林辞去了谷歌母公司Alphabet的职务后，几乎彻底放权，很少干涉公司业务。但从去年底开始，他开始多次参加谷歌举办的关于AI的会议，频率明显变高。据报道，关于谷歌期待已久的AI模型Gemini，他在和研究人员密切合作，研究AI程序「损失曲线」之类的问题。

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama2发布！Meta刚刚发布了LLaMa2，它是LLaMA的下一代版本，具有商业友好的许可证。🤯😍LLaMA2有3种不同的尺寸：7B、13B和70B。7B&13B使用与LLaMA1相同的架构，并且是商业用途的1对1替代🔥简介🧮7B、13B&70B参数版本🧠70B模型采用分组查询注意力（GQA）🛠聊天模型可以使用工具和插件🚀LLaMA2-CHAT与OpenAIChatGPT效果一样好🤗发布在HuggingFace：https://huggingface.co/meta-llama公告:https://ai.meta.com/llama/论文:https://ai.meta.com/rese

获星1.9k，LLM微调神器Lamini上演速度与激情，免费可用

LLM微调从一件复杂的事情，已经通过不断的技术改进变得易上手起来。这不，免费且迅速的LLM微调已经可以实现了。4月底，斯坦福的一群开发者发布了 Lamini，号称可以为每个开发人员提供从GPT-3带到ChatGPT的超能力。近日，Lamini推出了全新的Alpha公测版，让微调上演「速度与激情」。现在只需十分钟、三至五行代码就能实现微调，更重要的是0费用。目前，4亿参数以内的LLM微调完全免费。这只是一个开始。图片项目地址：https://github.com/lamini-ai/laminiLamini的优势先来一起看看Lamini有哪些优势。图片免费，适用于小型LLM；迅速，10-15分钟