llm-numbers

Kaggle 竞赛《LLM - Detect AI Generated Text》高分方案学习报告

比赛链接：LLM-DetectAIGeneratedText|Kaggle高分方案作者：SecretSauceArtRidge|Kaggle高分方案源码：ModelsXRunV1DeepLearning|Kaggle目录前言一、实现步骤1.数据集处理1.1选择数据集1.2合并数据集2.特征选择与提取2.1 对 prompt_name分类2.2 筛选文本2.3 改正错误单词 2.4 文本数据标记化3.模型训练和调优3.1训练Distilroberta模型3.2通过弱监督学习整合预测结果3.3通过强监督学习整合预测结果二、总结1

高分竞赛 span xff style pytorch nlp 分类回归机器学习自然语言处理深度学习

HuggingFists-低代码玩转LLM RAG-准备篇

之前写了几篇关于如何使用HuggingFists系统搭建LLMRAG应用的文章。对于使用者来说，HuggingFists现在能带来两大点帮助。一是能够以低代码的方式快速处理客户的各类存量文档，如Word、Visio、PDF等。这些文档内容多样，其中不乏需要用到OCR等相关技术才能识别和抽取的内容；二是可以帮助使用者快速搭建出LLMRAG的研究环境，可以对比研究各LLM的差异，RAG的应答效果评估以及积累Prompt的相关知识。下面我们就介绍一下如何搭建使用HuggingFists完成RAG相关流程的预备环境。(注：访问下面的链接玩转数据之低代码LLMRAG准备篇_哔哩哔哩_bi

HuggingFists 准备 xff0c margin-left xff 低代码大模型 RAG Prompt 通义千问 Milvus

可定制多目标视频生成；LLM驱动的文生图；控制视频生成中运动目标轨迹；扩散模型做全景分割；实时多功能SAM；各种分割任务统一模型

本文首发于公众号：机器感知可定制多目标视频生成；LLM驱动的文生图；控制视频生成中运动目标轨迹；扩散模型做全景分割；实时多功能SAM；各种分割任务统一模型LoMA:LosslessCompressedMemoryAttentionTheabilitytohandlelongtextsisoneofthemostimportantcapabilitiesofLargeLanguageModels(LLMs),butasthetextlengthincreases,theconsumptionofresourcesalsoincreasesdramatically.Atpresent,reduci

中运文生 img the segmentation 音视频人工智能计算机视觉深度学习 stable diffusion

AI大模型开发架构设计（1）——LLM大模型Agent剖析和应用案例实战

文章目录LLM大模型Agent剖析和应用案例实战1从LLM大模型到智能体演进技术语言模型是什么？大语音模型是什么？大语言模型日新月异LLM大模型存在局限性LLMAgent来势凶凶LLMAgent增长迅猛LLMAgent是什么？2LLMAgent架构深度剖析规划能力是什么？记忆能力是什么？工具使用能力是什么？3LLMAgent应用案例实战Auto-GPT基于LangChain实现一个CodeInterpreterLLM大模型Agent剖析和应用案例实战1从LLM大模型到智能体演进技术语言模型是什么？语言模型：给定一些字或者词(称为token)，预测下一个字或者词的模型。大语音模型是什么？大语言模

模型 mdash xff0c xff li AIGC LLM Agent 应用实战

LLM应用开发与落地：使用gradio十分钟搭建聊天UI

一、背景如果你是做LLM应用开发的，特别是做后端开发，你一定会遇到怎么快速写一个聊天UI界面来调试prompt或agent的问题。这时候的你可能在苦恼中，毕竟react.js,next.js,css,html也不是每个人都那么熟练，对吧？即使你是做前端开发的，你也可以尝试一下Gradio，哪天有人给你提了一个调试界面的需求，原本要半天的工作现在只需要十分钟了，多余的时机用来学习或享受生活，多美（或者，你让后端自己用Gradio搞一个，嘿嘿）。类似于Gradio这种低代码快速搭建webui的方案中，比较成熟还有Streamlit、Chainlit和dash等。这些方案都可以快速实现ChatGPT

应用开发十分钟 xff0c xff xff0 ui 人工智能

AIGC（MLLM、VLM、LLM、SD）系列——论文解读目录

涉及面广：多模态生成模型——MLLM（目前集中在视觉语言模型——VLM）、大语言模型——LLM、生成模型（SD系列）、对比学习的经典模型（CLIP系列）。持续更新：对于已经完成解读的会附上链接（有的会在一些场景做尝试，也会附上链接供大家快速参考结果），准备写的会备注筹备中。适宜人群：节省大把时间，快速定位需要的部分，适合学生、入门AIGC者和从业者作为笔记检索使用。———————————————————————————————————————————RAM论文题目：RecognizeAnything:AStrongImageTaggingModel关键词：RAM、属性识别、多标签分类、解读论文

mdash 解读 span 论文 AIGC 人工智能深度学习计算机视觉

【论文笔记】AK卷积（Convolutional Kernel with Arbitrary Sampled Shapes and Arbitrary Number of Parameters）

本文介绍AK卷积，传统的卷积有2个缺陷：1、卷积运算在固定大小的窗口运行、无法捕获其他窗口的信息，并且窗口的形状是固定的；2、卷积核的尺寸固定为，窗口大小固定为k，随着k增加，参数会快速增加。针对传统卷积的缺陷，作者提出了AK卷积，AK卷积拥有任意形状和任意的参数。作者在yolov5n和yolov8n上进行了测试，效果非常好。论文地址：AKConv:ConvolutionalKernelwithArbitrarySampledShapesandArbitraryNumberofParameters代码：https://github.com/cv-zhangxin/akconv一、AKConv前

Arbitrary 卷积 61 xff0c 论文阅读深度学习人工智能

c++ - 用魔数(Magic Number)初始化一 block 内存的简洁方法

我所指的几个例子:typedefstructSOME_STRUCT{unsignedintx1;unsignedintx2;unsignedintx3;unsignedintx4;//WhatIexpectedwouldwork,butdoesn't;the2ndparametergets//turnedintoan8-bitquantityatsomepointwithinmemsetSOME_STRUCT(){memset(this,0xFEEDFACE,sizeof(*this));}//Somethingthatworked,butseemshokey/hackishSOME_

简洁 amp unsigned section this c++initialization

c++ - 从魔数(Magic Number)到 int 或 long 的重载解析(在 range-v3 中)

在range-v3中，view_facade类有begin()函数。template())>detail::facade_iterator_tbegin(){return{range_access::begin_cursor(derived(),42)};}range_access::begin_cursor()是这样实现的，templatestaticRANGES_CXX14_CONSTEXPRautobegin_cursor(Rng&rng,long)//--1RANGES_DECLTYPE_AUTO_RETURN(rng.begin_cursor())templatestatic

amp range-v code begin_cursor begin c++c++11 c++14 range-v3

每日一看大模型新闻（2023.12.13）趣味项目CLoT:训练LLM更幽默地回答问题；用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习；2.7B能打Llama 2 70B，微软祭出

1.产品发布1.12.7B能打Llama270B，微软祭出「小语言模型」发布时间：2023-12-132.7B能打Llama270B，微软祭出「小语言模型」！96块A10014天训出Phi-2，碾压谷歌Gemininano主要内容：11月份以来，大型语言模型技术领域发生了许多重要事件。OpenAI推出了GPTs，颠覆了先前的GPT模型，并通过引入董事会吸引了大量关注。谷歌也在年底前匆忙发布了超大规模Gemini模型，甚至涉及了"视频造假"。微软则正式发布了Phi-2小语言模型，拥有2.7B参数，几乎超越所有13B以下的大型模型。Phi-2表现出色，性能可媲美比自己大25倍的模型。微软强调了训练

LLM 微软 strong xff xff0c 人工智能自然语言处理 prompt 语言模型数据分析 chatgpt embedding

23 24 252627 28 29