草庐IT

code-llama

全部标签

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。项目名称:中文LLaMA&Alpaca大语言模型+本地部署(ChineseLLaMA&AlpacaLLMs)项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca以下是原github中给出的体验GIF,可以看到这个模型还是具备一定的指令理解和上下文对话能力的。由于模型使用的是LoRA(一种高效模型训练方法),所以整个模型的参数量是比较小的(压缩包大概不到800M),但是需要和原版Facebook的权重进行结合才能使用。其实Facebook开源了,但又没完全开源

研究完llama.cpp,我发现手机跑大模型竟这么简单

最近在开源社区,很多人都在探索大模型的优化方法。有一个叫llama.cpp的项目用原始C++重写了LLaMa的推理代码,效果极好,获得了人们的广泛关注。通过一些优化和量化权重,它能让我们在各种以前无法想象的硬件上本地运行LLaMa模型。其中:在谷歌Pixel5手机上,它能以1token/s的速度运行7B参数模型。在 M2芯片的MacbookPro上,使用7B参数模型的速度约为16token/s我们甚至于可以在4GBRAM的树莓派上运行7B模型,尽管速度只有0.1 token/sGitHub链接:https://github.com/ggerganov/llama.cpp我们知道,除了通用化能力

python - 'import quandl' 产生 'Process finished with exit code -1073741819 (0xC0000005)'

这是我的整个程序:importquandlprint("HelloWorld");结果是:Processfinishedwithexitcode-1073741819(0xC0000005)首先我导入了Quandl,但后来我收到了:ModuleNotFoundError:Nomodulenamed'Quandl'然后我用谷歌搜索并阅读了将名称更改为quandl的建议。我已经在项目拦截器中安装了这个包,不过它的名字是Quandl。无论如何,看起来至少小写字母通过了编译。我在Windows10上运行我的程序。我的Python版本是3.7。我使用PyCharm。如果我尝试导入不同的包,那么它

聊聊拉长LLaMA的一些经验

SequenceLength是指LLM能够处理的文本的最大长度,越长,自然越有优势:更强的记忆性。更多轮的历史对话被拼接到对话中,减少出现遗忘现象长文本场景下体验更佳。比如文档问答、小说续写等当今开源LLM中的当红炸子鸡——LLaMA,第一版上下文长度是2048,第二版长度是4096。相比之下ChatGPT、GPT4已经支持到16k,Claude甚至支持到了100k。足以见得将LLaMA拉长是如此的任重而道远。本文将会介绍三种在旋转位置编码(RoPE)基础上扩充上下文的高性价比方案,在文末会介绍我的实践经验。线性插值法Kaiokendev的博客[1]中提到了方法,和Meta的一篇工作[2]不谋

python - mod_wsgi : Reload Code via Inotify - not every N seconds

到目前为止,我按照这个建议重新加载代码:https://code.google.com/archive/p/modwsgi/wikis/ReloadingSourceCode.wiki这有一个缺点,即代码更改仅每N秒检测一次。我可以使用N=0.1,但这会导致无用的磁盘IO。据我所知,linux内核的inotify回调可通过python获得。有没有更快的方法来检测代码更改并重新启动wsgi处理程序?我们在linux上使用守护进程模式。为什么要为mod_wsgi重新加载代码有人对我为什么想要这个很感兴趣。这是我的设置:大多数人使用“manage.pyrunserver”进行开发和其他一些w

python - 在 VS Code 中使用 IPython REPL

使用VisualStudioCode的Python扩展,我可以选择一些代码,右键单击它,然后选择“在Python终端中运行选择/行”(或者,我可以按Shift+Enter)。但是,这会将选定的代码发送到终端Pane中的普通旧PythonREPL,而我想让这段代码在IPython中运行(不是QtConsole,只是基于终端的IPython)。是否可以将IPython设置为默认REPL?我尝试将/usr/local/bin/ipython3设置为我的默认Python环境,但这不起作用(它仍然执行普通的Python解释器)。FWIW,我在macOS上。 最佳答案

【AVD】视频解码时如何获取 coded_width coded_height 即参与编码的宽高

基于字节对齐、宏块宽高等因素,导致一个宽w高h的视频其实际参与编码的某一帧的宽高并不一定等于w和h,而是有一个ffmpeg称之为coded_width及coded_height的编码宽高。出于另一些原因,例如数据送出与读取、数据加载到纹理等需求,不仅需要知道wh,还需要知道其coded_width及coded_height(以下简称cwch),那么该如何尽可能早地获取到这两个值呢?解码之前获取不到cwch参考着FFmpeg源码中的示例编写的编解码库,使用avformat_open_input(&format_context,filename,nullptr,nullptr)打开文件,然后用av

python - 在 VS Code 中漂亮地打印 pandas 数据框

我想知道是否可以在调试时(第一张图片)在VSCode中显示Pandas数据框,因为它在PyCharm中显示(第二张图片)?感谢您的帮助。df在vscode中打印:df在pycharm中打印: 最佳答案 截至January2021release在python扩展中,您现在可以在调试nativepython程序时使用内置数据查看器查看pandas数据帧。当程序在断点处暂停时,右键单击变量列表中的数据框变量并选择“在数据查看器中查看值” 关于python-在VSCode中漂亮地打印pandas

SonarQube 10.0 (macOS, Linux, Windows) - 清洁代码 (Clean Code)

请访问原文链接:https://sysin.org/blog/sonarqube-10/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgSonarCleanCodeIndustryleadingsolutionsIDE|SonarLintFreeIDEextensionthatprovideson-the-flyanalysisandcodingguidanceSelf-managed|SonarQubeSelf-managedstaticanalysistoolforcontinuouscodebaseinspectionAsaservice|SonarCloudClou

【docker】解决 Failed with result ‘exit-code‘和Start request repeated too quickly和Failed to start Docker

目录1、遇到问题2、问题解决1、遇到问题 journalctl-xeudocker.service░░Support:http://www.ubuntu.com/support░░░░Theunitdocker.servicehasenteredthe'failed'statewithresult'exit-code'.Mar3121:48:10VM-8-16-ubuntusystemd[1]:FailedtostartDockerApplicationContainerEngine.░░Subject:Astartjobforunitdocker.servicehasfailed░░Defi