草庐IT

earmaster中文版

全部标签

【AI实战】开源中文 llama2 来了,30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

【AI实战】开源中文llama2来了,30分钟搭建130亿参数大模型Llama2-Chinese-13b-Chat简介环境配置环境搭建依赖安装代码及模型权重拉取拉取Llama2-Chinese拉取Llama2-Chinese-13b-Chat模型权重及代码终端测试页面测试安装gradio加载模型并启动服务国内Llama2最新下载地址参考简介Llama22023年7月19日:Meta发布开源可商用模型Llama2。Llama2是一个预训练和微调的生成文本模型的集合,其规模从70亿到700亿个参数不等。LLaMA2的详细介绍可以参考这篇文章:【大模型】更强的LLaMA2来了,开源可商用、与Chat

python - PyGame 中的中文 unicode 字体

如何在PyGame中显示汉字?什么是用于此目的的好的免费/自由字体? 最佳答案 pygame使用SDL_ttf进行渲染,因此随着渲染的进行,您应该处于良好的状态。unifont.org似乎有一些关于一系列脚本的开源字体的广泛资源。我抓取了Cyber​​bitpan-unicode字体并提取了包含的ttf。以下“在我的机器上工作”是WindowsVistaHomeBasic和Python2.6:#-*-coding:utf-8-*-importpygame,sysunistr=u"黒澤明"pygame.font.init()srf=p

在树莓派中跑迷你Llama2中文模型

  OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序,此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等;  但该项目原本的模型并不支持中文,最近正好看到一个基于llama2的中文训练模型;想着把它跑在树莓派上速度会怎样;  使用Go实现进行模型推理,该在树莓派中的Llama2迷你中文模型,模型大小为15M使用的数据集为TinyStories英文翻译后的数据但仅翻译了TinyStories的部分数据目前为1M,中文词表使用UTF-8

Python:有什么方法可以在多语言(例如中文和英文)字符串上执行此 "hybrid"split()?

我有多种语言的字符串,包括使用空格作为单词分隔符的语言(英语、法语等)和不使用空格的语言(中文、日语、韩语)。给定这样一个字符串,我想用空格作为分隔符将英语/法语/等部分分隔成单词,并将中文/日语/韩语部分分隔成单个字符。我想将所有这些分离的组件放入一个列表中。一些例子可能会清楚地说明这一点:案例1:仅限英文的字符串。这个案例很简单:>>>"IlovePython".split()['I','love','Python']情况2:中文字符串:>>>list(u"我爱蟒蛇")[u'\u6211',u'\u7231',u'\u87d2',u'\u86c7']在这种情况下,我可以将字符串转换

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。项目名称:中文LLaMA&Alpaca大语言模型+本地部署(ChineseLLaMA&AlpacaLLMs)项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca以下是原github中给出的体验GIF,可以看到这个模型还是具备一定的指令理解和上下文对话能力的。由于模型使用的是LoRA(一种高效模型训练方法),所以整个模型的参数量是比较小的(压缩包大概不到800M),但是需要和原版Facebook的权重进行结合才能使用。其实Facebook开源了,但又没完全开源

python - 以编程方式更改PDF中文本的字体颜色

我根本不熟悉PDF规范。我想知道是否可以直接操作PDF文件,以便我认为重要的某些文本block以我选择的颜色突出显示。选择的语言是python。 最佳答案 这是可能的,但不一定容易,因为PDF格式非常丰富。您可以找到详细描述它的文档here.它给出的关于PDF如何显示文本的第一个基本示例是:BT/F1312Tf288720Td(ABC)TjETBT和ET是开始和结束文本对象的命令;tf是使用外部字体资源F13(恰好是Helvetica)的命令,大小为12;td是将光标定位在给定坐标的命令;Tj是为前一个字符串写入字形的命令。这种风格

开源中文分词Ansj的简单使用

ANSJ是由孙健(ansjsun)开源的一个中文分词器,为ICTLAS的Java版本,也采用了Bigram+HMM分词模型:在Bigram分词的基础上,识别未登录词,以提高分词准确度。虽然基本分词原理与ICTLAS的一样,但是Ansj做了一些工程上的优化,比如:用DAT高效地实现检索词典、邻接表实现分词DAG、支持自定义词典与自定义消歧义规则等。1.项目地址项目的github地址:https://github.com/NLPchina/ansj_seg项目的文档地址:http://nlpchina.github.io/ansj_seg/2.导入2.1依赖Ansj最新依赖包是5.1.6版本的,2

python - python中文件的权限更改

我想更改当前目录树中所有文件的文件权限。我正在尝试打开每个目录并打开文件并使用os.chmod()更改权限,但出现错误。importosimportstatforfilesinos.walk('.'):os.chmod(files,stat.S_IXGRP)我得到的错误是:File"delhis.py",line4,in?os.chmod(files,stat.S_IXGRP)TypeError:coercingtoUnicode:needstringorbuffer,tuplefound 最佳答案 您错误地使用了os.walk。f

JMeter测试工具设置中文

JMeter测试工具设置中文在JMeter中,默认情况下是英文的,如果需要使用中文进行测试,则需要进行如下设置:第一步、设置JMeter语言选项在JMeter运行时界面的“Options”菜单中,选择“ChooseLanguage”,然后选择“中文(中国)”。此时JMeter界面的文字将会变为中文。需要注意的是这个方法是临时性的,在下一次重新打开JMeter,它又会恢复成英文 第二步、找到根目录bin文件下的jmeter.properties修改在JMeter的安装路径的bin文件夹下,找到“jmeter.properties”文件,使用文本编辑器打开它,搜索“language=”找到这一行,

分享3个国内可用的“chatgpt镜像站”中文语境加强版AI软件

众所周知,openai没有对国内开放使用权限,因此国内的用户是不可以使用直接使用chatgpt的,部分朋友想要通过使用网络工具使用其对话服务,这种行为显然是不可取的。其实也有好用的中国版的chatGPT网站,只是大家可能之前没有听说过!下面小编给大家分享3个.1.HeiGPTHeiGPT是基于Openai官方GPT-3.5语言模型构架,通过在海量的文本数据上进行训练,具备了强大的自然语言处理能力,可以用于生成文本、回答问题等任务。ChatGPT能够与用户进行对话,理解用户输入并生成相应的回复。它能够生成连贯、有逻辑的语言,并具备一定的上下文理解能力。在性能方面丝毫不逊于chatgpt。您可以通