草庐IT

中文分词

全部标签

gitbash中文乱码显示数字问题

        在windows上用gitbash提交代码会遇到中文乱码,gitstatus查看代码状态的时候,中文状态是一串数字如下图: 用gitlog查看代码提交记录如果是中文显示的也是乱码。在工作中这样会很不方便,所以必须要解决这个工具显示中文不正确的问题1,右键点击gitbash上面的绿条,弹窗点Options2,  选择Text,修改编码如下图,然后点击Apply,Save3,修改git的全局配置gitconfig--globalcore.quotepathfalse#界面编码格式gitconfig--globalgui.encodingutf-8#文件提交编码格式gitconfig

彻底解决python中jupyter画图matplotlib的中文显示问题。Mac版本和Windows版本

jupyter使用matplotlib进行画图会面临中文无法显示的问题,导致这样的原因是没有配置对应的中文字体,所以无法在画图时显示中文。Windows版本解决方法在Window中,采用以下代码importmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']#用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False#用来正常显示负号Mac版本解决方法Mac中没有SimHei字体,所以Windows的代码无法使用,所以要先查询mac中支持的中文字体。以下代码可以查询mac中的所

C# Winform控件包 MaterialSkin使用教程 免费开源,支持中文!

如果没有拿到控件包DLL的可以去这篇文章里自取。C#Winform控件包分享,免费开源,支持中文!控件比较多,我会抽出时间分控件逐一书写教程,不定时更新,感兴趣的朋友可以关注我。本文将在以下几个方面进行指导。1.控件包的导入2.控件的简单用法3.更换主题1.控件包的导入创建Winform项目(我用的是.netframework4.7.2)打开工具箱,在工具箱内右击,点击添加选项卡,起个名字叫skin然后我们复制MaterialSkin.dll文件(没有文件的去上面的链接下载),到skin选项卡中粘贴。等待片刻,加载完成后可以看到,skin选项卡下面多出来了很多控件,这些就是我们控件包里面的控件

SPSS26中文免费版下载和安装教程

Spss26是一款由IBM公司开发的专业的数据统计分析软件,有着非常强大的功能,可以帮助用户对各种不同的数据进行分析。IBMSPSSStatistics简称为SPSS,是全球领先的统计分析、数据挖掘、预测模型产品及解决方案,提供高级统计分析、丰富的机器学习算法、文本分析、来源可扩展性、与大数据的集成以及无缝部署到应用程序中等功能。很多小伙伴都需要使用到spss这款软件,但是下载过程比较复杂,为了防止大家安装失败,今天小编就为大家带来了spss安装教程26超详细,一起来看看吧。spss安装前准备Spss26下载地址:http://www.originsoft.cn/single/Index/ot

SonarQube安装中文插件

SonarQube安装中文插件SonarQube是一个开源的代码质量检查工具,它支持20几种编程语言的代码质量管理与检测,提供了可视化的报告,可以快速的定位问题所在。方法一:直接本机安装,省心省力然而这里可能会报错:这时候就需要我们自己去寻找自己版本对应的包,也就是方法二方法二:这个时候我们自己去GitHub上面下载之后安装到自己的电脑上:https://github.com/xuhuisheng/sonar-l10n-zh/releases在这里可以看到对应的版本这里笔者使用的SonarQube是7.6版本,所以选择1.26存储到:对应的文件夹里面(安装目录下/extension/plugi

Mac版本Unity如何设置中文

第一步:打开UnityHub在安装界面找到使用的Unity编辑器,右边有个齿轮,点击选择添加模块。 第二步:拉到最底下,选择简体中文然后继续。 之后是一个同意条款,同意一下就等待它安装完成。 第三步:打开Unity编辑器,依次选择Unity-> Preferences->Languages,简体中文,之后重启编辑器即可。  

修复git diff正文中文乱码

Linuxgitdiff正文中文乱码在命令行下输入以下命令:$gitconfig--globalcore.quotepathfalse#显示status编码$gitconfig--globalgui.encodingutf-8#图形界面编码$gitconfig--globali18n.commit.encodingutf-8#提交信息编码$gitconfig--globali18n.logoutputencodingutf-8#输出log编码$exportLESSCHARSET=utf-8#最后一条命令是因为gitlog默认使用less分页,所以需要bash对less命令进行utf-8编码在命

AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署2.1CPU部署2.2GPU部署三.模型推理3.1Chat模型推理3.2Base模型推理四.模型量化4.1量化方法4.2在线量化4.3离线量化4.4量化效果五.模型微调5.1依赖安装5.2单机训练5.3多机训练5.4轻量化微调一.模型介绍Baichuan2是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练。其在多个权威的中文、英文和多语言的通用、领域benchmark上取得同尺寸最佳的效果。目前开源发布的包含有7B、13B的Base和Chat版本,并提供了Chat版本的4bits量化。所有版本对学术研究完全开放。同时,开发者通过邮件

es elasticsearch 九 索引index 定制分词器 type结构后期弃用原因 定制动态映射 动态映射模板 零停机重建索引

目录索引index定制分词器Type底层结构及弃用原因定制dynamicmapping定制dynamicmappingtemplate动态映射模板零停机重建索引生产环境应该度别名数据索引indexPut/indexStings分片Mapping映射Aliases别名增加Putmy_index2{      "settings":{        "number_of_shards":3,        "number_of_replicas":1 }, "mappings":{   "properties":{     "name":{"type":"text"}   } }, "aliase

ElasticSearch从入门到精通--第七话(自动补全、拼音分词器、自定义分词、数据同步方案)

ElasticSearch从入门到精通–第七话(自动补全、拼音分词器、自定义分词、数据同步方案)使用拼音分词可以引入elasticsearch的拼音分词插件,地址:https://github.com/medcl/elasticsearch-analysis-pinyin下载后,将包上传至服务器后,解压缩unzip-dpyelasticsearch-analysis-pinyin-7.12.1.zip将压缩后的目录放入es的plugins中即可,我这边是docker的数据卷,直接放入就行cp-rpy//var/lib/docker/volumes/es-plugins/_data重启es服务d