草庐IT

【工程实践】python 去除\xa0、\u3000、\n、\u2800、\t等字符

1.问题描述        在处理数据时,会遇到\xa0、\u3000、\u2800、\t等Unicode字符串。需要对其进行处理。2.空格类型说明      空格可以分为两类,一类为普通文本空格,另一类为html实体空格。普通文本空格介绍普通半角空格和普通全角空格。html实体空格介绍三种,分别为html实体不间断空格( )、html实体半角空格( )和html实体全角空格( )。         1.普通半角空格:英文空格键。这是最常见的空格,如我们写代码时,按下空格键产生的就是这种空格键。正则里直接使用空格或者\s就能匹配,在python中对应的unicod

Atom N2600, N2800 安装 Ubuntu22.04 卡住的问题处理

问题描述AtomN2600,N2800的某些旧型号机器,安装Ubuntu时在安装界面选择安装后,启动过程中会卡住,或者数秒即黑屏,再无反应.这个问题对于Debian系的其他发行版Lubuntu,LinuxMint,Debian都一样,但是用WinPE盘可以正常启动.经各种尝试,最终发现是ACPI相关的问题.解决的方法是在启动中加入noapic等参数.安装阶段当启动进入安装选项界面时,根据提示的'e'toeditthecommandsbeforebooting--在高亮TryorInstallUbuntuServer时按下e此时会进入GRUB2的编辑界面,内容大致如下setparams'Tryo

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

AI绘画、机器翻译、多轮对话……对于各类AI相关的功能来说,总有一个痛点,困扰着所有训模型的算法工程师们:想要效果更好,那么AI模型一般都很大,耗费的算力更多不说,运行起来还更费时间;如果希望模型小、运行快,那么效果通常不如前者好。这就像天平的两端,算法工程师们常常需要根据不同场景和限定条件,在跑得快和效果好之间取得一个平衡。因此,如果有一项技术可以在两者之间做好平衡,那么,它大概率会成为对业界有贡献的重要技术。LightSeq就是这样一项技术。具体来说,LightSeq是一个模型训练推理引擎,就像一个炼丹炉,Transformer/GPT/BERT这种以体积大、效果好、但运行更耗时的AI模型

我带着 chatGPT 做了 2800 道算法题

学算法认准 labuladong后台回复课程查看精品课点击卡片可搜索文章👇在线学习网站:https://labuladong.github.io/algo/老读者都知道,以前我的算法教程主要使用Java语言。但是现在有了chatGPT的帮助,《labuladong的刷题全家桶》已经全面支持了Java/C++/Python/Golang/JavaScript等所有所有主流编程语言,能尽可能照顾到更多读者的需求。具体来说,网站、Chrome刷题插件、vscode刷题插件、Jetbrain刷题插件全部支持了多语言切换的tab。废话不多说,直接上图:网站每篇文章中比较重要的代码片段块都支持了多语言ta