草庐IT

Bert不完全手册8. 预训练不要停!Continue Pretraining

paper:Don'tstopPretraining:AdaptLanguageModelstoDomainsandTasksGitHub:https://github.com/allenai/dont-stop-pretraining论文针对预训练语料和领域分布,以及任务分布之间的差异,提出了DAPT领域适应预训练(domain-adaptivepretraining)和TAPT任务适应预训练(task-adaptivepretraining)两种继续预训练方案,并在医学论文,计算机论文,新闻和商品评价4个领域上进行了测试。想法很简单就是在垂直领域上使用领域语料做继续预训练,不过算是开启了新

唱唱反调:风口上的技术不要盲目追

  对于前端领域的开发者来说,“学不动了”虽然更多是一种调侃,但也真实地反映出了他们面对频繁出新的前端技术时又爱又恨的心情。在经历了移动互联网的大爆发后,前端领域的边界不断扩张,新技术、新概念、新框架层出不穷。这在一定程度上迎合了开发者喜欢追踪热门框架和技术最新发展的天性,但同时也带来了新问题。热门框架那么多,到底该选哪个?新技术引入并非毫无代价,一味追求新技术是不是合理?最火、最流行的技术一定适合你所在的团队吗?在大前端领域,我们已经看到了太多技术风口,关于如何做好前端技术选型这件事,我们希望能从不一样的视角聊一聊。为此,InfoQ近期采访了阅文集团技术专家、前百度T8资深研发工程师彭星,谈

唱唱反调:风口上的技术不要盲目追

  对于前端领域的开发者来说,“学不动了”虽然更多是一种调侃,但也真实地反映出了他们面对频繁出新的前端技术时又爱又恨的心情。在经历了移动互联网的大爆发后,前端领域的边界不断扩张,新技术、新概念、新框架层出不穷。这在一定程度上迎合了开发者喜欢追踪热门框架和技术最新发展的天性,但同时也带来了新问题。热门框架那么多,到底该选哪个?新技术引入并非毫无代价,一味追求新技术是不是合理?最火、最流行的技术一定适合你所在的团队吗?在大前端领域,我们已经看到了太多技术风口,关于如何做好前端技术选型这件事,我们希望能从不一样的视角聊一聊。为此,InfoQ近期采访了阅文集团技术专家、前百度T8资深研发工程师彭星,谈

不要让“Clean Code”更难维护,请使用“Rule of Three”

“我们如何证明,通过遵循“代码整洁之道”(CleanCode)就可以编写更多的代码呢?”当人们试图将“代码整洁之道(CleanCode)”的原则应用于现有的代码库时,我经常会问这个问题。我认为这是合情合理的。当我们开始重构遗留代码时,通常会将内容提取到较小的方法中。然后再将方法提取到类中。很快,我们可能就能感觉到原来30行的方法现在已经分散在不同的类中。我们想知道的是:这在实际上是否是更容易维护了呢。也许我们是一个小团队。也许我们必须支持我们继承的一个相对较大(并且没有文档记录的)的代码库。寻求代码可维护性是一件好事。错误在于,认为代码可维护性与代码行数(linesofcode,LOC)相关。

不要让“Clean Code”更难维护,请使用“Rule of Three”

“我们如何证明,通过遵循“代码整洁之道”(CleanCode)就可以编写更多的代码呢?”当人们试图将“代码整洁之道(CleanCode)”的原则应用于现有的代码库时,我经常会问这个问题。我认为这是合情合理的。当我们开始重构遗留代码时,通常会将内容提取到较小的方法中。然后再将方法提取到类中。很快,我们可能就能感觉到原来30行的方法现在已经分散在不同的类中。我们想知道的是:这在实际上是否是更容易维护了呢。也许我们是一个小团队。也许我们必须支持我们继承的一个相对较大(并且没有文档记录的)的代码库。寻求代码可维护性是一件好事。错误在于,认为代码可维护性与代码行数(linesofcode,LOC)相关。

万字经验帖:不具备这九种能力,建议不要做SRE

SRE最早是由Google提出的概念,其大概的意思就是:以标准化、自动化、可扩展驱动维护,用软件开发解决运维难题。这个岗位面世的时候,其根本要解决的问题就是打破传统研发人员快速迭代而引发的业务不稳定性,用以保证业务维护侧重的服务质量以及稳定性之间的平衡。不同公司的SRE定位是不同的,可能某些公司的运维岗位也是SRE,以此,不能以偏概全,国内的SRE基本是以岗位来区分的,比如,有负责网络的SRE,有负责DBA的SRE,有专门负责业务的SRE,还有什么安全SRE等等。就谷歌所提到的SRE的理解来讲,基本都是以服务质量稳定为基线的维护工程师,只是对于SRE的要求是苛刻的,下面是我的个人理解:第一:技

万字经验帖:不具备这九种能力,建议不要做SRE

SRE最早是由Google提出的概念,其大概的意思就是:以标准化、自动化、可扩展驱动维护,用软件开发解决运维难题。这个岗位面世的时候,其根本要解决的问题就是打破传统研发人员快速迭代而引发的业务不稳定性,用以保证业务维护侧重的服务质量以及稳定性之间的平衡。不同公司的SRE定位是不同的,可能某些公司的运维岗位也是SRE,以此,不能以偏概全,国内的SRE基本是以岗位来区分的,比如,有负责网络的SRE,有负责DBA的SRE,有专门负责业务的SRE,还有什么安全SRE等等。就谷歌所提到的SRE的理解来讲,基本都是以服务质量稳定为基线的维护工程师,只是对于SRE的要求是苛刻的,下面是我的个人理解:第一:技

永远不要在你的 Linux 系统上运行这些命令

​本文涉及到一些你绝不能在你的Linux系统上运行的命令,因为它们可能对你的Linux系统造成致命的影响。因此,在我继续之前,我想指出,本文仅供信息参考,让读者知道要避免执行以下任何命令。这里提到的所有命令都可能对你的系统及其数据造成严重影响。​因此,让我们开始列出你绝不能运行的Linux命令,而我要再次说一遍,请小心谨慎地操作:你绝不能运行的Linux命令1.格式化系统磁盘Linux管理员经常使用此命令来格式化并为新创建的磁盘分区分配文件系统。但是,如果不负责任地使用,它也可能会格式化磁盘上的数据:$mkfs.ext4/dev/sda因此,在使用此命令时,请确保已选择所需的磁盘分区。2.删除

永远不要在你的 Linux 系统上运行这些命令

​本文涉及到一些你绝不能在你的Linux系统上运行的命令,因为它们可能对你的Linux系统造成致命的影响。因此,在我继续之前,我想指出,本文仅供信息参考,让读者知道要避免执行以下任何命令。这里提到的所有命令都可能对你的系统及其数据造成严重影响。​因此,让我们开始列出你绝不能运行的Linux命令,而我要再次说一遍,请小心谨慎地操作:你绝不能运行的Linux命令1.格式化系统磁盘Linux管理员经常使用此命令来格式化并为新创建的磁盘分区分配文件系统。但是,如果不负责任地使用,它也可能会格式化磁盘上的数据:$mkfs.ext4/dev/sda因此,在使用此命令时,请确保已选择所需的磁盘分区。2.删除

数据分析项目的五个坑点,千万不要对号入座!

​场景还原:某互联网企业的B2B商务拓展团队,主要通过电话销售联系潜在客户,外呼名单管理混乱,只有客户企业名称、联系电话两个字段,销售成功率极低,且团队管理混乱,只记录成交金额,没有对未成交原因做记录,也没有跟进记录。业绩完成差,团队流失严重,领导很着急。问题一(选择题)你是这个企业的数据分析师,此时你会: A、在月报里认真分析成功率低原因,写20页整改建议 B、月报只列数字,等着他们来找你谈合作(题目简单,思考一秒钟)经过上一篇的教育,大家都选B。是滴,这个场景里的问题根本是业务管理混乱导致的,数据能帮上忙就见鬼了。如果业务自己意识不到痛,只是数据分析师作为外人blablabla,根本没人理