草庐IT

language-scala

全部标签

Scala练习

wordCountpackagecom.doit.day03importscala.io.{BufferedSource,Source}objectWordCountDemo{defmain(args:Array[String]):Unit={//读取文件,获取到一个Source对象valsource:BufferedSource=Source.fromFile("D:\\develop\\ideaWorkSpace\\myself\\study\\scalaDemo\\data\\word.txt")//调用getLines方法,获取到每一行数据,每一行数据都放在迭代器中vallines:I

【论文阅读】Language Models are Few-Shot Learners(GPT-3)

前言本文简要介绍了GPT-3的背景,模型架构,训练数据以及训练方式部分。具体训练细节,实验结果很多,可以在用到的时候再看Intro本文剖析了pretrain-finetune架构存在的问题:对于每个新的任务,都需要大量的标注数据将表达能力更强的模型(预训练阶段要求用大模型)在比较窄的数据(微调阶段是在narrow数据分布上进行的)上训练是不合理的。大模型的效果并不能泛化到OOD数据上人类在接触一个下游任务时不需要大量的训练样本,只需要对任务的描述或者几个例子就可以。我们希望NLP模型也能有这种多任务之间无缝衔接的能力解决上述问题可行的方案:meta-learning:模型在预训练阶段就学到了一

AIGC之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

AIGC之LLaMA:《LLaMA:OpenandEfficientFoundationLanguageModels》翻译与解读导读:该论文提出了一个开源的大规模语言模型LLaMA。该模型有以下几个核心技术点:>>模型架构:LLaMA使用Transformer架构,特别是采用解决层归一化方法的16层模型。这相比于其他模型有更深的深度,能够学习更复杂的语言表示。>>训练数据:LLaMA训练的数据集包含4TB的句子,来自于BookCorpus、CC-News、OpenWebText-2等多个数据源。如此大规模的数据集有助于模型学习更丰富的语言知识。>>学习率调度:LLaMA使用渐进式学习率调度方法

scala异常和IO

异常处理语法处理上和Java类似,但是又不尽相同。java的异常处理publicclassExceptionDemo{publicstaticvoidmain(String[]args){try{inta=10;intb=0;intc=a/b;}catch(ArithmeticExceptione){//catch时,需要将范围小的写到前面e.printStackTrace();}catch(Exceptione){e.printStackTrace();}finally{System.out.println("finally");}}}注意事项(1)Java语言按照try—catch—fin

Scala泛型

泛型的定义object_11_泛型{defmain(args:Array[String]):Unit={//[A]这个代表的就是泛型==》在创建对象的时候,可以指定需要传进去的类型//作用就是在创建对象的时候,可以对传进去的参数一个约束,当设置泛型位int之后,那么传进去的值就必须是int//apply[A](xs:A*):List[A]=xs.toListvalints:List[Int]=List[Int](1,2,3,4)//自己写一个?单纯演示泛型语法的定义,没有什么实际的意义/***将泛型定义在类上,那么在整个类中,都可以使用该泛型,作用域是整个类*@tparamT*/classTe

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

PapernameLLaMA-Adapter:EfficientFine-tuningofLanguageModelswithZero-initAttentionPaperReadingNotePaperURL:https://arxiv.org/pdf/2303.16199.pdfCodeURL:https://github.com/ZrrSkywalker/LLaMA-AdapterTL;DR2023上海人工智能实验室和CUHKMMLab出的文章。提出LLaMA-Adapter,一种高效的微调方法,将LLaMA调整为指令跟随模型。对于llama7b模型来说,可训练参数缩小到1.2M,只需要

LLaMA:Open and Efficient Foundation Language Models

LLaMA:OpenandEfficientFoundationLanguageModelsIntroductionApproachPre-trainingDataArchitectureIntroduction在大规模数据下训练的大模型,已经展示了很好的表现,当模型足够大的时,模型会出现一个涌现的能力,如下图:最近的一项研究表明,在有限的算力下,表现最好的模型不是参数最大的,而是小一点模型搭配了更多数据。这项工作的重点是训练一系列语言模型,通过对比通常使用的更多的token进行训练,在各种推理预算下达到最佳性能。由此产生的模型被称为LLaMA,参数范围从7B到65B,与现有的最好的LLM相比

linux - 未在 Eclipse 中评估的新 Scala 工作表

我在Linux上的EclipiseIDE上使用Scala。我在评估新工作表时遇到问题。正在创建的新工作表中的表达式不会得到评估,并且不会显示内联结果。但是,旧的工作表仍然可以正常工作,表达式得到正确评估,结果以内联方式显示。我确实尝试了来自这个stackoverflow线程的以下建议:GettingInlineResultsinWorksheet但是,这也行不通。有人可以为此提出解决方案吗?为什么新工作表不起作用,而旧工作表仍然可以正常工作? 最佳答案 我快要疯了...Ubuntu15.04-EclipseScalaIDE4.1(基

linux - 未在 Eclipse 中评估的新 Scala 工作表

我在Linux上的EclipiseIDE上使用Scala。我在评估新工作表时遇到问题。正在创建的新工作表中的表达式不会得到评估,并且不会显示内联结果。但是,旧的工作表仍然可以正常工作,表达式得到正确评估,结果以内联方式显示。我确实尝试了来自这个stackoverflow线程的以下建议:GettingInlineResultsinWorksheet但是,这也行不通。有人可以为此提出解决方案吗?为什么新工作表不起作用,而旧工作表仍然可以正常工作? 最佳答案 我快要疯了...Ubuntu15.04-EclipseScalaIDE4.1(基

大数据Spark SparkSession的3种创建方式 Scala语言实现

1、什么是SparkSessionSparkSession是ApacheSpark2.0版本引入的一个编程接口,用于与Spark进行交互。它是Spark应用程序的入口点,提供了一种方便的方式来创建DataFrame、DataSet和SQLContext等数据结构,并且可以配置各种Spark应用程序的选项。SparkSession还管理了Spark应用程序的运行环境,包括Spark集群的连接,以及将数据加载到内存中进行处理等任务。2、创建SparkSession的几种方法在Scala中,创建SparkSession有以下几种方法:先引入SparkSession类importorg.apache.