目录理论知识准备构造文本特征向量TF-IDF值sklearn中TfidfVectorizer代码实例CountVectorizer()代码实操Word2Vec代码案例总结每文一语理论知识准备前期我们对分词进行了详细的讲解,那么分词之后,哪些关键词对一个文档才是重要的?比如可以通过单词出现的次数,次数越多就表示越重要。构造文本特征向量Count(文档:空格连接的字符串)TFIDF(文档:空格连接的字符串)Word2Vec(文档:分词列表)TF-IDF值单词的TF-IDF值可以描述一个单词对文档的重要性,TF-IDF值越大ÿ
之前尝试复现学姐前几年的一个工作,但是因为框架有点古老而作罢。然鹅,自己的实验结果一直跑得十分奇怪,为了去学姐的代码中寻找参考,今天再次进行了尝试。我的需求是安装Tensorflow_gpu_1.6.0(文中简称TensorFlow),目前机器已配置cuda11和cuda10,非root用户。目录前置疑问Q1:为什么安装TensorFlow需要重装CUDA?Q2:nvidia-smi和nvcc-V显示的不是同一版本CUDA?Q3:用conda装CUDA不可以吗?结论0安装之前——检查机器配置(非root用户)查询目标配置检查机器配置安装顺序1安装gcc1.1下载gcc(以gcc6.4.0为例)
之前尝试复现学姐前几年的一个工作,但是因为框架有点古老而作罢。然鹅,自己的实验结果一直跑得十分奇怪,为了去学姐的代码中寻找参考,今天再次进行了尝试。我的需求是安装Tensorflow_gpu_1.6.0(文中简称TensorFlow),目前机器已配置cuda11和cuda10,非root用户。目录前置疑问Q1:为什么安装TensorFlow需要重装CUDA?Q2:nvidia-smi和nvcc-V显示的不是同一版本CUDA?Q3:用conda装CUDA不可以吗?结论0安装之前——检查机器配置(非root用户)查询目标配置检查机器配置安装顺序1安装gcc1.1下载gcc(以gcc6.4.0为例)
本文作者:李杰TF计算图从逻辑层来讲,由op与tensor构成。op是项点代表计算单元,tensor是边代表op之间流动的数据内容,两者配合以数据流图的形式来表达计算图。那么op对应的物理层实现是什么?TF中有哪些op,以及各自的适用场景是什么?op到底是如何运行的?接下来让我们一起探索和回答这些问题。一、初识op1.1op定义op代表计算图中的节点,是tf.Operation对象,代表一个计算单元。用户在创建模型和训练代码时,会创建一系列op及其依赖关系,并将这些op和依赖添加到tf.Graph对象中(一般为默认图)。比如:tf.matmul()就是一个op,它有两个输入tensor和一个输
本文作者:李杰TF计算图从逻辑层来讲,由op与tensor构成。op是项点代表计算单元,tensor是边代表op之间流动的数据内容,两者配合以数据流图的形式来表达计算图。那么op对应的物理层实现是什么?TF中有哪些op,以及各自的适用场景是什么?op到底是如何运行的?接下来让我们一起探索和回答这些问题。一、初识op1.1op定义op代表计算图中的节点,是tf.Operation对象,代表一个计算单元。用户在创建模型和训练代码时,会创建一系列op及其依赖关系,并将这些op和依赖添加到tf.Graph对象中(一般为默认图)。比如:tf.matmul()就是一个op,它有两个输入tensor和一个输
引言Batchsize作为一个在训练中经常被使用的参数,在图神经网络的训练中也是必不可少,但是在TF-GNN中要求使用merge_batch_to_components()把batch之后的图合并成一张图。表现如下图: 通过上图可以看出,在merge之后的图中的点序号被重新按照顺序编号,同时边的序号也和点序号一样重新编号,且可以发现子图与子图之间并没有新增边的连接,需要注意的是对于图的size,merge只是连接了每个子图的size而不是以加法的形式增加size。问题由于需要在edgepooling中使用attention机制,并且尝试自己实现attention机制,需要获取到图的节点数量,
引言Batchsize作为一个在训练中经常被使用的参数,在图神经网络的训练中也是必不可少,但是在TF-GNN中要求使用merge_batch_to_components()把batch之后的图合并成一张图。表现如下图: 通过上图可以看出,在merge之后的图中的点序号被重新按照顺序编号,同时边的序号也和点序号一样重新编号,且可以发现子图与子图之间并没有新增边的连接,需要注意的是对于图的size,merge只是连接了每个子图的size而不是以加法的形式增加size。问题由于需要在edgepooling中使用attention机制,并且尝试自己实现attention机制,需要获取到图的节点数量,
前言最近在学习的过程中,推荐身边朋友使用\(ESP32\)但是由于\(ESP32\)官方并没有专门的IDE导致,身边很多朋友(包括我自己一开始也是)不知道如何入门\(ESP32\)。本片文章将从\(STM32\)的视角出发,给想入门\(ESP32\)的朋友提供了解\(ESP32\)的环境概念帮助,并教大家如何和\(STM32\)一样去开发和学习\(ESP32\)。\(ESP32\)环境不同与\(STM32\)。\(STM32\)可以采用\(keil\)直接一体化的软件,编译,下载,调试。但\(ESP32\)目前没有同一的IDE可以直接调试\(ESP32\),故学习\(ESP32\)需要自行搭建
前言最近在学习的过程中,推荐身边朋友使用\(ESP32\)但是由于\(ESP32\)官方并没有专门的IDE导致,身边很多朋友(包括我自己一开始也是)不知道如何入门\(ESP32\)。本片文章将从\(STM32\)的视角出发,给想入门\(ESP32\)的朋友提供了解\(ESP32\)的环境概念帮助,并教大家如何和\(STM32\)一样去开发和学习\(ESP32\)。\(ESP32\)环境不同与\(STM32\)。\(STM32\)可以采用\(keil\)直接一体化的软件,编译,下载,调试。但\(ESP32\)目前没有同一的IDE可以直接调试\(ESP32\),故学习\(ESP32\)需要自行搭建
2.特征工程2.1数据集2.1.1可用数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址:http://archive.ics.uci.edu/ml/scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#datasets2.1.2安装scikit-learn工具pip3installScikit-learn==0.19.1安装好之后可以通过以下命令查看是否安装成功importsklearn注:安装scikit-learn需要Numpy,Scipy等库分类、聚类、回归