TF-GNN_草庐IT

一个由tf1.6.0引发的故事｜从CUDA到gcc配置，非root用户重装旧版本TF环境

之前尝试复现学姐前几年的一个工作，但是因为框架有点古老而作罢。然鹅，自己的实验结果一直跑得十分奇怪，为了去学姐的代码中寻找参考，今天再次进行了尝试。我的需求是安装Tensorflow_gpu_1.6.0（文中简称TensorFlow），目前机器已配置cuda11和cuda10，非root用户。目录前置疑问Q1:为什么安装TensorFlow需要重装CUDA？Q2:nvidia-smi和nvcc-V显示的不是同一版本CUDA？Q3:用conda装CUDA不可以吗？结论0安装之前——检查机器配置（非root用户）查询目标配置检查机器配置安装顺序1安装gcc1.1下载gcc(以gcc6.4.0为例)

Dive into TensorFlow系列（2）- 解析TF核心抽象op算子

本文作者：李杰TF计算图从逻辑层来讲，由op与tensor构成。op是项点代表计算单元，tensor是边代表op之间流动的数据内容，两者配合以数据流图的形式来表达计算图。那么op对应的物理层实现是什么？TF中有哪些op，以及各自的适用场景是什么？op到底是如何运行的？接下来让我们一起探索和回答这些问题。一、初识op1.1op定义op代表计算图中的节点，是tf.Operation对象，代表一个计算单元。用户在创建模型和训练代码时，会创建一系列op及其依赖关系，并将这些op和依赖添加到tf.Graph对象中（一般为默认图）。比如：tf.matmul()就是一个op，它有两个输入tensor和一个输

TensorFlow Dive span color ring 算法与数据结构

Dive into TensorFlow系列（2）- 解析TF核心抽象op算子

本文作者：李杰TF计算图从逻辑层来讲，由op与tensor构成。op是项点代表计算单元，tensor是边代表op之间流动的数据内容，两者配合以数据流图的形式来表达计算图。那么op对应的物理层实现是什么？TF中有哪些op，以及各自的适用场景是什么？op到底是如何运行的？接下来让我们一起探索和回答这些问题。一、初识op1.1op定义op代表计算图中的节点，是tf.Operation对象，代表一个计算单元。用户在创建模型和训练代码时，会创建一系列op及其依赖关系，并将这些op和依赖添加到tf.Graph对象中（一般为默认图）。比如：tf.matmul()就是一个op，它有两个输入tensor和一个输

TensorFlow Dive span color ring 算法与数据结构

TF-GNN踩坑记录(一)

引言Batchsize作为一个在训练中经常被使用的参数，在图神经网络的训练中也是必不可少，但是在TF-GNN中要求使用merge_batch_to_components()把batch之后的图合并成一张图。表现如下图：通过上图可以看出，在merge之后的图中的点序号被重新按照顺序编号，同时边的序号也和点序号一样重新编号，且可以发现子图与子图之间并没有新增边的连接，需要注意的是对于图的size，merge只是连接了每个子图的size而不是以加法的形式增加size。问题由于需要在edgepooling中使用attention机制，并且尝试自己实现attention机制，需要获取到图的节点数量，

TF-GNN GNN span node color 人工智能

TF-GNN踩坑记录(一)

引言Batchsize作为一个在训练中经常被使用的参数，在图神经网络的训练中也是必不可少，但是在TF-GNN中要求使用merge_batch_to_components()把batch之后的图合并成一张图。表现如下图：通过上图可以看出，在merge之后的图中的点序号被重新按照顺序编号，同时边的序号也和点序号一样重新编号，且可以发现子图与子图之间并没有新增边的连接，需要注意的是对于图的size，merge只是连接了每个子图的size而不是以加法的形式增加size。问题由于需要在edgepooling中使用attention机制，并且尝试自己实现attention机制，需要获取到图的节点数量，

TF-GNN GNN span node color 人工智能

什么是机器学习特征工程？【数据集特征抽取（字典，文本TF-Idf）、特征预处理（标准化，归一化）、特征降维（低方差，相关系数，PCA）】

2.特征工程2.1数据集2.1.1可用数据集Kaggle网址：https://www.kaggle.com/datasetsUCI数据集网址：http://archive.ics.uci.edu/ml/scikit-learn网址：http://scikit-learn.org/stable/datasets/index.html#datasets2.1.2安装scikit-learn工具pip3installScikit-learn==0.19.1安装好之后可以通过以下命令查看是否安装成功importsklearn注：安装scikit-learn需要Numpy,Scipy等库分类、聚类、回归

TF-Idf 特征 strong li data 人工智能

什么是机器学习特征工程？【数据集特征抽取（字典，文本TF-Idf）、特征预处理（标准化，归一化）、特征降维（低方差，相关系数，PCA）】

2.特征工程2.1数据集2.1.1可用数据集Kaggle网址：https://www.kaggle.com/datasetsUCI数据集网址：http://archive.ics.uci.edu/ml/scikit-learn网址：http://scikit-learn.org/stable/datasets/index.html#datasets2.1.2安装scikit-learn工具pip3installScikit-learn==0.19.1安装好之后可以通过以下命令查看是否安装成功importsklearn注：安装scikit-learn需要Numpy,Scipy等库分类、聚类、回归

TF-Idf 特征 strong li data 人工智能

联邦GNN综述与经典算法介绍

作者：京东科技李杰联邦学习和GNN都是当前AI领域的研究热点。联邦学习的多个参与方可以在不泄露原始数据的情况下，安全合规地联合训练业务模型，目前已在诸多领域取得了较好的结果。GNN在应对非欧数据结构时通常有较好的表现，因为它不仅考虑节点本身的特征还考虑节点之间的链接关系及强度，在诸如：异常个体识别、链接预测、分子性质预测、地理拓扑图预测交通拥堵等领域均有不俗表现。那么GNN与联邦学习的强强组合又会擦出怎样的火花？通常一个好的GNN算法需要丰富的节点特征与完整的连接信息，但现实场景中数据孤岛问题比较突出，单个数据拥有方往往只有有限的数据、特征、边信息，但我们借助联邦学习技术就可以充分利用各方数据

综述 GNN 1fbpfcp fbpfcp 1fbpfcp-zoom 计算机图形学

联邦GNN综述与经典算法介绍

作者：京东科技李杰联邦学习和GNN都是当前AI领域的研究热点。联邦学习的多个参与方可以在不泄露原始数据的情况下，安全合规地联合训练业务模型，目前已在诸多领域取得了较好的结果。GNN在应对非欧数据结构时通常有较好的表现，因为它不仅考虑节点本身的特征还考虑节点之间的链接关系及强度，在诸如：异常个体识别、链接预测、分子性质预测、地理拓扑图预测交通拥堵等领域均有不俗表现。那么GNN与联邦学习的强强组合又会擦出怎样的火花？通常一个好的GNN算法需要丰富的节点特征与完整的连接信息，但现实场景中数据孤岛问题比较突出，单个数据拥有方往往只有有限的数据、特征、边信息，但我们借助联邦学习技术就可以充分利用各方数据

综述 GNN 1fbpfcp fbpfcp 1fbpfcp-zoom 计算机图形学

iTAK：在线预测全基因组转录因子TF，转录调节因子TR与蛋白激酶PK

前言康奈尔大学，FeiLab的一个预测工具。iTAK是依赖于数据库的用于从蛋白质或核苷酸序列中识别植物转录因子(TF)、转录调节因子(TR)和蛋白激酶(PK)，然后将单个TF、TR和PK分类为不同的基因家族的工具。本人能力有限，本文可能存在描述不当与错误的地方，请仔细辨别后使用。鉴定与依据TFs和TRs的识别和分类是基于主要从PlnTFDB(Perez-Rodriguezetal.,2010)和PlantTFDB[(Jinetal.,2014)总结的一致性规则（每个基因家族的必需和禁止的蛋白质结构域），与来自PlantTFcat(Daietal.,2013)和AtTFDB(Yilmazetal

基因蛋白 code section jianshu