pandaslearningmatplotlib设置中文显示matlotlib默认不支持中文字符,默认英文字体无法显示汉字查看inux/mac下面支持的字体:fc-list:lang=zh#windows、linux、macos系统通用设置#导入font_manager=>实例化FontProperties对象my_font=>在设置字体的地方使用这个对象,比如xticksfrommatplotlibimportfont_managermy_font=font_manager.FontProperties(fname="/System/Lirary/Fonts/PingFang.ttc")lt
pandaslearningmatplotlib设置中文显示matlotlib默认不支持中文字符,默认英文字体无法显示汉字查看inux/mac下面支持的字体:fc-list:lang=zh#windows、linux、macos系统通用设置#导入font_manager=>实例化FontProperties对象my_font=>在设置字体的地方使用这个对象,比如xticksfrommatplotlibimportfont_managermy_font=font_manager.FontProperties(fname="/System/Lirary/Fonts/PingFang.ttc")lt
代码地址:postgresql-13.1-ml:IntegrationofCardEstMethodsintoPostgreSQLbyHTTPServer(github.com)当前进度:可以支持单表查询、多表innerjoin的基数估计模块的替换。注意:本文的重点在于PG的修改。记录一下我的修改思路。整体流程PG作为http客户端,向基数估计服务端发送http请求。内容为需要基数估计的SQL语句。基数估计服务端返回该语句的selectivity。PG收到该查询的selectivity后乘以当前表的大小,即得到rows项目的难点主要在于获取需要基数估计的SQL查询语句。PG原版基数估计调用逻辑
代码地址:postgresql-13.1-ml:IntegrationofCardEstMethodsintoPostgreSQLbyHTTPServer(github.com)当前进度:可以支持单表查询、多表innerjoin的基数估计模块的替换。注意:本文的重点在于PG的修改。记录一下我的修改思路。整体流程PG作为http客户端,向基数估计服务端发送http请求。内容为需要基数估计的SQL语句。基数估计服务端返回该语句的selectivity。PG收到该查询的selectivity后乘以当前表的大小,即得到rows项目的难点主要在于获取需要基数估计的SQL查询语句。PG原版基数估计调用逻辑
这是一篇linkedin发表的深度迁移学习综述,里面讲了一些对于search/recommendsystem中的迁移学习应用.有不少指导性的方法,看完后摘录出来对于ranking方向的TL,主要有两种transfer方式:Modeltransfer对于参数量非常大的预训练模型,Fine-tuning训练代价比较大,这里基本没介绍,不太可行.更适合应用的方式是multi-tasktraining.(尤其是在多个产品线通过user来联系的场景)Crossdomain:适用场景为冷启问题(新用户/新场景),提升accuracy(减少数据稀疏性,学到更多的健壮特征),增强用户模型,主要有下面这几种实现
这是一篇linkedin发表的深度迁移学习综述,里面讲了一些对于search/recommendsystem中的迁移学习应用.有不少指导性的方法,看完后摘录出来对于ranking方向的TL,主要有两种transfer方式:Modeltransfer对于参数量非常大的预训练模型,Fine-tuning训练代价比较大,这里基本没介绍,不太可行.更适合应用的方式是multi-tasktraining.(尤其是在多个产品线通过user来联系的场景)Crossdomain:适用场景为冷启问题(新用户/新场景),提升accuracy(减少数据稀疏性,学到更多的健壮特征),增强用户模型,主要有下面这几种实现
最近在看一些深度学习相关的书,感觉对于参考文献1中的mini-batch部分理解得不是很透彻,主要是因为神经网络的输入开始变成批数据,加之对python的numpy不是很熟了。所以总想写点什么,一来有助于加深对于知识的理解,二来也算是分享知识咯。闲话少叙,让我们进入正题。在机器学习中,学习的目标是选择期望风险\(R_{exp}\)(expectedloss)最小的模型,但在实际情况下,我们不知道数据的真实分布(包含已知样本和训练样本),仅知道训练集上的数据分布。因此,我们的目标转化为最小化训练集上的平均损失,这也被称为经验风险\(R_{emp}\)(empiricalloss)。严格地说,我们
最近在看一些深度学习相关的书,感觉对于参考文献1中的mini-batch部分理解得不是很透彻,主要是因为神经网络的输入开始变成批数据,加之对python的numpy不是很熟了。所以总想写点什么,一来有助于加深对于知识的理解,二来也算是分享知识咯。闲话少叙,让我们进入正题。在机器学习中,学习的目标是选择期望风险\(R_{exp}\)(expectedloss)最小的模型,但在实际情况下,我们不知道数据的真实分布(包含已知样本和训练样本),仅知道训练集上的数据分布。因此,我们的目标转化为最小化训练集上的平均损失,这也被称为经验风险\(R_{emp}\)(empiricalloss)。严格地说,我们
这是一篇linkedin发表的深度迁移学习综述,里面讲了一些对于search/recommendsystem中的迁移学习应用.有不少指导性的方法,看完后摘录出来对于ranking方向的TL,主要有两种transfer方式:Modeltransfer对于参数量非常大的预训练模型,Fine-tuning训练代价比较大,这里基本没介绍,不太可行.更适合应用的方式是multi-tasktraining.(尤其是在多个产品线通过user来联系的场景)Crossdomain:适用场景为冷启问题(新用户/新场景),提升accuracy(减少数据稀疏性,学到更多的健壮特征),增强用户模型,主要有下面这几种实现
这是一篇linkedin发表的深度迁移学习综述,里面讲了一些对于search/recommendsystem中的迁移学习应用.有不少指导性的方法,看完后摘录出来对于ranking方向的TL,主要有两种transfer方式:Modeltransfer对于参数量非常大的预训练模型,Fine-tuning训练代价比较大,这里基本没介绍,不太可行.更适合应用的方式是multi-tasktraining.(尤其是在多个产品线通过user来联系的场景)Crossdomain:适用场景为冷启问题(新用户/新场景),提升accuracy(减少数据稀疏性,学到更多的健壮特征),增强用户模型,主要有下面这几种实现