参考书目:深入浅出Python量化交易实战在机器学习里面的X叫做特征变量,在统计学里面叫做协变量也叫自变量,在量化投资里面则叫做因子,所谓多因子就是有很多的特征变量。本次带来的就是多因子模型,并且使用的是机器学习的强大的非线性模型,集成学习里面的随机森林和LGBM模型,带来因子的选择策略和股票的选择策略。由于股票数据的获取都需要第三方库或者是专业的量化投资框架,很多第三方库某些功能需要收费(Tushare),而免费的一些库(证券宝)获取的数据特征变量又没那么多。所以这里是用聚宽量化投资框架,是可以免费使用一些功能的(只需要注册一个账号)。这里获取数据就采用聚宽平台的功能了。数据获取本次使用
XGBoost的decisiontree用的是pre-sortedbased的算法,也就是在treebuilding之前对各维特征先排序,代表性的算法是SLIQ和SPRINT。SLIQ和SPRINT算法的特点决定了树生长的方式是level-wise(breadth-first)的。而LightGBM的decisiontree是histogrambased的算法,也就是先将特征离散化,代表性的算法是CLOUDS,Mcrank和Machado。即采用leaf-wise的方式。Catboost参考:GitHub-wepe/efficient-decision-tree-notes:高效决策树算法系列
【MATLAB第70期】基于MATLAB的LightGbm(LGBM)梯度增强决策树多输入单输出回归预测及多分类预测模型(全网首发)一、学习资料(LGBM)是一种基于梯度增强决策树(GBDT)算法。本次研究三个内容,分别是回归预测,二分类预测和多分类预测参考链接:lightgbm原理参考链接:训练过程评价指标metric函数参考链接:lightgbm参数介绍参考链接:lightgbm调参参考链接:二、回归预测(多输入单输出)1.数据设置数据(103个样本,7输入1输出)2.预测结果3.参数设置parameters=containers.Map;parameters('task')='train