我国纺织业有着几千年的历史,是国民经济不可或缺的重要组成部分,中国作为世界纺织大国随着产业互联的发展,其背后的纺织行业供应链金融如何赋能产业是非常值得大家探讨的话题。一方面纺织产业有着很长的供应链条,并且链条上各种生产要素错综复杂;另一方面金融如何服务好产业链上的客户,并做好风险管控是一项富有挑战性又很有价值的事情。一、纺织产业供应链简介首先介绍一下纺织产业供应链,让大家有一个全面的了解。衣服大家都非常熟悉,但是在一件衣服背后是一个非常庞大的纺织产业,这个产业的链条非常长,从上游具有大宗属性的棉花、纱线、化纤到中游的坯布、印染再到下游的成品布、服装、销售,在整个链条上的各类生产要素众多,并且整
1. 金融行业大数据需求1.1 云原生相比Hadoop的优势传统大数据集群通常基于Hadoop系统构建,传统大数据作业通常是以裸进程的形式运行在节点上,很容易受到节点上的其他进程或其他因素干扰,因此带来的作业稳定性问题经常困扰用户。一个实际的例子,如果一个Flink作业发生了延迟,找不到业务上的原因,但是观测到节点的CPU使用率比较高。用户通常选择杀掉节点上的其他作业,使机器负载下降,这时作业很有可能恢复了正常。但是,最终也没有定位到延迟的具体原因,一段时间后很可能会再次出现相同的问题,而且每次杀掉其他作业的处理方式非常繁琐,并且代价比较高。那么,在大数据场景下,云原生系统相比Hadoop系统
1. 金融行业大数据需求1.1 云原生相比Hadoop的优势传统大数据集群通常基于Hadoop系统构建,传统大数据作业通常是以裸进程的形式运行在节点上,很容易受到节点上的其他进程或其他因素干扰,因此带来的作业稳定性问题经常困扰用户。一个实际的例子,如果一个Flink作业发生了延迟,找不到业务上的原因,但是观测到节点的CPU使用率比较高。用户通常选择杀掉节点上的其他作业,使机器负载下降,这时作业很有可能恢复了正常。但是,最终也没有定位到延迟的具体原因,一段时间后很可能会再次出现相同的问题,而且每次杀掉其他作业的处理方式非常繁琐,并且代价比较高。那么,在大数据场景下,云原生系统相比Hadoop系统
导读:结合当前业界数据治理的现状、背景、框架,我们可能希望了解一个从0~1的数据治理架构体系怎么做。也有朋友会有疑问:数据治理的管理、域间组合和协同,他们是什么样的一个关系,该怎么样去开展?另外,在这几年的金融行业的数据治理过程中,有哪些具体的实践?为了帮助大家解决这些困扰,本文将对金融数据治理的实践与思考,做一个梳理和总结。今天的介绍主要分为4个部分:金融数据治理背景数据治理架构体系数据治理管理域间组合与协同数据治理新实践和思考一、金融数据治理背景首先和大家分享下金融数据治理的背景。金融行业在整个数据治理领域里,跟政企一样,其数据治理比较领先。原因在于两个必不可少的因素:外驱和内驱。1、外驱
导读:结合当前业界数据治理的现状、背景、框架,我们可能希望了解一个从0~1的数据治理架构体系怎么做。也有朋友会有疑问:数据治理的管理、域间组合和协同,他们是什么样的一个关系,该怎么样去开展?另外,在这几年的金融行业的数据治理过程中,有哪些具体的实践?为了帮助大家解决这些困扰,本文将对金融数据治理的实践与思考,做一个梳理和总结。今天的介绍主要分为4个部分:金融数据治理背景数据治理架构体系数据治理管理域间组合与协同数据治理新实践和思考一、金融数据治理背景首先和大家分享下金融数据治理的背景。金融行业在整个数据治理领域里,跟政企一样,其数据治理比较领先。原因在于两个必不可少的因素:外驱和内驱。1、外驱
一、UPLIFT模型简介首先介绍一下UPLIFT模型。一个经典的场景:市场营销活动怎么找到最优投放客群?或者怎么找到最优的营销激励方式?普遍的思路就是投放高意愿(上图SureThings和Persuadable象限)的用户,但是这个思路最大的问题是:它忽略了自然流量下的用户转化。首先,高意愿用户中有一部分用户(SureThings象限用户)不投放也能够自然转化;此外,在折扣券的营销模式下,直接对高意愿用户进行投放往往会带来一个高成本的损耗。那是不是可以转而投低意愿(DoNoteDisturbs和LostCauses象限)的用户呢?通过投放将他们的消费意愿提升?事实上,对于低意愿的用户,他们转
一、UPLIFT模型简介首先介绍一下UPLIFT模型。一个经典的场景:市场营销活动怎么找到最优投放客群?或者怎么找到最优的营销激励方式?普遍的思路就是投放高意愿(上图SureThings和Persuadable象限)的用户,但是这个思路最大的问题是:它忽略了自然流量下的用户转化。首先,高意愿用户中有一部分用户(SureThings象限用户)不投放也能够自然转化;此外,在折扣券的营销模式下,直接对高意愿用户进行投放往往会带来一个高成本的损耗。那是不是可以转而投低意愿(DoNoteDisturbs和LostCauses象限)的用户呢?通过投放将他们的消费意愿提升?事实上,对于低意愿的用户,他们转
一、众安金融MLOps简介1、什么是MLOps(1)定义MLOps是将机器学习、数据工程和DevOps融合在一起,从而实现机器学习模型的高效迭代和持续稳定地应用于生产业务的一套方法架构。所以它是一套实践方法论,是一套架构方案。(2)协作团队①数据产品团队:定义业务目标,衡量业务价值。②数据工程团队:采集业务数据,然后对数据进行清洗转换。③数据科学家团队:构建ML解决方案,开发相应的特征模型。④数据应用团队:模型应用,对特征进行持续的监控。2、众安金融MLOps流程说明(1)样本准备,产品业务团队定义业务范围,确定建模的目标,选择样本人群准备训练集。(2)数据处理,需要对数据进行缺失值、异常值、
一、众安金融MLOps简介1、什么是MLOps(1)定义MLOps是将机器学习、数据工程和DevOps融合在一起,从而实现机器学习模型的高效迭代和持续稳定地应用于生产业务的一套方法架构。所以它是一套实践方法论,是一套架构方案。(2)协作团队①数据产品团队:定义业务目标,衡量业务价值。②数据工程团队:采集业务数据,然后对数据进行清洗转换。③数据科学家团队:构建ML解决方案,开发相应的特征模型。④数据应用团队:模型应用,对特征进行持续的监控。2、众安金融MLOps流程说明(1)样本准备,产品业务团队定义业务范围,确定建模的目标,选择样本人群准备训练集。(2)数据处理,需要对数据进行缺失值、异常值、
一、信贷风控简介信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率。与其他机器学习的工业场景不同,金融是极其厌恶风险的领域,其特殊性在于非常侧重模型的解释性及稳定性。业界通常的做法是基于挖掘多维度的特征建立一套可解释及效果稳定的规则及风控模型对每笔订单/用户/行为做出判断决策。其中,对于(贷前)申请前的风控模型,也称为申请评分卡--A卡。A卡是风控的关键模型,业界