草庐IT

苏涛:对抗样本技术在互联网安全领域的应用

导读:验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。分享内容包括三大方面:对抗样本介绍极验对抗样本技术探索与应用后续的工作与思考--01对抗样本介绍1.什么是对抗样本对抗样本(AdversarialExamples)的概念最早是ChristianSzegedy(克里斯蒂安·塞格迪)在ICLR2014(国际学习表征会议)上提出来的,即在数据集中通过故意添加细微的非随机

融360蒋宏:自动化特征工程和自动建模在风控场景的应用

01背景和问题目前,模型开发的流程越来越规范化,通常可以分为业务分析、样本准备、特征工程、模型构建、模型评估及监控这几个步骤。其中,特征工程和模型构建在建模的整个流程中依然非常耗时,并且非常依赖于模型开发者对业务的理解及数据处理的能力。在目前实际业务场景下,面临的最大的一个问题是,如何快速地构建起一个质量相对不错的模型,以适应业务的快速发展。传统的风控建模周期较长,通常要20天左右的时间才能达到上线的要求。其中,特征工程的耗时在整个建模过程中会占到大约60%的时间,且这个过程的挑战就是人工提取特征的复杂性和高时间耗费性。自动化特征工程能够对必要而繁琐的工作进行自动化处理,从而优化机器学习模型的

陈宏申:浅谈京东电商商品文案挖掘难点与优化实践

导读:在电商推荐中,除了推送商品的图片和价格信息外,文案也是商品非常重要的维度。基于编码器解码器范式的序列文本生成模型是文案挖掘的核心,但该种方法面临着两大技术挑战:一是文案生成结果不可靠和生成质量不可控,无法满足业务对电商商品文案内容可靠性的严格要求;二是序列文本生成模型经常面临数据坍塌,比较容易生成万金油式的安全文案,文案内容本身的多样性会越来越低,且无法捕捉语言本身的流行或演化趋势。针对以上两大挑战,在以文案生成系统为核心的基础上,引入了文案摘要清洗系统和文案质量评估系统,总结提出了一个通用的电商商品文案挖掘方案。今天将和大家分享京东电商平台的电商商品文案挖掘的优化实践,包括以下几方面内

苏涛:对抗样本技术在互联网安全领域的应用

导读:验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。分享内容包括三大方面:对抗样本介绍极验对抗样本技术探索与应用后续的工作与思考--01对抗样本介绍1.什么是对抗样本对抗样本(AdversarialExamples)的概念最早是ChristianSzegedy(克里斯蒂安·塞格迪)在ICLR2014(国际学习表征会议)上提出来的,即在数据集中通过故意添加细微的非随机

融360蒋宏:自动化特征工程和自动建模在风控场景的应用

01背景和问题目前,模型开发的流程越来越规范化,通常可以分为业务分析、样本准备、特征工程、模型构建、模型评估及监控这几个步骤。其中,特征工程和模型构建在建模的整个流程中依然非常耗时,并且非常依赖于模型开发者对业务的理解及数据处理的能力。在目前实际业务场景下,面临的最大的一个问题是,如何快速地构建起一个质量相对不错的模型,以适应业务的快速发展。传统的风控建模周期较长,通常要20天左右的时间才能达到上线的要求。其中,特征工程的耗时在整个建模过程中会占到大约60%的时间,且这个过程的挑战就是人工提取特征的复杂性和高时间耗费性。自动化特征工程能够对必要而繁琐的工作进行自动化处理,从而优化机器学习模型的

陈宏申:浅谈京东电商商品文案挖掘难点与优化实践

导读:在电商推荐中,除了推送商品的图片和价格信息外,文案也是商品非常重要的维度。基于编码器解码器范式的序列文本生成模型是文案挖掘的核心,但该种方法面临着两大技术挑战:一是文案生成结果不可靠和生成质量不可控,无法满足业务对电商商品文案内容可靠性的严格要求;二是序列文本生成模型经常面临数据坍塌,比较容易生成万金油式的安全文案,文案内容本身的多样性会越来越低,且无法捕捉语言本身的流行或演化趋势。针对以上两大挑战,在以文案生成系统为核心的基础上,引入了文案摘要清洗系统和文案质量评估系统,总结提出了一个通用的电商商品文案挖掘方案。今天将和大家分享京东电商平台的电商商品文案挖掘的优化实践,包括以下几方面内

天空卫士陆明:数据法在企业如何落地

导读:数据安全立法2018年9月于十三届全国人大常委会列入立法规划。经过三次审议,在2021年6月10日,十三届全国人大常委会第二十九次会议正式表决通过,并于2021年9月1日起施行。从法律角度来说,国家对于数据安全越来越重视,作为企业该如何针对数据安全法进行数据安全治理的规划,最终进行对应的技术落地?本文将分享数据法在企业的落地。主要内容包括以下几大方面:背景介绍数据安全架构——DSG框架数据安全控制——CARTA模型技术总结--01背景介绍首先来看一下近几年企业数字化转型以及数据安全的发展趋势。从2000年开始,企业经历了三个不同的阶段,分别是IT的工匠阶段、工业化阶段以及数字化时代的阶段

罗强:腾讯新闻如何处理海量商业化数据?

导读:随着信息化时代的来临,信息呈现出爆炸式的增长。尤其是在移动互联网的推动下,每天大量信息涌入让人们应接不暇,腾讯新闻客户端的出现,就是以帮助用户寻找有用信息而出现。这时,面对海量的数据、繁多的业务,如何处理手中的数据,利用数据赋能是今天会议讨论的重点。今天的介绍会围绕下面三部分展开:背景介绍海量日志处理架构数据应用举例--01背景介绍首先介绍一下腾讯新闻的背景。团队目前承担腾讯新闻客户端,体育和新闻插件的创新业务的输入,广告和用户行为的数据采集、处理、计算和分析的工作。最大的特点就是数据多、业务广。数据庞大,业务应用多样,例如数据会被用于报表展示、算法模型的训练、产品决策等场景。--02海

阿里妈妈牟娜:定向广告新一代点击率预估主模型——深度兴趣演化网络

分享嘉宾:牟娜阿里巴巴高级算法工程师编辑整理:孙锴内容来源:DataFunAITalk《定向广告新一代点击率预估主模型——深度兴趣演化网络》出品社区:DataFun导读:本次带给大家分享是阿里妈妈在2018年做的模型上的创新——深度兴趣演化网络(DeepInterestEvolutionNetwork),分享将从以下几个方面展开——提出该模型的背景及原因该模型的结构详解该模型的最终效果--01背景#1、业务形态在介绍该模型创新背景之前,先来看一下我们的业务形态:当我们打开淘宝的时候,首先呈现的是一个banner形式的广告;在首页猜你喜欢场景下,或者购物链路的其他场景下,会出现一些单品的广告:在

徐童:视频人物社交关系图生成与应用

导读:在线社交媒体平台的发展,带来了细粒度检索、视频语义摘要等媒体智能服务的巨大需求。现有的视频理解技术缺乏深入的语义线索,结合视频中人物的社交关系才能更完整、准确地理解剧情,从而提升用户体验,支撑智能应用。这里主要介绍我们将动态分析和图机器学习相结合,围绕视频中的人物社交关系网络所开展的两个最新的工作。主要内容包括:问题背景关系图生成关系图应用未来展望--01问题背景**1.现有视频理解技术缺乏深入语义线索**现有的视频理解技术更多地着眼于描述画面里人物的行为、动作、身份,很少关注更深层的语义信息。例如上图中让子弹飞的例子,现有算法理解的是“两个人坐在一起,一个人表情愤怒,另一个人表情开心”