导读:在公司内部,业务线经常面临数据有哪些、质量如何、是否可用、能产生多大价值的困惑,并且,随着数据量的增加,计算和存储资源面临瓶颈。本次将围绕数据治理重点关注的计算、存储等方面,分享数据治理的产品实践。通过分享,一方面可以了解当前业务线主要面临的待治理的数据问题;另一方面,从计算、存储等主要方面,了解数据治理需要重点关注的内容,同时,对数据治理的整体产品实践有宏观的认识,对内部业务线的数据治理提供针对性的建议。本次分享将主要包括以下几大方面:过往数据治理回顾当前治理痛点产品整体策略未来规划--01过往数据治理回顾这部分主要介绍网易内部业务线,包括严选、传媒和音乐,做数据治理工作中遇到的问题、
分享嘉宾:叶聪腾讯技术专家编辑整理:张智跃内容来源:DataFunAITalk「智能技术前沿实践分享」出品社区:DataFun导读:本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分:1、朋友圈爆款活动背后的秘密;2、计算机视觉基础;3、曾经的图像处理方法-传统学习方法;4、图像处理的爆发-深度学习方法;5、解析云端AI能力支撑;6、技能进阶。--01朋友圈爆款活动背后的秘密下图是五四青年节的活动,一个人脸匹配的游戏,其中使用的就是人脸识别的算法。大家上传自己的照片,就能匹配到民国时期的一些人物,然后以一种有趣的方式分享
导读:本文主要介绍了快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开:快手推荐系统CTR模型——PPNet多domain多任务学习框架短期行为序列建模长期行为序列建模千亿特征,万亿参数模型总结和展望--01快手推荐系统快手的推荐系统类似于一个信息检索范式,只不过没有用户显示query。结构为数据漏斗,候选集有百亿量级的短视频,在召回层,会召回万级的视频给粗排打分,再选取数百个短视频,给精排模型打分,最后会有数十个短视频进行重排。推荐主要是双类或单类,快手推荐的特点是用户比较多,会超过3.0亿。我们的短视频,每天有百亿的分发量,候选的短视
分享嘉宾:张政京东算法工程师编辑整理:AMS周金星出品平台:DataFunTalk导读:内容生态建设是近几年互联网快速发展的关键动因,也是AI化的重点方向之一。本文主要分享在京东广告业务下内容理解体系的建设情况,从标签化、内容准入、质量美学评价等多个角度探讨内容理解能力的应用;同时整体介绍智能创意助力广告内容生态建设,从内容理解到内容生成(视频、图片、文案),再到内容分发,并穿插OCR、智能抠图、多模态等相关的基础前沿算法能力。本文将围绕以下几部分进行展开:背景介绍内容理解体系智能内容生成创意优选&分发业务落地--01背景介绍&问题定义为什么要做智能创意?由图可见,从04年开始内容化生态逐步崛
导读:本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括:什么是湖仓一体架构哔哩哔哩目前的湖仓一体架构湖仓一体架构下,数据的排序组织优化湖仓一体架构下,索引增强与优化的实践探索--01什么是湖仓一体当我们讲湖仓一体时,涉及到数据湖和数据仓库两个概念。什么是数据湖?通常来说,它有以下几个特点:有一个统一的存储系统,所有的数据都放到这个统一的存储系统里,没有数据孤岛。支持任意数据类型,比较自由,包括结构化、半结构化和非结构化的数据。这些不同类型的数据都可以统一放到存储系统里。对于多个计算引擎是开放的,包括实时、离线的分析等,计算引擎很丰富。有比较灵活
导读:在公司内部,业务线经常面临数据有哪些、质量如何、是否可用、能产生多大价值的困惑,并且,随着数据量的增加,计算和存储资源面临瓶颈。本次将围绕数据治理重点关注的计算、存储等方面,分享数据治理的产品实践。通过分享,一方面可以了解当前业务线主要面临的待治理的数据问题;另一方面,从计算、存储等主要方面,了解数据治理需要重点关注的内容,同时,对数据治理的整体产品实践有宏观的认识,对内部业务线的数据治理提供针对性的建议。本次分享将主要包括以下几大方面:过往数据治理回顾当前治理痛点产品整体策略未来规划--01过往数据治理回顾这部分主要介绍网易内部业务线,包括严选、传媒和音乐,做数据治理工作中遇到的问题、
分享嘉宾:叶聪腾讯技术专家编辑整理:张智跃内容来源:DataFunAITalk「智能技术前沿实践分享」出品社区:DataFun导读:本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分:1、朋友圈爆款活动背后的秘密;2、计算机视觉基础;3、曾经的图像处理方法-传统学习方法;4、图像处理的爆发-深度学习方法;5、解析云端AI能力支撑;6、技能进阶。--01朋友圈爆款活动背后的秘密下图是五四青年节的活动,一个人脸匹配的游戏,其中使用的就是人脸识别的算法。大家上传自己的照片,就能匹配到民国时期的一些人物,然后以一种有趣的方式分享
导读:本文主要介绍了快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开:快手推荐系统CTR模型——PPNet多domain多任务学习框架短期行为序列建模长期行为序列建模千亿特征,万亿参数模型总结和展望--01快手推荐系统快手的推荐系统类似于一个信息检索范式,只不过没有用户显示query。结构为数据漏斗,候选集有百亿量级的短视频,在召回层,会召回万级的视频给粗排打分,再选取数百个短视频,给精排模型打分,最后会有数十个短视频进行重排。推荐主要是双类或单类,快手推荐的特点是用户比较多,会超过3.0亿。我们的短视频,每天有百亿的分发量,候选的短视
分享嘉宾:张政京东算法工程师编辑整理:AMS周金星出品平台:DataFunTalk导读:内容生态建设是近几年互联网快速发展的关键动因,也是AI化的重点方向之一。本文主要分享在京东广告业务下内容理解体系的建设情况,从标签化、内容准入、质量美学评价等多个角度探讨内容理解能力的应用;同时整体介绍智能创意助力广告内容生态建设,从内容理解到内容生成(视频、图片、文案),再到内容分发,并穿插OCR、智能抠图、多模态等相关的基础前沿算法能力。本文将围绕以下几部分进行展开:背景介绍内容理解体系智能内容生成创意优选&分发业务落地--01背景介绍&问题定义为什么要做智能创意?由图可见,从04年开始内容化生态逐步崛
导读:本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括:什么是湖仓一体架构哔哩哔哩目前的湖仓一体架构湖仓一体架构下,数据的排序组织优化湖仓一体架构下,索引增强与优化的实践探索--01什么是湖仓一体当我们讲湖仓一体时,涉及到数据湖和数据仓库两个概念。什么是数据湖?通常来说,它有以下几个特点:有一个统一的存储系统,所有的数据都放到这个统一的存储系统里,没有数据孤岛。支持任意数据类型,比较自由,包括结构化、半结构化和非结构化的数据。这些不同类型的数据都可以统一放到存储系统里。对于多个计算引擎是开放的,包括实时、离线的分析等,计算引擎很丰富。有比较灵活