草庐IT

我不建议你抄大厂的用户画像,为什么?

​看到用户画像的标题,熟悉陈老师的同学就知道:我又要写标签建设的文章了。是滴,再厉害的用户画像也是一个个标签组成的,而标签建设恰好是当前非互联网大厂进行用户画像建设的最大瓶颈。一、指望不上的用户标签几乎所有的互联网大厂的用户画像体系,都是在用户标签基础上搭起来的。而用户标签又是以用户行为为基础的。为了采集庞大的用户行为,为了基于用户行为做推荐,各大厂还搭建了庞大的数据计算平台,这也是目前朋友圈最流行的《XX大厂用户画像建设实战》之类文章主要思路。而对非互联网大厂而言,信了这套,会扑街。特别是传统企业。为啥?因为:头腾阿美滴们,本质上是垄断流量的平台。用户数量、用户活跃程度、用户行为丰富程度,与

我不建议你抄大厂的用户画像,为什么?

​看到用户画像的标题,熟悉陈老师的同学就知道:我又要写标签建设的文章了。是滴,再厉害的用户画像也是一个个标签组成的,而标签建设恰好是当前非互联网大厂进行用户画像建设的最大瓶颈。一、指望不上的用户标签几乎所有的互联网大厂的用户画像体系,都是在用户标签基础上搭起来的。而用户标签又是以用户行为为基础的。为了采集庞大的用户行为,为了基于用户行为做推荐,各大厂还搭建了庞大的数据计算平台,这也是目前朋友圈最流行的《XX大厂用户画像建设实战》之类文章主要思路。而对非互联网大厂而言,信了这套,会扑街。特别是传统企业。为啥?因为:头腾阿美滴们,本质上是垄断流量的平台。用户数量、用户活跃程度、用户行为丰富程度,与

如何构建好的用户画像平台?

一、画像平台产品架构上图是基于快看数据中台画像平台产品的理解和定位整理出来的产品架构。画像平台首先是服务于业务的,运营可以基于画像平台对单个用户或者人群包做画像的洞察,平台服务的业务应用层包含:(1)个性化推荐:它对画像的使用是非常重的,能够基于每个用户的画像去做千人千面的内容分发。(2)精细化运营:产品运营对用户做精细化营销的时候,会使用画像平台的人群圈选,依赖平台的人群洞察分析能力。(3)精准营销:商业化侧如精准营销,会依赖画像平台,针对内容或者产品特点,精准触达一定偏好的用户,提高营销效率。(4)获客推广:渠道获客推广对画像平台的应用也非常多,依赖也很重。画像平台产品服务层的功能一般包含

如何构建好的用户画像平台?

一、画像平台产品架构上图是基于快看数据中台画像平台产品的理解和定位整理出来的产品架构。画像平台首先是服务于业务的,运营可以基于画像平台对单个用户或者人群包做画像的洞察,平台服务的业务应用层包含:(1)个性化推荐:它对画像的使用是非常重的,能够基于每个用户的画像去做千人千面的内容分发。(2)精细化运营:产品运营对用户做精细化营销的时候,会使用画像平台的人群圈选,依赖平台的人群洞察分析能力。(3)精准营销:商业化侧如精准营销,会依赖画像平台,针对内容或者产品特点,精准触达一定偏好的用户,提高营销效率。(4)获客推广:渠道获客推广对画像平台的应用也非常多,依赖也很重。画像平台产品服务层的功能一般包含

推荐系统实战——自动化构建用户以及物料画像

自动化构建用户以及物料画像​​自动化构建用户以及物料画像​​​​意义​​​​新物料来源​​​​物料画像的更新​​​​物料更新添加入redis​​​​合并,物料画像构建逻辑​​​​用户侧画像的构建​​​​画像自动化构建​​​​用户画像更新脚本:process_user.py​​​​最后将上面三个脚本穿起来的shell脚本offline_material_and_user_process.sh​​​​crontab定时任务:​​自动化构建用户以及物料画像意义离线自动化构建用户和物料的画像,这部分内容在新闻推荐系统中是为系统源源不断添加新物料的途径,由于我们的物料是通过爬虫获取的,所以还需要对爬取的

推荐系统实战——自动化构建用户以及物料画像

自动化构建用户以及物料画像​​自动化构建用户以及物料画像​​​​意义​​​​新物料来源​​​​物料画像的更新​​​​物料更新添加入redis​​​​合并,物料画像构建逻辑​​​​用户侧画像的构建​​​​画像自动化构建​​​​用户画像更新脚本:process_user.py​​​​最后将上面三个脚本穿起来的shell脚本offline_material_and_user_process.sh​​​​crontab定时任务:​​自动化构建用户以及物料画像意义离线自动化构建用户和物料的画像,这部分内容在新闻推荐系统中是为系统源源不断添加新物料的途径,由于我们的物料是通过爬虫获取的,所以还需要对爬取的

当大火的文图生成模型遇见知识图谱,AI画像趋近于真实世界

作者:朱祥茹、段忠杰、汪诚愚、黄俊导读用户生成内容(UserGeneratedContent,UGC)是互联网上多模态内容的重要组成部分,UGC数据级的不断增长促进了各大多模态内容平台的繁荣。在海量多模态数据和深度学习大模型的加持下,AI生成内容(AIGeneratedContent,AIGC)呈现出爆发性增长趋势。其中,文图生成(Text-to-imageGeneration)任务是流行的跨模态生成任务,旨在生成与给定文本对应的图像。典型的文图模型例如OpenAI开发的DALL-E和DALL-E2。近期,业界也训练出了更大、更新的文图生成模型,例如Google提出的Parti和Imagen,

当大火的文图生成模型遇见知识图谱,AI画像趋近于真实世界

作者:朱祥茹、段忠杰、汪诚愚、黄俊导读用户生成内容(UserGeneratedContent,UGC)是互联网上多模态内容的重要组成部分,UGC数据级的不断增长促进了各大多模态内容平台的繁荣。在海量多模态数据和深度学习大模型的加持下,AI生成内容(AIGeneratedContent,AIGC)呈现出爆发性增长趋势。其中,文图生成(Text-to-imageGeneration)任务是流行的跨模态生成任务,旨在生成与给定文本对应的图像。典型的文图模型例如OpenAI开发的DALL-E和DALL-E2。近期,业界也训练出了更大、更新的文图生成模型,例如Google提出的Parti和Imagen,