这个星期,数据挖掘顶会ACMKDD2023在美国长滩开幕,在五天的主会议期间,大会专门给大模型准备了一整天。来自OpenAI、Meta、智谱AI、GoogleDeepMind、Microsoft、Intel等大语言模型领域走在前沿的公司及研究学者进行了精彩的思想碰撞。这也是为数不多的一次,是中国的大语言模型专家与国际巨头们同台竞技,深度交流。此次大模型开放日的Keynote演讲嘉宾包括:微软首席科学家&技术院士JaimeTeevan,OpenAIChatGPT团队成员JasonWei,智谱AICEO张鹏,谷歌DeepMind首席科学家/研究主管DennyZhou,以及MetaFAIR研究工程师
ACMSIGKDD(国际数据挖掘与知识发现大会,KDD)会议始于1989年,是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,也是首个引入大数据、数据科学、预测分析、众包等概念的会议。今年的KDD大会是第29届,于8月6日-10日在美国加州长滩举办。大会包含研究方向(Research)和应用数据科学方向(AppliedDataScience,ADS)两个track。随着会议的进行,各大奖项也开始逐一揭晓。其中来自香港中文大学、香港科技大学(广州)、东南大学、同济大学的研究者获得了研究方向最佳论文奖;来自谷歌的研究者获得了应用数据科学方向最佳论文奖;斯坦福大学(于今年1月获得学位)博士Wei
本期为大家介绍快手-社区科学线自研论文:TWIN:TWo-stageInterestNetworkforLifelongUserBehaviorModelinginCTRPredictionatKuaishou本文发表于2023年KDDAppliedDataScienceTrack(录取率25.4%),旨在解决传统的超长行为建模中长久存在的「两阶段中相似度度量标准不一致」问题,从而提升超长行为建模的精准度。作者:常健新、张晨斌、傅智毅、臧晓雪、关琳、吕静、惠轶群、冷德维、牛亚男、宋洋论文地址:https://arxiv.org/abs/2302.023521. 背景与Motivation快手,
谷歌在KDD2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新的梯度裁剪方式,提升了ranking模型的训练稳定性。下面给大家详细介绍一下这篇文章。1、模型背景本文以Youtube中的ranking模型为例,进行推荐系统ranking模型训练稳定性的分析。整体模型如下图所示,包括特征输入层、多任务共享层、每个任务私有参数层,整体包括CTR预估、CVR预估等多个任务联合训练。图片什么样的训练过程是稳定性比较差的呢?如下图所示,model-a的loss和auc曲线被文中称为micr
Abstract为了更好的推荐,不仅要对user-item交互进行建模,还要将关系信息考虑进来传统方法因子分解机将每个交互都当作一个独立的实例,但是忽略了item之间的关系(eg:一部电影的导演也是另一部电影的演员)高阶关系:用一个/多个链接属性连接两个itemKG+user-itemgraph+highorderrelations—>KGAT递归传播邻域节点(可能是users、items、attributes)的嵌入来更新自身节点的嵌入,并使用注意力机制来区分邻域节点的重要性Introductionu1u_1u1是要向其提供推荐的目标用户。黄色圆圈和灰色圆圈表示通过高阶关系发现但被传统方法
鉴于介绍新数据集和Benchmark研究往往需要不同于常规论文的评审标准,计算机视觉和自然语言处理领域,以及最近的NeurIPS会议,都有专门致力于建立新Benchmark数据集和任务的ConferenceTrack。然而在图机器学习领域,我们还没有类似的发表渠道。WorkshoponGraphLearningBenchmarks(GLB)致力于征集新的图机器学习任务或新的图结构数据集方面的贡献,这些任务和数据有潜力(i)帮助理解图表示模型在不同问题集合上的性能和局限性;(ii)为各种模型提供Benchmark评估支持。我们还欢迎基于Data-Cenetric方法的图学习的贡献,例如收集、注释
NSL-KDD数据集是著名的KDD’99数据集的修订版本,该数据集由四个子数据集组成:KDDTest+、KDDTest-21、KDDTrain+、KDDTrain+_20Percent。其中KDDTest-21和KDDTrain+_20Percent是KDDTrain+和KDDTest+的子集。数据集每条记录包含43个特征,其中41个特征指的是流量输入本身,最后两个是标签(正常或攻击)和分数(流量输入本身的严重性)。数据集中存在4种不同类型的攻击:拒绝服务(DoS)、探测、用户到根(U2R)和远程到本地(R2L)。每种攻击的简要说明如下:DoS是一种尝试关闭进出目标系统的流量的攻击。IDS被系
NSL-KDD数据集是著名的KDD’99数据集的修订版本,该数据集由四个子数据集组成:KDDTest+、KDDTest-21、KDDTrain+、KDDTrain+_20Percent。其中KDDTest-21和KDDTrain+_20Percent是KDDTrain+和KDDTest+的子集。数据集每条记录包含43个特征,其中41个特征指的是流量输入本身,最后两个是标签(正常或攻击)和分数(流量输入本身的严重性)。数据集中存在4种不同类型的攻击:拒绝服务(DoS)、探测、用户到根(U2R)和远程到本地(R2L)。每种攻击的简要说明如下:DoS是一种尝试关闭进出目标系统的流量的攻击。IDS被系
一、摘要学习复杂网络上的连续时间动态对于理解、预测和控制科学和工程中的复杂系统至关重要。然而,由于高维系统结构中的组合复杂性、它们难以捉摸的连续时间非线性动力学以及它们的结构-动力学依赖性,使得这项任务非常具有挑战。为了解决这些挑战,我们提出将常微分方程系统(ODEs)和图神经网络(GNNs)相结合,以数据驱动的范式来学习复杂网络上的连续时间动态变化。我们用GNN来建模微分方程系统。我们并未在前向过程中使用离散数量的神经网络层进行映射,而是在连续时间上数值地整合GNN层,从而捕获图上的连续时间动态。我们的模型可以解释为连续时间GNN模型或图神经ode模型。我们的模型可以用于:连续时间网络动态预
Cascade-LSTM是一个用于虚假信息级联检测的树结构神经分类器,它本质上是一个谣言(假新闻)检测模型,它将谣言检测任务视为一个树分类问题。 Cascade-LSTM在递归神经网络(本文具体基于TreeLSTM,即树结构的LSTM)的基础上,引入了一个双向的TreeLSTM结构来沿着传播树结构进行自底向上和自顶向下的遍历来编码传播树节点的用户特征。 具体地,Cascade-LSTM先从叶节点向根节点自底向上地遍历,更新节点特征,然后再从根节点向叶节点遍历-以自底向上的隐状态向量、节点特征和父节点的隐状态向量为输入,再次更新节点特征,以编码节点间的上下文依赖关系,来沿着传播树结