草庐IT

预测评估

全部标签

做完GPT-4完整测评,微软爆火论文称初版AGI就快来了

1956年,在达特茅斯学院召开的一个研讨会上,人工智能这一概念正式被提出。之后这个词一直挑战着心理学家、哲学家和计算机科学家,因为它太难被定义了。1994年,52名心理学家联合发文试图捕捉它的本质。随着时间的推移,研究者开始将注意力转移到特定领域的AI系统,如2016年AlphaGo挑战韩国冠军棋手大获全胜。之后,时间来到20世纪90年代末和21世纪初,研究者不满足于专用AI,因此开发更通用的人工智能系统呼声越来越高。随之而来的是,通用人工智能(AGI)一词开始在2000年代初期流行起来。最近一段时间,如大家所见,大型语言模型(LLM)走到聚光灯下,这些神经网络基于Transformer架构,

基于深度学习的短文本相似度学习与行业测评

文本相似度计算作为NLP的热点研究方向之一,在搜索推荐、智能客服、闲聊等领域得到的广泛的应用。在不同的应用领域,也存在着一定的差异,例如在搜索领域大多是计算query与document的相似度;而在智能客服、聊天领域更注重的是query与query之间的匹配,即短文本之间的相似度计算。不同的文本长度,相似度的计算方案也存在差异,长文本匹配更多注重文本的关键词或者主题的匹配,业界使用的较多的算法如:TF-IDF、LSA、LDA;而短文本匹配更多的是句子整体的语义一致性,业界较为主流的算法有:word2vec、esim、abcnn、bert等深度模型。相比于长文本的相似度计算,短文本的相似度计算存

基于深度学习的短文本相似度学习与行业测评

文本相似度计算作为NLP的热点研究方向之一,在搜索推荐、智能客服、闲聊等领域得到的广泛的应用。在不同的应用领域,也存在着一定的差异,例如在搜索领域大多是计算query与document的相似度;而在智能客服、聊天领域更注重的是query与query之间的匹配,即短文本之间的相似度计算。不同的文本长度,相似度的计算方案也存在差异,长文本匹配更多注重文本的关键词或者主题的匹配,业界使用的较多的算法如:TF-IDF、LSA、LDA;而短文本匹配更多的是句子整体的语义一致性,业界较为主流的算法有:word2vec、esim、abcnn、bert等深度模型。相比于长文本的相似度计算,短文本的相似度计算存

开源测试平台横向测评系列『流马』篇:测试界的“木牛流马”

前言我是从今年5月份第一次接触流马这个平台。第一次听到这个名字的时候,就觉得挺有趣的,猜测其名字应该是取自诸葛亮的“木牛流马”,后来和作者证实了一下,确实如此。当初诸葛亮发明木牛流马是为了提高运输效率,而流马测试平台是为了提高测试效率,可以说这个名字取得“恰到好处”。本文一万两千字左右,我写了好多天,可能是我耗时最久的一篇文章。其实写文章不是最难的,难的是边学习、边摸索、边踩坑、边解决问题、边写文章记录、边总结。所以写得还算是比较用心的,整体来说也比较详细。读起来可能会有点长,大家可以先关注收藏、后期有时间、空下来了再照着文章内容仔细研究。内容大致分为以下四个部分:【简介篇】项目概述:技术栈、

开源测试平台横向测评系列『流马』篇:测试界的“木牛流马”

前言我是从今年5月份第一次接触流马这个平台。第一次听到这个名字的时候,就觉得挺有趣的,猜测其名字应该是取自诸葛亮的“木牛流马”,后来和作者证实了一下,确实如此。当初诸葛亮发明木牛流马是为了提高运输效率,而流马测试平台是为了提高测试效率,可以说这个名字取得“恰到好处”。本文一万两千字左右,我写了好多天,可能是我耗时最久的一篇文章。其实写文章不是最难的,难的是边学习、边摸索、边踩坑、边解决问题、边写文章记录、边总结。所以写得还算是比较用心的,整体来说也比较详细。读起来可能会有点长,大家可以先关注收藏、后期有时间、空下来了再照着文章内容仔细研究。内容大致分为以下四个部分:【简介篇】项目概述:技术栈、