草庐IT

基于深度学习的短文本相似度学习与行业测评

文本相似度计算作为NLP的热点研究方向之一,在搜索推荐、智能客服、闲聊等领域得到的广泛的应用。在不同的应用领域,也存在着一定的差异,例如在搜索领域大多是计算query与document的相似度;而在智能客服、聊天领域更注重的是query与query之间的匹配,即短文本之间的相似度计算。不同的文本长度,相似度的计算方案也存在差异,长文本匹配更多注重文本的关键词或者主题的匹配,业界使用的较多的算法如:TF-IDF、LSA、LDA;而短文本匹配更多的是句子整体的语义一致性,业界较为主流的算法有:word2vec、esim、abcnn、bert等深度模型。相比于长文本的相似度计算,短文本的相似度计算存

SQL笔记--MySQL高级操作

MySQL高级SQL操作数据新增多数据插入蠕虫复制主键冲突查询数据查询选项别名数据源where子句groupby子句having子句orderby子句limit子句更新数据限制更新删除数据限制删除数据清除1、统计不同班级的人数信息按照现有SQL操作,即便数据表已经存在数据,但是我们也无法通过SQL实现,只能取出来后通过其他代码对数据进行加工实现通过高级SQL学习,我们就可以通过一条SQL指令完成操作selectcount(*),班级IDfrom学生表groupby班级ID;一、数据新增批量插入蠕虫复制主键冲突冲突更新冲突替换1、批量插入批量插入:是一种优化数据逐条插入的方式批量插入数据的语法与

【推荐】MySQL数据库设计SQL规范

1命名规范1、【强制】库名、表名、字段名必须使用小写字母并采用下划线分割,禁止拼音英文混用;(禁用-,-相当于运算符)2、【建议】库名、表名、字段名在满足业务需求的条件下使用最小长度;如information-->info;address-->addr等3、【强制】库名、表名、字段名禁止使用MySQL保留关键字,如from,table等详见​​https://dev.mysql.com/doc/refman/5.7/en/keywords.html​​4、【强制】临时库、临时表名必须以tmp为前缀并以日期为后缀,例如tmp_user_20201231;5、【强制】备份库、备份表名必须以bak为

使用腾讯云SSL证书,免费给个人网站开启HTTPS防护

大家好,这里是程序员晚枫。之前给大家介绍了​​如何通过DNS解析把自己的域名绑定到腾讯云服务器上​​,在使用的过程中我发现了一个问题:域名的访问协议有http和https(更加安全)。我现在有2个域名:python-office.com和python4office.cn,在不开启https的情况下,①以.cn为结尾的python4office.cn所有的浏览器都可以打开;②但是以.com结尾的python-office.com则存在:部分浏览器默认使用https进行访问导致打不开网页的问题。在这种情况下,就必须给python-office.com加上ssl证书,这样就可以对​​https://

Intellij IDEA配置Tomcat并创建JavaWeb项目

IntellijIDEA配置Tomcat并创建JavaWeb项目​​IntellijIDEA配置Tomcat并创建JavaWeb项目​​​​一、实验环境​​二、说明​​三、Web项目搭建​​​​四、运行Web项目​​一、实验环境​​Win10​​​​IntellijIDEA2019.2​​​​Tomcat9.0​​二、说明IntellijIDEA使用的是Ultimate版本(终极版),社区版是不能开发Web项目的此处使用的是「IntellijIDEA2019.2」其他新版本的Web项目搭建过程是差不多的,仔细一点即可使用macOS系统的也是相差无几三、Web项目搭建1、创建一个空项目2、点击n

SQL笔记--MySQL高级操作

MySQL高级SQL操作数据新增多数据插入蠕虫复制主键冲突查询数据查询选项别名数据源where子句groupby子句having子句orderby子句limit子句更新数据限制更新删除数据限制删除数据清除1、统计不同班级的人数信息按照现有SQL操作,即便数据表已经存在数据,但是我们也无法通过SQL实现,只能取出来后通过其他代码对数据进行加工实现通过高级SQL学习,我们就可以通过一条SQL指令完成操作selectcount(*),班级IDfrom学生表groupby班级ID;一、数据新增批量插入蠕虫复制主键冲突冲突更新冲突替换1、批量插入批量插入:是一种优化数据逐条插入的方式批量插入数据的语法与