草庐IT

从NLP视角看电视剧《狂飙》,会有什么发现?

目录1、背景2、数据获取3、文本分析与可视化3.1短评数据预处理3.2词云图可视化3.3top关键词共现矩阵网络3.4《狂飙》演职员图谱构建4、短评相关数据分析与可视化5、总结原文首发于微信公众号:实用自然语言处理作者:风兮建议查看原文:https://mp.weixin.qq.com/s/nURcYKN6vRBKjbMXAUbEng关键词:爬虫、文本数据预处理、数据分析、可视化、自然语言处理摘要:本文主要内容,获取解析豆瓣《狂飙》的短评相关数据和演职员信息,在数据预处理后,进行简单的数据分析和可视化展示。本文全部代码路径:https://github.com/fengxi177/pnlp20

流量录制回放工具jvm-sandbox-repeater入门篇——服务部署

趋于当前技术不断更新、产品功能多元化之下,流量回放的热度也是越来越高。在前一段时间,测试团队也提到阿里开源的流量回放工具jvm-sandbox-repeater我个人就先尝试一下,期间还是遇到一些问题,通过咨询和度娘的帮助下,整体功能的使用流程是跑通了。jvm-sandbox-repeater简介在聊之前,我们先来了解下jvm-sandbox-repeater,其实在官网上也有详细的介绍,这里就直接搬官网的吧jvm-sandbox-repeater是JVM-Sandbox生态体系下的重要模块,它具备了JVM-Sandbox的所有特点,插件式设计便于快速适配各种中间件,封装请求录制/回放基础协议

利用workerman构建一个客服系统(2)

前言从上一小结中我们快速入门了workerman中的GatewayWorker的初步使用.接下来我们继续深入的使用GatewayWorker.长连接绑定用户id实现实现一对一客服聊天背景我们从下载的Event源代码中会看到Gateway::sendToAll("$client_idlogin\r\n");这样一行代码,这行代码的意思是向所有人发送当前用户已登录的消息通知,但是这样是不太符合现实需求的.我们如何实现一对一发送消息给指定用户,而不需要向所有用户发送消息实现思路1.首先改在GateWayWoker下的Event源码首先注释掉该行代码Gateway::sendToAll("$clien

流量录制回放工具jvm-sandbox-repeater入门篇——服务部署

趋于当前技术不断更新、产品功能多元化之下,流量回放的热度也是越来越高。在前一段时间,测试团队也提到阿里开源的流量回放工具jvm-sandbox-repeater我个人就先尝试一下,期间还是遇到一些问题,通过咨询和度娘的帮助下,整体功能的使用流程是跑通了。jvm-sandbox-repeater简介在聊之前,我们先来了解下jvm-sandbox-repeater,其实在官网上也有详细的介绍,这里就直接搬官网的吧jvm-sandbox-repeater是JVM-Sandbox生态体系下的重要模块,它具备了JVM-Sandbox的所有特点,插件式设计便于快速适配各种中间件,封装请求录制/回放基础协议

利用workerman构建一个客服系统(2)

前言从上一小结中我们快速入门了workerman中的GatewayWorker的初步使用.接下来我们继续深入的使用GatewayWorker.长连接绑定用户id实现实现一对一客服聊天背景我们从下载的Event源代码中会看到Gateway::sendToAll("$client_idlogin\r\n");这样一行代码,这行代码的意思是向所有人发送当前用户已登录的消息通知,但是这样是不太符合现实需求的.我们如何实现一对一发送消息给指定用户,而不需要向所有用户发送消息实现思路1.首先改在GateWayWoker下的Event源码首先注释掉该行代码Gateway::sendToAll("$clien

Doris记录服务接口调用情况

背景公司的一个项目,需要记录某个接口的访问pv、uv,并且不能丢失明细数据,需要记录【用户,调用接口,调用详情,调用时间,调用次数】之前使用MySQL记录,每来一条记录一条,例如:insertintolog(id,user_id,resource_id,stat_date,view_count)values(default,user_id,view_id,'2022-06-11',1)存在的问题是没过多久MySQL中数据量级就到达千万,没法在毫秒的时间内返回结果使用MySQL中的明细数据进行聚合分析也非常的慢Doris聚合模型首先简单介绍下Doris,它是一个MPP数据库,一般是数据仓库进行多

Doris记录服务接口调用情况

背景公司的一个项目,需要记录某个接口的访问pv、uv,并且不能丢失明细数据,需要记录【用户,调用接口,调用详情,调用时间,调用次数】之前使用MySQL记录,每来一条记录一条,例如:insertintolog(id,user_id,resource_id,stat_date,view_count)values(default,user_id,view_id,'2022-06-11',1)存在的问题是没过多久MySQL中数据量级就到达千万,没法在毫秒的时间内返回结果使用MySQL中的明细数据进行聚合分析也非常的慢Doris聚合模型首先简单介绍下Doris,它是一个MPP数据库,一般是数据仓库进行多

SpringCloud微服务实战——搭建企业级开发框架(五十):集成移动端推送功能的系统通知公告数据库设计

  系统的通知公告功能似乎是很容易被忽略的功能模块,在传统的软件系统中,一般OA类软件系统不可或缺,而在应用软件系统中此功能或有或无,在现在大多数的互联网软件系统中,此功能又必不可缺。所以,在框架设计时,我们需要考虑业务系统是否需要此功能模块,然后将此功能作为扩展插件,在需要时开启,在不需要时配置关闭即可。  在系统公告设计之前,我们需要综合考虑目前系统通知公告功能都有哪些类型和实现方式。在类型方面如果是电商类网站,那么系统的通知公告有账户变动通知、物流变动通知、订单变动通知等等;如果是OA类系统,那么系统的通知公告有待办事项、审批通知、公司公告通知等等;在实现方式方面,有站内通知、短信通知、

SpringCloud微服务实战——搭建企业级开发框架(五十):集成移动端推送功能的系统通知公告数据库设计

  系统的通知公告功能似乎是很容易被忽略的功能模块,在传统的软件系统中,一般OA类软件系统不可或缺,而在应用软件系统中此功能或有或无,在现在大多数的互联网软件系统中,此功能又必不可缺。所以,在框架设计时,我们需要考虑业务系统是否需要此功能模块,然后将此功能作为扩展插件,在需要时开启,在不需要时配置关闭即可。  在系统公告设计之前,我们需要综合考虑目前系统通知公告功能都有哪些类型和实现方式。在类型方面如果是电商类网站,那么系统的通知公告有账户变动通知、物流变动通知、订单变动通知等等;如果是OA类系统,那么系统的通知公告有待办事项、审批通知、公司公告通知等等;在实现方式方面,有站内通知、短信通知、

使用python爬取豆瓣电影短评评论内容

需求:爬取豆瓣电影短评评论文本内容目标:将爬取的文本存入excel中爬虫步骤:1.拼接分页网址,循环请求分页数据,获取HTML代码2.分析获取到的HTML代码,解析出所需要的数据,提取内容3.存储爬取到的数据准备工作:1.开发工具pycharm2.模块requests、bs4或pyquery 爬虫实际流程:第一步:我们从豆瓣电影中选取一部电影(https://movie.douban.com/subject/35766491/),进入短评列表页面(https://movie.douban.com/subject/35766491/comments?status=P)第二步:打开f12开发者工具