草庐IT

新浪微博

全部标签

【技术流吃瓜】python可视化大屏舆情分析“张天爱“事件微博评论

目录一、事件背景二、微热点分析二、自开发Python舆情分析2.1Python爬虫2.2可视化大屏2.2.1大标题2.2.2词云图2.2.3条形图2.2.4饼图(玫瑰图)2.2.5地图三、演示视频四、完整源码一、事件背景大家好,我是马哥python说,一枚10年程序猿。演员张天爱于2022.8.25号在网上爆出一段音频"惯犯,希望所以女孩擦亮眼睛。"至今已有2.5亿次观看量,瞬间冲上热搜。二、微热点分析以下数据来源:微热点从舆情分析网站上来看,从热度指数的变化趋势来看,"张天爱"的热度在08月25日22时达到了92.56的峰值。"张天爱"全网热度:"张天爱"网络媒体的评价指标:"张天爱"关键词

数据采集实战(六)-- 新浪新闻

1.概述新闻是我们了解外界的重要渠道,以前,我们一般通过报纸和电视来获取新闻,那时候,获取新闻不仅有一定的成本,效率还不高。而如今,获取新闻的途径太多太方便了,大量重复的新闻充斥着各大平台,获取新闻已经没有什么成本,问题变成了过滤和鉴别新闻的可信程度。下面用【新浪新闻】作为采集对象,抛砖引玉,演示下新闻从采集到分析的整个过程。2.采集流程主要流程分为4个步骤:2.1采集从新浪滚动新闻页面中,找出获取新闻的API,然后,并发的采集新闻。这里为了简单起见,主要采集了新闻标题和摘要信息。#-*-coding:utf-8-*-importrequestsimportcsvimporttimeimpor

数据采集实战(六)-- 新浪新闻

1.概述新闻是我们了解外界的重要渠道,以前,我们一般通过报纸和电视来获取新闻,那时候,获取新闻不仅有一定的成本,效率还不高。而如今,获取新闻的途径太多太方便了,大量重复的新闻充斥着各大平台,获取新闻已经没有什么成本,问题变成了过滤和鉴别新闻的可信程度。下面用【新浪新闻】作为采集对象,抛砖引玉,演示下新闻从采集到分析的整个过程。2.采集流程主要流程分为4个步骤:2.1采集从新浪滚动新闻页面中,找出获取新闻的API,然后,并发的采集新闻。这里为了简单起见,主要采集了新闻标题和摘要信息。#-*-coding:utf-8-*-importrequestsimportcsvimporttimeimpor

【python爬虫案例】爬取微博任意搜索关键词的结果,以“唐山打人”为例

目录一、爬取目标二、展示爬取结果三、讲解代码四、同步视频4.1演示视频4.2讲解视频五、附:完整源码一、爬取目标大家好,我是马哥。今天分享一期python爬虫案例,爬取目标是新浪微博的微博数据,包含:页码,微博id,微博bid,微博作者,发布时间,微博内容,转发数,评论数,点赞数经过分析调研,发现微博有3种访问方式,分别是:PC端网页:https://weibo.com/移动端:https://weibo.cn/手机端:https://m.weibo.cn/最终决定,通过手机端爬取。这里,给大家分享一个爬虫小技巧。当目标网站既存在PC网页端,又有手机移动端,建议爬取移动端,原因是:移动端一般网

【python爬虫案例】爬取微博任意搜索关键词的结果,以“唐山打人”为例

目录一、爬取目标二、展示爬取结果三、讲解代码四、同步视频4.1演示视频4.2讲解视频五、附:完整源码一、爬取目标大家好,我是马哥。今天分享一期python爬虫案例,爬取目标是新浪微博的微博数据,包含:页码,微博id,微博bid,微博作者,发布时间,微博内容,转发数,评论数,点赞数经过分析调研,发现微博有3种访问方式,分别是:PC端网页:https://weibo.com/移动端:https://weibo.cn/手机端:https://m.weibo.cn/最终决定,通过手机端爬取。这里,给大家分享一个爬虫小技巧。当目标网站既存在PC网页端,又有手机移动端,建议爬取移动端,原因是:移动端一般网

AIGC、数字人、ChatGPT:人工智能新浪潮,比移动互联网大十倍

 毫不夸张地说,投资行业正在进入“地狱模式”,3000家投资机构正在疯狂看项目。在人工智能行业,由于技术的发展,正在迎来新的投资机遇,在这个过程中,相关公司很容易“拿到大钱”,有投资人确信,这个趋势将持续10年。 @数科星球原创 作者丨苑晶编辑丨十里香 一位不愿意透露姓名的投资人拨打了数科星球(ID:digital-planet)的电话,在他的认知中,如今投资机构行业正在掀起一股人工智能的投资新浪潮。最快项目过会时间已缩短至两个月,并且这仅仅是刚开始。 结合多天以来我们在投资圈得到的信息,印证了上述事实。在疫情放开的当下,虽然人们的消费还未恢复,但在数字经济领域,一场大爆发已经在酝酿。 日前,

AIGC、数字人、ChatGPT:人工智能新浪潮,比移动互联网大十倍

 毫不夸张地说,投资行业正在进入“地狱模式”,3000家投资机构正在疯狂看项目。在人工智能行业,由于技术的发展,正在迎来新的投资机遇,在这个过程中,相关公司很容易“拿到大钱”,有投资人确信,这个趋势将持续10年。 @数科星球原创 作者丨苑晶编辑丨十里香 一位不愿意透露姓名的投资人拨打了数科星球(ID:digital-planet)的电话,在他的认知中,如今投资机构行业正在掀起一股人工智能的投资新浪潮。最快项目过会时间已缩短至两个月,并且这仅仅是刚开始。 结合多天以来我们在投资圈得到的信息,印证了上述事实。在疫情放开的当下,虽然人们的消费还未恢复,但在数字经济领域,一场大爆发已经在酝酿。 日前,

大数据分析案例-基于逻辑回归算法构建微博评论情感分类模型

?‍♂️个人主页:@艾派森的个人主页✍?作者简介:Python学习者?希望大家多多支持,我们一起进步!?如果文章对你有帮助的话,欢迎评论?点赞??收藏?加关注+喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章大数据分析案例合集大数据分析案例-基于随机森林算法预测人类预期寿命大数据分析案例-基于随机森林算法的商

大数据分析案例-基于逻辑回归算法构建微博评论情感分类模型

?‍♂️个人主页:@艾派森的个人主页✍?作者简介:Python学习者?希望大家多多支持,我们一起进步!?如果文章对你有帮助的话,欢迎评论?点赞??收藏?加关注+喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章大数据分析案例合集大数据分析案例-基于随机森林算法预测人类预期寿命大数据分析案例-基于随机森林算法的商

Python——实现微博评论情绪分析(生成情绪时空分布地图(pyecharts))

情绪理解是文本处理里最常见任务之一。现提供一个五类情绪字典(由情绪词组成,5个文件,人工标注),实现一个情绪分析工具,并利用该工具对10000条新浪微博进行测试和分析(一行一条微博)。微博数据见课程中心weibo.txt,字典数据见公开数据中的emotionlexicon(https://doi.org/10.6084/m9.figshare.12163569.v2)。请按要求用函数进行功能封装,并在main中调用测试,鼓励尝试不同方式的可视化。1.实现一个函数,对微博数据进行清洗,去除噪声(如url等),过滤停用词。注意分词的 时候应该将情绪词典加入Jieba的自定义词典,以提高这些情绪词的