草庐IT

‘海外/国外‘地区微博签到shu据(正题在第二部分)

最近失眠,研究了项关于weibo爬虫的新功能,种种原因,大家可跳过第一部分的引用直接看第二部分。内容来源:健康中国、生命时报、央视等​​​​失眠标准一:3个“30分钟”● 入睡困难,从躺下想睡到睡着间隔超过30分钟● 睡眠维持困难,醒了以后到下一次入睡,间隔超过30分钟● 早醒,比平常提前醒来超过30分钟,而且醒了以后,清醒到天亮失眠标准二:上述这些问题一周超过3天失眠标准三:第二天白天很不舒服这些标准同时都具备,叫做失眠。​一个重要提醒:睡不好​的人,真的容易变胖!​睡眠会影响胖瘦:睡得晚、每晚睡不够的人,或更易变胖。发表在JAMA上的一项研究表明:晚睡以及每晚睡眠不足6小时的人容易肥胖,而

抓取某话题下指定时间内的微博数据,包括博文数据、评论信息等(可通过高级搜索筛选时间)

 代码有点长,完整代码放在文章最后了。最后的数据存储为了3个表,表的各字段如下:#csv头部writer.writerow(('话题链接','话题内容','楼主ID','楼主昵称','楼主性别','发布日期','发布时间','转发量','评论量','点赞量','评论者ID','评论者昵称','评论者性别','评论日期','评论时间','评论内容'))#微博博文与评论的全部信息writer_1.writerow(('话题链接','楼主ID','话题内容','楼主昵称','楼主性别','是否认证','认证类型','是否认证金v','发博数量','关注人数','粉丝数','微博等级','发布日期',

2023彻底解决Typora使用iPic微博图床失效问题

一、问题描述用Typora搭配iPic图床使用,最近csdn图片显示不出来用浏览器打开图片显示403,这里原因是微博图床出问题了导致的而使用iPic其他图床则需要一直付费,那有没有一劳永逸的解决所有问题呢?二、旧图恢复首先怎么找回旧图?我们把失效图片链接复制到微博app发送到任意聊天窗口然后长按保存到相册,即恢复了三、GitHub图床1、下载PicGo软件mac版下载地址:PicGo-2.3.1-x64.dmg其他版本可自行前往官网下载:官网下载地址。注意:官网需要下拉到底部,才能找到安装包2、新建GitHub仓库点击链接创建一个用来存储图片的GitHub仓库,仓库名可随便填写,仓库属性必须选

python - Flask中 "Flaskr"教程微博app运行单元测试

我已经克隆了flaskr来自Github的应用程序,我正在尝试关注TestingFlaskApplications教程。正在关注Bonus:TestingtheApplication,我在顶级flaskr目录中添加了一个子目录test,因此我的目录树如下所示:.├──build│  ├──bdist.linux-x86_64│  └──lib.linux-x86_64-2.7│  └──flaskr│  ├──flaskr.py│  ├──__init__.py│  ├──schema.sql│  ├──static│  │  └──style.css│  └──templates│ 

华为手机刷微博体验更好?技术角度的分析和思考,Android基础72问

在2020-6月左右分析这个问题的时候,“列表滑动的同时加载图片”这个功能还是关闭的,只有华为手机做了优化才有效果,其他手机是“滑动停止之后才会加载图片”在2020-8月再看这个问题的时候,“列表滑动的同时加载图片”这个功能在其他手机上已经开启华为的PerfSDK还有效果么?答案是有,具体分析可以看下文,因为有了这个SDK,不仅对微博有好处(减少图片加载个数),对华为也有好处(提升微博主页列表在华为手机上的滑动体验,即Fling曲线优化);而粗暴开启“列表滑动的同时加载图片”的其他手机,如果性能不足,开启后反而会增加卡顿出现的概率(微博官方应该有性能监控数据可以看到)反编译的微博版本:10.8

使用selenium自动化工具爬取微博内容和评论

任务需求是爬取微博的内容和评论。一开始我是准备直接用正常的爬虫来做,但是发现微博上的内容几乎都是动态加载生成的。所以了解了一下就学习使用·selenium自动化测试工具来爬取相关数据。首先是不登录微博,发现只能查看最多二十条数据,这自然限制太大所以还是需要实现登录后再爬取。1.登录微博由于微博现在的登录不能只输入账号密码,所以通过查找了一些方法后选用了注入cookie来实现自动登录。而想要注入的cookie需要自己先登录获得。这里直接使用了各位大佬给出的方法。实现扫码登录后获取cookie。fromseleniumimportwebdriverfromtimeimportsleepimport

使用selenium自动化工具爬取微博内容和评论

任务需求是爬取微博的内容和评论。一开始我是准备直接用正常的爬虫来做,但是发现微博上的内容几乎都是动态加载生成的。所以了解了一下就学习使用·selenium自动化测试工具来爬取相关数据。首先是不登录微博,发现只能查看最多二十条数据,这自然限制太大所以还是需要实现登录后再爬取。1.登录微博由于微博现在的登录不能只输入账号密码,所以通过查找了一些方法后选用了注入cookie来实现自动登录。而想要注入的cookie需要自己先登录获得。这里直接使用了各位大佬给出的方法。实现扫码登录后获取cookie。fromseleniumimportwebdriverfromtimeimportsleepimport

Python爬虫--个人微博发布的全部照片、视频

1、我们的目标是获取微博某博主的全部图片、视频2、拿到网址后我们先观察打开F12  随着下滑我们发现加载出来了一个叫mymblog的东西,展开响应发现需要的东西就在里面 3、重点来了!!! 通过观察发现第二页比第一页多了参数since_id而第二页的since_id参数刚好在上一页中能获取到,往下翻页同理第二页带着第三页需要的参数4、因为是get请求接下来就是设置params对下面网址进行请求然后提取bloghttps://weibo.com/ajax/statuses/mymblog5、不会翻页的我还发现了个简单的方法不用带since_id参数,只需要给page来个循环也可实现循环具体如下:

Python爬虫--个人微博发布的全部照片、视频

1、我们的目标是获取微博某博主的全部图片、视频2、拿到网址后我们先观察打开F12  随着下滑我们发现加载出来了一个叫mymblog的东西,展开响应发现需要的东西就在里面 3、重点来了!!! 通过观察发现第二页比第一页多了参数since_id而第二页的since_id参数刚好在上一页中能获取到,往下翻页同理第二页带着第三页需要的参数4、因为是get请求接下来就是设置params对下面网址进行请求然后提取bloghttps://weibo.com/ajax/statuses/mymblog5、不会翻页的我还发现了个简单的方法不用带since_id参数,只需要给page来个循环也可实现循环具体如下:

Redis数据结构实战演练,看看微博、微信、购物车、抽奖小程序是如何使用的?

大家都知道,现在只要是个系统就会有缓存的存在,而且几乎所有的系统都离不开Redis,可见Redis在现在系统的重要性。所以,今天我们就来聊一下Redis,当然主要聊聊Redis在不同业务场景下的使用。接下来,我们先从缓存的世界开始,一步步揭开Redis的神秘面纱。1.缓存发展史&缓存分类1.1大型网站中缓存的使用访问量越大,响应力越差,用户体验越差引入缓存、示意图如下:高性能:假如用户第一次访问数据库中的某些数据的话,这个过程是比较慢,毕竟是从硬盘中读取的。但是,如果说,用户访问的数据属于高频数据并且不会经常改变的话,那么我们就可以很放心地将该用户访问的数据存在缓存中。这样有什么好处呢?那就是