草庐IT

rss-reader

全部标签

python - Django RSS 提要身份验证

我正在考虑将RSS提要添加到我的一个Django应用程序中,我希望能够对它们进行身份验证。我想在Django1.2中使用新的联合框架。我已经阅读了有关如何执行此操作的文档并进行了基本的提要设置。我对Feed身份验证不熟悉,所以我不确定最好的方法是什么,或者我的实际选择是什么。每个用户都有一个唯一的子域,我希望URL结构看起来像这样:http://mysubdomain.mysite.com/myapp/rss/如果可能的话。我不希望提要公开可用,是否可以使用用户的用户名和密码进行身份验证?你有没有发现大多数提要阅读器都支持这个?如果无法对每个用户进行身份验证,我应该尝试使用uuid为他

python - 在 python 中使用 csv.reader 时如何使用多个定界符?

我在一个文本文件中有多行文本,看起来与此类似:2012-03-1613:47:30.465-0400STARTRunningLab.script19on_the我希望能够将此文本文件转换为csv。我已经使用这段代码完成了:fin=csv.reader(open('LogFile.txt','rb'),delimiter='\t')fout=open('newLogFile.csv','w')forrowinfin:fout.write(','.join(row)+'\n')但现在,我的问题是我需要能够在这部分行的空格后添加一个“,”:2012-03-1613:47:30.465-040

python - 如何阅读 RSS 提要中的所有文章?

我正在使用Pythonfeedparser从RSS提要中读取文章。但是,只能阅读文章的第一页。有没有其他的lib/package可以读取一个RSSfeed的所有文章?类似问题@SO:Feedparser-retrieveoldmessagesfromGoogleReader 最佳答案 RSS本身可能只有第一页数据。您可以从RSS项中的“链接”属性访问原始数据(至少它在feedparser中是这样称呼的)。像这样的东西:feed=feedparser.parse('http://reddit.com/.rss')forentryinf

python - Scrapy - 关注 RSS 链接

我想知道是否有人曾尝试使用以下方法提取/跟踪RSS项目链接SgmlLinkExtractor/CrawlSpider。我无法让它工作...我正在使用以下规则:rules=(Rule(SgmlLinkExtractor(tags=('link',),attrs=False),follow=True,callback='parse_article'),)(请记住,RSS链接位于link标记中)。我不确定如何告诉SgmlLinkExtractor提取text()链接而不是搜索属性...欢迎任何帮助,提前致谢 最佳答案 CrawlSpide

python - psutil.Process.get_memory_info中RSS的单位是什么?

当我使用ps-opid,rss-p1时,我看到以下内容:PIDRSS1784但是当我使用psutil查询rss时,我得到了不同的值:>>>p=psutil.Process(1)>>>printp.get_memory_info().rss802816psutil是否有可能使用不同的单位?我在documentation中找不到任何相关信息. 最佳答案 ps的输出以千字节为单位。psutil的RSS(驻留集大小)以字节为单位。>>>802816/7841024来自manps:rssRSSresidentsetsize,thenon-sw

python - 为什么 csv.reader 不是 pythonic?

我开始使用csv.reader在Python2.6中,但您不能在其上使用len或对其进行切片等。这背后的原因是什么?这当然感觉非常有限。或者这只是后来版本中的一个废弃模块? 最佳答案 我很确定您不能使用len或slice,因为它是一个迭代器。试试这个。importcsvr=csv.reader(...)lines=[lineforlineinr]printlen(lines)#numberoflinesforoddinlines[1::2]:printodd#printoddlines

python - 为什么 BeautifulSoup 无法正确读取/解析此 RSS (XML) 文档?

YCombinator足以提供RSSfeed和一个bigRSSfeed包含HackerNews上的热门项目.我正在尝试编写一个python脚本来访问RSS提要文档,然后使用BeautifulSoup解析出某些信息。但是,当BeautifulSoup尝试获取每个项目的内容时,我遇到了一些奇怪的行为。以下是RSS提要的几行样例:HackerNewshttp://news.ycombinator.com/Linksfortheintellectuallycurious,rankedbyreaders.EFFPatentProjectGetsHalf-Million-DollarBoostfr

python - 为多次迭代重置 csv.reader 的正确方法?

自定义迭代器存在问题,因为它只会迭代文件一次。我打电话seek(0)在迭代之间的相关文件对象上,但是StopIteration第一次调用next()时抛出2号运行。我觉得我忽略了一些明显的东西,但会欣赏一些新的眼光:classMappedIterator(object):"""Givenaniteratorofdictsorobjectsandaattributemappingdict,willmaketheobjectsaccessibleviathedesiredinterface.Currentlyitwillonlyproducedictionarieswithstringva

Python 异步 : reader callback and coroutine communication

我正在尝试实现一个将数据从标准输入传递到协程的简单想法:importasyncioimportsysevent=asyncio.Event()defhandle_stdin():data=sys.stdin.readline()event.data=data#NOTE:dataassignedtotheeventobjectevent.set()@asyncio.coroutinedeftick():while1:print('Tick')yieldfromasyncio.sleep(1)ifevent.is_set():data=event.data#NOTE:datareadfro

Python:如何使用 feedparser 和 etags 检查 RSS 更新

我试图跳过未使用feedparser和etags修改的RSS提要。遵循文档指南:http://pythonhosted.org/feedparser/http-etag.htmlimportfeedparserd=feedparser.parse('http://www.wired.com/wiredscience/feed/')d2=feedparser.parse('http://www.wired.com/wiredscience/feed/',etag=d.etag)printd2.status这个输出:200这个脚本不应该返回304吗?我的理解是,当RSS提要更新时,etag