Pandas-Datareader

python - 从大型元组/行列表中有效地构建 Pandas DataFrame

我继承了一个以Stata.dta格式保存的数据文件。我可以使用scikits.statsmodelsgenfromdta()函数加载它。这会将我的数据放入一维NumPy数组中，其中每个条目是一行数据，存储在24元组中。In[2]:st_time=time.time();initialload=sm.iolib.genfromdta("/home/myfile.dta");ed_time=time.time();print(ed_time-st_time)666.523324013In[3]:type(initialload)Out[3]:numpy.ndarrayIn[4]:initi

行列 DataFrame section initialload 999.0 python tuples pandas dta

python - 从大型元组/行列表中有效地构建 Pandas DataFrame

我继承了一个以Stata.dta格式保存的数据文件。我可以使用scikits.statsmodelsgenfromdta()函数加载它。这会将我的数据放入一维NumPy数组中，其中每个条目是一行数据，存储在24元组中。In[2]:st_time=time.time();initialload=sm.iolib.genfromdta("/home/myfile.dta");ed_time=time.time();print(ed_time-st_time)666.523324013In[3]:type(initialload)Out[3]:numpy.ndarrayIn[4]:initi

行列 DataFrame section initialload 999.0 python tuples pandas dta

python - 从 pandas.HDFStore 表中选择列

如何从pandasHDFStore中检索特定列？我经常处理非常大的数据集，这些数据集太大而无法在内存中进行操作。我想迭代地读取csv文件，将每个block附加到HDFStore对象中，然后处理数据的子集。我已经阅读了一个简单的csv文件并将其加载到HDFStore中，代码如下:tmp=pd.HDFStore('test.h5')chunker=pd.read_csv('cars.csv',iterator=True,chunksize=10,names=['make','model','drop'])tmp.append('df',pd.concat([chunkforchunkinc

中选 HDFStore 39 code section python pandas hdfs

python - 从 pandas.HDFStore 表中选择列

如何从pandasHDFStore中检索特定列？我经常处理非常大的数据集，这些数据集太大而无法在内存中进行操作。我想迭代地读取csv文件，将每个block附加到HDFStore对象中，然后处理数据的子集。我已经阅读了一个简单的csv文件并将其加载到HDFStore中，代码如下:tmp=pd.HDFStore('test.h5')chunker=pd.read_csv('cars.csv',iterator=True,chunksize=10,names=['make','model','drop'])tmp.append('df',pd.concat([chunkforchunkinc

中选 HDFStore 39 code section python pandas hdfs

python - 如何从 namedtuple 实例列表中创建 pandas DataFrame(带有索引或多索引)？

简单示例:>>>fromcollectionsimportnamedtuple>>>importpandas>>>Price=namedtuple('Price','tickerdateprice')>>>a=Price('GE','2010-01-01',30.00)>>>b=Price('GE','2010-01-02',31.00)>>>l=[a,b]>>>df=pandas.DataFrame.from_records(l,index='ticker')Traceback(mostrecentcalllast)...KeyError:'ticker'更难的例子:>>>df2=p

中创多索 code gt ticker python pandas

python - 如何从 namedtuple 实例列表中创建 pandas DataFrame(带有索引或多索引)？

简单示例:>>>fromcollectionsimportnamedtuple>>>importpandas>>>Price=namedtuple('Price','tickerdateprice')>>>a=Price('GE','2010-01-01',30.00)>>>b=Price('GE','2010-01-02',31.00)>>>l=[a,b]>>>df=pandas.DataFrame.from_records(l,index='ticker')Traceback(mostrecentcalllast)...KeyError:'ticker'更难的例子:>>>df2=p

中创多索 code gt ticker python pandas

python - 在 Pandas 中创建百分位桶

我正在尝试根据它们的值将我的数据分类到百分位桶中。我的数据看起来像，a=pnd.DataFrame(index=['a','b','c','d','e','f','g','h','i','j'],columns=['data'])a.data=np.random.randn(10)printaprint'\nthesearerankedasshown'printa.rank()dataa-0.310188b-0.191582c0.860467d-0.458017e0.858653f-1.640166g-1.969908h0.649781i0.218000j1.887577thesear

中创 python 39 section code pandas

python - 在 Pandas 中创建百分位桶

我正在尝试根据它们的值将我的数据分类到百分位桶中。我的数据看起来像，a=pnd.DataFrame(index=['a','b','c','d','e','f','g','h','i','j'],columns=['data'])a.data=np.random.randn(10)printaprint'\nthesearerankedasshown'printa.rank()dataa-0.310188b-0.191582c0.860467d-0.458017e0.858653f-1.640166g-1.969908h0.649781i0.218000j1.887577thesear

中创 python 39 section code pandas

python - Py Pandas .format(数据框)

作为Python新手，我最近发现使用Py2.7我可以执行以下操作:print'{:20,.2f}'.format(123456789)这将给出结果输出:123,456,789.00我现在希望对pandasdf有类似的结果，所以我的代码是这样的:importpandasaspdimportrandomdata=[[random.random()*10000foriinrange(1,4)]forjinrange(1,8)]df=pd.DataFrame(data)print'{:20,.2f}'.format(df)在这种情况下，我有错误:Unknownformatcode'f'foro

python Pandas code format section dataframe

python - Py Pandas .format(数据框)

作为Python新手，我最近发现使用Py2.7我可以执行以下操作:print'{:20,.2f}'.format(123456789)这将给出结果输出:123,456,789.00我现在希望对pandasdf有类似的结果，所以我的代码是这样的:importpandasaspdimportrandomdata=[[random.random()*10000foriinrange(1,4)]forjinrange(1,8)]df=pd.DataFrame(data)print'{:20,.2f}'.format(df)在这种情况下，我有错误:Unknownformatcode'f'foro

python Pandas code format section dataframe