hdf2c

python - 从 Oracle 读取一个包含数百万行的大表并写入 HDF5

我正在使用一个包含数百万行和100多列的Oracle数据库。我正在尝试使用带有某些索引列的pytables将这些数据存储在HDF5文件中。我将在pandasDataFrame中读取这些数据的子集并执行计算。我尝试了以下操作:使用实用程序将表下载到csv文件中，使用pandas逐block读取csv文件，并使用pandas.HDFStore附加到HDF5表。我创建了一个dtype定义并提供了最大字符串大小。但是，现在当我尝试直接从OracleDB下载数据并通过pandas.HDFStore将其发布到HDF5文件时，我遇到了一些问题。pandas.io.sql.read_frame不支持分

python - 如何在 pytables/hdf5 中存储宽表

我有来自csv的数据，它有几千列和一万(左右)行。在每一列中，数据属于同一类型，但不同的列具有不同类型的数据*。以前我一直在从numpy中提取数据并将其存储在磁盘上，但速度很慢，尤其是因为通常我想加载列的某些子集而不是所有列。我想使用pytables将数据放入hdf5，我的第一种方法是将数据放在一个表中，每个csv列有一个hdf5列。不幸的是，这没有用，我认为是因为512(软)列限制。存储这些数据的明智方法是什么？*我的意思是，数据从文本转换后的类型。最佳答案事实上，这可能无法以天真的方式进行。HDF5为每个数据集的元数据分配6

何在 pytables section numpy python hdf5

python - 不支持 hdf5(请安装/重新安装 h5py)不支持 Scipy!什么时候导入 TFLearn？

我收到这个错误:hdf5notsupported(pleaseinstall/reinstallh5py)Scipynotsupported!当我尝试导入tflearn时。我认为由于这个问题，我的TFLearn代码无法正常工作？最佳答案几分钟前我遇到了同样的问题，几乎你只需要使用当前环境的包管理器重新安装h5py。http://docs.h5py.org/en/latest/build.html 关于python-不支持hdf5(请安装/重新安装h5py)不支持Scipy!什么时候导

不支请安 section h5py python scipy tensorflow

python - 如何将这种类型的数据 <hdf5 object reference> 转换为在 python 中更具可读性的内容？

我有相当大的数据集。所有信息存储在hdf5格式文件中。我找到了h5pylibrary对于python。一切正常，除了[]我不知道如何将其转换为更具可读性的内容。我能做到吗？因为这个问题中的文档对我来说有点难。也许除了Python之外，还有其他一些使用不同语言的解决方案。我很感激我得到的每一个帮助。理想情况下，它应该是文件的链接。这是我的代码的一部分:importnumpyasnpimporth5pyimporttimef=h5py.File('myfile1.mat','r')#printf.keys()test=f['db/path']st=test[3]print(st)st输出是

python 可读性 code section import python-2.7 hdf5 h5py

python - 作为数据库的 Pandas HDF5

去年我一直在使用pythonpandas，它的性能和功能给我留下了深刻的印象，但是pandas还不是数据库。我最近一直在思考如何将pandas的分析能力集成到平面HDF5文件数据库中。不幸的是，HDF5并不是为处理本地并发而设计的。我一直在寻找锁定系统、分布式任务队列、并行HDF5、平面文件数据库管理器或多处理方面的灵感，但我仍然不清楚从哪里开始。最终，我想要一个RESTfulAPI来与HDF5文件交互以创建、检索、更新和删除数据。一个可能的用例是构建一个时间序列存储，传感器可以在其中写入数据，分析服务可以在其上实现。任何关于可能的路径、现有的类似项目或关于整个想法的便利/不便的任何想

python Pandas HDF5 HDF section database pytables

python - 在 ubuntu 中安装 HDF5 和 pytables

我正在尝试在Ubuntu14.04中安装tables包，但它似乎在提示。我正在尝试使用PyCharm及其包安装程序安装它，但它似乎在提示HDF5包。但是，似乎我找不到要在tables之前安装的任何hdf5包。谁能解释一下要遵循的程序？最佳答案我发现用安装libhdf5-serial-devsudoapt-getinstalllibhdf5-serial-dev成功了。关于python-在ubuntu中安装HDF5和pytables，我们在StackOverflow上找到一个类似的问

中安 pytables code section python ubuntu-14.04 hdf5

python - 当使用 "pandas.read_hdf() "读取巨大的 HDF5 文件时，为什么我仍然得到 MemoryError 即使我通过指定 block 大小读取 block ？

问题描述:我使用pythonpandas读取几个大的CSV文件并将其存储在HDF5文件中，生成的HDF5文件大约为10GB。回读时出现问题。即使我尝试分block读回它，我仍然会遇到MemoryError。这是我创建HDF5文件的方式:importglob,osimportpandasaspdhdf=pd.HDFStore('raw_sample_storage2.h5')os.chdir("C:/RawDataCollection/raw_samples/PLB_Gate")forfilenameinglob.glob("RD_*.txt"):raw_df=pd.read_csv(f

block MemoryError 39 code 300000 python pandas hdf5

python - 如何有效地将 python pandas 数据框保存在 hdf5 中并在 R 中将其作为数据框打开？

我认为标题涵盖了这个问题，但要阐明:pandaspython包有一个DataFrame数据类型，用于在python中保存表数据。它还具有与hdf5的便捷接口(interface)文件格式，因此可以使用类似dict的简单界面保存pandasDataFrames(和其他数据)(假设您安装了pytables)importpandasimportnumpyd=pandas.HDFStore('data.h5')d['testdata']=pandas.DataFrame({'N':numpy.random.randn(5)})d.close()到目前为止一切顺利。但是，如果我随后尝试将相同的h

python pandas 34 attr r data.table hdf5

python - HDF5 文件和 PyTables 文件之间的区别

HDF5文件和PyTables创建的文件有区别吗？PyTables有两个函数.isHDFfile()和.isPyTablesFile()表明有是两种格式之间的区别。我在Google上做了一些调查，发现PyTables是建立在HDF之上的，但除此之外我没能找到更多信息。我对互操作性、速度和开销特别感兴趣。谢谢。最佳答案 PyTables文件是HDF5文件。但是，据我了解，PyTables向HDF文件中每个条目的属性添加了一些额外的元数据。如果您正在为python/numpy寻找更“普通”的hdf5解决方案，请查看h5py。它不像Py

PyTables python code section numpy hdf5

python - 使用 h5py 创建的 HDF5 文件无法通过 h5py 打开

我在Ubuntu12.04(32位版本)下创建了一个HDF5文件，显然没有任何问题，使用Anaconda作为Python发行版并在ipython笔记本中编写。底层数据都是numpy数组。例如，importnumpyasnpimporth5pyf=h5py.File('myfile.hdf5','w')group=f.create_group('a_group')group.create_dataset(name='matrix',data=np.zeros((10,10)),chunks=True,compression='gzip')但是，如果我尝试从一个新的iypthon笔记本打开

h5py 5py 39 group python numpy io hdf5

32 33 343536 37 38