pandas-explode

python - 如何重新排列 python pandas 数据框？

我从.csv文件中读取了以下数据框，其中“日期”列是索引。天在行中，列显示当天小时的值。>Dateh1h2h3h4...h24>14.03.201360505249...73我想这样安排，以便有一个包含日期/时间的索引列和一个包含序列中的值的列>Date/TimeValue>14.03.201300:00:0060>14.03.201301:00:0050>14.03.201302:00:0052>14.03.201303:00:0049>.>.>.>14.03.201323:00:0073我尝试使用两个循环遍历数据帧。在Pandas中有更简单的方法吗？最

python pandas 2013 gt 00 row sequence dataframe

python - 使用 Pandas 读取空格分隔的数据

这个问题在这里已经有了答案:Howtomakeseparatorinpandasread_csvmoreflexiblewrtwhitespace,forirregularseparators?(4个答案)关闭5年前。我曾经使用numpy.loadtxt()读取数据。然而，最近我在SO中发现,pandas.read_csv()快得多。要读取这些数据，我使用:pd.read_csv(filename,sep='',header=None)我现在遇到的问题是，在我的例子中，分隔符可以不同于一个空格，x个空格甚至一个制表符。这里是我的数据的样子:56.00101.8552.40101.855

python Pandas section 100.74 100

python - 在 Pandas 列中查找混合类型

在解析数据文件时，我经常收到此警告:WARNING:py.warnings:/usr/local/python3/miniconda/lib/python3.4/site-packages/pandas-0.16.0_12_gdcc7431-py3.4-linux-x86_64.egg/pandas/io/parsers.py:1164:DtypeWarning:Columns(0,2,14,20)havemixedtypes.Specifydtypeoptiononimportorsetlow_memory=False.data=self._reader.read(nrows)但是如

python Pandas section gt 34

python - Pandas dropna - 存储丢弃的行

我正在使用pandas.DataFrame.dropna方法删除包含NaN的行。如文档中所示，此函数返回一个不包括删除的行的数据框。如何将删除行的副本存储为单独的数据框？是:mydataframe[pd.isnull(['list','of','columns'])]总是保证返回dropna删除的相同行，假设dropna是用subset=['list','of','columns']调用的？最佳答案您可以通过使用unary~(invert)operator索引原始DataFrame来做到这一点给出NA免费DataFrame的倒数

丢弃 python code section dropna python-3.x pandas

python - 如何将 pandas 数据框行转换为逗号分隔的字符串

我需要遍历pandasdf的每一行并将其转换为逗号分隔的字符串。例子:df3=DataFrame(np.random.randn(10,5),columns=['a','b','c','d','e'])abcde0-0.158897-0.7497990.2689210.0700350.0996001-0.863654-0.086814-0.614562-1.6788500.9802922-0.0981680.710652-0.456274-0.373153-0.53346331.001634-0.736187-0.8120340.223062-1.33797240.173549-0.5

python pandas 39 section code

python - 如何使用单个命令 [Python - Pandas] 获取所有列的数据类型？

我想查看存储在我的数据框中的所有列的数据类型，而无需遍历它们。路在何方？最佳答案 10mintopandas有很好的例子DataFrame.dtypes:df2=pd.DataFrame({'A':1.,'B':pd.Timestamp('20130102'),'C':pd.Series(1,index=list(range(4)),dtype='float32'),'D':np.array([3]*4,dtype='int32'),'E':pd.Categorical(["test","train","test","train"

python 39 class code pandas

python - 使用 sklearn 的 KFold 分离 Pandas 数据框

我已经通过下面的代码获得了训练集和测试集的索引。df=pandas.read_pickle(filepath+filename)kf=KFold(n_splits=n_splits,shuffle=shuffle,random_state=randomState)result=next(kf.split(df),None)#traincanbeaccessedwithresult[0]#testcanbeaccessedwithresult[1]我想知道是否有更快的方法将它们与我检索到的行索引分别分成2个数据帧。最佳答案你需要D

sklearn python section result code pandas scikit-learn

python - 在 Pandas 中找到最接近给定时间的 DataFrame 行

我有一个由DatetimeIndex索引的Pandas数据框:DatetimeIndex:53732entries,1993-01-0712:23:58to2012-12-0220:06:23Datacolumns:Date(dd-mm-yy)_Time(hh-mm-ss)53732non-nullvaluesJulian_Day53732non-nullvaluesAOT_87053732non-nullvalues440-870Angstrom53732non-nullvalues440-675Angstrom53732non-nullvalues500-870Angstrom53

给定 DataFrame code self pre python datetime pandas time-series

python - 计算 Pandas 数据框中每个特定单词的出现次数

我想计算数据框中每个特定单词的出现次数。我目前使用str.contains:a=df2[df2['col1'].str.contains("sample")].groupby('col2').size()n=a.apply(lambdax:1).sum()有没有一种方法可以匹配正则表达式并获取出现次数？在我的例子中，我有一个大数据框，我想匹配大约100个字符串。最佳答案更新:原始答案计算那些包含子字符串的行。要计算一个子字符串的所有出现次数，您可以使用.str.count:In[21]:df=pd.DataFrame(['hel

单词 python code words 39 pandas dataframe

python - 在 Pandas 数据框中使用什么 dtype 表示金钱？

所以我有一个pandas数据框对象，其中包含货币列，精确到小数点后两位，例如“133.04”。没有3位或更多小数位的数字，只有两位。我的尝试:十进制模块我尝试为此使用Decimal模块，但是当我尝试像这样重新采样时gr_by_price=df['price'].resample(timeframe,how='ohlc')我明白了pandas.core.groupby.DataError:Nonumerictypestoaggregate就在这之前我检查数据类型print(type(df['price'][0]))我是这个图书馆和货币处理的新手，也许Decimal不是正确的选择？我该怎么

python Pandas section code Decimal python-3.x dataframe

111 112 113114115 116 117