DTYPE_t_草庐IT

python - Pandas read_csv dtype 读取所有列，但很少作为字符串读取

我正在使用Pandas读取一堆CSV。将选项json传递给dtype参数以告诉pandas将哪些列作为字符串而不是默认值读取:dtype_dic={'service_id':str,'end_date':str,...}feedArray=pd.read_csv(feedfile,dtype=dtype_dic)在我的场景中，所有除少数特定列之外的列将被读取为字符串。因此，我不想在dtype_dic中将多个列定义为str，而是将我选择的少数列设置为int或float。有没有办法做到这一点？这是一个循环遍历具有不同列的各种CSV，因此在将整个csv读取为字符串(dtype=str)后直接

read_csv python 39 dtype csv pandas

python - 将 pandas.Series 从 dtype 对象转换为 float ，将错误转换为 nans

考虑以下情况:In[2]:a=pd.Series([1,2,3,4,'.'])In[3]:aOut[3]:011223344.dtype:objectIn[8]:a.astype('float64',raise_on_error=False)Out[8]:011223344.dtype:object我希望有一个选项允许在将错误值(例如.)转换为NaN时进行转换。有没有办法做到这一点？最佳答案使用pd.to_numeric使用errors='coerce'#Setups=pd.Series(['1','2','3','4','.'

python pandas code 39 nan

python - 将 pandas.Series 从 dtype 对象转换为 float ，将错误转换为 nans

考虑以下情况:In[2]:a=pd.Series([1,2,3,4,'.'])In[3]:aOut[3]:011223344.dtype:objectIn[8]:a.astype('float64',raise_on_error=False)Out[8]:011223344.dtype:object我希望有一个选项允许在将错误值(例如.)转换为NaN时进行转换。有没有办法做到这一点？最佳答案使用pd.to_numeric使用errors='coerce'#Setups=pd.Series(['1','2','3','4','.'

python pandas code 39 nan

python - 如何使用 cython 创建自定义 numpy dtype

有使用Chere创建自定义numpydtypes的示例:另外，它seemstobepossible在cython中创建自定义ufunc:似乎也应该可以使用cython创建一个dtype(然后为其创建自定义ufunc)。可能吗？如果是这样，您可以发布一个示例吗？用例:我想做一些生存分析。基本数据元素是具有相关审查值的生存时间(float)(如果相关时间表示故障时间，则为False，如果它表示审查时间(即在观察期间没有发生故障)，则为True)。显然，我可以只使用两个numpy数组来存储这些值:一个用于时间的float组和一个用于检查值的bool数组。但是，我想考虑一个事件多次发生的可能性

自定 python code numpy cython

python - 如何使用 cython 创建自定义 numpy dtype

有使用Chere创建自定义numpydtypes的示例:另外，它seemstobepossible在cython中创建自定义ufunc:似乎也应该可以使用cython创建一个dtype(然后为其创建自定义ufunc)。可能吗？如果是这样，您可以发布一个示例吗？用例:我想做一些生存分析。基本数据元素是具有相关审查值的生存时间(float)(如果相关时间表示故障时间，则为False，如果它表示审查时间(即在观察期间没有发生故障)，则为True)。显然，我可以只使用两个numpy数组来存储这些值:一个用于时间的float组和一个用于检查值的bool数组。但是，我想考虑一个事件多次发生的可能性

自定 python code numpy cython

python - 按 dtype 选择 Pandas 列

我想知道PandasDataFrames中是否有一种优雅且简写的方式来按数据类型(dtype)选择列。即从DataFrame中仅选择int64列。详细地说，类似于df.select_columns(dtype=float64)提前感谢您的帮助最佳答案从0.14.1开始，有一个select_dtypes方法，这样你就可以更优雅/更一般地做到这一点。In[11]:df=pd.DataFrame([[1,2.2,'three']],columns=['A','B','C'])In[12]:df.select_dtypes(includ

python Pandas section select_dtypes select scipy

python - 按 dtype 选择 Pandas 列

我想知道PandasDataFrames中是否有一种优雅且简写的方式来按数据类型(dtype)选择列。即从DataFrame中仅选择int64列。详细地说，类似于df.select_columns(dtype=float64)提前感谢您的帮助最佳答案从0.14.1开始，有一个select_dtypes方法，这样你就可以更优雅/更一般地做到这一点。In[11]:df=pd.DataFrame([[1,2.2,'three']],columns=['A','B','C'])In[12]:df.select_dtypes(includ

python Pandas section select_dtypes select scipy

python - 将 pandas 时间序列从 object dtype 重新索引为 datetime dtype

我有一个不被识别为DatetimeIndex的时间序列，尽管它被具有有效日期的标准YYYY-MM-DD字符串索引。将它们强制为有效的DatetimeIndex似乎不够优雅，让我觉得我做错了什么。我读入(其他人的惰性格式)包含无效日期时间值的数据并删除了这些无效观察结果。In[1]:df=pd.read_csv('data.csv',index_col=0)In[2]:printdf['2008-02-27':'2008-03-02']Out[2]:count2008-02-27202008-02-2802008-02-29272008-02-3002008-02-3102008-03-

dtype datetime 2008 39 code python python-2.7 pandas

python - 将 pandas 时间序列从 object dtype 重新索引为 datetime dtype

我有一个不被识别为DatetimeIndex的时间序列，尽管它被具有有效日期的标准YYYY-MM-DD字符串索引。将它们强制为有效的DatetimeIndex似乎不够优雅，让我觉得我做错了什么。我读入(其他人的惰性格式)包含无效日期时间值的数据并删除了这些无效观察结果。In[1]:df=pd.read_csv('data.csv',index_col=0)In[2]:printdf['2008-02-27':'2008-03-02']Out[2]:count2008-02-27202008-02-2802008-02-29272008-02-3002008-02-3102008-03-

dtype datetime 2008 39 code python python-2.7 pandas

python - 在 pandas 0.10.1 上使用 pandas.read_csv 指定 dtype float32

我正在尝试使用pandasread_csv方法读取一个简单的空格分隔文件。但是，Pandas似乎没有遵守我的dtype论点。也许我指定的不正确？我已将我对read_csv的有点复杂的调用提炼为这个简单的测试用例。我实际上在我的“真实”场景中使用了converters参数，但为了简单起见，我删除了它。下面是我的ipythonsession:>>>cattest.outab0.763980.813940.321360.91063>>>importpandas>>>importnumpy>>>x=pandas.read_csv('test.out',dtype={'a':numpy.floa

pandas read_csv code gt python numpy