草庐IT

pandas_udf

全部标签

python - Pandas Rolling_std with Window 使用所有以前的行数

我想计算每日yield的rolling_std,使用当前行之前的所有记录。如何设置窗口以使用行的滚动计数?例如:在04-04上。我想使用所有行来计算,在04-01我想使用日期小于04-01的所有行。DateDailyStd4/4/2016-0.003087335?4/1/20160.006480923?3/31/2016-0.001553158?3/30/20160.004351748?3/29/20160.009234222? 最佳答案 在pandas0.18中,使用Rolling对象。这是为期2天的滚动标准:df.rolling

python - Pandas 填充 np.nan 问题

环境Windows8.1python3.5Pandas我想做什么按照以下规则在pandas.DataFrame列中填充np.nan:如果值是数字,则用其余值的平均值填充np.nan。如果值不是数字,则用其余值的模式填充np.nan。问题以下代码似乎不起作用。#buildDataFramedfna=pd.DataFrame(np.random.randn(100,5),columns=list('ABCDE'))dfna['F']=[random.choice(list('abcdefghijkf'))foriinrange(100)]dfna[::20]=np.nan#fillingn

python - 无法将 Pandas 导入 IPython

我正在运行Windows7.0,与Python2.7.我在安装之前安装了pandasipython0.12.1(稳定的)。当我运行importpandas在IPython.exe我收到错误消息:Nomodulenamedpandas如果我从开始菜单调用IPython,通过cmd它不会在C:\Python27中自动运行pandas所在的位置。相反,它以不同的路径运行C:\Users\mycomputername\\.ipython.(ipython无法检测到机器上存在pandas库,这似乎是不合理的)。也就是说,我也cd到C:\Python27\dist\ipython-0.12要运行的

python - 用 pandas drop row 清理嘈杂的数据

我正在尝试使用语法关键字减少来自大型数据集的噪音。有没有办法根据一组特定的关键字水平修剪数据集。Input:id1,id2,keyword,freq,gp1,gps2222,111,#paris,100,loc1,loc2444,234,have,1000,loc3,loc4434,134,#USA,30,loc5,loc6234,234,she,600,loc1,loc2523,5234,mobile,900,loc3,loc4从这里我需要删除像have,she,and,did这些常用关键字这对我有用。我试图用这样的关键字消除整行。为了将来的分析目的,我正在尝试从数据集中去除噪音。使

windows - 导入错误 : No module named 'pandas.compat.numpy'

刚刚安装了AnacondaforWindows,在尝试导入pandas时无法解决以下问题:importpandasaspd**Traceback(mostrecentcalllast):**File"C:\Users\Username\AppData\Roaming\Python\Python35\site-packages\IPython\core\interactiveshell.py",line2885,inrun_codeexec(code_obj,self.user_global_ns,self.user_ns)File"",line1,inimportpandasaspdF

windows - 通过 Windows 命令行使用 conda 安装 sklearn_pandas

我想安装sklearn_pandas通过Windows命令行使用conda库。该软件包在conda存储库中显然是“私有(private)的”(诚然,这很可能是我无法安装它的原因,但我更愿意寻求建议,以防万一有办法解决这个问题)。我已经尝试过condainstall-ccreditxsklearn_pandas,但出现以下错误:Solvingenvironment:failedPackagesNotFoundError:Thefollowingpackagesarenotavailablefromcurrentchannels:-sklearn_pandasCurrentchannels

python - 尝试使用 pip 安装 pandas 时权限被拒绝

我正在尝试使用pip从Windows命令行安装Pythonpandas包:pipinstallpandas但我收到以下错误。我还从这里下载了wheel版本https://pypi.python.org/pypi/pandas/0.17.0/#downloads也试过了:pipinstallpandas-0.17.1-cp35-none-win_amd64.whl无论哪种情况,我都会收到此错误:Exception:Traceback(mostrecentcalllast):File"c:\users\adi\appdata\local\programs\python\python35\l

c# - 将表作为参数传递给 SQLCLR TV-UDF

我们有一个第三方DLL,它可以对源信息的DataTable进行操作并生成一些有用的值,我们正在尝试通过SQLCLR将其连接起来,以便在SQLServer2008中作为表值UDF进行调用。取概念here更进一步,我想编写一个CLRTable-ValuedFunction对来自数据库的源数据表进行操作。我很确定我了解在T-SQL方面需要发生什么;但是,.NET(C#)代码中的方法签名应该是什么样的?“来自SQLServer的表数据”的参数数据类型是什么?例如/*Setup*/CREATETYPEInTableTypeASTABLE(LocationNameVARCHAR(50),LatFL

c# - 在 SQL CLR UDF 中使用 System.Linq 程序集

我正在使用VisualStudio2010中的SQLUDF项目类型在C#中创建一个SQLServer用户定义函数。我的代码中有一个简单的Linq字符串操作表达式(myString.Where()),它会生成一个错误,因为我我没有使用System.Linq命名空间。如果我添加usingSystem.Linq;对于我的.cs文件,我收到一条错误消息,询问我是否缺少程序集引用。如果我随后在解决方案资源管理器中右键单击该项目并选择“添加引用”,则.NET选项卡中没有列出System.Linq组件。我想我可以浏览硬盘驱动器以找到合适的程序集DLL,但为什么VisualStudio不知道呢?在SQ

c# - 如何在 CLR UDF 中返回 nvarchar(max)?

假设如下定义://////ReplaceseachoccurrenceofsPatterninsInputwithsReplace.Thisisdone///withtheCLR:///newRegEx(sPattern,RegexOptions.Multiline).Replace(sInput,sReplace).///Theresultofthereplacementisthereturnvalue.///[SqlFunction(IsDeterministic=true)]publicstaticSqlStringFRegexReplace(stringsInput,strin