草庐IT

sas7bdat

全部标签

SAS编程:如何获取某路径下文件的名称?

文章内容截取于SAS编程:Dopen系列函数介绍。我使用以下路径文件进行演示,路径中有4个.sas文件、4个.log文件,以及1个文件夹,共9个文件。Directory过程涉及以下3个函数:DOPENDNUMDREAD1.DOPEN(fileref)DOPEN函数的作用是,打开一个路径,并返回一个路径标识值(Opensadirectory,andreturnsadirectoryidentifiervalue)。这可以理解为,在一次SAS会话中,给路径发放身份证明,这个证明跟路径是一一对应的,就像人的身份证一样。人有了身份证,可以进行诸如乘高铁、坐飞机的活动,路径有了“身份证”,也可以进行一些

SAS编程-ADaM:Efficacy Analysis Flag的两种生成方法

临床试验会针对EfficacyEndpoints进行Efficacy分析,这些分析是针对特定的EfficacyParamters。纳入Efficacy分析的人群,通常是基线以及基线后至少一次访视值不为空(Withnon-missingvaluesatbaselineandatleastonpost-baseinevisit)。在SAP中,分析人群会有明确定义。在ADaM中,会建立特定Flag变量来标识每一个分析人群。例如,FullAnalysisSet对应参与随机化或参与入组的人群,对于符合条件的受试者,变量FASFL赋值为“Y”。1.EfficacyAnalysisFlag说明Efficac

SAS编程-Table:层级关系的频数汇总处理 ——层级拼接法

临床试验TFL输出中,有一类频数汇总表的各条目是包含层级关系的。例如,之前介绍的SAS编程:按SOC和PT类别汇总AE的受试者发生率,单个SOC下,可能会对应多个PT。对于具有层级关系的频数汇总表,常规的处理方式是,先对各个层级进行单独统计,之后再汇总进行排序,前面提到的AESOCPT表格就是这样处理的。今天,介绍另一种方法,我给这种方法取名为层级拼接法。层级拼接法的本质是,将多层级转化为单层级进行处理。这个方法的效率要比各个层级单独处理高很多,推荐大家尝试使用。层级拼接的处理主要在文章3.3、3.5、3.6部分,结合代码和输出结果,希望读者能够掌握这样的处理方法。1.层级处理介绍看过我前面介

SAS编程:如何将数据集批量输出到Excel中?

欢迎关注:SAS茶谈!最近,为了解一个项目的数据结构,需要查看不少RawData。简单的记录筛选,SAS操作起来不复杂,但是对于大批量数据集记录查看,SAS筛选就略显繁琐。这种情况下,将数据集批量输出到EXCEL中进行查看,是一个不错的方法。数据集批量输出的要达到什么样的效果呢?我想的是,所有数据集都在一个EXCEL文件中,数据集名称作为对应的Sheet名称,每个表单冻结首行,并且直接设置好首行筛选。这样打开输出的EXCEL文件,就可以不需要多余的设置,直接浏览、筛选数据。在SAS编程中,常见的批量处理的方法有两种,一是宏程序中的宏循环,二是callexecute语句。下面介绍整个输出的实现过

python - 将大型 SAS 数据集转换为 hdf5

我有多个大型(>10GB)SAS数据集,我想将其转换为在pandas中使用,最好在HDF5中使用。有许多不同的数据类型(日期、数字、文本),一些数字字段也有不同的缺失值错误代码(即值可以是.、.E、.C等)我希望保留列名和标签元数据。有没有人找到一种有效的方法来做到这一点?我尝试使用MySQL作为两者之间的桥梁,但在传输时出现了一些超出范围的错误,而且速度非常慢。我还尝试以Stata.dta格式从SAS导出,但SAS(9.3)以与pandas中的read_stat()不兼容的旧Stata格式导出。我还尝试了sas7bdat包,但从描述来看它还没有经过广泛测试,所以我想以另一种方式加载数

SAS试图在订购日期到船舶的天数中获得差异

我正在使用AdventureWorks数据集。寻找方法平均计算几天需要多长时间来交付订单日期和发货日期之间的产品。格式SAS日期9。例如。:orderdateshipdate01JUL2005:00:00:0008JUL2005:00:00:00看答案这是一种可能会有所帮助的方法。SAS功能intck()非常有用!/*Generateadatasetasdescribed.*/datahave;doid=1to10000;orderdate=today()-(ceil(ranuni(id)*1000));shipdate=orderdate+ceil(ranuni(id)*10);output

乘客信息泄露!网站、App瘫痪!SAS航空公司再次遭黑客入侵

据报道,斯堪的纳维亚航空公司今年第二次被亲俄罗斯的黑客组织"匿名苏丹"攻破,导致SAS网站和其航空公司的应用程序瘫痪数小时。美国东部时间周三早上6:30左右,SAS的客户开始在Twitter上抱怨无法进入该航空公司的网站。大约在同一时间,匿名苏丹黑客团伙将这条信息置顶在他们加密的Telegram频道。随后,该组织提出3500美元的赎金来停止攻击。该组织告诉SAS,他们有一个小时的时间与他们在Telegram上的匿名苏丹机器人进行谈判,否则他们可能会遭到一整天的连环攻击,以及泄露一些用户信息等。在攻击期间,SAS在推特上对客户说,该航空公司的官方丹麦版网站仍在运行,用户可以登录使用。令人哭笑不得

SAS编程:如何获取某路径下所有文件的修改时间?

####1.目的**获取文件末次修改时间,可以进行一些的程序检查**。例如,.sas和.log的末次修改时间,两者比较可以判断出,程序更新后,是否重新Run过;例如,Source侧(Production)的.log文件与QC侧(Validation)的.log的末次修改时间,判断V侧程序是否在P侧程序之后Run过。####2.涉及内容前面两篇文章介绍了,通过SAS编程,如何获取某路径下的所有文件名称,以及如何如何获取某个文件的末次修改时间:>[SAS编程:如何获取某路径下文件的名称?](https://www.jianshu.com/p/b2aca26bdeac)>[SAS编程:如何获取某文件

hadoop - 如何让 Hadoop 接受带有复合 WHERE 子句的 SAS 直通查询?

我试图通过在内部(Hadoop端)WHERE子句中发送附加条件,将传递查询(即使用PROCSQL,而不是LIBNAME)的结果SAS数据集缩小到Hadoop。例如,有效的代码如下所示(dtpart宏变量定义较早,以便向下选择到HDFS中的单个分区):procsql;connecttohadoop(server="&srvid"port=10000user="&uid"pw="&passwd"schema=default);createtablework.creative_lkupasselectadvertiser_id,creative_id,creative,rendering_i

hadoop - Not In Where 条件在 SAS Hive Hadoop 中删除空白

我希望有人遇到过这个!我注意到在SASHadoop(显式SQL传递)中使用“不在”条件时,它会删除与其相关的字段(REASON字段)中的空白。如果使用“标准”ProcSQL,它只会删除声明的内容而不是空白。是否有解决方法可以保留空白?示例代码:CreateTableTEST_02AsSelecta.*,b.Info,b.Info2FromTEST_01aLeftJoinTEST_03bONa.SERVICE=b.SERVICEWherea.REASONNotIn('REASON1','REASON2','REASON3')Anda.ACTIVITYNotIn('ACTIVITY1','