草庐IT

dynamic-sizing

全部标签

hadoop - 使用 hive.optimize.sort.dynamic.partition 选项避免单个文件

我正在使用配置单元。当我使用INSERT查询编写动态分区并打开hive.optimize.sort.dynamic.partition选项(SEThive.optimize.sort.dynamic.partition=true)时,总是有单个每个分区中的文件。但是如果我关闭该选项(SEThive.optimize.sort.dynamic.partition=false),我会遇到这样的内存不足异常。TaskAttempt3failed,info=[Error:Errorwhilerunningtask(failure):attempt_1534502930145_6994_1_01

linux - 乌兹 : Sqoop dynamic target directory

我正在执行Oozie工作流中的sqoop作业。我可以在sqoop命令中创建具有静态名称的目标目录,如下所示。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target-dir/user/test/Employee/20150126我需要创建带有日期的动态目标目录。我试过跟随,但没有用。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target

hadoop - 配置单元加载数据 :how to specify file column separator and dynamic partition columns?

好吧,我有一些关于将mysql数据加载到hive2的问题,并且不知道如何指定分隔符,我尝试了serval次但一无所获。下面是hive表,id是分区列,0:jdbc:hive2://localhost/>desctest;+-----------+------------+----------+|col_name|data_type|comment|+-----------+------------+----------+|a|string|||id|int||+-----------+------------+----------+当我执行loaddatalocalinpath'fil

hadoop - pig 与大表倾斜连接导致 "Split metadata size exceeded 10000000"

我们在一个小的(16M行)不同表和一个大的(6B行)倾斜表之间有一个pig连接。常规连接在2小时内完成(经过一些调整)。我们尝试使用skewed并能够将性能提高到20分钟。但是,当我们尝试更大的倾斜表(19B行)时,我们从SAMPLER作业中得到这条消息:Splitmetadatasizeexceeded10000000.Abortingjobjob_201305151351_21573[ScriptRunner]atorg.apache.hadoop.mapreduce.split.SplitMetaInfoReader.readSplitMetaInfo(SplitMetaInfo

hadoop - HDFS 中参数 "mapred.min.split.size"的行为

参数“mapred.min.split.size”改变了之前写入文件的block的大小?假设我在开始JOB时传递值为134217728(128MB)的参数“mapred.min.split.size”。关于发生的事情,正确的说法是什么?1-每个MAP处理相当于2个HDFSblock(假设每个block64MB);2-我的输入文件(以前包含HDFS)将有一个新的分区,以占用HDFS128M中的block; 最佳答案 splitsize的计算公式:-max(mapred.min.split.size,min(mapred.max.spl

file - Hadoop MapReduce : Appropriate input files size?

我有3位数GB甚至1或2位数TB的数据集。因此,输入文件是一个文件列表,每个文件的大小约为10GB。我在hadoop中的mapreduce作业处理所有这些文件,然后只给出一个输出文件(带有聚合信息)。我的问题是:从Apache调整hadoop/mapreduce框架的合适文件大小是多少?我听说大文件比小文件更受欢迎。有什么想法吗?我唯一确定的是hadoop读取block,每个block默认为64MB。所以如果文件大小是64MB的倍数就好了。目前,我的应用程序只将输出文件写入一个文件。文件大小当然是3位千兆位。我想知道如何有效地对文件进行分区。当然,我可以只使用一些unix工具来完成这项

php - 拉维尔 4 : load class dynamically from string in database

我希望我知道如何更恰本地搜索这个问题/短语。这妨碍了我寻找先前的问题;如果这是重复的,请耐心等待。在这篇文章的底部查看更新/编辑背景/我正在尝试做的事情:我有一个看起来很像这样的URL:http://myapp.com/calculate/$fileID/$calculateID$fileID和$calculateID是我用来跟踪数据集和我称之为“计算”的东西的键。本质上,该URL表示对$fileID中的数据执行$calculateID。我转到我的数据库(mongo)并询问php类名或sring或文件路径,或者你有什么匹配$calculateID。例如,假设表格如下所示:+-----+

php - Dynamics CRM 2011 SOAP RetrieveMultiple 查询忽略条件

我正在使用PHP和SOAP连接到DynamicsCRM2011Online,但遇到了一个问题。以下RetrieveMultiple忽略我的条件并返回所有记录。我想要的是所有以“test@test.com”作为电子邮件地址的联系人。有人可以告诉我下面的标准/条件有什么问题吗?谢谢!falsefirstnameemailaddress1Equaltest@test.comAndfalsecontact2501false 最佳答案 尝试使用以下SOAP格式:Queryfalsefirstnameemailaddress1Equalabc@

php - 当文件大于 post_max_size 时,Symfony2 验证器不工作

我在php.ini中将upload_max_filesize和post_max_size设置为32Mb。我正在使用Symfony2。我创建了一个包含文件变量的实体,以便人们可以上传文件:/***@Assert\File(maxSize="3M")*/public$file;当文件小于3Mb时,文件正确上传。当3Mb时验证器工作正常,显示正常错误消息“文件太大”但是,当文件>32Mb(post_max_size)时:Fatalerror:Allowedmemorysizeof150994944bytesexhausted(triedtoallocate62353390bytes)in/A

php - 在 PHP 中验证 Microsoft Dynamics

我正在尝试将MicrosoftDynamicsOnline与我的网站集成。但是,我正在努力寻找一种使用PHP通过API(无论是REST还是SOAP)进行身份验证的体面方法。大多数示例使用MicrosoftCRMSDK(在.NET中)进行身份验证。但是,我的网站基于PHP,我想知道您如何访问MicrosoftDynamicsAPI(REST和/或SOAP)。有谁知道通过php使用MicrosoftDynamicsAPI进行身份验证的合适方法吗? 最佳答案 从DynamicsCRM2016(v8.0)开始,我们获得了用于跨平台集成的RE