草庐IT

样本数

全部标签

hadoop - 将文件样本从 hdfs 复制到本地 fs?

好的,一个很愚蠢的问题...我在hdfs中有一个大文件/user/input/foo.txt我想从这个位置复制前100行到本地文件系统...而且数据非常敏感,所以我对实验有点犹豫。将样本数据从hdfs复制到本地fs的正确方法是什么。 最佳答案 如果文件没有被压缩:bin/hadoopfs-cat/path/to/file|head-100>/path/to/local/file如果文件是压缩的:bin/hadoopfs-text/path/to/file|head-100>/path/to/local/file

hadoop - 如何在 hive 中获取 100K 用户的随机样本及其所有交易?

我有一个庞大的数据集,其中包含数百万用户的信息以及他们1年的购买记录。有没有办法从这些数据中创建100K用户的随机样本(保留他们所有的个人购买)?由于一个用户可以进行多次购买,因此样本将包含超过10万条记录。我能够找到rand()函数,但它没有为我提供用户的所有记录。我试过这个查询:select*frommytablewhererand()此结果仅生成10万个随机记录,而不是这10万个用户的所有记录。关于如何编写配置单元查询以获得此结果有什么建议吗? 最佳答案 您应该首先创建包含100,000个随机用户ID的表:CREATEtabl

java - Hadoop HPROF 分析未写入 CPU 样本

我想使用HPROF来分析我的Hadoop作业。问题是我得到了TRACES但profile.out文件中没有CPUSAMPLES。我在运行方法中使用的代码是:/**Getconfiguration*/Configurationconf=getConf();conf.set("textinputformat.record.delimiter","\n\n");conf.setStrings("args",args);/**JVMPROFILING*/conf.setBoolean("mapreduce.task.profile",true);conf.set("mapreduce.task

hadoop - 如何使用 Map/Reduce 选择随机(小)数据样本?

我想编写一个map/reduce作业,以根据行级条件从大型数据集中选择一些随机样本。我想尽量减少中间键的数量。伪代码:foreachrowifrowmatchesconditionputtherow.idinthebucketifthebucketisnotalreadylargeenough你做过这样的事吗?有什么众所周知的算法吗?包含连续行的示例也足够好。谢谢。 最佳答案 映射器:输出所有符合条件的值,每个值都有一个随机整数键。单reducer:输出前N个值,丢弃键。排序器将为您随机化映射器输出顺序。您不知道映射器会找到多少个限

android - 更改位图的样本大小

我正在从glsurfaceview创建一个位图并将其添加到数组列表中,但是当我从glsurfaceview创建一个位图时它会出现outofmemory错误代码:Bitmapbitmap=createBitmapFromGLSurface(0,0,mEffectView.getWidth(),mEffectView.getHeight(),gl);al_bitmaps.add(bitmap);方法:privateBitmapcreateBitmapFromGLSurface(intx,inty,intw,inth,GL10gl)throwsOutOfMemoryError{intbitm

android - 样本未准备好音池

我正在开发一款将短语从英语翻译成另一种语言的应用程序。我正在使用ExpandableListView并通过BaseExpandableListAdapter绑定(bind)数据。简而言之:当点击一个列表项时,会打开一个子项,您可以在其中看到翻译,同时有一个声音在说话。问题是有时不播放声音-特别是对于较长的短语。我可以在logcat中看到以下内容:1)当根本没有播放声音时...示例未加载。等待30毫秒。sampleX未准备好2)实际播放声音的时间*示例未加载。等待30毫秒。因此,即使播放了声音,logcat也会显示“样本尚未准备好”。好的,这就是logcat给出的信息。另一件事是,声音文

java - WifiDirectActivity 样本修改 : Transfer an ArrayList<String> p2p

我在这里查看了Androidwifip2pAPI,并查看了“WiFiDirectActivity”中提供的示例代码,它只允许手机将图像文件从一部手机传输到另一部手机。他们为此使用的代码是:publicvoidonClick(Viewv){//AllowusertopickanimagefromGalleryorother//registeredappsIntentintent=newIntent(Intent.ACTION_GET_CONTENT);intent.setType("image/*");startActivityForResult(intent,CHOOSE_FILE_R

android - 如何使用 MediaMuxer 混合两个音频样本并编码回音频文件

我目前有两个独立的媒体提取器和编解码器,用于将每个单独的样本分解为ByteBuffer。然后我将每个样本存储到两个short数组中。然后我调用我的混合函数,它将两个样本组合成一个short[]如果我用AudioTrack播放这个short[]它会播放根据需要同时播放两种声音,效果很好。但是,我真正想做的是使用MediaMuxer将我的新short[]转换回mp4音频文件并将其存储到设备以供以后播放.有人可以帮我弄清楚我做错了什么吗?这是我的一些代码...如您所见,我注释掉了AudioTrack,这就是我试图将short[]回到ByteBuffer,这样我就可以使用媒体混合器来创建音频文

android - 如何解码样本大小不等于 2 的幂的位图?

简单的例子:BitmapFactory.Optionsopts=newBitmapFactory.Options();opts.inSampleSize=scale;Bitmapbmp=BitmapFactory.decodeStream(is,null,opts);当我传递的scale值不等于2的幂时,位图仍按最接近的2的幂值缩放。例如,如果scale=3那么由于某种原因实际比例变为2。可能是因为我使用了硬件加速?无论如何,如何在不为完整位图分配内存的情况下按非2的幂值缩放位图?附言我知道,使用二的幂要快得多,但在我的情况下,时间并不是那么重要,我需要按提供的比例精确缩放图像(否则它

android - 使用 Android 的 AudioTrack 组合声音样本的字节会产生噪音

我正在构建一个相当简单的Android应用程序(sdk修订版14:ICS),它允许用户一次选择两个音频剪辑(都是RIFF/WAV格式,little-endian,签名的PCM-16位编码)和以各种方式组合它们以创造新的声音。我用于此组合的最基本方法如下://...soundsamplesarereadintomemoryasrawbytearrayselsewhere//...offsetiscurrentlysetto45soastoskipthe44byteheaderofbasic//RIFF/WAVfiles...//Actualcombinationmethodpublicb