草庐IT

target-cpu

全部标签

hadoop - pig CPU 密集型任务 - 小数据文件 - 许多映射器?

我正在寻找有关如何通过我的Pig作业提高性能的任何提示。输入是单个文件(MB),但对于文件中的每一行,都会执行一个CPU密集型任务。因此,理想的做法是将此文件拆分到我的AmazonEMR集群中的许多映射器(和机器)。但是我找不到一种方法来做到这一点,因为Hadoop自然只会以64(或者是128?)MB间隔进行拆分,所以我只有1个映射器!我看过NLineInputFormat(http://www.olenick.com/blog/hadoop-for-small-data/),但这是针对旧API的,也不确定它如何与Pig一起使用。为了让事情更复杂,我正在使用CSVExcelStorag

java - Hadoop HPROF 分析未写入 CPU 样本

我想使用HPROF来分析我的Hadoop作业。问题是我得到了TRACES但profile.out文件中没有CPUSAMPLES。我在运行方法中使用的代码是:/**Getconfiguration*/Configurationconf=getConf();conf.set("textinputformat.record.delimiter","\n\n");conf.setStrings("args",args);/**JVMPROFILING*/conf.setBoolean("mapreduce.task.profile",true);conf.set("mapreduce.task

hadoop - HDFS 错误 : target already exists

我是Hadoop的新手。当我尝试执行此命令时,它说目标已经存在。如何从hadoop中删除此文件?这与删除目标一样吗?me$hdfs-copyFromLocalmyfile.txtinput/myfile.txtcopyFromLocal:Targetinput/myfile.txtalreadyexists 最佳答案 您不必先删除文件再复制新文件。您可以将-f选项与-copyFromLocal一起使用,一步完成hadoopfs-copyFromLocal-fmyfile.txtinput/myfile.txt

java - 在多个 CPU 内核上运行独立的 Hadoop 应用程序

我的团队使用Hadoop库构建了一个Java应用程序,将大量输入文件转换为有用的输出。考虑到当前的负载,单个多核服务器在未来一年左右的时间里表现良好。我们(还)不需要建立多服务器Hadoop集群,但我们选择“准备中”开始这个项目。当我在命令行(或在eclipse或netbeans中)运行这个应用程序时,我还不能说服它一次使用多个map和/或reduce线程。鉴于该工具非常占用CPU,这种“单线程”是我目前的瓶颈。当在netbeansprofiler中运行它时,我确实看到该应用程序出于各种目的启动了多个线程,但同时只有一个map/reduce在运行。输入数据由多个输入文件组成,因此Had

php - 限制 CPU 负载或设置进程优先级

这不是我第一次从我的主机收到过多的CPU负载警告。该代码只是一些带有mysql查询的随机php脚本,没什么特别的。(表格没什么特别的,最多几百行,如果需要,我总是限制它们。我不介意它运行0.15秒而不是0.05秒,那么有什么方法可以控制进程优先级或限制CPU负载?谢谢! 最佳答案 如果这是一个运行很长时间的后台程序或程序,请添加sleep()/usleep().短暂的sleep会显着降低您的CPU使用率。下面的代码会消耗大量的cpuwhile(...){//dostuff}因为您没有为CPU留出空间来执行其他任务。改成while(.

Linux查看服务器硬件网卡cpu型号内存BIOS、主板型号信息

一、,(1)查看服务器型号、序列号命令:dmidecode|grep"SystemInformation"-A9|egrep"Manufacturer|Product|Serial"(2)查看主板型号 命令:dmidecode|grep-A16"SystemInformation$" (3)查看BIOS信息命令:dmidecode-tbios  (4)查看内存槽及内存条命令:dmidecode-tmemory|head-45|tail-23 (5)查看网卡信息命令:dmesg|grep-iEthernet 二、查看CPU信息(1)查看cpu型号命令:cat/proc/cpuinfo|grepn

Linux查看服务器硬件网卡cpu型号内存BIOS、主板型号信息

一、,(1)查看服务器型号、序列号命令:dmidecode|grep"SystemInformation"-A9|egrep"Manufacturer|Product|Serial"(2)查看主板型号 命令:dmidecode|grep-A16"SystemInformation$" (3)查看BIOS信息命令:dmidecode-tbios  (4)查看内存槽及内存条命令:dmidecode-tmemory|head-45|tail-23 (5)查看网卡信息命令:dmesg|grep-iEthernet 二、查看CPU信息(1)查看cpu型号命令:cat/proc/cpuinfo|grepn

php - 确定 php 脚本使用了多少资源(cpu 百分比和内存)

我目前正在使用由tideways.iofork的xhprof库用于分析myscript.php执行情况。从xhprof,我可以获得walltime、cputime、memoryusage和peakmemoryusage.我尝试对symfony控制台进行基准测试-所以我在其ConsoleCommandEvent上添加了TIDEWAYS_ENABLE()并在其ConsoleTerminateEventTIDEWAYS_DISABLE.问题:如何确定myscript.php消耗了多少百分比的cpu?我可以像hereonserverfault那样将百分比计算为cpuusage=cputime/

php - 有什么方法可以减少 htmlspecialchars() CPU 使用率?

我有一个php5.4/mysql网站,每天有500万次点击,在带有nginx和的linux服务器上运行php-fpm。数据库位于单独的服务器上。我注意到,在高峰时段,我的网络服务器负载上升到15,而不是四核处理器的正常负载4。我已经使用xdebug和xhprof分析了我的php应用程序,并看到90%的CPU工作是由我用来显示数据的Twig模板中的htmlspecialchars()函数完成的。有时每页调用100到1000个htmlspecialchars()。我已经尝试减少不必要的转义,但仍然无法避免。有什么方法可以通过htmlspecialchars()函数降低CPU使用率吗?也许在

php - 在哪里可以找到触发 unset() 垃圾回收的 "low memory"和 "free CPU cycles"调用?

在解释PHPunset()不会立即触发“垃圾收集”时,我经常发现引用了以下引用,但只有在它认为合适时才触发(强调我的):unset()doesjustwhatit'snamesays-unsetavariable.Itdoesnotforceimmediatememoryfreeing.PHP'sgarbagecollectorwilldoitwhenitseefits-byintentionassoon,asthoseCPUcyclesaren'tneededanyway,oraslateasbeforethescriptwouldrunoutofmemory,whateverocc