草庐IT

spark-streaming-kafka

全部标签

windows - Spark EC2 对 Windows 的支持

所有关于在AmazonEC2上部署Spark集群的文档都是与Linux环境相关的。但是,目前我的分布式项目依赖于一些Windows功能,我想开始使用Windows集群,同时进行必要的更改。p>我想知道是否有任何方法可以让我们以相对类似于spark-ec2脚本的方式在EC2上部署WindowsSpark集群由Spark提供。 最佳答案 spark-ec2目前仅支持使用specificLinuxAMIs在EC2中启动集群,因此目前无法使用该工具部署WindowsSpark集群。我怀疑spark-ec2是否会具备这种能力,因为它使用的所有

php - 为什么 stream_socket_server 不阻止来自 Windows 上其他套接字的端口?

我有一个reactphp脚本打开多个端口进行监听。代码归结为尝试在端口x上打开一个套接字,如果被占用,则选择端口+1。我发现我可以为同一个端口打开多个套接字而不会出现错误消息,这使得上述查找“空闲”端口的方法无效:var_dump($s1=stream_socket_server("tcp://127.0.0.1:7777",$errno,$errstr));var_dump($s2=stream_socket_server("tcp://127.0.0.1:7777",$errno,$errstr));两个调用都返回一个具有不同ID的资源。为什么会发生这种情况,端口是否可能已经有来自

windows - 在 Windows 上运行 Kafka

这个问题在这里已经有了答案:HowtoinstallKafkaonWindows?(9个回答)关闭10个月前。在windows上安装Kafka有疑问。我们的服务器场完全基于Windows。我有一个C++应用程序和一个需要交换大量快速数据的asp.netmvc应用程序。我们正在考虑将Kafka用于数据传递层。我们不确定Kafka是否推荐在windows上运行。非常感谢任何反馈。谢谢。

windows - 将 spark.local.dir 设置为不同的驱动器

我正在尝试在Windows10上设置独立的Spark。我想设置spark.local.dir至D:\spark-tmp\tmp,因为目前它似乎正在使用C:\Users\\AppData\Local\Temp,在我的例子中是在SSD驱动器上,考虑到某些数据集的大小,它可能没有足够的空间。所以我更改了文件%SPARK_HOME%\conf\spark-defaults.conf到以下,没有成功spark.eventLog.enabledtruespark.eventLog.dirfile:/D:/spark-tmp/logspark.local.dirfile:/D:/spark-tmp/

R Spark 一次从文件夹中读取一个文件,与 Shiny 集成

我在HDFS上有一个文件夹,其中包含10个CSV文件。每个CSV文件包含10000行和17列。目标响应式读取HDFS上的文件夹。如果文件夹中包含文件,则从文件夹中一次读取一个文件(从旧到新)。在Shiny中绘制一些参数。当新文件添加到文件夹或从文件夹中读取时更新绘图。状态目前,借助SparklyR,我能够一次响应式(Reactive)读取所有文件并生成包含100000个点的绘图(ggplot)。如果我在启动应用程序后添加第11个文件(包含10000行),绘图将更新为110000个点。library(sparklyr)conf=spark_config()conf$spark.drive

php - IIS 网站 "failed to open stream: No such file or directory in C:\inetpub\vhosts\"但那里存在文件

您好,我一直在努力解决一个奇怪的问题。我正在使用IIS并将我的网站文件夹之一移动到我服务器的桌面,然后将其放回去,现在我明白了Warning:include_once(./lib/config.inc.php)[function.include-once]:failedtoopenstream:NosuchfileordirectoryinC:\inetpub\vhosts\politikacim.net\httpdocs\index.phponline12Warning:include_once()[function.include]:Failedopening'./lib/conf

windows - Spark 发射 : find version

我的环境是Windows7,安装了scala2.11.4(运行良好),Java1.8我已经尝试过spark-1.2.0-bin-hadoop2.4和spark-1.2.1-bin-hadoop2.4并且每次我都放bin\spark-shell.cmd我刚刚收到来自Windows的错误:find:'version':Nosuchfileordirectoryelsewasunexpectedatthistime.这里有什么我忽略的吗?非常感谢。更新:(来自spark-class2.cmd)C:\Users\spark-1.2.1-bin-hadoop2.4>for/F"tokens=3"

Linux部署Kafka及常见问题记录

Linux部署Kafka及常见问题记录kafka使用场景Kafka基本概念BrokerTopic(主题)Partition(分区)ProducerConsumerConsumerGroup(消费者群组)offset偏移量Linux安装&启动kafka修改核心配置文件创建数据存放目录启动验证kafk是否启动成功Topic(主题)创建命名规则注意事项查看生产者(producer)消费者(consumer)异常记录启动报错:Socketserverfailedtobindtoip:端口:Cannotassignrequestedaddress.解决方案composer更新失败,依赖冲突Nothasb

kafka操作3

kafka消费方式pull(拉)模式:consumer采用从broker中主动拉取数据。kafka采用这种方式。pull模式的不足之处是,如果kafka没有数据,消费者可能会陷入循环中,一直返回空数据。push(推)模式:kafka没有采用这种方式,因为由broker决定消息发送速率,很难适应所有消费者的消费速率。例如推送的速度为50m/s,低于这个处理速度的consumer就来不及处理消息。kafka消费者总体工作流程一个消费者可以消费多个分区数据。每个分区的数据只能由消费者组中的一个消费者消费。每个消费者的offset由消费者提交到系统主题保存。消费者组ConsumerGroup(CG):

kafka开kerberos认证报错the client is being asked for a password

@Kafkakerberos认证错误记录TOCkafka开发调试kerberos认证错误记录背景kafka开发调试,开kerberos情况下遇到的错误。错误日志Couldnotlogin:theclientisbeingaskedforapassword,buttheKafkaclientcodedoesnotcurrentlysupportobtainingapasswordfromtheuser.notavailabletogarnerauthenticationinformationfromtheuserCausedby:javax.security.auth.login.LoginEx