草庐IT

spark-ec

全部标签

ruby-on-rails - 尝试使用 mongoid 作为 orm in rails 连接到 ec2 上的 mongodb 实例

基本上我有一个在ec2上运行和工作的mongodb实例。在一边,我有一个Rails3.2应用程序,其中mongoid作为orm在本地工作。我接下来要做的是尝试使用mongoid将我的Rails应用程序连接到mongodb实例。另外,打算稍后在Dotcloud上托管我的Rails应用程序运行代码railsgmongoid:config以使用以下代码生成mongoid.yml文件:development:host:localhostdatabase:mongotest_developmenttest:host:localhostdatabase:mongotest_testsetthese

Amazon EC2 上的 MongoDB

我不太了解Mongodb和EC2。因此,作为外行,我的问题是如果mongodb服务器安装在标准小型EC2LINUX/UBUNTU实例上,则mongodb服务器可以处理多少I/O(每秒kb/mb/gb)。是否有任何公式或软件或网站可以告诉服务器的最大强度或输出?注意:Mongodb和EC2实例以默认模式安装。提前致谢 最佳答案 没有一个特定的公式来确定您可以在服务器上运行什么,因为这将根据您的服务器配置和您的应用程序(和服务器)当时实际执行的操作而有很大差异。还会有一个平均负载与峰值负载的对比......这可能会高得多。例如:如果您的

mongodb - MongoDB 和 Spark 中的连接过多

我的SparkStreaming应用程序将数据存储在MongoDB中。不幸的是,每个Sparkworker在将其存储在MongoDB中时打开了太多连接以下是我的代码Spark-MongoDB代码:publicstaticvoidmain(String[]args){intnumThreads=Integer.parseInt(args[3]);StringmongodbOutputURL=args[4];StringmasterURL=args[5];Logger.getLogger("org").setLevel(Level.OFF);Logger.getLogger("akka")

大数据经典技术解析:Hadoop+Spark大数据分析原理与实践

作者:禅与计算机程序设计艺术1.简介大数据时代已经来临。随着互联网、移动互联网、物联网等新兴技术的出现,海量数据开始涌现。而在这些海量数据的基础上进行有效的处理,成为迫切需要解决的问题之一。ApacheHadoop和ApacheSpark是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点,大大提升了大数据应用的效率和效果。本文通过对Hadoop和Spark两个最著名的大数据框架的技术原理与实现过程进行解析,帮助读者了解大数据分析的核心原理及其各自的优缺点,并且通过一些具体实例让读者感受到大数据分析的魅力。2.关键词ApacheHadoo

Sony索尼CMOS图像传感器SubLVDS与SLVS-EC接口FPGA开发方案

    索尼Sony公司的工业CMOS图像传感器主要有3种接口:Sub-LVDS、SLVS、SLVS-EC。目前主要通过FPGA芯片作为硬件采集方案。    Sub-LVDS接口的CMOS主要是IMX2XX系列和IMX3XX系列的一部分型号,例如IMX250,IMX252、IMX255、IMX392、IMX304等。    SLVS与SLVS-EC接口的CMOS主要是IMX3XX系列的一部分型号,IMX4XX系列和IMX5XX系列,例如IMX342,IMX387,IMX421,IMX422,IMX430,IMX437、IMX542等。    3种接口的主要参数指标及特点对比见下图。    3种

json - Apache Spark 和 MongoDB Hadoop-Connector 创建的 BSON 结构

我正在尝试使用MongoDBHadoop-Connector将一些JSON从Spark(Scala)保存到MongoDB。我遇到的问题是这个API似乎总是将您的数据保存为“{_id:...,value:{yourJSONdocument}}”。在下面的代码示例中,我的文档是这样保存的:{"_id":ObjectId("55e80cfea9fbee30aa703261"),"value":{"_id":"55e6c65da9fbee285f2f9175","year":2014,"month":5,"day":6,"hour":18,"user_id":246}}有什么方法可以说服Mon

mongodb - 将 Parse.com 应用程序迁移到 AWS EC2 Ubuntu 时出现的问题

我有一台安装了Ubuntu的EC2机器。在机器上,我已经安装了Node.js、MongoDB和Github版本的ParseServer。我创建了一个名为euro的数据库。在此数据库中,我使用以下代码创建了一个用户:>useeuroswitchedtodbeuro>db.createUser(...{...user:'username',...pwd:'password',...roles:[{role:'readWrite',db:'euro'}]...}...)在迁移应用程序之前,我注意到在AWSEC2实例管理页面中,您可以看到2个IP地址:公共(public)IP和私有(priva

node.js - 在 Nodejs 中以编程方式连接到 Mongodb Amazon EC2 实例

我正在制作一个NodeJS网络应用程序。我想使用Amazon的弹性beantalk部署该应用程序,并且我想使用MongoDB作为数据库。现在我对解决方案的理解是:在AmazonEC2实例上设置MongoDB实例(我已经这样做了)在server.js中以编程方式连接到此数据库以读取和写入数据库这个解决方案有意义吗?如果是这样,我如何以编程方式连接到EC2MongoDB实例?我找到了Node的官方MongoDB包:https://www.npmjs.com/package/mongodb但文档只提到连接到MongoDB的本地实例://ConnectionURLvarurl='mongodb

mongodb - 使用 Mongodb 的 Spark 非常慢

我正在运行带有mongodb连接器的spark-shell。但是程序很慢,我想我不会得到程序的响应。我的spark-shell命令是:./spark-shell--masterspark://spark_host:7077\--conf"spark.mongodb.input.uri=mongodb://mongod_user:password@mongod_host:27017/database.collection?readPreference=primaryPreferred"\--jars/mongodb/lib/mongo-spark-connector_2.10-2.0.0

mongodb spark连接器问题

我是mongodb的新手。我正在尝试从mongodb中提取数据作为SparkDataframe。我正在使用MongoDBConnectorforSpark链接:https://docs.mongodb.com/spark-connector/master/我按照这个网站的步骤操作:https://docs.mongodb.com/spark-connector/master/scala/datasets-and-sql/程序编译成功但出现以下运行时错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:com/mongodb/C