我正在尝试使用通过变量传递日期引用的子查询来完成需要计算列的查询。我不确定我是不是“做对了”,但本质上查询永远不会完成并且会连续旋转几分钟。这是我的查询:
select @groupdate:=date_format(order_date,'%Y-%m'), count(distinct customer_email) as num_cust,
(
select count(distinct cev.customer_email) as num_prev
from _pj_cust_email_view cev
inner join _pj_cust_email_view as prev_purch on (prev_purch.order_date < @groupdate) and (cev.customer_email=prev_purch.customer_email)
where cev.order_date > @groupdate
) as prev_cust_count
from _pj_cust_email_view
group by @groupdate;
子查询有一个 inner join 完成自连接,它只给我在 @groupdate 中的日期之前购买的人数。 EXPLAIN 如下:
+----+----------------------+---------------------+------+---------------+-----------+---------+---------------------------+--------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+----------------------+---------------------+------+---------------+-----------+---------+---------------------------+--------+---------------------------------+
| 1 | PRIMARY | _pj_cust_email_view | ALL | NULL | NULL | NULL | NULL | 140147 | Using temporary; Using filesort |
| 2 | UNCACHEABLE SUBQUERY | cev | ALL | IDX_EMAIL | NULL | NULL | NULL | 140147 | Using where |
| 2 | UNCACHEABLE SUBQUERY | prev_purch | ref | IDX_EMAIL | IDX_EMAIL | 768 | cart_A.cev.customer_email | 1 | Using where |
+----+----------------------+---------------------+------+---------------+-----------+---------+---------------------------+--------+---------------------------------+
_pj_cust_email_view 表的结构如下:
'_pj_cust_email_view', 'CREATE TABLE `_pj_cust_email_view` (
`order_date` varchar(10) CHARACTER SET utf8 DEFAULT NULL,
`customer_email` varchar(255) CHARACTER SET utf8 DEFAULT NULL,
KEY `IDX_EMAIL` (`customer_email`),
KEY `IDX_ORDERDATE` (`order_date`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1'
同样,正如我之前所说,我不确定这是完成此任务的最佳方式。任何批评,指导表示赞赏!
更新
我取得了一些进展,我现在通过遍历所有已知月份而不是数据库中的月份并提前设置变量来按程序执行上述操作。我还是不喜欢这个。这就是我现在得到的:
设置用户定义的变量
set @startdate:='2010-08', @enddate:='2010-09';
获取给定范围内的不同电子邮件总数
select count(distinct customer_email) as num_cust
from _pj_cust_email_view
where order_date between @startdate and @enddate;
获取在给定范围之前购买的客户总数
select count(distinct cev.customer_email) as num_prev
from _pj_cust_email_view cev
inner join _pj_cust_email_view as prev_purch on (prev_purch.order_date < @startdate) and (cev.customer_email=prev_purch.customer_email)
where cev.order_date between @startdate and @enddate;
其中 @startdate 设置为月初,@enddate 表示该月范围的结束。
我真的觉得这仍然可以在一个完整的查询中完成。
最佳答案
我认为您根本不需要使用子查询,也不需要迭代数月。
相反,我建议您创建一个表来存储所有月份。即使您用 100 年的月份预先填充它,它也只有 1200 行,这是微不足道的。
CREATE TABLE Months (
start_date DATE,
end_date DATE,
PRIMARY KEY (start_date, end_date)
);
INSERT INTO Months (start_date, end_date)
VALUES ('2011-03-01', '2011-03-31');
存储实际的开始和结束日期,因此您可以使用 DATE 数据类型并正确索引两列。
编辑:我想我更了解您的要求,并且我已经清理了这个答案。以下查询可能适合您:
SELECT DATE_FORMAT(m.start_date, '%Y-%m') AS month,
COUNT(DISTINCT cev.customer_email) AS current,
GROUP_CONCAT(DISTINCT cev.customer_email) AS current_email,
COUNT(DISTINCT prev.customer_email) AS earlier,
GROUP_CONCAT(DISTINCT prev.customer_email) AS earlier_email
FROM Months AS m
LEFT OUTER JOIN _pj_cust_email_view AS cev
ON cev.order_date BETWEEN m.start_date AND m.end_date
INNER JOIN Months AS mprev
ON mprev.start_date <= m.start_date
LEFT OUTER JOIN _pj_cust_email_view AS prev
ON prev.order_date BETWEEN mprev.start_date AND mprev.end_date
GROUP BY month;
如果您在表中创建以下复合索引:
CREATE INDEX order_email on _pj_cust_email_view (order_date, customer_email);
那么该查询最有可能成为仅索引查询,并且运行速度会快得多。
下面是这个查询的 EXPLAIN 优化报告。请注意每个表的 type: index。
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: m
type: index
possible_keys: PRIMARY
key: PRIMARY
key_len: 6
ref: NULL
rows: 4
Extra: Using index; Using temporary; Using filesort
*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: mprev
type: index
possible_keys: PRIMARY
key: PRIMARY
key_len: 6
ref: NULL
rows: 4
Extra: Using where; Using index; Using join buffer
*************************** 3. row ***************************
id: 1
select_type: SIMPLE
table: cev
type: index
possible_keys: order_email
key: order_email
key_len: 17
ref: NULL
rows: 10
Extra: Using index
*************************** 4. row ***************************
id: 1
select_type: SIMPLE
table: prev
type: index
possible_keys: order_email
key: order_email
key_len: 17
ref: NULL
rows: 10
Extra: Using index
这是一些测试数据:
INSERT INTO Months (start_date, end_date) VALUES
('2011-03-01', '2011-03-31'),
('2011-02-01', '2011-02-28'),
('2011-01-01', '2011-01-31'),
('2010-12-01', '2010-12-31');
INSERT INTO _pj_cust_email_view VALUES
('ron', '2011-03-10'),
('hermione', '2011-03-15'),
('hermione', '2011-02-15'),
('hermione', '2011-01-15'),
('hermione', '2010-12-15'),
('neville', '2011-01-10'),
('harry', '2011-03-19'),
('harry', '2011-02-10'),
('molly', '2011-03-25'),
('molly', '2011-01-10');
这是给定该数据的结果,包括电子邮件的串联列表以便于查看。
+---------+---------+--------------------------+---------+----------------------------------+
| month | current | current_email | earlier | earlier_email |
+---------+---------+--------------------------+---------+----------------------------------+
| 2010-12 | 1 | hermione | 1 | hermione |
| 2011-01 | 3 | neville,hermione,molly | 3 | hermione,molly,neville |
| 2011-02 | 2 | hermione,harry | 4 | harry,hermione,molly,neville |
| 2011-03 | 4 | molly,ron,harry,hermione | 5 | molly,ron,hermione,neville,harry |
+---------+---------+--------------------------+---------+----------------------------------+
关于带有用户定义变量的 MySQL 子查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5093490/
我正在尝试设置一个puppet节点,但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
我正在用Ruby编写一个简单的程序来检查域列表是否被占用。基本上它循环遍历列表,并使用以下函数进行检查。require'rubygems'require'whois'defcheck_domain(domain)c=Whois::Client.newc.query("google.com").available?end程序不断出错(即使我在google.com中进行硬编码),并打印以下消息。鉴于该程序非常简单,我已经没有什么想法了-有什么建议吗?/Library/Ruby/Gems/1.8/gems/whois-2.0.2/lib/whois/server/adapters/base.
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用? 最佳答案 我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击
我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢
我已经从我的命令行中获得了一切,所以我可以运行rubymyfile并且它可以正常工作。但是当我尝试从sublime中运行它时,我得到了undefinedmethod`require_relative'formain:Object有人知道我的sublime设置中缺少什么吗?我正在使用OSX并安装了rvm。 最佳答案 或者,您可以只使用“require”,它应该可以正常工作。我认为“require_relative”仅适用于ruby1.9+ 关于ruby-主要:Objectwhenrun
我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是
我将应用程序升级到Rails4,一切正常。我可以登录并转到我的编辑页面。也更新了观点。使用标准View时,用户会更新。但是当我添加例如字段:name时,它不会在表单中更新。使用devise3.1.1和gem'protected_attributes'我需要在设备或数据库上运行某种更新命令吗?我也搜索过这个地方,找到了许多不同的解决方案,但没有一个会更新我的用户字段。我没有添加任何自定义字段。 最佳答案 如果您想允许额外的参数,您可以在ApplicationController中使用beforefilter,因为Rails4将参数
我是一个Rails初学者,但我想从我的RailsView(html.haml文件)中查看Ruby变量的内容。我试图在ruby中打印出变量(认为它会在终端中出现),但没有得到任何结果。有什么建议吗?我知道Rails调试器,但更喜欢使用inspect来打印我的变量。 最佳答案 您可以在View中使用puts方法将信息输出到服务器控制台。您应该能够在View中的任何位置使用Haml执行以下操作:-puts@my_variable.inspect 关于ruby-on-rails-如何在我的R
我知道我可以指定某些字段来使用pluck查询数据库。ids=Item.where('due_at但是我想知道,是否有一种方法可以指定我想避免从数据库查询的某些字段。某种反拔?posts=Post.where(published:true).do_not_lookup(:enormous_field) 最佳答案 Model#attribute_names应该返回列/属性数组。您可以排除其中一些并传递给pluck或select方法。像这样:posts=Post.where(published:true).select(Post.attr