我正在开发一个NRT解决方案,它要求我经常更新Impala表上的元数据。目前,此失效是在我的spark代码运行后完成的。我想通过直接从我的Spark代码执行此刷新/无效来加快速度。什么是最有效的方法?Oozie太慢了(30秒开销?不,谢谢)对(边缘)节点的SSH操作似乎是一个有效的解决方案,但感觉“hackish”我也没有看到从Spark中的Hive上下文执行此操作的方法。 最佳答案 REFRESH和INVALIDATEMETADATA命令特定于Impala。您必须连接到Impala守护进程才能运行它们——这会触发Impala特定元