我正在尝试设置动态序列 etl 作业,它将使用 XCOM 从运行的第一个任务中获取数据。这是当前代码:
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime as dt, timedelta as td, date
from airflow.models import BaseOperator
from airflow.operators.sensors import ExternalTaskSensor
from airflow.operators.dummy_operator import DummyOperator
from airflow.operators.python_operator import PythonOperator
from airflow.models import Variable
START_DT = dt.combine(dt.today(), dt.min.time())
END_DT = dt.combine(dt.today(), dt.max.time())
NOW = dt.now()
CURRENT_EXEC = '{{ execution_date }}'
TODAY_MD = dt.today().strftime("%m%d")
def datetime_range(start, end, delta):
"""Generates the date range with time separation"""
current = start
if not isinstance(delta, td):
delta = td(**delta)
while current < end:
yield current
current += delta
default_args = {
'owner': 'test',
'depends_on_past': False,
'start_date': START_DT,
'email': ['test@test.com'],
'email_on_failure': False,
'email_on_retry': False,
'queue': 'etl',
'retries': 1,
'retry_delay': td(minutes=1),
}
dag_name = 'SEQ_TEST_01'
dag = DAG(dag_id=dag_name, default_args=default_args, schedule_interval=td(minutes=30))
def seq_job(sq_dt, **kwargs):
for count, dt_in in enumerate(datetime_range(START_DT, END_DT, {'minutes':30}), 1):
if sq_dt < str(dt_in):
curr_seq = count, dt_in, dt_in + td(minutes=29, seconds=59)
sequence = int(curr_seq[0])
return sequence
pycall = PythonOperator(
task_id='seq_sensor',
provide_context=True,
python_callable=seq_job,
op_kwargs={'sq_dt': CURRENT_EXEC},
dag=dag)
def group(grp, **context):
sequence = context['task_instance'].xcom_pull(task_ids='seq_sensor')
grp = '%0.2d' % grp
database = 'TEST'
today_date = '{{ ds_nodash }}'
return BashOperator(
task_id='ETL_GRP{}_{}_{}'.format(database, sequence, gap),
bash_command='script.sh {} {} {} {}'.format(today_date, sequence, database, grp),
dag=dag)
complete = DummyOperator(
task_id='All_Sequences_complete',
dag=dag)
pycall >> group(1) >> complete
pycall >> group(2) >> complete
pycall >> group(3) >> complete
问题是无论我尝试什么,我都会不断收到此错误:
Traceback (most recent call last):
File "/usr/local/lib/python2.7/site-packages/airflow/models.py", line 263, in process_file
m = imp.load_source(mod_name, filepath)
File "/opt/airflow/incubator-airflow/airflow/dags/new_dag_seq.py", line 66, in <module>
pycall >> group(1) >> complete
File "/opt/airflow/incubator-airflow/airflow/dags/new_dag_seq.py", line 56, in group
sequence = context['task_instance'].xcom_pull(task_ids='seq_sensor')
KeyError: 'task_instance'
不确定是不是我遗漏了一些小东西,还是我的一切都错了。仍然是 Airflow 的新手,并尝试将我们的 ETL 测试环境设置为每 30 分钟运行一次,并使用由 datetime_range 生成并基于 execution_date 变量的唯一序列号。
最佳答案
尝试使用 context['ti'] 代替。
关于python - Airflow XCOM KeyError : 'task_instance' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41254253/
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。
我正在尝试测试是否存在表单。我是Rails新手。我的new.html.erb_spec.rb文件的内容是:require'spec_helper'describe"messages/new.html.erb"doit"shouldrendertheform"dorender'/messages/new.html.erb'reponse.shouldhave_form_putting_to(@message)with_submit_buttonendendView本身,new.html.erb,有代码:当我运行rspec时,它失败了:1)messages/new.html.erbshou
我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用? 最佳答案 我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击
我已经从我的命令行中获得了一切,所以我可以运行rubymyfile并且它可以正常工作。但是当我尝试从sublime中运行它时,我得到了undefinedmethod`require_relative'formain:Object有人知道我的sublime设置中缺少什么吗?我正在使用OSX并安装了rvm。 最佳答案 或者,您可以只使用“require”,它应该可以正常工作。我认为“require_relative”仅适用于ruby1.9+ 关于ruby-主要:Objectwhenrun
我花了三天的时间用头撞墙,试图弄清楚为什么简单的“rake”不能通过我的规范文件。如果您遇到这种情况:任何文件夹路径中都不要有空格!。严重地。事实上,从现在开始,您命名的任何内容都没有空格。这是我的控制台输出:(在/Users/*****/Desktop/LearningRuby/learn_ruby)$rake/Users/*******/Desktop/LearningRuby/learn_ruby/00_hello/hello_spec.rb:116:in`require':cannotloadsuchfile--hello(LoadError) 最佳
我已经像这样安装了一个新的Rails项目:$railsnewsite它执行并到达:bundleinstall但是当它似乎尝试安装依赖项时我得到了这个错误Gem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension./System/Library/Frameworks/Ruby.framework/Versions/2.0/usr/bin/rubyextconf.rbcheckingforlibkern/OSAtomic.h...yescreatingMakefilemake"DESTDIR="cleanmake"DESTDIR="
关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion在首页我有:汽车:VolvoSaabMercedesAudistatic_pages_spec.rb中的测试代码:it"shouldhavetherightselect"dovisithome_pathit{shouldhave_select('cars',:options=>['volvo','saab','mercedes','audi'])}end响应是rspec./spec/request