失敗した場合の水晶の再試行

Question

このように構成されたトリガーがあるとします。

<bean id="updateInsBBTrigger" class="org.springframework.scheduling.quartz.CronTriggerBean"> <property name="jobDetail" ref="updateInsBBJobDetail"/> <!-- run every morning at 5 AM --> <property name="cronExpression" value="0 0 5 * * ?"/> </bean>

トリガーは別のアプリケーションに接続する必要があり、問題（接続の失敗など）が発生した場合は、10分ごとに5回まで、または成功するまでタスクを再試行する必要があります。このように機能するようにトリガーを設定する方法はありますか？

dogbane · Accepted Answer

ソース： Quartzで失敗したジョブを自動的に再試行

成功するまで何度も何度も繰り返し続けるジョブが必要な場合は、失敗したときにスケジューラーに再度実行するように指示するフラグを付けてJobExecutionExceptionをスローするだけです。次のコードは、その方法を示しています。

class MyJob implements Job { public MyJob() { } public void execute(JobExecutionContext context) throws JobExecutionException { try{ //connect to other application etc } catch(Exception e){ Thread.sleep(600000); //sleep for 10 mins JobExecutionException e2 = new JobExecutionException(e); //fire it again e2.setRefireImmediately(true); throw e2; } } }

特定の回数再試行する場合は、少し複雑になります。 StatefulJobを使用し、JobDataMapにretryCounterを保持する必要があります。ジョブが失敗した場合は、この値を増分します。カウンターが最大再試行回数を超えた場合、必要に応じてジョブを無効にすることができます。

class MyJob implements StatefulJob { public MyJob() { } public void execute(JobExecutionContext context) throws JobExecutionException { JobDataMap dataMap = context.getJobDetail().getJobDataMap(); int count = dataMap.getIntValue("count"); // allow 5 retries if(count >= 5){ JobExecutionException e = new JobExecutionException("Retries exceeded"); //make sure it doesn't run again e.setUnscheduleAllTriggers(true); throw e; } try{ //connect to other application etc //reset counter back to 0 dataMap.putAsString("count", 0); } catch(Exception e){ count++; dataMap.putAsString("count", count); JobExecutionException e2 = new JobExecutionException(e); Thread.sleep(600000); //sleep for 10 mins //fire it again e2.setRefireImmediately(true); throw e2; } } }

Fl&#225;vio Ferreira · Answer

失敗後にジョブを回復するには、次のような実装をお勧めします。

final JobDataMap jobDataMap = jobCtx.getJobDetail().getJobDataMap(); // the keys doesn't exist on first retry final int retries = jobDataMap.containsKey(COUNT_MAP_KEY) ? jobDataMap.getIntValue(COUNT_MAP_KEY) : 0; // to stop after awhile if (retries < MAX_RETRIES) { log.warn("Retry job " + jobCtx.getJobDetail()); // increment the number of retries jobDataMap.put(COUNT_MAP_KEY, retries + 1); final JobDetail job = jobCtx .getJobDetail() .getJobBuilder() // to track the number of retries .withIdentity(jobCtx.getJobDetail().getKey().getName() + " - " + retries, "FailingJobsGroup") .usingJobData(jobDataMap) .build(); final OperableTrigger trigger = (OperableTrigger) TriggerBuilder .newTrigger() .forJob(job) // trying to reduce back pressure, you can use another algorithm .startAt(new Date(jobCtx.getFireTime().getTime() + (retries*100))) .build(); try { // schedule another job to avoid blocking threads jobCtx.getScheduler().scheduleJob(job, trigger); } catch (SchedulerException e) { log.error("Error creating job"); throw new JobExecutionException(e); } }

なぜ？

クォーツワーカーをブロックしません
それは背圧を回避します。 setRefireImmediatelyを使用すると、ジョブはすぐに実行され、バックプレッシャーの問題が発生する可能性があります

dimitrisli · Answer

2つのオフセットをより適切にDBに保存するための柔軟性と構成可能性を向上させるために、ジョブを再試行する必要がある時間を通知するrepeatOffsetとtrialPeriodOffsetを使用して、ジョブの再スケジュールが許可されている時間枠の情報を保持します。次に、（Springを使用していると仮定して）次のような2つのパラメーターを取得できます。

String repeatOffset = yourDBUtilsDao.getConfigParameter(..); String trialPeriodOffset = yourDBUtilsDao.getConfigParameter(..);

次に、カウンターを覚えるのではなく、initalAttemptを覚えておく必要があります。

Long initialAttempt = null; initialAttempt = (Long) existingJobDetail.getJobDataMap().get("firstAttempt");

次のチェックのようなものを実行します。

long allowedThreshold = initialAttempt + Long.parseLong(trialPeriodOffset); if (System.currentTimeMillis() > allowedThreshold) { //We've tried enough, time to give up log.warn("The job is not going to be rescheduled since it has reached its trial period threshold"); sched.deleteJob(jobName, jobGroup); return YourResultEnumHere.HAS_REACHED_THE_RESCHEDULING_LIMIT; }

上記のように、アプリケーションのコアワークフローに戻される試行の結果の列挙型を作成することをお勧めします。

次に、再スケジュール時間を作成します。

Date startTime = null; startTime = new Date(System.currentTimeMillis() + Long.parseLong(repeatOffset)); String triggerName = "Trigger_" + jobName; String triggerGroup = "Trigger_" + jobGroup; Trigger retrievedTrigger = sched.getTrigger(triggerName, triggerGroup); if (!(retrievedTrigger instanceof SimpleTrigger)) { log.error("While rescheduling the Quartz Job retrieved was not of SimpleTrigger type as expected"); return YourResultEnumHere.ERROR; } ((SimpleTrigger) retrievedTrigger).setStartTime(startTime); sched.rescheduleJob(triggerName, triggerGroup, retrievedTrigger); return YourResultEnumHere.RESCHEDULED;