以下の内容はhttps://anton0825.hatenablog.com/entry/2022/08/09/000000より取得しました。


SageMakerでTrainingJobを起動すると「ClientError: Failed to invoke sagemaker:CreateProcessingJob. Error Details: The account-level service limit 'ml.m5.2xlarge for processing job usage' is 20 Instances」エラー

TrainingJobを起動したのに、エラーメッセージは「CreateProcessingJobを実行したけど、processing jobのservice limitに引っかかったよ」と言っている。

TrainingJobを起動したはずなのになぜ・・と思ったら、TrainingJobは裏でProcessingJobを起動しているっぽい。

TrainingJobを起動した後、ProcessingJobの一覧を確認するとTrainingJobと同数のProcessingJobが起動している・・

掲題のエラーが発生した状況は以下。

  • TrainingJobを20インスタンス実行中
  • 追加でProcessingJobを1インスタンス起動

逆に、以下のケースではエラーが起きなかった。

  • ProcessingJobを1インスタンス実行中
  • TrainingJobを20インスタンス起動

ProcessingJob起動時のみProcessingJobの「すべての処理ジョブにおける合計インスタンス数」がチェックされているっぽい。起動順序によってエラーになる・ならないが変わるのは何か変な感じ

docs.aws.amazon.com




以上の内容はhttps://anton0825.hatenablog.com/entry/2022/08/09/000000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14