Amazon SageMaker AI、大規模モデルの構築とカスタマイズを劇的に効率化
- •NovaやLlamaなどのフロンティアモデル向けに、サーバーレスでのカスタマイズ機能と開発を支援するAIエージェントが導入された。
- •新機能「Amazon Nova Forge」により、学習データの混合比率を調整し「破滅的忘却」を防ぎながら高度な推論モデルを構築できる。
- •SageMaker HyperPodがエラスティック学習等に対応し、ハードウェア障害からの迅速な復旧と最大95%のGPU稼働率を実現した。
Amazon SageMaker AIは、大規模なAIモデルのトレーニングとファインチューニングのライフサイクルを簡素化するための大幅なアップデートを発表した。特筆すべきは、新しく導入されたサーバーレスのモデルカスタマイズ機能であり、AIエージェントが開発者をガイドすることで、人間への好みの調整や特定のビジネス目標に合わせたモデル構築を支援する。このエージェントが技術的なセットアップを代行するため、企業はサーバー管理や高価な計算クラスターの運用に煩わされることなく、独自のデータや業界特有の制約事項に集中できるようになる。さらに、複雑な強化学習を用いずにモデルを最適化する「DPO(直接選好最適化)」などの手法も容易に適用可能となった。
また、高度な推論能力を持つ高品質なモデルを構築するための専用ツール「Amazon Nova Forge」も導入された。Nova Forgeでは、モデルを最初から構築するのではなく、学習の初期段階や中間段階で独自のデータを組み込むことが可能である。これにより、新しい情報を学習する際に以前の知識を失ってしまう「破滅的忘却(Catastrophic Forgetting)」という課題を回避しつつ、専門性の高いモデルを作成できる。野村総合研究所のマネージング・ディレクターである稲葉貴彦氏は、この機能により金融サービスに特化した独自のLLM構築が可能になると述べている。
大規模な運用に向けて、SageMaker HyperPodには「エラスティック・トレーニング」と「チェックポイントレス・トレーニング」が追加され、信頼性が向上した。エラスティック・トレーニングは利用可能なハードウェアに応じて負荷を自動調整し、チェックポイントレス・トレーニングはハードウェア障害発生時に数秒で正常なチップへデータを移行して復旧を行う。AWSのリードを務めるアンカー・メロトラ氏は、これらのシステムによって計算リソースの有効活用率が最大95%に達し、開発コストと時間の双方を大幅に削減できると説明している。
さらに、実験の追跡やモデルの性能評価を行うオープンソースツール「MLflow」のサーバーレス版も提供が開始された。この可観測性の向上により、開発者はリアルタイムでトレーニングの進捗を監視し、バグを迅速に特定することが可能となる。Collinear AIの共同創設者であるソミヤディップ・バクシ氏は、これらの機能強化が実験の追跡を簡素化し、AI開発の効率を大きく変えると評価している。一連のアップデートにより、AmazonはAIモデル開発における技術的な障壁を大幅に引き下げたといえる。