Amazon SageMaker AI、観測性とサーバーレス機能を強化
- •リアルタイムのGPUおよびメモリ追跡が可能な、詳細なインスタンスレベルのメトリクスを導入。
- •RLVRやDPOなどの高度な手法に向けた、リソースプロビジョニングを自動化するサーバーレスカスタマイズ機能を提供。
- •WebSocketおよびHTTP/2接続による双方向ストリーミングで、リアルタイムのマルチモーダル対話を実現。
Amazon SageMaker AIは、生成AIワークロードのファインチューニングから推論、本番環境でのホスティングに至るライフサイクル全体を効率化する一連のアップデートを発表した。特に注目すべきは観測性(オブザーバビリティ)フレームワークの強化である。これにより、開発者は個別のコンテナ単位でGPUやメモリの使用状況を監視できるようになった。このきめ細かな可視化は、これまでシステム全体の平均値に隠れていたリソースのボトルネックを特定するのに役立ち、高い負荷がかかるアプリケーションでも安定したパフォーマンスを確保できる。
また、新たに追加されたサーバーレスカスタマイズ機能は、特定のタスクに合わせてモデルを調整する手法を大きく変えるものだ。データサイズに基づいて必要な計算能力を自動的に選択するため、インフラ計画における試行錯誤を排除できる。この環境は、特定の検証可能な目標を達成することで学習する「検証可能な報酬からの強化学習 (RLVR)」や、複雑な報酬モデルを構築せずにモデルの振る舞いを人間の好みに合わせる「直接選好最適化 (DPO)」といった高度な手法をサポートしている。
次世代のインタラクティブなAIを支えるため、Amazon SageMaker AIは双方向ストリーミング機能も実装した。リクエストが完了するまで応答を待つ標準的なシステムとは異なり、この技術はオープンな双方向チャネルを維持する。これにより、ユーザーとモデルの間で情報が同時に流れるため、音声アシスタントやリアルタイム翻訳サービスにおいて瞬時のフィードバックが可能となる。さらに、IPv6やPrivateLinkのサポート拡張と相まって、これらの更新は企業の革新スピードとセキュリティ要件の両立を強力に後押しするだろう。