Amazon、マルチエージェントAIで決済テストを自動化
- •Amazonの決済チームがSAARAMを導入し、テスト生成時間を1週間から数時間に短縮。
- •Amazon BedrockとStrands Agents SDKを活用し、複雑な品質保証ワークフローを自動化。
- •人間の思考プロセスを模倣した設計により、ハルシネーションを抑制しテスト網羅率を向上。
Amazonの決済(AMET Payments)チームは、複数のAIエージェントを活用してソフトウェアテストを自動化する高度なシステム「SAARAM」を導入した。従来、品質保証(QA)エンジニアはテストケースを作成するために、1週間かけて手作業でドキュメントを分析していた。リード開発者のJayashree R氏とFahim Surani氏(共にAmazonのエンジニア)は、Strands Agents SDKとAmazon Bedrock経由のLLMを活用することで、具体的で実行可能なテストシナリオをわずか数時間で生成可能にした。これにより、エンジニアは反復的な文書作成から解放され、より戦略的な業務に集中できるようになった。 今回の技術的突破口は、単純な命令から人間中心のアーキテクチャへと転換したことにある。開発チームはAIを単一の頭脳として扱うのではなく、テストプロセスを人間の専門家の思考パターンを模倣した専門的なステップに分解した。具体的には、カスタマージャーニーの分析、ビジネスルールの特定、データフローのマッピングなどが含まれる。このモジュール化された設計により、地域ごとの決済規制などの複雑なロジックを正確に理解し、AIが事実に基づかない情報を生成するハルシネーションを最小限に抑えつつ、テストの網羅性を高めている。 SAARAMの現行バージョンでは、専門特化したエージェントのパイプラインが採用されている。「インテリジェント・ゲートウェイ」が設計図やコードリポジトリなどのファイルを適切な「データ抽出エージェント」へと振り分ける。抽出されたデータは「ビジュアライザー」に送られ、考えられるすべてのユーザーパスを図解化する。これは、単一の出力を求めるのではなく、モデルを論理的なフェーズに沿って導く緻密なプロンプトエンジニアリングによって実現されている。 最終的に、システムは知識の蒸留(Knowledge Distillation)の原理を用いて、これらすべての情報を構造化された要約に統合する。これにより、AIはテストケースを書き始める前に、製品要件の完全かつ明確な全体像を把握できる。このソリューションは現在、Amazonのグローバルストアや決済組織全体に展開されている。この事例は、信頼性の高いAIを構築するには、単にモデルの規模を拡大するよりも、人間の論理を研究する方が効果的であることを示している。