Associa、Amazon Bedrockで4,800万件の文書を自動分類
- •Amazon Bedrockを活用し、4,800万件の文書で95%の分類精度を達成した。
- •「1ページ目のみ」を処理する手法により、精度向上と50%のコスト削減を両立した。
- •比較検証の結果、性能と推論コストのバランスにおいてAmazon Nova Proが最適であると判断された。
北米最大のコミュニティ管理企業であるAssociaにとって、300の支店に分散する約5,000万件の文書管理は極めて困難な課題であった。従来、従業員は規約から保険証券に至るまで、あらゆる書類を数千時間かけて手作業で仕分けていた。そこで同社はAWS Generative AI Innovation Centerと提携し、Amazon Bedrockを用いた高度な分類システムを開発。非構造化データを整理された実用的なデータストリームへと変換することに成功した。
エンジニアリングチームは、文書全体をAIに読み込ませるよりも、最初の1ページのみを解析する方が効果的であることを突き止めた。このアプローチは、モデルを混乱させる「ノイズ(無関係な情報)」を排除すると同時に、文書あたりのコストを半分に抑える結果をもたらした。また、画像のみの解析ではなく視覚データと光学文字認識 (OCR) を組み合わせることで、「不明」と判定される文書の処理能力が大幅に向上した。これにより、システムはテキストを読み取るだけでなく、ページのレイアウトや視覚的な構造までも理解できるようになった。
AnthropicのClaudeやAmazon Novaファミリーなど複数のモデルをベンチマークした結果、最終的にAmazon Nova Proが選定された。この特定の構成により、1文書あたりわずか0.55セントという低コストで、95%の精度を実現している。この展開は、インテリジェント文書処理 (IDP) がいかに業務のボトルネックを解消し、スタッフを事務的なファイリング作業から解放して、より付加価値の高いコミュニティ管理業務に集中させられるかを証明している。
このソリューションは既存のワークフローにシームレスに統合できるモジュール設計で構築されている。Amazon Bedrockを利用することで、自社で複雑なハードウェアインフラを維持することなく、膨大なデータ量に合わせて処理能力を柔軟に拡張できる点が大きな強みである。