この記事の要点は？

百川智能が2350億パラメータの医療特化型基盤モデル「Baichuan-M3」を発表 HealthBenchにおいてGPT-5.2を上回り、臨床推論で世界最高水準の性能を達成能動的な問診機能やハルシネーション抑制技術を搭載し、安全性を大幅に強化

百川智能が235B医療モデル公開、GPT-5.2を凌駕

•百川智能が2350億パラメータの医療特化型基盤モデル「Baichuan-M3」を発表
•HealthBenchにおいてGPT-5.2を上回り、臨床推論で世界最高水準の性能を達成
•能動的な問診機能やハルシネーション抑制技術を搭載し、安全性を大幅に強化

中国の百川智能（Baichuan Intelligent Technology）が、2350億もの膨大なパラメータを誇る医療特化型の基盤モデル「Baichuan-M3」を発表した。このモデルは、臨床現場における極めて複雑な意思決定を支援するために設計されている。従来の受け身な質疑応答システムとは一線を画し、プロの医師が行う診断プロセスそのものをシミュレートすることが可能だ。具体的には、単純なテキスト予測ではなく、体系的な医療面談を再現する独自の学習パイプラインを採用しており、能動的な意思決定支援へとパラダイムを転換させている。

特筆すべき機能の一つは、能動的な情報収集能力である。Baichuan-M3は、ユーザーからの初期プロンプトだけに頼るのではなく、診断に不可欠な情報の不足を自ら特定し、曖昧さを解消するために聞き取り（深掘り質問）を行う。これに加えて、高度な長期推論機能も備えており、複数回にわたる対話を通じて、一見バラバラな症状や過去の病歴を一つの論理的な診断に結びつけることができる。こうした能力は、複雑な症例の分析において真価を発揮するだろう。

また、医療AIにおいて最も懸念されるハルシネーションのリスクを抑えるため、研究チームは「適応型ハルシネーション抑制」技術を導入した。これにより、対話中も常に医学的事実に即した回答を維持できるようになっている。実際に、HealthBenchやScanBenchといった厳格な評価フレームワークにおいて、臨床面談や安全性のカテゴリーでGPT-5.2を上回る世界最高水準の結果を記録した。現在、フルモデルおよび各種量子化版がHugging Faceでオープンウェイトとして公開されており、医療AIの研究に新たな可能性を提示している。

中国の百川智能（Baichuan Intelligent Technology）が、2350億もの膨大なパラメータを誇る医療特化型の基盤モデル「Baichuan-M3」を発表した。このモデルは、臨床現場における極めて複雑な意思決定を支援するために設計されている。従来の受け身な質疑応答システムとは一線を画し、プロの医師が行う診断プロセスそのものをシミュレートすることが可能だ。具体的には、単純なテキスト予測ではなく、体系的な医療面談を再現する独自の学習パイプラインを採用しており、能動的な意思決定支援へとパラダイムを転換させている。

特筆すべき機能の一つは、能動的な情報収集能力である。Baichuan-M3は、ユーザーからの初期プロンプトだけに頼るのではなく、診断に不可欠な情報の不足を自ら特定し、曖昧さを解消するために聞き取り（深掘り質問）を行う。これに加えて、高度な長期推論機能も備えており、複数回にわたる対話を通じて、一見バラバラな症状や過去の病歴を一つの論理的な診断に結びつけることができる。こうした能力は、複雑な症例の分析において真価を発揮するだろう。

また、医療AIにおいて最も懸念されるハルシネーションのリスクを抑えるため、研究チームは「適応型ハルシネーション抑制」技術を導入した。これにより、対話中も常に医学的事実に即した回答を維持できるようになっている。実際に、HealthBenchやScanBenchといった厳格な評価フレームワークにおいて、臨床面談や安全性のカテゴリーでGPT-5.2を上回る世界最高水準の結果を記録した。現在、フルモデルおよび各種量子化版がHugging Faceでオープンウェイトとして公開されており、医療AIの研究に新たな可能性を提示している。

百川智能が235B医療モデル公開、GPT-5.2を凌駕

タグ