サイモン・ウィリソン、AI執筆疑惑を論破
- •Webフレームワーク「Django」の共同開発者であるサイモン・ウィリソン(Simon Willison)が、ブログ執筆に生成AIを使用しているという疑惑を公式に否定した。
- •AI特有の文章の特徴とされる「LLM臭」の正体は、実際には2015年から使用しているPythonコードによる記号の自動変換だった。
- •今回の騒動は、人間の執筆スタイルを文体のパターンのみに基づいてAI製だと誤認するリスクを浮き彫りにしている。
Webフレームワーク「Django」の共同開発者として知られる著名な技術者、サイモン・ウィリソン(Simon Willison)が、自身のブログ記事が大規模言語モデル(LLM)によって書かれているという相次ぐ疑惑に反論した。批判の多くは、読者がAI生成テキスト特有の癖として結びつけがちな、いわゆる「LLM臭(LLM smell)」に向けられている。ウィリソン氏の場合、AIが複雑な重文を構成する際によく用いる「エムダッシュ(—)」という句読点を頻繁かつ正確に使用していることが、主な「容疑」とされていた。
しかし、真相は現代のAIブームよりずっと前に遡る、極めて日常的なものだった。ウィリソン氏は、エムダッシュの使用が2015年に実装した特定のPythonコードによるものであることを明かした。このスクリプトは、ブログ投稿内のハイフンを正式なエムダッシュに自動置換するもので、ChatGPTなどが一般的になるより10年近く前、GitHubへの移行時に導入された仕組みだ。これは、人間の長年の習慣を、後付けでAIによる生成物の痕跡だとラベル付けしてしまう現代のデジタル環境における大きな課題を露呈させている。
今回の出来事は、文体の「雰囲気」のみに基づいたAI検知の難しさを示す重要なケーススタディと言える。ユーザーがAIのパターンに詳しくなるにつれ、本物の人間の創造性や個人的な自動化ツールを、人工的な出力だと誤認するリスクが高まっているのだ。ウィリソン氏の事例は、AIが人間のデータで学習される一方で、人間もまた機械のような一貫性を生むツールやスクリプトを日常的に利用していることを示している。結局のところ、特定の句読点やフォーマットの存在は、執筆者の正体を見極めるための指標としては不十分なのである。