『大規模言語モデルは新たな知能か——ChatGPTが変えた世界』 岡野原大輔 2023年6月 岩波書店
ChatGPTが世を騒がせて久しい。AIは既に日常生活に普通に入り込んでいる。一方、AI技術者とは言わないまでも、生成AIを専門的に解説できる人がそれほど多いわけではない。論理の世界に入ろうとすると数学の知識が無いと付いていけないので、一般人はどうしても敬遠してしまう。
アマゾンのコメントを読むと、この本、大規模言語モデル(LLM)の知識のある人には少々物足りなさがあるが、素人で関心のある人には全体像を掴むのに適しているとある。
もちろん全くの素人が初めて読んでも、すべてがすらすらと頭に入るというわけには行かないが、LLMとは何か、コンピューターに言語を理解させるに至ったこれまでの開発の歴史、ニューロモデルや深層学習がどのような構造を概念としているのかを掴むことが出来る。微分、行列、ベクトルといった数式は一切使わずに136ページの本としてコンパクトに纏められているので、一気に読み通すことができるだろう。
ちなみに著者の経歴を調べてみると、大学時代にベンチャーを立ち上げ、検索エンジンを仲間とともに作成して売り歩いたのを出発点に、深層学習をコア技術とする現在の事業に至ったとある。マイクロソフトのビル・ゲーツ、グーグルのセルゲイ・ブリンやラリー・ペイジのような起業家精神に溢れた若者が日本でも育っていたことを初めて知った次第である。