清水亮 世界中で争奪戦の<激レアアイテム>、330万円で買うか買わないか?日本のAI開発の光となる『四畳半のスーパーコンピューター』ここに爆誕す

人工知能はウソをつく【第6回】
清水亮

大規模言語モデルを作るには大規模な半導体が必要

ChatGPTの流行で、世界的に大規模言語モデル注目が集まっているでも、大規模言語モデルを作るためには大規模な半導体が必要だ。

秋葉原に売ってるようなモノではなく、ホンモノの、プロが使うやつが。

秋葉で買える最高のGPUがポルシェのエンジンだとしたら、今買ったGPUはF1カーのエンジン。値段10倍ほど違うが、性能は2倍程度。だがこの2倍が決定的な差になる。

ちなみに、経済産業省が東京大学柏の葉キャンパスに設置したAI橋渡しクラウド基盤、通称ABCIは総工費20億円のプロジェクトである。随時追加予算が組まれているが、そのABCIでさえ、この部品は設置されていない。

僕が買ったのはA100の80GB版ABCIにあるのは40GB版に過ぎない。数はABCIのほうがずっと多いかもしれないが、80GBか40GBかというのも、やはり致命的な差となる

というのも、この容量の違いが扱えるモデルの規模を決めるからだ。40GBを束ねて使うことも出来なくはないが、かなり無理があるし余計な手間がかかる。80GB版を持っていれば、最低限の実験は手元でできるようになる。

1  2  3  4  5