Grokとは?Grok 3で何ができるのか、モデル別に徹底比較

Grokとは?Grok3で何ができるのかモデル別に比較してみた記事の表紙画像

みなさん、こんにちは。
株式会社シー・エス・エスのES開発部、かわらです。

みなさんも日常生活で耳にタコができるほど聞いていると思いますが、日々AIが進歩していますね。
ついこの前まで、質問にとんちんかんな答えを返す様を面白がっていたと思ったら、あっという間に質問内容の意図に沿ってしっかりした回答を返すようになっています。

今年度の全社総会で、壇上に上がる偉い人達の大半がAIを話題に挙げていたのも個人的に印象に残っています。

▼シー・エス・エスグループの全社総会の様子、各部門長からの発表内容

 

そんなAIの話題で持ちきりの昨今ですが、先日、xAI社が最新AIモデル「Grok 3」を発表したので、今回はGrokについて解説していこうと思います。

 

Grokとは

GrokはxAI社が開発した対話型AIのこと

Grokはイーロン・マスク氏が2023年に設立したAI開発企業、xAI社が開発した大規模言語モデル(LLM)に基づく対話型AIです。

LLMに基づく対話型AIということで、OpenAI社のChatGPTやGoogle社のGeminiなどと同じカテゴリーのAIに分けられるかと思います。

難しげな専門用語(LLM)が出てきましたが、ざっくり説明しますと「膨大な量のテキストデータを学習させることで人間のような自然な言語の理解・生成を目指す技術」という感じです。

Grokの変遷

Grokは、Grok 1の登場以来、およそ半年ごとに大規模なアップデートを重ねてきました。

Grokのモデル別機能比較表

初代Grokから、先日リリースされたGrok 3に至るまで、それぞれのバージョンでどのような進化を遂げ、どんなことができるようになったのか、詳しくご紹介していきますね。

Grok 1

2023年11月 Xの有料プランユーザーに向けてリリース。

Grok 1の時点では以下のような機能が実現されていました。

  • テキスト生成
  • テキストの翻訳
  • テキストの要約
  • 質疑応答

こうして見てみると、Grok 1の時点で既にテキスト対話型のAIの基本的な機能は使用できる状態であったようです。

Grok 1.5 & Grok 1.5V

2024年3月リリース。

Grok 1.5では推論能力や長文に対する理解力の強化など、主に性能面での改善が施されました。

Grok 1.5のリリースから間もなく、Grok 1.5Vがリリースされます。

今までのGrokはテキスト処理に特化していたAIでしたが、Grok 1.5Vは画像や図などの視覚情報も処理できる「マルチモーダルAI」となりました。

視覚から得られる情報も扱えるようになったことで、以下のようなことができるようになりました。

  • フローチャートの図からプログラミングコードを作成する
  • 画像の情報から画像に対する説明を行う


新機能が加わったこともあり、急激に進化した感じがしますね...!

Grok 2

2024年8月リリース。

Grok 2では性能面のさらなる強化に加え、リアルタイム情報アクセス機能と画像生成機能が実装されました。

特にリアルタイム情報アクセス機能に関しては、他のAIモデルに対してGrokが優位性を持つ部分となります。

大規模言語モデルに基づくAIは、その性質上、学習に使用したデータ以後の最新情報を扱うのを不得手としていました。

しかし、Grok 2はXを介することによって、最新のニュースやトレンドに関する情報も正確に扱うことを可能としたのです。

Grok 3の特徴

それではいよいよ、今回リリースされたGrok 3の特徴について見ていきましょう。

性能面の劇的な向上

Grok 3ではGrok 2からさらに性能面が強化されました。

Grok 3はGrok 2の約10倍の計算能力を持ち、タスクの実行がより迅速で正確になり、長い文章や大量のデータに対応する力も上昇しています。

この成長を実現したのがGrok 3のトレーニング環境です。トレーニングに使用したリソースはGrok 2の10倍~15倍程であり、Grok 3のトレーニングでは約20万台の高性能GPUを利用して、合計で2億GPU時間の学習を行ったとされています。

1台のGPUが1時間稼働すると1GPU時間というのを考えると、途方もない計算リソースが使用されたことが分かるかと思います。

DeepSearch機能の実装

DeepSearch機能は、AIがリアルタイムでウェブ検索を行い、最新情報を収集した上で様々な意見や事実をまとめてから回答してくれる機能です。

Grok 2の時からXを利用したリアルタイム検索機能はありましたが、それと比較すると以下のような違いがあります。

  • Grok 2のリアルタイム検索
    • ホットな話題やトレンドの収集に特化
    • 深掘りよりも速報性を優先した設計
  • Grok 3のDeepSearch
    • 深く掘り下げたリサーチに特化
    • ウェブ全体から情報を集めてAIが結果をまとめる

Grok 2では「Xでは○○が話題になってます」と言うレベルなのに対し、
Grok 3では「○○が話題ですが、××という背景があり△△と考えられます」

といったレベルまで分析してくれる感じです。
結果の正当性は置いておいて、めちゃくちゃ賢いですね。

さいごに:AIの進化スピードが速すぎる

Grok 1がリリースされてから今回のGrok 3がリリースされるまで約1年3ヶ月。

この期間の短さを踏まえるとAIの急成長ぶりを再認識できますね。。。

新技術の進歩に対してしっかりアンテナを張っていかなければ!と改めて思わされました。

 

今回の記事は以上となります。
最後までご覧いただきありがとうございました。

この記事を書いた人

この記事を書いた人のプロフィール写真(ヤドカリ)

[経歴]
入社5年目。配属以降、Rubyをメインに扱う案件に複数件参画してきました。
最近は未経験のOracleを頑張っています。
 
[趣味]
散歩・レトロゲーム
 
[ひと言]
プロフィール写真は、数年前に沖縄の海で撮ったヤドカリの写真です。
デスクトップの背景みたいな写真だな と気に入っています。