稗田利明のIT Insights

ITの未来を探る、情報発信"

生成AI、SPI型テストで就活生並みの実力 稗田利明

生成AI、SPI型テストで 就活生並みの実力

 

こんにちは、稗田利明です!

(株)ビジー・ビーは、「Microsoft Excel」用のアドイン「生成AIツール for Excel」を2024年5月版にアップデートし、GoogleのAI「Gemini 1.5 Pro」に対応したと発表しました。 このアドインは、OpenAIの「ChatGPT」やAnthropicの「Claude 3」など、主要な生成AIを Excel の関数として利用できるようにするものです。 今回のアップデートにより、16のAIモデルに対応し、世界で唯一のこのようなExcelアドインとなりました。

## SPI型テストで生成AIの実力を検証

ジー・ビーは、採用試験で使われるSPI型テストを用いて、主要6つの生成AIモデルの業務適性を比較しました。 正答数ではAnthropicの「Claude 3 Opus」がトップで、173問中173問を正解しました。 一方、「世界最高性能」と評されるOpenAIの「GPT-4」は158問正解に留まり、最高性能ではありませんでした。

「Claude 3 Opus」の正答率は59%で、ビジー・ビーは来春卒業予定の就活生並みの実力と評価しています。 分野別では、英語は「GPT-4」が100%の正答率でトップでしたが、日本語と非言語(計算、論理)分野では「Claude 3 Opus」がそれぞれ62%、46%と最高でした。

## 適切なプロンプトエンジニアリングが重要

ジー・ビーは、AIモデルにも得意分野があると指摘し、適切なプロンプトエンジニアリングと各モデルの長所を組み合わせれば、SPI型テストの正答率は82%に達すると試算しています。 そのため、「優良企業に就職できる程度に優秀」とAIの実力を評価しました。

 

「生成AIツール for Excel」がGoogleの生成AI「Gemini 1.5 Pro」に対応(窓の杜) - Yahoo!ニュース https://news.yahoo.co.jp/articles/ed94f08696550f2c900d49a295926bba39b9dcff