生成AIに関するニュースを見ない日はないくらい、様々な情報が出てきます。
その中でも、Googleの新しいAI「Gemini」についての話題を目にすることが増えてきました。
しかし、「具体的にどんなものなのか?」「どんなことができるのか?」わかりにくいですよね?
この記事では、「Gemini」について、ご紹介します。
まだ全てが公開されているわけではありませんので、正確な情報ではない場合があります。この記事の情報は2023年12月7日です
目次 非表示
Geminiの特徴
GeminiはマルチモーダルAI
テキストだけでなく、画像や音声や動画も扱えます。現在のGPT-4でもマルチモーダルですが、Geminiは開発よりマルチモーダルAIとして設計されているのでさまざまな要素を複合的に扱うことができます。
GeminiはGPT-4を超える
Googleは「マルチモーダルかつ論理的な判断に優れている」と発表
MMLUという大規模マルチタスク言語理解と呼ばれるテストで、GPT-4の86.4%というスコアに対し、Gemini(Gemini Ultra)は90.0%というスコアを獲得しました。
人間の専門家を上回るパフォーマンスを示した初のモデルになったと言われています
Geminiの3つのモデル
Gemini Ultra
超高性能の最上位モデルでハイパフォーマンスなマシンが必要とされています。MMLUという大規模マルチタスク言語理解と呼ばれるテストで90.0%というスコアを獲得したのはこのモデルとなります。
Gemini Pro
このモデルはGoogleの検索や広告などに利用されるモデルです。2023年12月7日にBardに搭載されたモデルです。(2023.12現在では英語でのみ使用可能で、言語設定を英語にする必要があります。)
Gemini Nano
スマホなどで動かせるように設計された軽いモデル。GoogleはPixel 8 ProにGemini nanoを実装すると発表しました。(現時点での言語対応は英語のみ)
独自チップ「Google Tensor G3」上で動作するので、ChatGPTなどと異なり、ネットワークの接続なしに利用できるのが特徴。
今後の予定
Nano以外のGeminiモデルを使用したAIアシスタント「Assistant with Bard」が、2024年初頭からPixel向けに提供開始予定
2024年にはGemini Ultraで稼働する「Bard Advanced」をリリース予定
現時点でわかっていること
- マルチモーダルAI
- GPR-4を超える
- Geminiの3つのモデル