グーグル開発のAIチャットボット「Bard」。数学とプログラミングの機能改善に注力【テッククランチ】

2023年6月20日

執筆者

Kyle Wiggers

TechCrunchのシニアレポーター、特に人工知能分野に関心を持っている。VentureBeat、Digital Trendsのほか、Android Police、Android Authority、Droid-Life、XDA-Developersなどのガジェットブログに寄稿している。

グーグルの窮地に陥っている人工知能(AI)搭載チャットボットBardが論理や推論などのタスク処理能力を少しずつ向上させている。グーグルは6月7日のブログへの投稿で「暗黙的なコード実行」と呼ばれる技術のおかげでBardがいま、数学とコーディングの分野で特に能力を向上させていることを示唆している。

ブログによると、Bardのような大規模言語モデル(LLM)は基本的に予測エンジンだ。プロンプトが与えられると文章の中でどんな単語が次に来るかを予測し、応答を生成する。そのため、電子メールやエッセイの書き手としては格段に優秀だが、ソフトウェア開発者としてはややミスが多い。

GitHubのCopilotやアマゾンのCodeWhispererのようなコード生成モデルはどうなのかと言う人もいるかもしれない。だが、これらは多目的ではない。BardやライバルのChatGPTがウェブや電子書籍などの膨大なテキストサンプルで学習したのとは異なり、CopilotやCodeWhispererなどのコード生成モデルはほとんどコードサンプルだけで訓練、そして微調整された。

一般的なLLMにおけるコーディングと数学の欠点に対処しようと、グーグルは暗黙的なコード実行を開発し、Bardが自らのコードを書き、実行できるようにした。Bardの最新バージョンは論理的コードの恩恵を受けるかもしれないプロンプトを特定し、そのコードを「見えないところで」書いてテストし、その結果を使用して表面上はより正確な応答を生成する。

グーグルは社内のベンチマークに基づき、新しいBardの「計算ベースの」単語と数学の問題に対する応答は以前のBardと比較して30%改善されたとしている。もちろん、そうした主張が外部のテストに耐えられるかどうかは少し様子をみなければならない。

「このような改良をもってしてもBardが常に正しく動くとは限らない。例えば、Bardがプロンプト応答を助けるコードを生成しないかもしれないし、生成したコードが間違っているかもしれない。あるいはBardが実行したコードを応答に含めないかもしれない」とBardの開発を率いるJack Krawczyk(ジャック・クラフチク)氏とエンジニアリングVPのAmarnag Subramanya(アマルナグ・スブラマニャ)氏はブログに書いている。「とはいえ、構造化された論理主導型の機能で応答するために改善されたこの能力はBardをさらに役立つものにするための重要な一歩だ」とも主張している。

グーグルが今年初めにBardを発表したとき、Bing ChatやChatGPTなどと比べてそれほど優れているわけではなかった。実際、グーグルの広告でBardが誤った回答をしたことで、同社の株価が一時的に8%下落するなど、その展開はちょっとした失敗となった。

報道によると、リリース前にBardをテストした複数のグーグル社員は社に深刻な懸念を伝えた。ある社員はBardを「病的な嘘つき」と表現し、別の社員は「役に立たないよりひどい」と判断した。

暗黙的なコード生成、そして新しい言語のサポートやマルチモーダルなクエリ、画像生成といった機能強化によりグーグルは批判に応え、挽回しようとしている。

しかし、そうした取り組みがこの分野をリードしている生成AIチャットボットに追いつくのに十分であるかどうかはまだわからない。最近、Anthropic(アンソロピック)は「コンテキストウィンドウ」を大幅に拡張したAIチャットボットのモデルを発表した。このモデルでは数分間ではなく、数時間、あるいは数日間、比較的首尾一貫とした会話をすることができる。また、ChatGPTの開発元であるOpenAIは、外部の知識やスキルでChatGPTを大幅にグレードアップするプラグインのサポートを開始した。

From TechCrunch. © 2023 Verizon Media. All rights reserved. Used under license.

元記事:Google claims that Bard is improving at math and programming
By:Kyle Wiggers
翻訳:Nariko

人気記事

  • コピーしました

RSS
RSS