Google I/O 2024 帶來了像是 Ask Photo 、搜尋引擎正式導入生成式 AI 、畫圈搜尋幫助學習等新功能,除了這些新功能之外,Google 還推出名為「Project Astra」的新專案,Project Astra 建構一個真正實用且可以幫助日常生活的未來 AI 助理。
「Project Astra」一個真正實用且可以幫助日常生活的未來 AI 助理
Google 發布了它們對 AI 助手未來願景「Project Astra」的影片,影片中使用者與 Google 的多模態基礎模型 Gemini 支援的 AI 人工智慧代理原型互動。可以看到 Project Astra 跟一般聊天機器人的視覺場景辨識不同, Project Astra 可以讓使用者在螢幕上畫上記號,Gemini 可以根據記號來回答問題。譬如影片中在螢幕上對喇叭畫上箭頭並詢問「喇叭的這個部分叫什麼?」,Gemini 回答被畫記號的喇叭部分叫做 ” Tweeter 高音單體 “,Tweeter 是喇叭負責產生高頻率聲音的部分。
Project Astra 也可以幫助使用者想有創意的頭韻 (alliteration) ,Gemini 幫色鉛筆想出「Creative crayons color cheerfully」的頭韻詞,Gemini 想出來之後還表示它們 (色鉛筆們) 確實能創造出色彩豐富的作品。看來 Gemini 對自己想出來的句子很有自信呢。
Project Astra 還能透過視覺辨識功能看懂電腦裡的程式代碼作用是什麼:
Project Astra 能識別出使用者目前所在的位置並告知使用者所處地區以什麼聞名:
除此之外 Project Astra 還有豐富的聯想能力,看到兩隻貓和一個畫著問號的箱子,它可以聯想到薛定諤的貓。還能為老虎娃娃跟狗狗取了「Golden Stripes」的二重奏樂隊名稱。
看完之後大家會不會覺得 Google 發布的 AI 助手未來願景「Project Astra」的功能跟 OpenAI 前天發布會上公布的視覺場景辨識功能很像呢?Project Astra、OpenAI 的視覺辨識功能和 Meta 雷朋智慧眼鏡一樣都是讓 AI 開始能夠看到東西,一樣可以透過看到的東西回答問題。想了解更多有關 Project Astra 功能的朋友可以觀看下方影片,想了解 OpenAI 、Meta 雷朋智慧眼鏡的朋友可以點擊下方連結前往閱讀: