Google最新AI代理系統Gemini Spark的真實世界測試結果出爐,結果令測試者驚呼「好得嚇人」,這不僅為Google上月I/O大會的現場示範提供了有力背書,也為採用相同模型的蘋果智能(Apple Intelligence)兌現承諾帶來重大利好。
2026年6月2日,美國紐約——資深科技記者傑伊·彼得斯(Jay Peters)對Google上月I/O開發者大會上發布的代理型AI系統Gemini Spark進行了真實場景測試。他設計了一項貼近日常生活的任務:要求Gemini起草一封電郵給妻子,匯總2026年的每月平均雜貨開支,但在過程中完全沒有提供妻子的姓名或預算試算表的檔案名稱。
測試結果令人震驚。Gemini Spark成功找到了彼得斯妻子的電郵地址,從其Google雲端硬碟中準確定位了2026年家庭預算試算表——儘管該檔案名稱中並未包含「預算」二字——提取了每月雜貨支出數據,包括尚未結束的5月份不完整數據,計算出平均值,並在Gmail中自動生成了一封草擬電郵。更令人驚訝的是,電郵以妻子的名字稱呼收件人,而她的電郵地址中並未包含其名字;郵件末尾甚至使用了彼得斯夫婦之間特有的署名方式。
彼得斯對測試結果直言:「哇,這真的瘋了。」他形容Gemini Spark的表現「好得嚇人」,並表示雖然結果並非完美無瑕,但已足以令他感到震撼。這一真實場景測試表明,Google在I/O大會上的現場示範並非虛構,AI代理在現實生活中確實能夠執行複雜的多步驟任務。
這項測試對蘋果公司意義尤為重大。約一年前,知名蘋果評論員約翰·格魯伯(John Gruber)曾對蘋果發起猛烈批評,指責該公司在發布新Siri功能時,僅展示了無法實際演示的概念影片,連在嚴格受控的環境中也無法重現。相比之下,Google在I/O大會上進行了現場即時示範,雖然仍與真實使用場景存在差距,但已是重大進步。
如今,Gemini Spark的實測成功為蘋果智能帶來了新的希望。由於蘋果智能將採用與Gemini Spark相同的底層模型,這意味著蘋果承諾已久的Siri升級功能有可能真正實現,即使這些承諾最終是由Google的技術來兌現。對於期待蘋果智能已久的用戶而言,這無疑是一個積極信號。
💬 留言