- +1
比OpenAI良心多了,一文總結(jié)Google發(fā)布會(huì)的11個(gè)亮點(diǎn)
原創(chuàng) 數(shù)字生命卡茲克 數(shù)字生命卡茲克
就在X上一群人被草莓哥亂發(fā)OpenAI預(yù)告,瘋狂搞心態(tài)的時(shí)候。
Google帶著MadeByGoogle ‘24發(fā)布會(huì)來(lái)了。

OpenAI甚至為了狙擊Google,在人發(fā)布會(huì)開始幾分鐘后,發(fā)了一個(gè)Blog,就這么個(gè)破Blog,還讓他們的AI草莓哥當(dāng)謎語(yǔ)人預(yù)告了兩天。

現(xiàn)在的OpenAI,真的跟狼來(lái)了一樣,我對(duì)他已經(jīng)沒有任何期待和信任可言了。每次就差那兩個(gè)臟話罵出來(lái)了!
而Google在沒有任何的預(yù)期下,還是有一些額外的驚喜的。
我總結(jié)了11個(gè)亮點(diǎn),你看完了這篇文章,也算是看完發(fā)布會(huì)了。
1. Google要根據(jù)Gemini重構(gòu)Android。

他們定義了一個(gè)詞,叫AI OS,Google想把AI OS帶給所有人。
目前它們已經(jīng)支持200多個(gè)國(guó)家和地區(qū)的45種語(yǔ)言,它可以在數(shù)十個(gè)設(shè)備制造商的數(shù)百個(gè)手機(jī)型號(hào)上使用,全球數(shù)十億臺(tái)設(shè)備上得到支持。
2. 手機(jī)上Gemini的圖像識(shí)別翻車了。
他們第一個(gè)演示的是Gemini的圖像識(shí)別能力。
作為多模態(tài)AI,圖像拍攝識(shí)別似乎被卷成必須有的功能了。最能考驗(yàn)照片識(shí)別能力的,就是拍攝說(shuō)明書、日程表這類信息密集的內(nèi)容——既要識(shí)別圖像,還得看得懂文本內(nèi)容給出答案。
演示的小哥拍攝了一張紙質(zhì)音樂會(huì)海報(bào),上面巡演的日程安排。演示者讓Gemini查看自己的計(jì)劃,選擇可以去看Sabrina Carpenter演出的時(shí)間。

然而,現(xiàn)場(chǎng)演示必定會(huì)出現(xiàn)的失誤,它來(lái)了。
Gemini前兩次拍照都很不給面子地現(xiàn)場(chǎng)演示失敗,隔著太平洋我都感覺現(xiàn)場(chǎng)尬住了,還是兩次。。。= =
這個(gè)演示還特意提了一下,用的是三星Galaxy S24 Ultra手機(jī),難道是三星發(fā)力了?

現(xiàn)場(chǎng)緊急換了一部設(shè)備重新嘗試,好在第三次順利識(shí)別出了圖片內(nèi)容。
Gemini直接給出了很具體的日期:Sabrina會(huì)在2024年11月9日到達(dá)舊金山,并且這一天演示者沒有其他安排,可以去看演出。
現(xiàn)場(chǎng)的掌聲終于響起,哥們兒肉眼可見地松了一口氣啊。

3. 跨軟件交互很方便。
Gemini現(xiàn)在能夠在手機(jī)上直接理解并分析視頻內(nèi)容。
你可以一邊觀看視頻,一邊呼喚出Gemini為你總結(jié)重點(diǎn),或者回答你關(guān)于視頻內(nèi)容的問(wèn)題。
比如晚上觀看油管上美食視頻后,都不用你挨個(gè)識(shí)圖,自動(dòng)生成視頻中出現(xiàn)的食物清單,并添加到用戶的個(gè)人"待嘗試"列表中。

吃貨福音。

并且可以為油管上的一些旅行視頻創(chuàng)建景點(diǎn)清單或行程建議。
作為一個(gè)連散步都需要出場(chǎng)bgm的,
你也可以要求gemini制作一個(gè)“適合在首爾散步的韓國(guó)流行音樂播放列表”,它能根據(jù)用戶描述的場(chǎng)景、情緒或活動(dòng)類型推薦合適的音樂。
使尋找音樂變得更加直觀和個(gè)性化。

4. 寫文速度很快效果也不錯(cuò)。
Gemini還可以輔助在手機(jī)端用僅數(shù)秒的時(shí)間完成郵件寫作。
小哥演示了兩個(gè)場(chǎng)景:第一個(gè)是給房東寫封不失禮貌的催促信,通知她來(lái)維修家里的供電模塊。
第二個(gè)是給教授寫一封生病缺勤的道歉信(看來(lái)這種事小哥之前沒少干)。

此外Gemini還有方便用戶潤(rùn)色文本和發(fā)送郵件的交互設(shè)計(jì)。

看到Gemini沒幾秒就完成道歉信,小哥都快憋不住笑了。
5.Gemini Live實(shí)時(shí)對(duì)話效果還不錯(cuò),但只是低延遲的TTS。
Google推出了類似于GPT4o的可以隨時(shí)打斷的實(shí)時(shí)對(duì)話功能,他們稱為Gemini Live。

里面有10種音色可以選擇。

演示的小姐姐跟Gemini Live聊了半天,音色效果不錯(cuò),延遲也足夠低,但是其實(shí)看著就是一個(gè)低延遲的TTS,而不是GPT4o那種原生的多模態(tài)大模型。
因?yàn)闆]有任何情緒理解和表達(dá)的演示,按照Google的尿性,真要是有他們一定會(huì)瘋狂展示的,另外在一些長(zhǎng)一點(diǎn)的回答上,還是能明顯的感覺到延時(shí)。
所以其實(shí)就是個(gè)低延時(shí)的TTS對(duì)話。
目前得Gemini Advanced訂閱用戶才能用,一個(gè)月20美刀,立刻上線。

6.Pixel 9 是首款搭載多模態(tài) Gemini Nano 的手機(jī)。
這是迄今為止在手機(jī)上發(fā)布的功能最強(qiáng)大的設(shè)備端 AI 模型,比之前在 Pixel 8 Pro 上用的 AI 強(qiáng)大了三倍。

Pixel 9 的處理器(TPU 和 Tensor G4)可以在一秒內(nèi)生成多達(dá) 45 個(gè)單詞,比之前的速度快了兩倍。
普通版的 Pixel 9 有 12GB 的內(nèi)存,而 Pro 版本的內(nèi)存更大,達(dá)到了 16GB。而且他們最騷的是,終于也上了衛(wèi)星通話的功能。

這里只能說(shuō)一句,遙遙領(lǐng)先!
這次發(fā)布的產(chǎn)品包括三款直板手機(jī)和一款折疊手機(jī)。常規(guī)系列包括一款配備 6.3 英寸顯示屏的基礎(chǔ)版 Pixel 9,一款配備 6.8 英寸屏幕的 Pixel 9 Pro XL,以及一款新的更小巧的 6.3 英寸 Pixel 9 Pro。

說(shuō)實(shí)話,我覺得,有點(diǎn)丑。
還有個(gè)新款的折疊屏Pixel 9 Pro Fold。

更丑了。
7.Call Notes在電話過(guò)程中可以幫你記錄下關(guān)鍵信息。
現(xiàn)在,Pixel的“通話助手”變得更強(qiáng)大了,增加了“Call Notes”功能。
在你打完電話后,它會(huì)為你提供一個(gè)完全私密的通話總結(jié)。這樣即使你在通話時(shí)沒有紙筆,也能輕松獲取電話號(hào)碼、時(shí)間、細(xì)節(jié)和其他你不想忘記的信息。

而且這個(gè)過(guò)程全部是本地跑的,基本沒有隱私問(wèn)題。
小哥舉了個(gè)例子,他最近考慮換個(gè)發(fā)型,但他的理發(fā)師做不了他想要的發(fā)型,所以他推薦我去另一家理發(fā)店。
但是問(wèn)題是,他忘了記下那家店的電話號(hào)碼。有了Call Notes后,就可以輕松回溯。

7.類似于Recall的屏幕截圖功能有點(diǎn)厲害。
有個(gè)大家都熟悉的場(chǎng)景:你在手機(jī)上看到一些想記住的東西,也許你會(huì)在腦海中記下來(lái),或者截圖保存。
但通常,你要么忘記了要記的東西,要么在需要的時(shí)候找不到。

然后他們就做了一個(gè)新的產(chǎn)品。

可以用AI快速搜索所保存的所有圖片。比如你手機(jī)里有幾十張自行車的圖,你搜一下自行車,就都出來(lái)了。

你還能問(wèn)一下更復(fù)雜的,比如T恤價(jià)格,你可以看到Pixel截圖不僅找到了原始圖像,而且還根據(jù)圖像中的信息用自然語(yǔ)言為我提供了答案。

8.一個(gè)普普通通的本地AI畫圖Pixel Studio。
每部Pixel 9手機(jī)都配備了新的Pixel Studio,他們手機(jī)上的首款圖像生成器。

效果我覺得,就是普普通通,屬于能用。
比如日落時(shí)的海灘篝火坑,就感覺效果,非常的普通。

9.AI相機(jī)拍合照非常棒。
Pixel相機(jī),說(shuō)是第一個(gè)AI相機(jī)。
大多數(shù)參數(shù)我不懂,但是這個(gè)合照的場(chǎng)景非常的有趣。

很多時(shí)候大家沒發(fā)拍合照,總有一個(gè)朋友要當(dāng)攝影師。
它會(huì)用一個(gè)簡(jiǎn)單的屏幕界面來(lái)引導(dǎo)你拍照,比如讓你把相機(jī)交給別人,這樣你們可以交換位置。然后,你可以根據(jù)第一張照片中人物的輪廓,把他們?cè)谛抡掌袑?duì)齊,再拍一張。最終生成的圖片會(huì)把兩張照片合成在一起,看起來(lái)就像大家同時(shí)出現(xiàn)在同一張照片里一樣。


解決了合照的一大痛點(diǎn)。
10.新的手表和耳機(jī)。
發(fā)了一個(gè)Pixel Watch 3。

一個(gè)耳機(jī)Pixelbuds Pro 2。

耳機(jī)可以隨時(shí)喚醒Gemini跟他對(duì)話。
11.對(duì)標(biāo)GPT4o的Project Aster。
Project Aster在幾個(gè)月前的Google發(fā)布會(huì)上就亮相過(guò)了,直接對(duì)標(biāo)GPT4o的原生多模態(tài)大模型。
現(xiàn)在,在Gemin Live中,你未來(lái)也可以用到Aster了。

比如,你可以在與Gemini對(duì)話時(shí)共享你的相機(jī),這樣你可以直接展示自己在微積分作業(yè)中遇到的問(wèn)題,或者尋求下一步家具組裝的幫助。

而且,還把最常用的應(yīng)用程序也集成到Gemini Live中,這樣它可以在對(duì)話和消息中幫助你采取行動(dòng),并從像Google日歷這樣的應(yīng)用程序中提取信息。
所以你可以直接在Gemini Live中給鄰居發(fā)短信,分享關(guān)于某個(gè)商家的詳細(xì)信息,并同時(shí)查看你的日歷,完全不需要打開其他應(yīng)用程序。

有點(diǎn)屌,GPT4o+蘋果的集合體。
就是可惜,還是個(gè)餅。

這,就是這一次MadeByGoogle ‘24的全部?jī)?nèi)容了。
在AI方面,跟硬件的結(jié)合,還是蠻有意思的,Gemini Live至少不是期貨,今天就可以用。
比那個(gè)只會(huì)畫餅的OpenAI,還是強(qiáng)了很多。
希望Google越來(lái)越好,錘死OpenAI。
原標(biāo)題:《比OpenAI良心多了,一文總結(jié)Google發(fā)布會(huì)的11個(gè)亮點(diǎn)?!?/p>
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司