久久精品免视看国产成人,欧一区二区三区,亚洲黄色小视频,日本免费一区二区六区

谷歌實驗室負責人:真正改變生活的AI產品將在近三年出現

來源:     作者:渝訊網     人氣:     發布時間:2025-04-26    
2025-04-26 12:28:03 來源:中國企業家雜志微信公眾號

“寫大段提示詞調用AI的方式過時了,用戶需要更高效的交互方式?!惫雀鑼嶒炇邑撠熑藛滔!の榈挛值拢↗osh Woodward,以下簡稱“喬希”)近日接受播客采訪時說道。

谷歌實驗室是專門測試谷歌新項目的試驗場,所以在這里喬希強調速度,以快速迭代為榮,一個創意項目從測試到“畢業”的周期一般在50~100天。他還表示,創意落地早期不要只看測試出來的各種數據,那都太小了,要觀察客戶的眼睛,當你展示產品時,他們是否眼前一亮?在這個階段,藝術比科學更重要。

喬希還發表了對視頻生成模型發展的看法,他認為未來視頻內容的消費會更個性化,因為AI能根據用戶的興趣生成他們感興趣的內容。最后,類比蘋果“iPhone時刻”,喬希認為真正能改變生活方式的AI產品將在近三年開始出現。

精彩觀點如下:

1.普通用戶需要更高效的交互方式,行業內正在探索通過拖拽PDF、圖片等方式來重組內容,從而簡化冗長的文本輸入。

2.知識的未來會呈現無限可重組性,任何輸入都能被轉化為任意形式的輸出。

3.如今,YouTube、TikTok等平臺根據算法給你推送感興趣的內容,未來AI可能會根據你的興趣直接生成視頻內容。

4.創意落地早期不要只看測試出來的各種數據,那都太小了,要觀察客戶的眼睛,當你展示產品時,他們是否眼前一亮?

5.當前是塑造下一代核心生產力工具的關鍵時期,我們必須想清楚創造這些工具是想取代人類,還是想增強人類的創造力。

6.真正的AI產品將在近三年開始出現,那時就會看到類似Uber、Airbnb、Instacart這樣真正改變生活的應用。

以下是對話全文(有刪減):

寫提示詞調用AI的方式過時了

主持人:你提出“通過撰寫提示詞調用AI的方式已過時”這一充滿爭議的觀點,具體是什么意思?

Josh Woodward:我認為這種方式已經過時了,從用戶體驗的角度來看,我不敢相信曾試圖將大段提示詞輸入這些小框中來使用AI。當前存在兩種趨勢:開發者可能仍會編寫多頁提示詞,但普通用戶需要更高效的交互方式,行業內正在探索通過拖拽PDF、圖片等方式來重組內容,從而簡化冗長的文本輸入。不過大模型需要上下文,所以上下文理解這種方式不會消失,但信息傳遞方式正在發生劇變。

主持人:谷歌實驗室的使命和運作模式是什么?

Josh Woodward:谷歌實驗室是一個匯聚創新者的平臺,專注于打造從0到1的新型人工智能產品,涵蓋消費產品、B2B(企業與企業之間開展交易活動的商業模式)產品和開發者工具。里面不僅有谷歌的資深員工,還有科學家、創業者等多元背景的人才。團隊聚焦某個領域的未來發展,如創造力、軟件開發、娛樂產業等,并以小團隊的形式運作,快速構建、迭代并發布產品。它有點脫離了傳統的谷歌大型產品領域,不過仍可以與Chrome或谷歌其他部門合作,去探索、實驗和嘗試顛覆。

主持人:如何營造谷歌實驗室內部的團隊文化?

Josh Woodward:我們以快速迭代為榮,從一個創意最終落地到用戶手中通常只需要50~100天。在人工智能日新月異的發展現狀下,速度至關重要。另外還有一點是我們經常從小事做起。在谷歌這樣的環境中,一些產品可能有數十億人在使用,但人們會忘記這些事情都是從解決用戶的某一個痛點開始的。當我們開始一個新項目時,如果每周有10000名活躍用戶,我們就已經非常興奮了,這在其他部門可能不值一提,但對我們的初創項目來說意義重大。

此外,我們還保持與外部初創公司的合作,同時注重谷歌內部DeepMind的發展,因此對研究前沿的現狀以及未來的發展方向有一定了解。我們尋找富有創造力的人,但必須以平常心對待失敗。我們歡迎兼具模型專業知識和用戶洞察力的“獨角獸”型人才,一般我們會通過獨特的評估體系來挖掘這類潛力股,比如查看GitHub歷史記錄等。

主持人:如何決定下一步開發哪些項目?是自下而上還是自上而下的決策機制?

Josh Woodward:我們采用混合模式。在戰略層面,我們關注谷歌的使命以及對谷歌具有戰略意義的領域。因為我們身處其中,所以會從更廣的角度思考,例如,軟件開發的未來會是什么樣子?谷歌有成千上萬的開發人員,顯然人工智能將在這個領域發揮巨大作用。我們會考慮是否可以為其他谷歌員工構建一些東西,但同時也會考慮為外部的用戶構建什么,所以這方面我們采取自上而下的視角。而在具體執行時,我們讓4~5人的小團隊自主挖掘用戶問題,從自下而上的視角去發現細節,解決具體問題。雖然這在其他團隊看來可能有點混亂,但對我們很有效,我們正在努力生存到下一個10000+用戶的里程碑產品出世。

還有很多東西即將問世,我個人對谷歌的圖像生成模型和視頻生成模型也很感興趣。AI生成視頻已經成為現實,不過視頻生成模型運行成本很高,比如Veo需要數百臺計算機支持運算。語言大模型如Gemini、ChatGPT,去年一年時間成本下降了約97%,假設AI模型的成本曲線是這樣,那么視頻和圖像生成模型的成本在不久的將來一定也可以快速下降。

AI生成視頻發展到什么階段了

主持人:如何看待人工智能視頻生成的現狀?

Josh Woodward:跳躍場景、跳躍剪輯等問題已經得到解決,模型對物理世界的認知已經取得了很大的進步,但效率和服務成本仍是挑戰,應用層面還有很多可研究的東西。這是另一個巨大的機會,類似其他人工智能模式,真正的價值在應用層面上。

主持人:人工智能視頻生成何時才能帶來經濟效益?目前它的成本是遠高于帶來的收益的。

Josh Woodward:這很難預測,我不太能確定何時能帶來經濟效益。但我想說,除了產品和應用層面,我們可能還需要在商業模式方面進行創新。我們的第一個想法是先訂閱然后按使用量收費,第二個想法是按輸出付費。對于電影和視頻來說,這有點像制片人做項目時的想法。如果把它想象成個人創作,這更像是一種拍賣模式的模型。所以還有很多值得探索的地方,我們可能知道事情進展的速度,它可能會在某個季度實現突破,而不是在很多年后。

主持人:人工智能發展速度是否在加快?

Josh Woodward:我一直認為它會慢下來,但實際上過去三年的進展飛速。預訓練可能會停滯不前,但推理計算打開了全新的局面。我們團隊里有一位作家,他提出了“相鄰團隊”的概念,比如你走進一個房間,看到所有的門通向這些相鄰的團隊。所以在我們內部,AI還有很多值得探索的項目。

主持人:視頻消費的未來會是怎樣的?

Josh Woodward:我認為娛樂的未來更具可控性。想象一下你坐在沙發上,也許會瀏覽一些東西,或者將其投屏到電視上,這都會變得更加可控。另外就是視頻消費未來會更個性化。如今,YouTube、TikTok等平臺根據算法給你推送感興趣的內容,未來AI可能會根據你的興趣直接生成視頻內容。

很多東西都會在運行中產生。還有一種理論:10~15年前崛起的創作者推動了YouTube等平臺的發展,未來可能會發生轉變,或許將由另一批我們稱之為“策展人”的群體主導,他們負責策劃內容,使用模型進行創作。

在某種程度上,所需的成本、時間和技能可能簡化到只需點擊按鈕或簡單描述,就能生成不同版本的內容。很多時候,90%的人只是在平臺上進行消費,創作者非常少,未來這種現象會改變,消費者可以從一個完全不同的角度來使用這些內容平臺。例如,未來的用戶界面可能會出現“加入”按鈕。就像現在的界面有播放、暫停、保存、收藏等功能,未來可能會有新的交互方式。我們目前正在NotebookLM中構建類似功能,想象一下“前進播放”功能,你可以創建虛擬形象,或者進行語音克隆,所有元素將以全新的方式融合。

主持人:電影和游戲之間的界線會變得模糊嗎?

Josh Woodward:這確實有可能。當前電影、視頻內容、游戲的構建和3D技術之間正在產生有趣的交集。雖然我們尚不清楚最終走向,但各領域正在相互借鑒經驗,包括一些訓練技術層面的突破。

主持人:現在很多公司都在構建生成式視頻模型,有些直接從像素流入手,有些則采用3D技術,認為要真正做好視頻必須掌握3D技術。你對此有何看法?

Josh Woodward:我們目前在這兩個方向都有投入。在3D方面,我們一開始有個項目,基本操作是先拍六張運動鞋的照片,然后創建3D旋轉效果,將其投放到搜索界面中,效果非常好,它填充細節的方式也令人驚嘆。直到后來出現了像Veo這樣的產品,只需兩三張照片就能生成整個產品目錄。

在視頻方面,3D視角非常有趣。我們做過一個案例:為每個教室重現登月場景,讓學生“進入登月艙”,我們還建立了一個小側面板,學生可以在那里輸入問題,大家玩得很開心。這很有趣,模型實際上會填充細節,所以你會覺得視頻和游戲之間的界線有點模糊,這正是我們同時布局兩個方向的原因。

展示讓客戶眼前一亮的產品

主持人:你能談談谷歌Mariner(智能體原型)嗎?

Josh Woodward:我們2024年12月推出Mariner,試圖了解讓這些模型控制你的電腦或瀏覽器會發生什么。我們用84天開發了Chrome擴展程序,讓用戶能直接體驗?,F在,Anthropic、OpenAI、谷歌和其他初創公司都在探索類似方向,即模型不僅能處理知識、信息、寫作,還能滾動頁面、打字、點擊,甚至在后臺同時處理多個任務。

對于Mariner,我們短期要解決的問題是它能否在瀏覽器中完成任務?但更長遠的目標是,當我們擁有這樣的東西時,人機交互的未來會是什么樣子?

主持人:Mariner的理想應用場景是什么?

Josh Woodward:它可能不在消費者端,而是企業端。我們在對Mariner進行用戶調查研究時發現,它能夠幫忙處理高重復性勞動,很多這樣的活動都出現在企業方面。比如,它們可以成為銷售團隊的一部分,接聽客戶電話,他們已經做好了接下來需要做的所有事情,只是想把這些步驟推廣出去,他們的用戶界面很笨重,運行起來需要很長時間,我想讓Mariner完成所有這些工作,這些事情很有趣。

主持人:你是如何測試出這個企業層面的需求的,是用谷歌云的客戶來測試的嗎?

Josh Woodward:這的確涉及大大小小的企業,我們有很多云客戶,他們總是希望獲得最新最好的產品,這些都是很好的測試對象。我們也與許多初創公司合作,我們一直在嘗試從市場的不同維度學習。

多年來,我在構建產品的過程中發現,大家都在談論產品的市場契合度。因為早期產品開發階段人們往往過度聚焦產品的迭代,而忽視了市場側的迭代,找到正確的市場定位與打磨產品同樣重要,兩者必須緊密結合。在Mariner項目的早期階段,我們面對的問題是,能否讓人工智能模型驅動計算機,這是一項巨大的創新,但目前在準確性和速度方面仍有不足。我們正處于技術可行性驗證階段,接下來需要找到合適的市場。

在早期,我們做了很多事情,而且速度非常快。我經常和產品經理和團隊成員(包括工程師和用戶體驗師)說,創意落地早期不要只看測試出來的各種數據,那都太小了,要觀察客戶的眼睛,當你展示產品時,他們是否眼前一亮?這就是你要關注的信號,在這個階段,藝術比科學更重要。

主持人:谷歌能否利用既有用戶數據打造個性化體驗?

Josh Woodward:我們確實在內部使用自己的數據做了一些事情。比如我個人選擇開啟了很多功能,讓系統全盤接收數據來創造好的東西。不過你會在Gemini應用程序中看到類似的功能,用戶可以鏈接不同服務。這其實是一個正在探索的領域——什么樣的數據最有趣、最有用,同時需要建立恰當的控制機制,讓用戶相信我們不會把它泄露出去。

目前很多實驗都是用我們自己的數據來測試,在我自己的數據中,我感覺自己有第二個大腦,能更好地幫助我思考。Gemini模型特別擅長處理上下文,具備驚人的短期記憶能力,這正是我們現在重點開發的一個領域。

主持人:你認為我們什么時候能使用足夠精確和快速的計算機來實現以上應用場景?

Josh Woodward:這是另外一個問題,不過確實現在的計算速度有點難實現。不僅是谷歌內部,其他實驗室的情況也是如此。現在比較困難的領域是,計算機如何精確地定位你想要的東西。另一個需要討論的問題是人機交互的邊界問題——何時需要人類介入?我們需要設計一種合適的機制,讓用戶能夠自主選擇是否參與操作。目前的人機交互控制機制還非常粗糙,我們需要更精細的權限管理系統。這些是尚未解決的問題。再次重申那個原則,產品要依靠模型變得更聰明、更快、更便宜。

目前谷歌25%的代碼由AI編寫

主持人:為什么所有實驗室的研究重點都集中在計算機的使用上?所有的技術恰好在同一時間融合了,就像大家都商量好了似的。

Josh Woodward:這是個有趣的問題,我不知道其他實驗室的具體情況,但我想說,當你閱讀創新的歷史時,你會發現重大發現同一時間出現的情況并不罕見?,F在的大模型是一種新的范式,很多人都在某些方面看到了潛力,人員流動和跨實驗室交流也加速了思想的碰撞。這種現象與編程領域的發展類似,現在已經有了智能體,很多事情正在醞釀中,這非常有趣但也需要保持警惕,別在這場變革中落后了。

主持人:你們的目標是打造從1到100再到十億級用戶的獨立產品,還是通過NotebookLM這類項目找到適合市場的產品后,將其整合到谷歌生態中?

Josh Woodward:最初,我們確實遵循傳統的孵化器模式,將項目培育成熟后剝離。例如,AI Studio和Gemini API現在已移交DeepMind運營。但在可預見的未來,像NotebookLM這類高度依賴人工智能的項目,我們只會把它放在實驗室里。我們關注的重點是將這些技術轉化為可持續發展的商業產品。大部分嘗試可能會失敗,但反過來思考,如果所有項目都成功“畢業”,那是不是說明我們還不夠激進?如果我們最終都實現了那些天馬行空的創意,這當然是好結果,反之如果在100天內沒有進展的話,我們就及時止損,轉而做下一件事。

主持人:你預測2025年最值得關注的創新領域會是什么?

Josh Woodward:智能體和AI生成視頻領域已經有很大進展,我們也談到了計算機使用的一些事情。但我覺得需要換個角度思考,我們有個叫《實驗室》的文檔,收集了82個關于未來的預測。其實對未來做出預測是很危險的一件事,更別說我們還預測了82個了,但我們團隊的思想實驗是,想象你在一個房間里,天花板突然打開,一個膠囊掉下來,我們跳進去后被帶到2028年,獲得五分鐘觀察未來的機會,記錄所見后返回現在,再整理你所看到的內容,那么知識的未來是什么?我們站在較高的層次思考這個問題,這82個預測中有一個是:知識的未來會呈現無限可重組性,任何輸入都能被轉化為任意形式的輸出。

如果相信這點,我們就會下注,基于這種未來可能性構建產品?;氐胶芏嗳苏陉P注或構建的一些產品上,我認為目前還處于視頻生成和智能體發展階段,可能還有一些未被注意到的東西。另外,我認為編程領域可能還會有重大突破。

主持人:實驗室團隊也會做敲代碼相關的工作嗎?

Josh Woodward:是的。目前谷歌25%的代碼都由人工智能編寫,這個比例增長得非常快。編程領域有兩個發展方向:一是降低門檻,如何讓從未寫過代碼的人也能參與進來,這是一個巨大的機會;二是將專業程序員的工作效率提高10倍甚至100倍。這兩個方向都很有潛力。

主持人:你認為目前人工智能領域被過度炒作了什么?

Josh Woodward:我希望不要在聊天機器人領域重復投入了,包括谷歌在內。另外,人們盲目地將人工智能塞進各種產品,甚至連人工智能本身都被過度炒作了,我希望大家能更精確地了解人工智能的顛覆性和應用場景。我們應該關注工作流程的問題,而不僅僅是將人工智能生硬地添加到現有產品上。我們可以看到第一代人工智能出來時,各家都爭先恐后地推出商業化的應用,都把它視為“iPhone時刻”。當喬布斯在2007年走上舞臺時,他說這是iPhone,如果你看看三年后的App Store,一開始會發現很多無意義的應用程序,但后面就出現了改變生活的應用,這大概就是我們現在在這場人工智能革命中所處的位置,真正的AI產品將在近三年開始出現,那時就會看到類似Uber、Airbnb、Instacart這樣真正改變生活的應用。

主持人:人工智能的哪些領域值得關注?

Josh Woodward:我們剛才提到了編程代碼。我認為,如果能推出具有編寫代碼、自我糾錯、自我修復和遷移等功能的代碼模型,軟件開發的速度將發生質變,這將是一個巨大的進步。盡管這個領域已經被廣泛討論,但我覺得它的潛力仍被低估了,它應該被更大力地宣傳。

還有一點是,我認為現階段大家還沒有真正消化無限上下文的概念,它可能會涉及一些個性化問題,還關系到類似“Mariner”這樣的項目如何持續發展的問題。谷歌在這方面投入了大量資金,因為我們認為這是一個關鍵戰略,關系到以后的工作流程問題,非常重要。

還有品位與設計的價值。當人工智能生成內容成為主流時,好的品位和設計將變得尤為重要。此外,真實性與可信度也將成為核心議題,我們需要重新定義“真實”。這些內容會變得比現在更加重要。

主持人:關于人工智能還有其他不同的見解嗎?

Josh Woodward:第一,現在是人工智能發展的黃金時代,我們正處于一個充滿可能性的窗口期,存在很多機會。第二,除了關注模型競賽和技術迭代之外,更要重視在公司中所構建的價值觀,當前是塑造下一代核心生產力工具的關鍵時期,我們必須想清楚創造這些工具是想取代人類,還是想增強人類的創造力。比如在視頻生成領域,我支持擴大人類的創造力。硅谷歷史上曾多次出現影響深遠的技術變革,這些變革持續影響了幾代人,既可能帶來福祉,也可能埋下隱患。所以那些掌握著智能技術的開發者們,應該好好利用它們,充分考慮技術帶來的長期影響。

原標題:谷歌實驗室負責人:真正改變生活的AI產品將在近三年出現|中企薦讀

編輯:鄧晞    責編:張松濤     審核:阮鵬程

打賞

感謝您的支持,我會繼續努力的!

掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

責任編輯:渝訊網
主站蜘蛛池模板: 高邑县| 苍山县| 阜平县| 嵩明县| 凤阳县| 巴南区| 鱼台县| 巴塘县| 旬邑县| 吴堡县| 射阳县| 奉化市| 陇西县| 白朗县| 富宁县| 高安市| 报价| 绥宁县| 武穴市| 当涂县| 龙海市| 四平市| 宣城市| 外汇| 赤城县| 五家渠市| 温宿县| 股票| 托克逊县| 陆丰市| 广安市| 滨海县| 沽源县| 胶南市| 恭城| 林州市| 双辽市| 潍坊市| 福海县| 黎城县| 杂多县|