關閉廣告
鑽石舞台
跳到主文
鑽石鑽石亮晶晶
部落格全站分類:
不設分類
相簿
部落格
留言
名片
Jul
25
Mon
2022
04:00
機器之能 - 谷歌開發者大會:一碗難以端平的水
close
谷歌創始人早在1998年就明確警告過,以廣告為導向的搜索引擎會偏離消費主義的真正需求。不過,在2000 年面臨抉擇時,谷歌選擇了注意力商人這條路。如今,再先進的技術發布也遮掩不住當初這個選擇所帶來的困擾。搜索等服務上的大踏步與隱私安全上的小碎步透露出,同時服務兩大群體——消費者和廣告商,這碗水有多麼難端平。
撰文 |吳昕
5月12日凌晨,谷歌 I/O 開發者大會如期而至。毫無懸念,作為兩個小時大會的開場白,CEO Sundar Pichai 介紹了技術谷歌對疫情、洪水等全球災難性事件的馳援。然後,谷歌搜索、翻譯、地圖等軟件服務,以及眾多硬件產品陸續出現在總部海岸線圓形劇場的舞台。劇場內,掌聲間斷響起。劇場外,約會 App 巨頭 Match 集團又起訴谷歌,要求法院阻止谷歌對支付系統的壟斷。這些年,數據隱私、反壟斷雙線應戰已經表明,24歲的谷歌不再是一家顛覆性初創,而是成熟且勢力龐大的企業:作為最大的搜索引擎,全球市場份額在81.5%至92.96%之間;獨攬全球數字廣告近30%份額。在美國,谷歌控制着超過 95% 的搜索廣告和超過 50% 的展示廣告。二十年來,這種商業模式一直沒有改變。先進技術不斷被用於提升賺錢服務的能力,例如搜索、地圖、視頻等 ,更多使用帶來更多用戶數據,廣告收入也隨之創造新高,猶如一座飛輪。儘管谷歌押注是多方位的,那些「為超額收益所下的賭注 (Alpha-bet)」依然沒有掘金成功。01谷歌母公司營收中,超過80%來自谷歌的廣告業務。其中,搜索引擎是谷歌最賺錢的部門。YouTube 作為數字廣告工具的重要性正在被廣告商們所理解。當大會宣布將新技術賦能這些最會下蛋的「鵝」時,幾乎可以聽到零售商們隔着屏幕的掌聲。在谷歌搜索推出新功能「Multisearch near Me」之前,已經有了文字、圖片搭配搜索「Multisearch」。拍攝一身橙色長裙照片,輸入「綠色」文本,即可獲綠色長裙的商品信息。
現在,你可以將 Multisearch 找出的結果與 Google Maps 整合,找到附近供應某種佳肴的餐廳,或者在附近五金店中找到所需的家具零配件。是不是有些零售線上線下融合的意思?
谷歌還推出了場景探索。用戶平移相機,然後輸入一個關於眼前物體的搜索短語,例如「無堅果巧克力棒」,即可在眾多巧克力中找到心儀的那一款。
結合文本、圖片等多模態搜索,是谷歌重新想象的搜索。谷歌的想法是,用戶不會在大量網頁列表中搜索信息,而是會提出問題,並讓在這些頁面上訓練的語言模型直接回答這些問題。過去兩年,BERT 是搜索引擎的基礎模型,也是從傳統關鍵字搜索轉向更複雜的搜索查詢的開始。MUM(多任務統一模型) 繼承了這一傳統,但比 BERT 強大1000倍,具有多任務、多模態和多語言特點。例如,搜索算法不僅可以理解文本,還可以理解視頻、圖像和音頻文件。當 MUM 被整合到 Google Lens 時,可以實現文本+圖片的搜索,也顯示出其商業化潛力。YouTube 屬於谷歌廣告收入來源中相對較小的一個——截至2020年其收入接近200億美元,約占谷歌廣告總收入的13%。目前,YouTube 月登陸用戶數在20億左右,YouTube TV、YouTube Music以及YouTube Premium 付費訂閱用戶增長勢頭良好,公司對未來發展也比較樂觀。谷歌認為,長遠來看,YouTube不僅是用戶用來娛樂的地方,也是一個尋找信息的網站。去年,谷歌推出了自動生成的章節,讓用戶可以更輕鬆地跳轉到最感興趣的部分。現在, 谷歌將 DeepMind 多模態技術應用到了文本、音頻和視頻,更快更准地自動生成視頻章節。
2019年才開始支持廣告的谷歌地圖,已經成為很多商戶的重要廣告投放渠道。作為安卓平台最流行的移動APP(安裝用戶超過20億人),谷歌地圖每月有10億活躍用戶,每天更新可達數萬次。本次大會上,谷歌地圖推出了一項全新功能—— 沉浸式街景(Immersive View)。谷歌利用3D繪圖,與計算機視覺和人工智能技術結合,將衛星、無人機等拍攝的數十億張街景和航空影像融合一起打造出來。假如你計劃去倫敦旅行,可能想要確定最佳景點和餐飲選擇。你可以虛擬地翱翔威斯敏斯特教堂或大本鐘,並使用時間滑塊查看這些地標在一天中不同時間的樣子,還可以滑到街道上去探索該地區的餐館和商店。更厲害的是,當你選中了一家餐廳,可以進入其中,餐廳的環境、桌椅擺設陳列等等,都會呈現在你面前。順便提一句,除了零售,旅遊也是谷歌廣告的大金主。
「在 2022 年,我們將繼續專注於發展我們的知識和信息產品,包括搜索、地圖和 YouTube,以提供更多幫助,」今年2月,谷歌第四季度電話會議上,Pichai 闡述了谷歌對支持多模態搜索的人工智能模型的投資。「對人工智能的投資將是關鍵,我們將繼續改進智能助理等對話界面。」「從 MUM 到 Pathways 再到 BERT 等等,這些深度人工智能投資正在幫助我們在搜索質量方面處於領先地位。」他補充說。02一個大型模型可能會在幾乎沒有訓練數據的情況下實現許多下游任務,將這些尖端技術融入產品,正是谷歌服務持續創新的源泉。作為大模型的另一個示範案例,大會宣布穀歌翻譯已更新為包括 24 種新語言,使其支持的語言總數達到 133 種。這也是谷歌翻譯的一個技術里程碑。此次新增的24種語言多半出現在印度和非洲,屬於相對冷門的語言,以使用人數來看,裡面最受歡迎的是擁有5000萬使用人口的Bhojpuri,最少的則是只有2萬人仍在使用的梵文。
這24種語言也是首批採用零樣本機器翻譯(Zero-Shot Machine Translation)誕生出爐的成品。這是一個新的人工智能系統,它「在沒有看到示例的情況下學習翻譯成另一種語言,」谷歌解釋說。谷歌在大約 100 種數據豐富的語言上訓練「單個巨大的 AI 模型」,然後將學到的知識應用到它不知道的其他語言中。這就像一個會說多種語言的人開始閱讀另一種語言的小說,可以根據自己對語言的一般知識來拼湊這些語言的可能意思。大型語言模型,無論是否開源,都具有高昂的開發成本。如此規模的源泉和護城河,也只有谷歌這樣的公司才挖得起。AI21 Labs 2020 年的一項研究顯示 ,開發一個只有 15 億個參數的文本生成模型的費用高達 160 萬美元。推理——實際上是運行經過訓練的模型——是另一個消耗。有人估計過,在單個 AWS 實例 ( p3dn.24xlarge ) 上運行 GPT-3 的成本每年至少為 87,000 美元。谷歌還在大會上公開了對話生成語言模型 LaMDA 2,也是目前 Google打造的最先進對話 AI,以及公司迄今為止研發的最大規模模型 Pathways Language Model(PaLM),基於 5400 億參數訓練而成。
PaLM 在許多自然語言處理任務上都有着突破性的表現。例如,PaLM 從未見過孟加拉語和英語之間的對譯,也從未被訓練過如何回答問題或翻譯,該模型自己將所有功能結合在一起,可以用孟加拉語正確回答問題。不過,與搜索、地圖和視頻等這些「帶貨」強勁的服務不同,谷歌仍並未在翻譯服務上投放廣告。03相較於前述業務的風光無量,谷歌雲業務就顯得尷尬了。雲業務上,谷歌一直落後於亞馬遜和微軟,與這兩家行業巨頭相比,其收入規模不在同一量級上,且一直還未實現盈利。近年來,谷歌一直在積極推動以雲端為基礎的生產力軟體與服務套裝工具。Google Workspace等諸多關鍵領域的創新也登上了本次大會的舞台。當然,比較優勢仍然是機器學習和 AI 。如果企業日常事務中的10%能用AI 來解決,對他們來說是一筆巨大的成本節省。作為自然語言解決業務用例的具體示例,谷歌電子郵件產品提供了人工智能生成的回覆建議。隨着時間越來越寶貴,人們需要簡單工具幫助自己完成一些工作,摘要也是一個重要的技術趨勢。現在,谷歌也為 Google Docs 引入了自動總結功能。將其中一個機器學習模型應用在文本總結功能中,Google Docs 會自動解析單詞並提取出要點。
這標誌着自然語言處理的一個大飛躍。總結需要理解長段落、壓縮信息並生成語言,而這些已經超出過去最好的機器學習模型的能力。而文檔只是一個開始。谷歌正努力將總結功能引入 Google Workspace 的其他產品。在接下來的幾個月里,Google Chat 將使用該功能,為聊天對話提供摘要,幫助用戶迅速加入群聊,或回顧重點信息。而且谷歌正在努力將轉錄和總結功能引入 Google Meet。這樣,用戶可以快速補上重要會議中錯過的部分。如今 Google Workspace 即將轉換為收費服務。過去由於門檻低加上有免費選項,Google Workspace 受到很多剛起步、預算不高的新創團隊和中小型企業的青睞,現在能否憑藉這些比較優勢繼續贏得客戶青睞?對谷歌雲業務有什麼樣的提振?仍然是一個大大的問號。04與搜索等服務上的大踏步形成鮮明對比,谷歌在隱私安全上邁的是小碎步。一個多小時的發布後,很少花時間談自己怎麼賺錢的谷歌主動提到了廣告這個話題。會上,谷歌突出了一個名為 「我的廣告中心」新功能。用戶可以控制自己看到的廣告內容。例如,選擇更想看到的品牌、不想看到的品牌,以及如何個性化廣告。用戶也可以選擇其想看到的廣告類型,比如健身、旅遊、美容等,或關閉個性化廣告。
不過,用戶的每一次選擇和點擊無異於變相透露自己喜好。「類型」和「品牌」這兩個標籤對於品牌來說,就像是用戶追蹤了品牌的官方賬號,主動關注自己有興趣的品牌最新資訊,反而可以讓品牌更接近客群,甚至因此觸及過去沒有鏈接到的用戶。
本質上,消費者仍然是以個人數據作為貨幣來購買「免費」服務,例如搜索、地圖、視頻等,谷歌由此獲取用戶喜好、習慣等寶貴信息。
事實上,谷歌創始人早在1998年就明確警告過,以廣告為導向的搜索引擎會偏離消費主義的真正需求。但他們最終還是走向了注意力商人的道路。二十年來,他們一直沒有從根本上改變這條路,也常常困於同時服務於兩個利益衝突的群體。
因此,面對蘋果率先打破「行規」,谷歌的改變更像是不得不「適者生存」。從聯合學習(federylearning of cohort,FLoC)到基於興趣的廣告方案(Topics API),邁向隱私安全的步伐總顯得畏手畏腳。
例如,FLoC 主要通過聚集具有相似興趣的大量人群(「人以群分」)來投放相關廣告,帳戶是匿名的。谷歌不再允許具體到個人的定向投放廣告,而是允許廣告商根據海量的(群)定向投放廣告。據說,與基於 cookie 的廣告相比,它每花費 1 美元就能實現 95% 的轉化。不過,批評接踵而來。一方面,這種策略無異於讓谷歌獨家訪問該公司已經在很大程度上壟斷的大量用戶數據。另一方面, FLoC 未能提供隱私權保護。「與它的核心目標相反,FLoC允許跨站點跟蹤單個用戶。」麻省理工學院媒體實驗室研究人員 Alex Berke 、 Dan Calacci 在一篇研究中發現「超過95%的用戶設備在使用4周後就可以被唯一識別。」研究還展示了這些估計是多麼保守。因為,這種風險會隨着常用設備指紋識別方法的使用而增加。於是,今年年初,谷歌又在 Chrome 中創建了名為 Topics 和 FLEDGE 的新跟蹤和行為廣告定位方法,並計劃為許多 Chrome 用戶自動啟用。競對 DuckDuckGo 對這兩項技術的評價是, 「再次試着為侵犯隱私的豬塗上口紅」。和 FLoC 類似,系統會自動使用用戶的瀏覽歷史來推斷用戶其對某些主題的興趣(例如,「兒童互聯網安全」、「個人貸款」等)。FLoC 會自動與網站和跟蹤公司共享一個群組標識符,但 Topics 會自動共享推斷出的興趣子集,公司可以使用它來定位適合用戶的廣告和內容。同時,FLEDGE 授權 Chrome 根據瀏覽歷史將廣告定位到用戶。儘管谷歌在本次開發者大會上重申「從未銷售用戶的個人隱私」,但就目前情況來看,在默認情況下,他們的隱私方案仍然允許谷歌瀏覽器自動監視用戶的在線活動並與廣告商和其他方共享有關的信息,以便他們可以在未經用戶同意的情況下定位廣告。而這些方案是否足以保護用戶隱私,仍然有待大量研究的證明。多年來,人們一直能夠要求從搜索中刪除某些敏感的個人身份信息——例如,可能用於金融欺詐的銀行賬戶或信用卡號碼等信息。本次開發者大會上,谷歌強調現在用戶可以快速、輕鬆地要求從搜索結果中刪除個人數據——比如電話號碼、電子郵件地址,甚至是實際地址。而在以前,用戶必須出示潛在危害的證據,如身份盜竊,才能讓谷歌從搜索結果中刪除他們的個人信息。不過,只要你還記得2014年歐洲法院曾裁定,像谷歌這樣的搜索引擎需要允許歐洲互聯網用戶請求刪除他們的個人信息,以實現他們的遺忘權,這樣的轉變多少顯得姍姍來遲。
當然,開發者大會還公布了一系列安全和隱私更新。例如,控制照片和視頻的訪問權限;授予 APP 訪問非精確位置數據的權限;支持安卓和 Chrome 的虛擬信用卡、賬號安全狀態、最小化數據痕跡等等。
但如果你是蘋果用戶,不少更新會讓你似曾相識。其背後原因正在於注意力商人之路導致谷歌始終無法像蘋果那樣,將讓安卓的用戶體驗做到極致。正如我們看到的,與搜索等服務技術躍進的姿態不同,雖然產品和服務的某些方面正變得更加私密,但谷歌實際上並沒有提供足夠的隱私安全保護。如何在堅持同時服務於兩大利益衝突群體,並在用戶失去耐心時,實現其與廣告商的長久利益平衡,仍然是每次開發者大會未有言明的最大挑戰。
全站熱搜
創作者介紹
鑽石舞台
鑽石舞台
鑽石舞台 發表在
痞客邦
留言
(0)
人氣(
)
留言列表
禁止留言
文章搜尋
最新文章
熱門文章
誰來我家
參觀人氣
本日人氣:
累積人氣:
贊助商連結
關閉視窗