騰訊靠什么突圍“百模大戰”?
作 者 |張津京
【資料圖】
了解更多金融信息 |BT財經數據通正文共計4371字,預計閱讀時長11分鐘
大模型的“百模大戰”,騰訊終于下場。
從6月19日發布自己的行業大模型,到7月16日召開的世界人工智能大會,騰訊云行業大模型率先登場,越來越清晰的事實背后,凸顯著騰訊對于大模型領域的思考。
尤其是跟BAT其他兩家的選擇不同,騰訊上來首先端出的是行業大模型,而不是通用大模型。這意味著騰訊其實找到了在這個領域放大自身優勢的方式。
因為是國內互聯網企業最早點出要推動數字融合,推進產業互聯網發展的平臺,騰訊從一開始接觸到大模型,想到的就是如何與產業相結合。
關鍵,讓人意想不到的是,秉持這個邏輯下場,騰訊其實直奔解決大模型研發方一直糾結的一個問題:那就是大模型該如何保證長期可持續發展。
只有做到這一點,任何大模型才能談得上有未來。
1
大模型是用來解決問題的
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生,在世界互聯網大會產業發展論壇做主題演講時表示,通用大模型有很強的能力,但并不能解決很多企業的具體問題?!捌髽I的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素?;谛袠I大模型,構建自己的專屬模型,也許是企業更優的選項”。
這恰恰說出了當下大模型產業發展的一個現實。
從Open AI發布ChatGPT3.5開始,浮躁成為這個行業的外顯標簽之一。越來越多的企業開始在這個領域炫技。
高峰時期,美國硅谷每天會產生幾十個大模型相關的論文,上百個與大模型相關的創業產品DEMO視頻?!懊總€視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對于技術該怎么用一般都沒有答案?!贝竽P椭芯空?,計算機工程碩士李莉認為,現在很多模型的研究者和應用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化?!叭绻嬲诺浇洕?,你會發現根本用不上?!?/p>
在她看來,這已成為行業通病。
同樣國內大模型的紛至沓來,相關的事情也沒少做。例如讓大模型直接作詩或者用方言將相關的內容讀出來,甚至做成視頻之類,頻繁出現在模型研發方發布會的現場。
這其實是一種市場推廣行為,但并不意味著大模型真正要在這個方面實現應用。
最近Newsweek有一個商業調查顯示,ChatGPT的用戶數量已經比一二月份高峰時期下降了近95%。在統計原因中,“感覺ChatGPT對工作的促進能力沒有想象那么強”,是用戶選擇最多的一個結果。
“從技術看這個是一個特別正常的結果”,李莉表示類似ChatGPT這樣的通用大模式,其訓練數據來自互聯網所有能找到的相關數據,無論對錯全部輸給模型學習,只在輸出的時候由人工來核實部分結果并標注結果輸出的邊界?!耙虼?,通用大模型往往變成那種看起來像專家的答案,但真正被行業內人士分析就發現似是而非?!?/p>
在她看來,未來大模型發展最快的肯定不是ChatGpt這類通用模型,“產業模型或者細分行業模型有很大機會,因為只有在專業領域由專業的人員輔助大模型學習專業知識,才能真正為行業提供需要的人工智能輔助”。
對此,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生也表示,通用大模型一般是基于廣泛的公開文獻與網絡信息來訓練的,許多專業知識與行業數據積累不足,導致回答的行業針對性與精準度不夠?!巴ㄓ么竽P涂梢栽?00個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求?!钡脩魧ζ髽I提供的專業服務,要求高、容錯性低,企業一旦向公眾提供了錯誤信息,可能引起嚴重后果。
2
TO B才是大模型未來發展核心
其實ChatGPT也不是沒想過要進入行業應用市場,但在理想與現實之間有了一個巨大的鴻溝。
眾所周知,通用大模型是利用互聯網知識進行培訓的,即所謂通用數據。其中既要花費大量的數據和資金進行訓練,可能效果還不是很好;另一方面又要維持日常運營,相關投入也非常大,讓一般的通用大模型壓力很大。
OpenAI的創始人在接受硅谷媒體的訪談時,也曾就ChatGPT3.5的邏輯和思維展現能力進行過闡述,然而他并不清楚ChatGPT3.5是如何實現這一功能的。事實上,他們在訓練ChatGPT的過程中,一直在不斷地將微軟必應搜索中的結果和用戶的對話數據輸入其中。
在訪談的最后,他也承認ChatGPT的出現只是一個美麗的誤會,但他們所能做的就是不斷為這樣的大模型提供資源,無論是軟件還是硬件都在此列。據觀看了這場訪談的李莉了解,OpenAI在短短三年內就已經燒掉了180億美元,現在又緊急融資了100億美元。這一事實恰恰印證了這一點。
但由于他們在行業上數據搜集能力不強,造成通用模型對于行業應用適用程度較低,沒有想象的好用。
另一方面,自2018年騰訊啟動930變革以來,中美互聯網技術的發展出現了明顯的路線差異。
各家互聯網企業以數實融合為開發產品和技術的基本思路,這體現了中國互聯網企業在滿足制造業和實際生產需求方面更為緊密的聯系。
從這一角度來看,中國互聯網企業將在推動社會經濟發展方面具有更清晰明確的角色。
有趣的是,大模型的成長和訓練需要大量數據的支持。ChatGPT和谷歌Bard等領先的模型都是在通用大模型領域進行訓練的,它們的背后都有搜索引擎帶來的龐大數據支持。然而,盡管這些數據量龐大,但在特定行業的數據量和數據活躍度上,尚未完全滿足用戶的需求。
這實際上為中國企業提供了彎道超車的機會。中國龐大的人口基數使其在各個行業擁有比美國甚至世界其他國家更豐富的數據積累。無論是醫療、法律、物流還是細分行業的生產。在國家數據安全法的指導下,這些數據天然地與海外大模型隔離,保證了數據安全。
因此,這些B端數據被認為是中國大模型企業的巨大優勢。
比如,中國已榮升為全球最大的工業機器人生產國和消費國,全球機器人市場中的75%是由中國的企業所購買。這些購買機器人的企業,通常都將其機器人應用于核心工藝和核心流程中。
這一現象意味著,如果這些企業希望通過引入人工智能模型以提高管理效率,它們就必須部署自己的私有人工智能模型。他們需要通過訓練自己生產中的數據,以滿足企業的發展需求。
如果能從中國一線企業采集到絕大多數機器人使用的參數和對應的數據,就能以最快的速度幫助這些企業建立和訓練屬于自己的人工智能模型。
在這一點上,中國企業具有天然的優勢。
3
為什么是騰訊先落子
專屬行業大模型,目前國內騰訊是首先落子的領軍者之一。
在所有人都開始關注行業大模型的時候,在百度、阿里、科大訊飛等國內大模型開發方都開始轉型行業大模型的時候,為什么騰訊能最先發布自己的行業大模型呢?
這可能跟騰訊在國內率先提出互聯網平臺要跟產業相結合有關。
一方面,這幾年騰訊利用互聯網技術和AI技術,在實體經濟和生產一線做了很多嘗試,推動了很多新模式的落地,這已經成為中國數實融合的樣板。騰訊在其中積累了很多面對行業企業的服務經驗和數據,同時也對行業企業的需求非常清楚,這為其建立行業大模型提供了良好的基礎。
另一方面,騰訊專門為行業大模型打造了自己的技術平臺。
這里面首先是星脈網絡,這是騰訊云正式發布新一代HCC高性能計算集群。該集群采用騰訊云星星海自研服務器,服務器之間采用業界最高的3.2T超高互聯帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。
其次是騰訊云專門為行業大模型打造的AI 原生(AI Native)向量數據庫。該數據庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫。
正是有了這樣的技術基礎,加上騰訊這些年服務行業客戶的經驗和獲得的數據,讓騰訊有了率先推出行業大模型的底氣。
騰訊云副總裁、騰訊云智能負責人、優圖實驗室負責人吳運聲在人工智能大會期間接受媒體專訪時表示,騰訊希望在每個特定場景里面100%解決客戶的問題,“而不是找100個產品解決70%到80%的問題”。
在他看來,騰訊會聚焦找一些特定的行業跟客戶深入打磨解決行業的問題,“比如說文旅行業跟客戶做一些深入探討,比如說OTA領域的客戶在業務流程里面用大模型的技術,結合自身的業務場景,還有數據相關的東西對大模型進行精調,解決他的問題”。
關鍵,騰訊云從產業客戶需求場景出發,基于大模型高性能計算集群,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和“量體裁衣、普惠適用”的行業模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。
騰訊云TI平臺行業精調解決方案,支持客戶用自己的數據一站式訓練精調,構建自己的專屬大模型。具備五大優勢:提供高質量的行業大模型、完善的平臺工具、成熟的流程服務、全面的配套服務、領先的安全能力保障。
比如騰訊云升級行業大模型應用場景,行業大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊云風控大模型融合了騰訊過去20多年黑灰產對抗經驗,和上千個真實業務場景,整體反欺詐效果比傳統模式有20%左右的提升。企業可以基于prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現全流程零人工參與,建模時間也從2周減少到僅需2天。
再比如過去的同傳技術,往往需要大量樣本數據進行訓練,尤其涉及一些特別專業領域的翻譯,也需要人工加持進行調優,才能保障翻譯效果?;谛袠I大模型技術,不再需要百萬級的訓練數據,使用小樣本訓練便也可以獲得不錯的翻譯結果,讓每一次交互翻譯,都對下句的翻譯提升發揮實時作用……
換句話說,騰訊既準備好自己的技術基礎,又有行業數據知道行業想要什么,還做了一整套幫助企業落地大模型在自身業務應用的產品,形成了一整套推動大模型行業化的能力。
當然,騰訊對行業大模型是持開放態度的,他們覺得大模型是需要多分共同努力的結果。吳運聲就表示,大模型時代開放是非常重要的一個特點,“底層的技術變化太快,技術的這些外延的能力會非常廣,這種情況下發揮最大的價值只有開放,通過開放提升讓更多人加入進來,更多行業的專家,各類的角色人員加入進來,我們才能讓這個生態,整個體系更加的健康,產生更多的可能性”。
對此,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生也認為,伴隨著大語言模型的發展,產業和社會也將從數字化、網絡化,走向智能化?!霸谶@個過程中,騰訊始終認為,人工智能發展的根本目標是落地于產業,服務于人”。
因為,只有能真正解決用戶需求、距離場景和數據更近的企業,才能擁有大模型的未來。
文章系作者個人觀點如有疑問及任何意見反饋可直接在評論區留言或發送郵件
關鍵詞:
相關閱讀
-
騰訊靠什么突圍“百模大戰”?
作者|張津京 了解更多金融信息|BT財經數據通正文共計4371字,預計閱讀 -
【聚焦】負性光刻膠可應用于顯示器件、...
近年來,受下游應用開發力度不足等因素限制,我國聚異戊二烯裝置開工率 -
山東最擅長制造什么?
◎文|江禾◎編輯|小木 作為傳統工業強省,山東工業門類齊全、工業產品 -
大漲10%,滴滴真翻身了嗎?
7月9日晚,在各大公司開始摩拳擦掌二季度答卷之時,滴滴出行再默默發布 -
退還2059萬元,鋰電跨界新秀合作項目終止!
7月10日晚,協鑫能科(002015)公告,Zim-ThaiTantalum(Private)Limi -
華為ERP思考:國產自研邁出第一步
華為的進入會刺激用友、金蝶、浪潮等國產廠商加快技術革新,以及伴隨著