深藍媒體智庫沙龍|三問大模型:流量見頂?越大越好?安全可控?
從拼參數到講落地,短短半年時間,大模型經歷了一次“神化”,又迅速“接地氣”起來。在這輪“百模大戰”中,人們越來越篤定,大模型將是比互聯網以及移動互聯網更大的機會。但在這個過程中,也不可避免地遭遇了技術、安全、商業化模式等方面的諸多挑戰,如何跨過這些障礙,找到落地場景,打通商業模式,成為大模型的當務之急。
8月16日,由北京商報社、深藍媒體智庫主辦的AI主題沙龍在新聞大廈藝術館舉行,沙龍以“大模型見真章”為主題,圍繞著大模型產品、技術路線、場景尋找、倫理安全等諸多問題,探尋大模型商業化落地的可行之徑。
(資料圖片僅供參考)
會上,北京商報社社長兼總編輯李波濤在致辭中表示,在經濟尋求向上突破的當下,幾乎唯一沒有爭議的就是科技,科技可以帶來力量。無論是產業還是行業,“破圈”都已形成一個越來越明顯的趨勢,希望通過深藍智庫的活動,實現產業、行業、人群的“破圈”,將更多前沿的科技成果向更廣泛的產業、行業、人群進行傳播和輸出。
不是泡沫型發展
2023年,大模型接棒元宇宙,成為引爆科技圈的頂流。但半年過去了,由于尚未在產業端形成扎實的應用,人們也不免懷疑,大模型是否會像過去許多人工智能技術那樣,數次達到爆發的邊緣,但最終往往曇花一現。
對此,百度科技與社會研究中心主任余歡認為,這一波大模型的興起不是AI概念第一次被熱炒,經過70多年發展,人工智能經歷了幾次起伏,但不同的是,這一波大模型不再是泡沫型發展,而是已經成為當下人工智能的主流方向。
余歡表示,相比起之前的人工智能,這一波大模型的特點是泛化性更強、標準化程度更高、工業化發展趨勢更明顯。大模型解決的是中長尾的問題,即很多定制化場景無法解決的問題,能夠在小樣本、小數據的基礎上,以相對低成本的情況滿足場景化需求。
對于大模型的發展趨勢,文淵智庫創始人王超用馬克·吐溫的一句話總結,“歷史不會簡單地重復,但總是沿著相同的韻腳前行”。回顧整個科技史,從互聯網到智能手機,都經歷了爆發、泡沫、瓶頸和沉淀,“大模型同樣如此,大模型是一個新的科技浪潮,但我覺得它的爆發、泡沫、瓶頸和沉淀期,包括商業化過程,會比互聯網、智能手機浪潮更快”。
數據、用戶和場景
技術實力并不等于變現能力,商業化是人工智能行業繞不過去的難題,對大模型來說也是如此。圍繞著商業化的問題,新壹科技CTO張華偉的看法是:大模型商業化落地需要集齊數據、用戶和場景,“商業化是一個長期的過程,一個顛覆性的創新需要打破現有業務去重構,目前國內大模型混戰還在起步階段”。
元語智能聯合創始人兼COO朱雷則為大模型的落地概括出了三個關鍵詞:快速、業務和增長。在他看來,當下人們認為大模型難落地,也是因為沒有發現有價值的應用。面向企業客戶做商業化落地,需要有真實的需求牽引,從用戶出發,從需求出發,借用AI技術讓業務快速增長。
朱雷解釋稱,“快速”是因為很多企業等不及,受限于預算、經營環境以及客戶需求等問題,企業通常不能花費一兩年的時間等待大模型達到GPT4的效果后才考慮落地。“業務”是因為很多模型廠商兜售方案時,其實與其主營業務沒有太大關系,只是泛泛而談的大模型場景,而無法解決具體的業務問題。“增長”則是因為當下很多方案都以“降本增效”為導向,但商業化公司的重點很多時候不在降本,而在增效。畢竟省錢的空間是有限的,只有掙錢才是最重要的事情。
中小微模式有望成主流
動輒千億規模的參數是過去一段時間,大模型“秀肌肉”的關鍵之一,但這也延伸出了一個新的探討,即大模型是不是越大越好?
在技術層面,360智腦產品資深專家葛燦輝認為,中小微模式有望成為國內主流。怎么理解中小微模式?葛燦輝解釋,即在保持較高預測準確性的同時,大幅度減小模型的大小和計算成本,優化計算效率,以實現高效的模型預測在較小的設備上運行。
朱雷同樣提到,大模型可能會有兩大趨勢,分別是端云共生以及大小并行。在端云共生方面,目前除了較頭部的大模型制造商有云端API外,具體在端側可能也存在廣泛的應用場景,比如工業領域的一些具身智能機器人,以及一些XR眼鏡等都可以跑端側的模型。這種趨勢可以概括為從以GPT4為代表的云端API模式慢慢遷移到端云并行的狀態。
這也延伸出了第二個預測,大小并行。朱雷解釋稱,千億規模的模型一直會存在,甚至可能出現更大量級的模型,但越來越小參數量級的模型可能也會有非常大的應用空間,也就是說要往輕量級模型上發展,能夠運行在低端芯片上,并且可以產生不錯的效果。
安全、可控、可靠
當下大模型應用方面還會遇到很多風險和挑戰,包括幻覺、結果不可控、安全以及歧視、偏見等問題。解決好這些問題,是實現大模型落地的關鍵前提。
螞蟻集團大安全AI算法資深專家鄭霖表示,大模型只有更安全,在產業應用方面才能更深入更廣泛。在新AI時代,螞蟻集團從四個維度對可信AI做了重新定義,分別為大模型的可靠性、可控性、內容安全及合規以及倫理安全。
除安全問題外,鄭霖認為,大模型還需要重視生態的打造,從底層架構,到中間算法,再到上層應用,整體需要各行各業的從業者參與進來,將生態搭建起來。包括芯片短缺和算力等問題,都需要這樣一個生態去解決。
葛燦輝則將視角聚焦在了兼容這一問題上。據悉,整個場景布局中的核心是API(應用程序編程接口),這一平臺的任務是賦能千行百業、打造開發者業務。
“API主要提供各種能力,比如翻譯、對話能力等,簡單說就是API接入大模型可以做新應用。”葛燦輝這樣介紹基于大模型開發行業應用的過程,“底層是360多個基礎大模型,基于底層能力、API開發者工具和360智腦API開放平臺,客戶可以開發各種行業應用,比如知識管理、醫療問答、智能客服等。”
在葛燦輝看來,API的開放和兼容對快速推進上述流程至關重要。他強調,“API一定要做到開放,360對外對內的API能力完全一致。兼容性在大模型時代也非常關鍵,360智腦的API和OpenAI的API是完全兼容的,用戶只需要改一個API的地址,再改一個API Key,就可以用OpenAI原生的官方客戶端調用360智腦的API,所以我們不需要開發客戶端,第三方客戶端可以直接用,這會讓客戶接入360智腦的效率大大提升”。
北京商報記者 楊月涵
關鍵詞:
相關閱讀
- 08-17
- 08-17
最近更新
- 08-17
- 08-17
- 08-17
- 08-17
- 08-17
- 08-17
- 08-17
- 08-17
- 08-16