北京2022年6月24日 /美通社/ -- 近幾年,“AI大模型”儼然是AI界的“當紅明星”,從國外的谷歌、微軟、英偉達,到國內的浪潮信息、阿里、百度,都在不遺余力的布局AI大模型,而AI大模型的參數量更是屢創新高。
AI大模型究竟有什么魔力能吸引如此關注?AI大模型的產業應用價值有多大?產業化道路是布滿荊棘還是一路坦途?
近期,浪潮信息AI軟件研發總監吳韶華博士和復旦大學管理學院張誠教授受財聯社邀請做客鯨平臺直播間,與財聯社科創板日報記者黃心怡就AI大模型與人工智能產業發展的關系展開了一場高端對話。
一訓多能的算法基礎設施
AI大模型的出現,讓很多產業人士認為這項技術會改變信息產業格局,即基于數據的互聯網時代、基于算力的云計算時代之后,將進入基于大模型的AI時代。在未來,人工智能像供水供電一樣流向終端,流向用戶、流向企業,誰能先做到這點,誰就會在AI產業布局中獲得先發優勢。
什么是AI大模型?吳韶華博士從技術角度給出解釋,AI大模型是“人工智能預訓練大模型”的簡稱,包含了“預訓練”和“大模型”兩層含義,二者結合產生了一種新的人工智能模式,即模型在大規模數據集上完成了預訓練后無需微調,或僅需要少量數據的微調,就能直接支撐各類應用。例如浪潮信息于去年9月推出的2457億參數的大模型“源 1.0”,一個模型就能提供聊天、對話、知識問答、寫作等各類應用。
張誠教授從應用角度指出,大模型與訓練數據、預訓練等構成了AI的基礎架構,這種基礎架構即浪潮信息提出的“算法基礎設施”,在此基礎上,可以支持算法更高效地融入當前企業各類業務所使用的工具軟件,形成算法應用價值的商業變現。
大模型加速AI產業化進程
當前人工智能落地面臨長尾場景應用的“碎片化”和應用開發的“高門檻”等挑戰,而AI大模型是解決AI產業化應用痛點的一劑良方。
吳韶華博士提出,AI大模型將對AI模型的構建及應用產生極大影響,它會將傳統煙囪式的、碎片化的AI應用開發轉向集中式開發。一方面AI大模型具備很好的泛化能力,一個模型可以支撐各類不同應用,有效緩解碎片化開發反復建模的困境;另一方面,圍繞AI大模型構建的算法基礎設施,比如浪潮“源1.0”大模型開放的API、開源的應用代碼等,使開發者無需關心底層技術,設置無需配置編程環境,就可以直接將應用構建于AI大模型的能力之上,在降低開發門檻的同時,讓開發人員能夠將更多的精力聚焦核心業務邏輯。
張誠教授則認為,AI大模型代表了人工智能技術向產品化、產業化落地的趨勢,這個趨勢的持續發展會深刻改變產業格局。同時,人們對AI的認知、行業對其能力的評估都將越來越體系化。
AI大模型的“先天優勢”為其加速AI產業化發展奠定了基礎。在數字經濟的未來,AI大模型以及包含大模型在內的人工智能模型,憑借優秀的數據價值挖掘能力,較高的應用智能化水平,將會成為數字經濟的智能化核心,甚至會成為數字經濟中的智能大腦。
當然,AI大模型的發展也并非一蹴而就的。吳韶華博士指出,AI大模型的構建,首先需要大規模、高質量數據集的支撐,數據集的質量很大程度上決定了模型的質量。在大規模高質量數據集上,目前不但缺少相關配套軟件,也缺少數據集質量評測標準;其次還有模型算法以及訓練算力等方面的挑戰。張誠教授則認為,當前AI大模型和企業提升勞動效率需求的結合是最大的挑戰,也就是如何讓AI大模型在生產中真正發揮生產力作用。
挑戰只是暫時的,AI大模型代表了人工智能技術發展的方向。吳韶華博士和張誠教授堅信,AI大模型會在技術上產生更多的突破,也會對應用的規模化落地產生更好的促進作用。
采訪實錄
黃心怡:請談談對AI大模型的理解。
吳韶華:AI大模型的出現帶來一種新的現象,它將AI應用的開發從碎片化、煙囪式的開發,轉變成集中式開發,這種開發范式的變化,有望緩解當前人工智能落地難的問題,更好的賦能人工智能應用創新。
張誠:我們可以把人工智能到商業應用看成上下游的關系,上游對機器學習模型進行很好的預訓練,做成更扎實的“半成品”,幫助下游落時更好地把注意力放到商業問題的優化上,這樣算法的商業應用就會更快、更有效。比如,AI大模型因為其自身具有的兼容性能適應更多場景,同時大模型做到了相對標準化,下游可以降低對算法的使用成本,以及和商業問題的適配成本。當然,企業對這種改變的適應也是影響大模型產生效果的重要影響因素。
吳韶華:浪潮信息將大模型看作算法基礎設施,這種基礎模型在算法層面的能力,還要聯合服務軟件才能在應用中發揮出來。因此,在應用支撐上模型和服務軟件共同形成一種類似于算法基礎設施的作用。
黃心怡: 您認為AI大模型的應用價值有多大?對于推進人工智能規模化落地能否起到作用?
吳韶華:首先是應用的碎片化,尤其是長尾場景應用的碎片化,是人工智能落地的難題。碎片化意味著不同場景需要有針對性的建模,每個小場景都要從數據到模型、應用整個流程走一遍。此外,隨著數據的更新,模型也要更新。設想下,對于一個維護上百個模型的企業,要同時更新上百個模型及應用,投入是巨大的。因為大模型具備比較廣泛的普適應用支撐能力,將傳統AI應用的煙囪式、碎片化開發轉變成集中式開發,很好的緩解了碎片化場景反復建模的現象。
其次,大模型也可以使研發人員聚焦在應用開發的核心要素上。在算法基礎設施層面,包括浪潮信息構建的源 1.0都是開源開放的,開發者不需要關心底層搭建的技術,就能直接調用源1.0的大模型能力。這種能力把AI應用的開發往上推了一大步,讓開發者聚焦應用最核心的業務邏輯,把跟模型相關的內容放在模型層面或算法基礎設施的層面。比如,基于源1.0搭建的“劇本殺”游戲,可以直接復用源1.0的開源代碼,開發過程基本不需要寫代碼和調試代碼,就完成了整個應用的構建,此時,開發者能把更多精力放在劇情內容等創意的創作上。
總結一下,大模型一方面會將AI應用的開發從煙囪式轉變到集中式開發,另一方面大模型降低了AI應用的開發難度,讓開發者能夠更聚焦在核心業務邏輯上,這是大模型給AI的應用落地帶來的兩大益處。
張誠:大模型和AI產業的發展是一個必然趨勢,對這種趨勢的未來判斷其實通過回顧信息技術的商業應用歷史來對照。上世紀90年代早期管理信息系統(MIS)剛開始在商業得到應用的時候,企業往往需要18個月到36個月才能完成信息系統的建設和流程的配合。但是到了最近二十年,相關產品越來越標準,3個月到12個月就能完成中等規模信息系統的設計和上線應用。從新技術發展來說,早期很重的項目定制化咨詢方式,到現在越來越多的系統以產品化、標準化的方式復制實施。
同時,現在越來越多的云服務被采納,算法基礎設施使得算法逐漸產品化、技術集中化,最終完成“標準產品”應用+二次開發的成熟模式。算法被標準化,應用或設置也可以標準化,那么人工智能應用的開發就不用從零開始做,時間也會大大縮短。同時,大模型的產品化、基礎化過程,讓企業智能化的成本越來越低,進一步促進人工智能產業的應用發展。
黃心怡:浪潮信息在實際應用過程中有沒有成本降低的案例
吳韶華:劇本殺就是一個典型的案例,在大模型出現之前,如果要做這樣一個游戲,需要很強大的模型,這個模型既要有對話能力,也要有邏輯推理能力,這對于模型的開發、數據的選擇門檻很高。
我們在源1.0開放過程中也遇到了很多類似情況,比如一個模型即可以支撐用戶的隨機閑聊,公文寫作,還可以支持一些特定場景的各類任務,這些在沒有大模型和算法基礎設施支撐之前,用戶需要有自己的算法人員,從頭開始收集數據、標注數據,然后做模型等,經過一系列研發流程,最后才能走到最核心的業務邏輯上。
現在有了大模型,這些問題都可以得到很好的解決或者緩解,開發者不再關注底層算法基礎設施的構建,只要通過API就能獲得相應能力。所以大模型不管是從規模化效應,還是針對單用戶的應用場景,都在成本方面有比較好的促進作用。
黃心怡:AI大模型的落地還存在哪些技術和應用瓶頸?
張誠:技術的應用在商業上要回答好兩個最基本的問題:投入產出比(ROI)和價值創造。
第一個問題涉及商業運營的基本利益原則:技術帶來的生產效率提升超過技術投入,企業才愿意去使用它。隨著技術成本不斷降低,達到收益-成本的均衡點后,自然會有越來越多的企業愿意接受,現在只是企業在等待均衡點到達的合適時間點。關鍵是第二個問題,涉及企業競爭優勢和可持續發展的戰略問題,即企業究竟需要什么樣的AI可以產生超越競爭者的競爭優勢。這個問題不完全是由技術決定的,而是由企業需求決定的。特別是實體企業,比如像制造業、傳統服務業,人在哪個地方做不好,哪個地方的生產效率或者轉換效率就會很低,如果用技術能夠解決、改變,技術與生產的結合就會非常重要。
假設把技術看成一種推動力,哪些業務場景是AI真正能夠緊密結合在企業流程里,能夠解決企業實際的生產需求或者某個決策需求,同時經濟和社會收益都是值得去做的,那么AI大模型就能順利落地。所以,從應用的角度來看,大模型可能會遇到的瓶頸就是怎樣和實體企業的勞動效率提升和形成競爭優勢這兩個需求結合起來。
吳韶華:大模型在技術上仍面臨著較大挑戰。首先大模型的構建過程中面臨大規模、高質量的數據集開發。數據集的質量決定了模型的質量,大規模的、高質量數據集的構建,是一個比較普遍的挑戰。不管是語言、文字等單模態數據,還是多模態數據,都面臨類似問題。
第一是在軟件及方法方面,業界缺少開源軟件,也缺少數據集構建和數據集質量評測的相關標準。我們在構建數據集的時候,基本上從零起步,從軟件、算法的角度構建了一個關于數據集的端到端開發平臺。多模態數據集更是如此,多模態數據可能會包含文字、圖象、語音、視頻等,它不僅需要原始數據,還需要對原始數據進行對齊,這更進一步增強了數據集構建的難度。大模型需要海量數據來做支撐,海量數據的收集本身就是一件比較有挑戰的事情。
構建數據集后,需要一個大規模集群來做訓練。以源1.0為例,在2128顆業界最先進的GPU集群上開展訓練。大規模集群算力的獲取就是一個比較大的挑戰。此外,怎么用好這個集群,加速訓練過程,進而降低算力成本開銷,也同樣充滿挑戰。
所以,從技術層面來講,大模型既有數據獲取,構建的挑戰,也有模型算法、訓練算力性能優化的挑戰。
黃心怡:人工智能在數字經濟當中發揮的價值?它的挑戰以及機遇有哪些?
吳韶華:大模型以及其他人工智能模型,將會是數字經濟的核心支撐。一方面它可以很好的挖掘數據價值,另外一方面,在應用的智能化上也會發揮關鍵作用,大模型有可能會成為數字經濟的智能大腦。
大模型帶來了很多新的機會,隨著技術的成熟,還會涌現更多機會。比如建模,AI大模型帶來的集中式建模能力將有效緩解碎片化應用開發的痛點。同時,大模型本身也能否孵化出新型應用,比如大模型具有很強的對話、交流能力,可以很好的賦能元宇宙的虛擬人場景。大模型對多模態信息的強大處理能力,也會孵化出來更豐富的多模態應用。
張誠:在過去的十年,更多的是人工智能和大模型的宣傳,嘗試,探索階段。接下來的十年會,對人工智能的應用會更好、也會更成熟,企業更懂得人工智能、大模型技術是什么、什么時候應用,同時還會很專業的評定收入產出比,評定人工智能對企業造成的成本增減,亦即獲得收益之間的平衡。當AI大模型的應用越來越成熟,我們就可以期待接下來每一年都比以前會更好。
黃心怡:總結一下您對AI大模型的一些思考
吳韶華:大模型將在技術上產生更多的突破,也會對應用的規模化落地產生更好的促進作用。
張誠:大模型代表了人工智能技術發展向產品化、產業化落地的趨勢,這個趨勢繼續下去,會更深刻改變產業的格局。