日前,在福建省福州市鼓樓區安泰街道南門兜地鐵站里舉行的2025年就業援助月專項活動中,工作人員利用AI技術和大數據分析等先進技術,為求職者提供智能化的崗位匹配和職業規劃建議。謝貴明攝(人民視覺)
一位江蘇市民正在使用大模型輔助完成日常工作。王坤垚攝
國家互聯網信息辦公室2025年1月8日發布的信息顯示,截至2024年12月31日,共302款生成式人工智能服務在國家網信辦完成備案,其中2024年新增238款備案。
從名單看,細分領域的大模型大量涌現,如科大訊飛的“訊飛星火教育大模型”、平安健康的“聊個天大模型”等。與此同時,隨著DeepSeek-V3等大模型產品憑借更低成本、更強性能引發海內外市場關注,越來越多國產生成式人工智能大模型加入了“提質+降價”的隊伍。
國產大模型應用情況如何?正處于什么樣的發展階段?帶著這些問題,記者進行了采訪。
功能更強
工作生活“好搭子”
備案數量的增多,從一個側面反映出國產大模型在工作和生活中出現的頻率增高了。
國產大模型具體發揮著怎樣的作用?“把自己從繁瑣、細碎的基礎工作中解放出來”是很多用戶談到應用體會時的第一感受。
安徽姑娘強宇銘目前主修法律專業。在她看來,和人際溝通類似,如果能夠給大模型提供明確且精準的提示詞,使用者就能獲得事半功倍的效果。“國產大模型是我學習的‘好搭子’。國內人工智能企業月之暗面開發的Kimi大模型幫我搜最新的司法立法動態,文心一言能幫我草擬或潤色文章。我還會使用通義法睿等專門針對法律行業的大模型服務,來回答法律問題、輔助案情分析,并生成各類法律文書。”強宇銘舉例說。
除了搜索和生成之外,大模型提供的服務也越來越專業、越來越精細。
“有一次,我臨時需要將一份專業報告中的多種圖片調整成統一大小。這需通過Word文檔中的VBA功能實現,不僅需要編寫代碼,而且較為復雜。要是在以前,我只能自己上網搜尋教程并從基礎學起。現在,豆包大模型提供的解決方案非常實用,同時提供了具體的代碼示例。”在上海從事房地產開發工作的薛天朗說。
據百度智能云AI與大模型平臺業務副總經理李景秋介紹,擴展大模型應用場景需要滿足不同維度的要求:一是基座模型質量,要有一個可被指令增強的基礎模型;二是準備相關場景化數據,關注數據與實際場景的一致性和配適性;三是在訓練過程中找到最優的調試參數。
李景秋說,依托大模型強大的能力,百度智能云千帆平臺開始與更多行業和企業進行合作。比如,在教育領域,借助大模型,“考試寶”為其會員提供試題解析服務的能力顯著提升。在招聘領域,獵聘利用大模型快速從簡歷中抽取信息進行語義分析,人才供需匹配效果更好。“目前,互聯網行業之外,金融、教育、文娛、能源等行業都能看到大模型的身影。”她說。
中國信通院政策與經濟研究所主任工程師程瑩認為,國產大模型技術在語言、視覺、多模態等領域持續突破,在文本、音頻、視覺、3D等數據方面實現多模態統一,持續突破人工智能感知、理解和推理世界的能力邊界。這些,拓展著大模型與各行各業融合的深度和廣度。“如今,芯片制造商、數據供應商、模型研發企業、應用開發商等方面協同合作正日益增強,共同創造全新應用場景和市場空間。”
成本更低
應用普及“降門檻”
本領增長的同時,國產大模型的使用成本也不斷降低。
不久前,杭州深度求索人工智能基礎技術研究有限公司推出的DeepSeek-V3上線并同步開源,快速吸引了全球同行的目光。在多項基準測試中,DeepSeek-V3的成績超越了不少開源模型,并在性能上和世界頂尖的閉源模型不分伯仲。OpenAI創始成員安德烈·卡帕斯稱贊道:“DeepSeek—V3使得在有限算力預算上進行模型預訓練這件事變得容易。”
算力門檻降低、訓練成本減少、性能持續提高……這些變化,在很多國產大模型上都有體現。
2024年12月底,阿里云計算有限公司宣布對大模型產品進行新一輪降價,其中Qwen-VL-Plus輸入價格每千tokens(源代碼中可以被編譯器識別的最小單位)從0.008元降至0.0015元,降幅達81.3%。按照最新價格,1塊錢可以處理約600張720P圖片或1700張480P圖片。此前,字節、百度、智譜AI等國內大模型領軍企業也紛紛調降了相關產品和服務的價格。
國產大模型降價底氣何在?商業上是否可持續?
記者了解到,在降成本方面,國產大模型供應商們正在不斷取得新進展。
有的進行峰谷調節,優化配置資源。“豆包大模型通過技術創新來降低成本,定價上有合理的毛利空間,既能保障企業和開發者用得起,又確保自身商業可持續。”火山引擎相關負責人說,業務團隊從算法設計階段就考慮到超大規模的推理需求,在KV cache機制等方面進行創新,使模型能夠用更低成本完成復雜的推理任務。在工程方面,利用規模化優勢,根據科研、辦公、休閑娛樂等不同場景的不同負載進行波峰波谷混合調度,實現整體成本的降低。
有的主打差異供給,力求事半功倍。比如,千帆大模型平臺根據用戶不同需要進行針對性供給,從而降低其使用成本。“我們提供多種類型的大模型服務,支持企業調用旗艦級模型解決復雜問題,使用輕量級模型解決簡單問題,從而大幅降低使用成本。”百度智能云千帆產品相關負責人說,千帆積極提供工具鏈支持企業對輕量級模型進行訓練調試,同時通過提供數據飛輪、模型蒸餾等模型精調技術和訓練方法進行效果提升,幫助企業用戶以更低成本、更高效率完成專有模型的全鏈路開發。
在中國信通院人工智能研究所軟硬件與生態部主任李論看來,國產大模型降價有多方面因素。從供給側看,算法、芯片等軟硬件進步帶來的技術紅利,讓大模型訓練及推理成本逐漸降低。從需求側看,降低價格可以鼓勵更多用戶和企業使用大模型,從而豐富應用場景、創造全新價值、實現規模效應。“隨著預訓練階段逐步完成,全球及國內大模型廠商將轉向大力推進大模型的后訓練及推理側工程技術優化。未來,高性價比的大模型服務有望增加。”李論說。
前景更好
“邊干邊學”是趨勢
多位業內人士表示,理想情況下,大模型產品應實現價格、私密安全性和大模型能力效果的平衡。現實中,國產大模型還面臨缺乏高質量數據、特定場景表現不佳、服務不穩定等挑戰,需要在性能優化中擴大應用,在應用擴大中提升性能。“我們要用好大模型的基本能力、創意能力、多模態能力、業務能力、創新能力和科學能力,并將其與我國產業創新應用場景充分結合,最終賦能百行千業。”360集團創始人周鴻祎說。
數據的數量決定大模型的廣度,數據的質量決定大模型的精度。在實踐中,不少企業正通過讓大模型“邊干邊學”實現良性循環。
騰訊云智能AI產品專家趙新宇介紹,大模型在不同行業落地的同時,也在推動其自身的成長。比如,“少年得到”的K12語文作文批改功能,就應用了騰訊混元大模型的多模態能力。這款產品通過騰訊云智能的OCR技術識別學生作文內容,并根據設置好的評分標準,由大模型為作文打分。“通常,大模型和學校教師判分,偏差需要控制在5分甚至更低。”趙新宇說,客戶群體的擴大不僅對大模型提出了新要求,也有助于加快大模型開發迭代速度,提高大模型的實用性和適應性。
中國移動基于10086客服領域多年沉淀的客服業務特色數據資源,通過對用戶意圖識別、語言理解、邏輯推理、知識檢索等任務的針對性、系統化訓練,讓“九天”客服大模型不斷煥發新生機。“5G網絡支撐起海量數據和大規模連接需求,讓全社會的信息流動更加順暢、更加高效,人與人、人與物、物與物的連接更加緊密,經濟社會發展的網絡底座更加健壯。”中國移動董事長楊杰說,中國移動推廣“九天”多模態通用大模型服務,積極推進更大參數體量、更強推理能力的模型訓練。
專家預計,“邊干邊學、邊學邊用”的良性循環將會讓國產大模型加速走進日常生活。
“未來,大模型有望全方位融入普通人的生活。它可以作為生活助手,即時解答各類知識疑問;可作為娛樂伙伴,幫助人們創作小說、繪畫、音樂等;可以作為健康管家,預警健康風險,輔助醫療咨詢。”程瑩說。(王俊嶺)
(責任編輯:蔡文斌)