近兩年,人工智能快速發(fā)展迭代,大語言模型如雨后春筍般涌現(xiàn),文本生成、文生圖、語音處理、代碼處理、視頻處理等生成式人工智能走進(jìn)人們的生活。同時(shí),一些企業(yè)開始發(fā)力研發(fā)可在電腦、手機(jī)端訓(xùn)練的輕量化小模型。
“我們需要高鐵、飛機(jī)、游輪等大型交通工具,也需要私家轎車、公交車,以及摩托車、自行車等小型交通工具。因?yàn)樵诓煌瑘?chǎng)景下,不同人群有不同需求。”在青島自然語義公司聯(lián)合創(chuàng)始人、首席架構(gòu)師孫燕群看來,滿足特定市場(chǎng)的需求,是專而精的小模型興起的重要原因及其存在的價(jià)值。
(相關(guān)資料圖)
今年3月,自然語義研發(fā)的Euler模型通過中央網(wǎng)信辦生成式人工智能服務(wù)備案。不同于大模型動(dòng)輒千億級(jí)的參數(shù)量,Euler的參數(shù)量只有2.5B(25億),是典型的輕量化小模型。相較于大模型,小模型有何特點(diǎn)?應(yīng)用前景如何?記者對(duì)此進(jìn)行了采訪。
低成本、易調(diào)試的端側(cè)小模型興起
關(guān)于小模型,目前并沒有明確定義。孫燕群表示,在行業(yè)內(nèi),參數(shù)量低于100B的模型就算比較小的模型。在實(shí)際應(yīng)用時(shí),要想在筆記本電腦端實(shí)現(xiàn)微調(diào),模型參數(shù)量一般在3B左右。
相較大模型,小模型在算力消耗、使用成本方面更具優(yōu)勢(shì)。具體來說,一是訓(xùn)練和推理所需的硬件資源較少,使得成本較低;二是使用更便捷,可在手機(jī)、電腦、物聯(lián)網(wǎng)設(shè)備等計(jì)算場(chǎng)景中實(shí)時(shí)運(yùn)行;三是結(jié)構(gòu)簡(jiǎn)單,開發(fā)者能快速定位問題,易于調(diào)試。
記者了解到,隨著大模型的比拼日益激烈,一些企業(yè)開始押注小模型。2024年8月,微軟和英偉達(dá)就相繼發(fā)布過小型語言模型。國(guó)內(nèi)不少企業(yè)也開始研發(fā)在“斷網(wǎng)、弱網(wǎng)”環(huán)境下,讓各種智能終端具備自主思考能力的端側(cè)小模型。例如,在今年3月舉辦的中關(guān)村論壇年會(huì)期間,北京的面壁智能公司就發(fā)布了應(yīng)用于汽車智能座艙的純端側(cè)超級(jí)智能助手。今年1月,廣東佛山移動(dòng)牽頭聯(lián)合40家單位成立佛山市AI小模型產(chǎn)業(yè)聯(lián)合體,致力于通過人工智能小模型提供個(gè)性化服務(wù),助力企業(yè)完成智能化升級(jí)。
“小模型讓我們實(shí)現(xiàn)了與科技巨頭們的錯(cuò)位競(jìng)爭(zhēng)。”提到小模型的具體應(yīng)用場(chǎng)景,孫燕群舉例說,Euler通過備案后,已經(jīng)開始面向中小企業(yè)和個(gè)人用戶提供服務(wù)。如與山東某市級(jí)檔案館合作,上線了檔案模型;與青島當(dāng)?shù)匾患覂x器儀表設(shè)備公司合作,開發(fā)了內(nèi)網(wǎng)技術(shù)相關(guān)的模型。
退而求其次后的“主動(dòng)作為”
“客觀來說,大模型的能力強(qiáng)于小模型,一個(gè)參數(shù)量2.5B的模型無論如何都不可能超過200B模型的算力。”孫燕群直言,這也是大公司都在做千億級(jí)模型的原因。模型小,神經(jīng)網(wǎng)絡(luò)參數(shù)就少,容納的知識(shí)量不夠,“體現(xiàn)在文本生成上,就是容易出現(xiàn)上下文不連貫的情況”。
自然語義最初的目標(biāo)并不是小模型。2019年底,該公司考慮要做大模型,但由于發(fā)展方向不明朗,同時(shí)在購(gòu)買高算力GPU上面臨資金和貨源壓力,因此未能實(shí)施。
“沒想到,僅過了兩年時(shí)間,國(guó)外的大模型就發(fā)布了。”孫燕群回憶說,后來隨著越來越多大企業(yè)涌入大模型賽道,作為基礎(chǔ)硬件的高算力GPU價(jià)格水漲船高。“那段時(shí)間,聽說哪里有GPU,我們就坐飛機(jī)去買,常常是提前交了定金也不一定能買到。”最終,公司用10多臺(tái)設(shè)備組成一個(gè)算力集群,能支撐做出7B參數(shù)的模型。
為了在現(xiàn)有設(shè)備基礎(chǔ)上盡可能提高參數(shù),自然語義公司工程師經(jīng)過頭腦風(fēng)暴,想出了新的分詞方式,以及將向量計(jì)算從實(shí)數(shù)空間轉(zhuǎn)換到復(fù)空間等各種辦法。“經(jīng)過模型訓(xùn)練,這些技術(shù)都達(dá)到了比較好的效果,能讓一個(gè)3B參數(shù)的模型,達(dá)到了150B參數(shù)模型60%左右的能力。”孫燕群表示。
中國(guó)信息通信研究院人工智能研究所副總工程師王蘊(yùn)韜告訴記者,小模型之所以能在“瘦身”后仍保持可觀性能,得益于一系列成熟的模型壓縮與高效架構(gòu)技術(shù),包括剪枝、量化、知識(shí)蒸餾、設(shè)計(jì)先天高效的網(wǎng)絡(luò)架構(gòu)等。
讓“小身材”跑出“大能量”
“小模型發(fā)展大有可為。”在王蘊(yùn)韜看來,未來面向特定應(yīng)用場(chǎng)景的小模型,潛力將會(huì)進(jìn)一步釋放。以AI終端為代表的應(yīng)用形態(tài)及產(chǎn)品服務(wù),將成為小模型釋放大能力的主戰(zhàn)場(chǎng)。
關(guān)于小模型的應(yīng)用前景,王蘊(yùn)韜進(jìn)一步解釋,一是為離線辦公、文檔摘要、私密對(duì)話等場(chǎng)景鋪平道路;二是隨著處理器架構(gòu)和神經(jīng)處理單元技術(shù)的應(yīng)用,手機(jī)、車載和物聯(lián)網(wǎng)設(shè)備將成為小模型的天然舞臺(tái);三是在垂直領(lǐng)域與“專精特新”行業(yè),如金融、醫(yī)療、法律、教育等已出現(xiàn)6B及以下參數(shù)的定制模型,成本低、上線快,可在特定任務(wù)上反超通用大模型。
“市場(chǎng)關(guān)心的是能否解決實(shí)際問題,不關(guān)心背后模型細(xì)節(jié),能夠與場(chǎng)景深度結(jié)合,擁有行業(yè)知識(shí),尤其是可信的小模型至關(guān)重要。”王蘊(yùn)韜說。
從用戶端來看,在實(shí)際應(yīng)用中,小模型的性價(jià)比優(yōu)勢(shì)也十分明顯。北京某互聯(lián)網(wǎng)公司算法工程師張先生向記者表示,在現(xiàn)有技術(shù)條件下,想要在本地部署大模型存在一定難度。“專業(yè)GPU芯片價(jià)格太高,無法應(yīng)用到低價(jià)格的終端上,如手機(jī)、機(jī)器人等配備的芯片就無法撐起大模型。另外,這些終端所配備的電池,往往也支撐不了高性能芯片的耗電等。”張先生表示,這些硬件性能有限的終端,更適合小模型施展。
王蘊(yùn)韜分析認(rèn)為,未來將是大小模型混合的系統(tǒng)范式。“云端大模型負(fù)責(zé)通用推理,端側(cè)小模型承擔(dān)即時(shí)響應(yīng)與私域數(shù)據(jù)處理。”他還強(qiáng)調(diào),小模型并非“大模型的低配版”,而是面向資源受限環(huán)境與專用任務(wù)的高性價(jià)比解法。通過配合端云混合部署和行業(yè)數(shù)據(jù)精調(diào),企業(yè)完全可以讓“小身材”跑出“大能量”,在AI商業(yè)落地的下一程中獲得確定性收益。
關(guān)鍵詞:
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 洪水過后,這些飲食安全問題要警惕
- 今日熱聞!新疆兵團(tuán):一線“土專家”為農(nóng)業(yè)生產(chǎn)賦能
- 民政部:二季度加大民生保障力度 各困難群體服務(wù)持續(xù)提升
- 特朗普威脅對(duì)銅加征關(guān)稅 美國(guó)期貨銅價(jià)飆至新高 精彩看點(diǎn)
- 中新健康丨參比制劑認(rèn)定陷“三無身份”困境 業(yè)界提三點(diǎn)建議
- 暑運(yùn)以來北京首都機(jī)場(chǎng)國(guó)際及地區(qū)日均客流量同比增17%
- 民政部:今年上半年福利彩票發(fā)行銷售1071.98億元
- 低空經(jīng)濟(jì)如何飛得更好 每日簡(jiǎn)訊
- 粵語音樂劇《大狀王》北京首演在即 加場(chǎng)開票引爆期待|焦點(diǎn)快播
- 臺(tái)風(fēng)“丹娜絲”漸近 浙江多地列車停運(yùn)船舶停航 當(dāng)前資訊
資訊
- 2025年全國(guó)快遞業(yè)務(wù)量突破1000億件
- 每日短訊:“沒事!踩我背上!”西藏吉隆口岸遭遇山洪 警察以背為“橋”安全轉(zhuǎn)移一名孕婦
- 年內(nèi)A股公司意向收購(gòu)擬IPO企業(yè)數(shù)量大增 科技型企業(yè)受追捧 聚焦
- “蜜都”饒河:電子商務(wù)交易額3年間增長(zhǎng)424.6%_信息
- 【新要聞】?jī)?nèi)蒙古開行今年首趟消夏旅游專列
- 天天資訊:四川西昌全力打造西部商業(yè)航天港 千億元級(jí)產(chǎn)業(yè)集群初具雛形
- 2025國(guó)際無人機(jī)應(yīng)用及防控大會(huì)在京舉行
- 忍忍就過去了?專家:“糖痛”嚴(yán)重時(shí)有截肢風(fēng)險(xiǎn)
- 7月7日央行開展1065億元7天期逆回購(gòu)操作_當(dāng)前焦點(diǎn)
- 杭州:“地下治污 地上興業(yè)”新模式引領(lǐng)城市土地集約利用_熱訊
焦點(diǎn)
- 哪些看似安全的暑期活動(dòng)可能暗藏風(fēng)險(xiǎn)?官方安全貼士快收藏
- 焦點(diǎn)熱門:表里山河是山西!
- 當(dāng)前聚焦:我國(guó)最大綠色氫氨項(xiàng)目正式投產(chǎn) 電力100%來自上游綠電
- 每日觀察!“十四五”以來每年城鎮(zhèn)新增就業(yè)穩(wěn)定在1200萬人以上
- 我國(guó)連續(xù)15年穩(wěn)坐全球制造業(yè)首位
- 2024年全國(guó)海洋經(jīng)濟(jì)總量首次突破10萬億元
- 每日看點(diǎn)!國(guó)家發(fā)展改革委:2024年全社會(huì)研發(fā)經(jīng)費(fèi)投入規(guī)模比“十三五”末增長(zhǎng)近50%
- 每日訊息!特朗普關(guān)稅政策再成焦點(diǎn),現(xiàn)貨黃金跌逾1%,前路何方?
- 【時(shí)快訊】中國(guó)三部門發(fā)文開展零碳園區(qū)建設(shè)
- 1-4月規(guī)模以上紡織企業(yè)工業(yè)增加值同比增長(zhǎng)4.2%_即時(shí)