一区二区三区毛片免费|亚洲国产日韩在线一区|香蕉国产精品偷在看视频|亚洲无线码在线一区观看|久久伊人一区二区三区四区|中文字幕无码久久久久久久|五月天精品无码一区二区免费|精品96久久久久久中文字幕无

首頁  ?  新聞頻道  ?  國際新聞

新聞分析|全球科研團隊競逐低成本AI模型研發(fā)新范式

2025-02-23 15:56:42

來源:新華網(wǎng)

  新華社北京2月23日電 新聞分析|全球科研團隊競逐低成本AI模型研發(fā)新范式

  新華社記者彭茜

  美國斯坦福大學等機構研究團隊近日宣布,在基座大模型基礎上,僅耗費數(shù)十美元就開發(fā)出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發(fā)的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業(yè)可以較低成本研發(fā)出適合自身的AI應用,AI普惠性有望增強。同時,其所應用的“測試時擴展”技術或代表一條更可持續(xù)的AI研發(fā)路徑。

  低成本玩轉高級推理

  美國斯坦福大學和華盛頓大學研究團隊近日宣布研發(fā)出名為s1的模型,在衡量數(shù)學和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團隊稱,訓練租用所需的計算資源等成本只需約幾十美元。

  s1的核心創(chuàng)新在于采用了“知識蒸餾”技術和“預算強制”方法?!爸R蒸餾”好比把別人釀好的酒進一步提純。該模型訓練數(shù)據(jù)是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數(shù)據(jù)集。

  “預算強制”則使用了AI模型訓練新方法——“測試時擴展”的實現(xiàn)方式?!皽y試時擴展”又稱“深度思考”,核心是在模型測試階段,通過調整計算資源分配,使模型更深入思考問題,提高推理能力和準確性。

  “預算強制”通過強制提前結束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進行微調,通過“預算強制”控制訓練后的模型計算量,使用16個英偉達H100 GPU僅進行26分鐘訓練便達成目標。

  美國加利福尼亞大學伯克利分校研究團隊最近也開發(fā)出一款名為TinyZero的精簡AI模型,稱復刻了DeepSeek-R1 Zero在倒計時和乘法任務中的表現(xiàn)。該模型通過強化學習,實現(xiàn)了部分相當于30億模型參數(shù)的大語言模型的自我思維驗證和搜索能力。團隊稱項目訓練成本不到30美元。

  “二次創(chuàng)造”增強AI普惠性

  清華大學計算機系長聘副教授劉知遠接受記者采訪時說,部分海外研究團隊使用DeepSeek-R1、o1等高性能推理大模型來構建、篩選高質量長思維鏈數(shù)據(jù)集,再用這些數(shù)據(jù)集微調模型,可低成本快速獲得高階推理能力。

  相關專家認為,這是AI研發(fā)的有益嘗試,以“二次創(chuàng)造”方式構建模型增強了AI普惠性。但有三點值得注意:

  首先,所謂“幾十美元的低成本”,并未納入開發(fā)基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環(huán)節(jié)的算力成本,并未計算基座模型的預訓練成本、數(shù)據(jù)采集加工成本。

  其次,“二次創(chuàng)造”構建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數(shù)學任務、編程及數(shù)學益智游戲等特定任務中有良好表現(xiàn),但無法適用于更復雜、多樣化的任務場景。而s1模型也只能通過精心挑選的訓練數(shù)據(jù),在特定測試集上超過早期版本o1 preview,而遠未超過o1正式版或DeepSeek-R1。

  最后,開發(fā)性能更優(yōu)越的大模型,仍需強化學習技術。劉知遠說,就推動大模型能力邊界而言,“知識蒸餾”技術意義不大,未來仍需探索大規(guī)模強化學習技術,以持續(xù)激發(fā)大模型在思考、反思、探索等方面的能力。

  AI模型未來如何進化

  在2025年美國消費電子展上,美國英偉達公司高管為AI的進化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規(guī)模定律”呈現(xiàn)從“預訓練擴展”、到“訓練后擴展”,再到“測試時擴展”的演進。

  “預訓練擴展”堪稱“大力出奇跡”——訓練數(shù)據(jù)越多、模型規(guī)模越大、投入算力越多,最終得到AI模型的能力就越強。目標是構建一個通用語言模型,以GPT早期模型為代表。而“訓練后擴展”涉及強化學習和人類反饋等技術,是預訓練模型的“進化”,優(yōu)化其在特定領域的任務表現(xiàn)。

  隨著“預訓練擴展”和“訓練后擴展”邊際收益逐漸遞減,“測試時擴展”技術興起。田豐說,“測試時擴展”的核心在于將焦點從訓練階段轉移到推理階段,通過動態(tài)控制推理過程中的計算量(如思考步長、迭代次數(shù))來優(yōu)化結果。這一方法不僅降低了對預訓練數(shù)據(jù)的依賴,還顯著提升了模型潛力。

  三者在資源分配和應用場景上各有千秋。預訓練像是讓AI模型去學校學習基礎知識,而后訓練則是讓模型掌握特定工作技能,如醫(yī)療、法律等專業(yè)領域?!皽y試時擴展”則賦予了模型更強推理能力。

  AI模型的迭代還存在類似摩爾定律的現(xiàn)象,即能力密度隨時間呈指數(shù)級增強。劉知遠說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數(shù)就能實現(xiàn)相同能力。未來應繼續(xù)推進計算系統(tǒng)智能化,不斷追求更高能力密度,以更低成本,實現(xiàn)大模型高效發(fā)展。

  • 相關閱讀
  • 以色列總理:以在加沙“隨時準備重返激烈戰(zhàn)斗”

      新華社耶路撒冷2月23日電(記者王卓倫 馮國芮)據(jù)以色列媒體23日報道,以總理內塔尼亞胡當天發(fā)出警告說,以色列在加沙地帶“隨時準備重返激烈戰(zhàn)斗,作戰(zhàn)計劃已準備就緒”。  內塔尼亞胡當天在參加以軍方活動時說,巴勒斯坦...

    時間:02-24
  • 所羅門群島附近海域發(fā)生6.0級地震

      新華社悉尼2月24日電 霍尼亞拉消息:南太平洋島國所羅門群島附近海域24日發(fā)生6.0級地震。目前尚無人員傷亡和財產(chǎn)損失報告?! ?jù)美國地質調查局地震信息網(wǎng)消息,此次地震發(fā)生在當?shù)貢r間24日5時16分(北京時間2時16分),...

    時間:02-24
  • 出口民調顯示聯(lián)盟黨在德國聯(lián)邦議院選舉中得票領先

      新華社柏林2月23日電(記者邰思聰 李超)德國新一屆聯(lián)邦議院(議會下院)選舉投票于當?shù)貢r間23日18時結束。出口民調顯示,基督教民主聯(lián)盟和基督教社會聯(lián)盟組成的聯(lián)盟黨得票率領先其他政黨。  德國電視一臺發(fā)布的出口民調...

    時間:02-24
  • 中國駐英國使館為“里斯本丸”號船幸存者家屬舉辦新春招待會

      新華社倫敦2月23日電(記者章博寧 趙小娜)中國駐英國大使館22日在倫敦為“里斯本丸”號船幸存者家屬舉辦新春招待會,共同追憶80多年前中國漁民英勇營救英軍戰(zhàn)俘的感人事跡?! ?942年10月,日本軍隊征用“里斯本丸”...

    時間:02-23
  • 國際觀察|烏克蘭危機升級三年 多方博弈仍在激化

      新華社莫斯科/基輔2月23日電 題:烏克蘭危機升級三年 多方博弈仍在激化  新華社記者黃河 李東旭  烏克蘭危機升級已三年。這場沖突劇烈沖擊地區(qū)安全、經(jīng)濟、社會等諸多領域,同時深刻...

    時間:02-23
  • 尼日利亞中部交通事故造成至少14人死亡

      新華社阿布賈2月23日電(記者楊喆)尼日利亞警方23日說,尼日利亞中部尼日爾州22日發(fā)生車輛相撞事故,造成至少14人死亡、6人受傷。  尼日爾州交警部門負責人說,22日下午,一輛客車在該州一條高速公路上試...

    時間:02-23
  • 《哪吒2》在斐濟上映 預售火爆臨時加映

      新華社蘇瓦2月23日電(記者郭鑫惠)斐濟首都蘇瓦市達莫達爾影院市場部經(jīng)理克利夫22日接受新華社記者采訪時表示,中國動畫電影《哪吒之魔童鬧?!罚ㄒ韵路Q《哪吒2》)自20日在蘇瓦上映以來,票房表現(xiàn)出色,上座率超出預...

    時間:02-23
  • 全球連線 | 40天1004公里 他們徒步穿越塔克拉瑪干

      近日,職業(yè)徒步者周揚和張治國完成一項壯舉,他們以全自助方式徒步40天,由東往西橫穿“死亡之?!彼死敻缮衬?,總距離達1004公里,期間他們克服沙塵暴、寒潮、脫水等多重困難。周揚說他為這次穿越塔克拉瑪干沙...

    時間:02-23
  • 以借口“羞辱性儀式”推遲釋放巴方人員

      新華社北京2月23日電 巴勒斯坦伊斯蘭抵抗運動(哈馬斯)22日釋放6名以方被扣押人員后,以色列方面卻以哈馬斯釋放以方被扣押人員時舉行“羞辱性儀式”為由,未按照約定于當天釋放600多名巴方在押人員。哈馬斯指責以色列公...

    時間:02-23
免責聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網(wǎng)站轉載圖片、文字之類版權申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。
柳林县| 德格县| 台山市| 库尔勒市| 武山县| 乐至县| 静乐县| 灵丘县| 萨嘎县| 沭阳县| 白山市| 尼玛县| 电白县| 崇阳县| 晋中市| 台东县| 文登市| 平果县| 剑阁县| 济源市| 涡阳县| 云林县| 连南| 祁连县| 东兰县| 阿克陶县| 顺平县| 凌云县| 泽库县| 河南省| 娱乐| 兴宁市| 博白县| 临泉县| 鹤峰县| 潢川县| 虎林市| 乃东县| 安化县| 郑州市| 绥中县|