每日經(jīng)濟(jì)新聞 2025-08-12 11:37:41
每經(jīng)AI快訊,8月12日,360智腦團(tuán)隊(duì)宣布提出新的Light?IF框架,以預(yù)覽?自檢式推理和信息熵控制為核心,提升模型在復(fù)雜指令上的遵循度。Light?IF框架包括五個(gè)關(guān)鍵環(huán)節(jié):難度感知指令生成、Zero-RL強(qiáng)化學(xué)習(xí)、推理模式提取與過濾、熵保持監(jiān)督冷啟動(dòng)、熵自適應(yīng)正則強(qiáng)化學(xué)習(xí)。Light-IF-32B/14B/8B/4B/1.7B全系模型將陸續(xù)在Hugging Face開放。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP