書生·浦語:發展歷程,浦語發布,書生·浦語200億參數版本開源,浦語開源,模型能力

書生·浦語

上海人工智慧實驗室與商湯科技聯合香港中文大學、復旦大學發布新一代大語言模型書生·浦語2.0（InternLM2）。這個大模型包含70億和200億兩種參數規格，以及基座、對話等版本，向全社會開源並提供免費商用授權。

在55個主流評測集上，InternLM2與多個同量級模型接受了綜合評測，結果顯示：InternLM2的輕量級（70億參數）和中量級（200億參數）版本性能處於領先水平；200億參數版本儘管只是中等規模，但在整體表現上達到了與ChatGPT比肩的水平。

基本介紹

軟體名稱：書生·浦語
軟體平台：書生通用大模型體系
上線時間：2023年6月
最近更新時間：2024年1月
開發商：上海人工智慧實驗室聯合多家機構
外文名：InternLM
別名：浦語

發展歷程,浦語發布,書生·浦語200億參數版本開源,浦語開源,模型能力,模型套用,浦語靈筆,浦語數學,

發展歷程

浦語發布

2023年7月，書生·浦語正式發布

支持8K語境長度的千億參數級語言大模型，具有1040億參數，是在包含18000億 token 的高質量語料上訓練而成。書生·浦語也正式開源了一個70億參數的輕量級版本InternLM-7B，以及貫穿數據、預訓練、微調、部署和評測五大環節的全鏈條工具體系。

書生·浦語200億參數版本開源

2023年9月，上海人工智慧實驗室聯合多家機構推出書生·浦語大模型200億參數版本InternLM-20B，並在阿里雲魔搭社區（ModelScope）開源首發。同時，書生·浦語面向大模型研發與套用的全鏈條工具鏈全線升級，與InternLM-20B一同繼續全面開放，向企業和開發者提供免費商用授權。

書生·浦語面向大模型研發與套用的全鏈條工具鏈

InternLM-20B是基於2.3T token預訓練語料從頭訓練的中量級語言大模型。相較於InternLM-7B，訓練語料經過了更高水平的多層次清洗，補充了高知識密度和用於強化及推理能力的訓練數據。因此，在考驗語言模型技術水平的理解能力、推理能力、數學能力、編程能力等方面，InternLM-20B都有顯著提升。

浦語開源

2024年1月，書生·浦語2.0正式開源

書生·浦語2.0（英文名：InternLM2）核心理念：回歸語言建模的本質，致力於通過提高語料質量及信息密度，實現模型基座語言建模能力獲得質的提升，進而在數理、代碼、對話、創作等各方面都取得長足進步，綜合性能達到同量級開源模型的領先水平。InternLM2是在2.6萬億token的高質量語料上訓練得到的。沿襲第一代書生·浦語（InternLM）的設定，InternLM2包含7B及20B兩種參數規格及基座、對話等版本，滿足不同複雜套用場景需求。秉持“以高質量開源賦能創新”理念，上海AI實驗室繼續提供InternLM2免費商用授權。

書生·浦語大模型開源歷程

模型能力

書生·浦語2.0回歸語言建模本質，築牢大模型能力基礎

大模型套用生態的發展和繁榮是建立在模型基座強大的通用基礎能力之上的。上海AI實驗室聯合團隊研究認為，大模型各項性能提升的基礎在於語言建模能力的增強，對於大模型的研究應回歸語言建模本質，通過更高質量的語料以及更高的信息密度，築牢大模型能力基礎。

支持200K超長上下文，實現“大海撈針” 通過拓展訓練視窗大小和改進位置編碼，InternLM2支持200K token的上下文，能夠一次性接受並處理約30萬漢字（約五六百頁的文檔）的輸入內容，準確提取關鍵信息，實現長文本中“大海撈針”。為測試InternLM2在真實長文本處理任務中的能力，研究人員將一份時長3小時的公開會議錄音轉錄稿輸入模型中，並要求InternLM2從中提取出關鍵信息。測試結果表明，儘管在未校對的文本中存在較多錯別字，但InternLM2仍從中準確提煉出了關鍵信息，並總結了發言人的主要觀點。

模型套用

浦語靈筆

簡介 2023年10月，上海人工智慧實驗室（上海AI實驗室）推出首個圖文混合創作大模型書生·浦語靈筆（InternLM-XComposer）2024年1月，全面升級的書生·浦語靈筆2.0（InternLM-XComposer2），在大模型落地套用的探索上再邁進一步。

開源書生·浦語靈筆2.0開源了圖文創作大模型（InternLM-XComposer2-7B）和它背後的圖文理解與問答模型（InternLM-XComposer2-VL-7B），上海人工智慧實驗室提供免費商用。