基本介紹
- 中文名:訊飛星火認知大模型
- 外文名:Spark Desk
- 別名:星火大模型、訊飛星火
- 所屬企業:科大訊飛
- 發布時間:2023年5月6日
- 最新版本:V3.5
行業背景,名稱寓意,發展沿革,發展事記,研發階段,正式發布,功能介紹,功能綜述,文本生成,語言理解,知識問答,邏輯推理,數學能力,代碼能力,多模互動,模型測評,技術特點,訓練平台,模型結構,訓練數據,版本疊代,研發人員,模型套用,行業模型,原生套用,智慧型硬體,模型影響,影響綜述,資本市場,套用市場,
行業背景
人工智慧產業已經發展許多年,但一直並未出現“殺手級”的套用,直至2022年OpenAI公司發布ChatGPT,這款產品帶來了震撼的產品體驗,引領生成式技術浪潮,人工智慧拉開了新一輪技術和產業革命,眾多行業專家認為其是人工智慧領域的“iPhone時刻”。以ChatGPT為代表的大模型在文本生成、語言理解、邏輯推理、數學能力與代碼能力等領域具備像人類一樣觸類旁通的能力,並表現出強大的進化能力。科大訊飛為了對標ChatGPT,開始研發“訊飛星火認知大模型”。
名稱寓意
訊飛星火認知大模型取名“星火”有三層寓意:
- 當前認知大模型的智慧型湧現,讓科大訊飛更加看清了通用人工智慧AGI的遠景目標和實現路徑;
- 早在2001年科大訊飛“半湯會議”上,創業團隊就提出了“燃燒最亮的火把,要么率先燎原,要么最先熄滅”;
- “星火”來自中國傳統文化二十八星宿中的“心宿”星座,在中國傳統文化中,被視為吉祥的象徵,代表著力量、勇氣和堅韌不拔的精神。
發展沿革
發展事記
研發階段
科大訊飛在語音識別、語音合成、自然語言處理等領域有技術積累,2011年,科大訊飛就承建語音及語言信息處理國家工程研究中心。2014年,科大訊飛推出“訊飛超腦計畫”。2016年,科大訊飛開始“星火計畫”研究項目,旨在開發具有人類水平智慧型的語音識別系統。2017年,訊飛承建“認知智慧型全國重點實驗室”。
2022年5月,科大訊飛與中國科學技術大學重組“認知智慧型全國重點實驗室”。同年12月,科大訊飛啟動“1+N”大模型技術攻關。同月15日,訊飛星火認知大模型正式立項。
正式發布
2023年4月24日,科大訊飛星火認知大模型官網正式上線,並開放需求調研。
2023年5月6日,科大訊飛在安徽創新館正式發布星火認知大模型。
2023年6月9日,科大訊飛在24周年慶上正式發布訊飛星火認知大模型V1.5,升級開放式知識問答、多輪對話等能力,同時推出星火App、星火助手中心、星火語伴App等。
2023年8月15日,科大訊飛發布訊飛星火認知大模型V2.0,升級代碼能力和多模態能力。同月,訊飛星火認知大模型通過《生成式人工智慧服務管理暫行辦法》備案,可正式上線面向公眾提供服務。
2023年9月5日,科大訊飛宣布訊飛星火大模型面向全民開放,用戶可以在各大套用商店下載,直接註冊使用。
2023年10月24日,科大訊飛在合肥召開“2023科大訊飛全球1024開發者節”,發布訊飛星火認知大模型V3.0。
2024年1月9日,科大訊飛發布基於星火認知大模型的管理數字員工產品、行銷數字員工產品和辦公數字員工產品。1月30日,科大訊飛發布星火認知大模型V3.5。
功能介紹
功能綜述
訊飛星火認知大模型具有7大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模互動。
文本生成
商業文案:根據用戶要求,創作具有吸引力與情感共鳴的商業文案。
行銷方案:根據描述,創作多種形式的行銷方案。
英文寫作:使用英文完成多風格多任務的的長寫作任務。
新聞通稿:根據新聞要素,創作嚴謹詳實的新聞通稿。
語言理解
機器翻譯:翻譯多種語言的文字,包括英語、中文、法語、德語、西班牙語等常用語種。
文本摘要:根據文本提取簡潔而準確的摘要,快速理解文章的核心觀點。
語法檢查:檢查語法錯誤並提供正確的語法建議,使寫作更加規範與專業。
情感分析:分析文本中的情感色彩,如正面、負面或中性,更好了解內容觀點和態度。
知識問答
生活常識:提供有關日常生活的知識,如飲食、運動、旅遊等方面的建議。
工作技能:提供工作方面的知識,如溝通技巧、時間管理技巧、團隊協作等方面的建議。
醫學知識:提供基本的健康保健知識以及疾病預防、診斷和治療方面的建議。
歷史人文:提供有關歷史事件、文化傳承、名人故事、名言警句等方面的文案。
邏輯推理
思維推理:通過分析問題的前提條件和假設來推理出答案或解決方案,給出新的想法和見解。
科學推理:使用已有的數據和信息進行推斷、預測和驗證等科學研究中的基本任務。
常識推理:在進行對話交流時,運用已有的常識知識來分析、解釋和回套用戶的提問或需求。
數學能力
方程求解:包括一元二次方程、二元一次方程、三元一次方程等等。
幾何問題:平面幾何(如直線、圓、三角形等的性質)和立體幾何(如體積、表面積、投影等)。
微積分:處理導數、積分等微積分相關的問題,涉及基本概念如極限、連續性、導數等。
機率統計:涉及隨機變數、機率分布、假設檢驗等方面的內容。
代碼能力
代碼生成:智慧型生成單行或函式級代碼建議;根據注釋、函式名自動生成代碼。
代碼解釋:類、函式及其作用逐一詳解;支持逐行代碼注釋;學習海量範式,快速精準解讀。
代碼糾錯:精準定位拼寫、語法、邏輯錯誤;新老代碼比較,支持一鍵修改。
單元測試:選中代碼,一鍵生成單測用例;多主流單元測試框架;智慧型生成單元測試數據。
多模互動
多模理解:上傳圖片素材,大模型完成識別理解,返回關於圖片的準確描述。
視覺問答:圍繞上傳圖片素材,回響用戶的問題,大模型完成回答。
多模生成:根據用戶的描述,生成符合期望的合成音頻和視頻。
虛擬人視頻:描述期望的視頻內容,整合AI虛擬人,快速生成匹配視頻。
模型測評
- SuperCLUE
2023年5月9日,中文通用大模型綜合性評測基準“SuperCLUE”正式發布,經過測評,訊飛星火認知大模型在榜單首次發布時位列總榜第三、中國第一。
在2023年7月“SuperCLUE”中文大模型排行榜中,訊飛星火排行總榜第六、中國第三;在2023年7月基礎能力榜單中,訊飛星火排行第三;在2023年7月中文特性榜單中,訊飛星火排行第四。
模型 | 總分 | 基礎能力 | 中文特性 | 學術專業 |
---|---|---|---|---|
人類 | 83.66 | 85.03 | 82.29 | - |
GPT-4 | 70.89 | 70.04 | 72.67 | 69.96 |
GPT-3.5-turbo | 59.79 | 64.40 | 63.19 | 51.78 |
訊飛星火V1.5 | 58.02 | 63.32 | 65.72 | 45.03 |
模型 | 平均分 | 語義理解 | 閒聊 | 對話 | 角色扮演 | 知識百科 | 生成創作 | 邏輯推理 | 代碼 | 計算 | 安全 |
---|---|---|---|---|---|---|---|---|---|---|---|
人類 | 85.03 | 90.17 | 71.53 | 77.99 | 82.19 | 97.44 | 68.79 | 90.55 | 90.45 | 94.97 | 86.22 |
GPT-4 | 70.04 | 82.91 | 46.77 | 66.39 | 63.46 | 92.65 | 66.67 | 60.33 | 85.45 | 61.48 | 73.02 |
GPT-3.5-turbo | 64.40 | 87.18 | 45.16 | 65.57 | 60.58 | 85.29 | 72.36 | 42.98 | 72.73 | 38.52 | 72.22 |
訊飛星火 V1.5 | 63.32 | 78.26 | 45.90 | 59.84 | 55.88 | 73.48 | 54.92 | 54.70 | 60.00 | 76.86 | 71.54 |
- 人工智慧大模型體驗報告3.0
根據新華社研究院《人工智慧大模型體驗報告3.0》,訊飛星火認知大模型獲得1775最高分,在“技術實力”和“發展潛力”處於“第一象限”,並獲得基礎能力指數、智商指數、工具提效指數三項評測指標第一。
- 《麻省理工科技評論》
在《麻省理工科技評論》一個8個一級大類的600道題目的測試和盲評中,訊飛星火認知大模型V2.0在語言專項、數學專項、理科綜合、邏輯思維、編程能力、綜合知識6個大類中得分率排名第一,以81.5分(滿分100分)的成績獲得總分第一名。
技術特點
訓練平台
科大訊飛聯合華為打造了基於昇騰生態的自主可控大模型算力底座“飛星一號”平台,訊飛星火認知大模型V3.5正是基於支撐萬億參數大模型訓練的萬卡中國國產算力平台“飛星一號”訓練。
模型結構
訊飛星火認知大模型基於“Transformer”神經網路結構,這種結構可以直接處理整個句子或段落,而不需要分段或分句處理,從而更好地處理長文本序列。“Transformer”結構主要由編碼器和解碼器組成,編碼器負責將輸入的文本序列編碼為一系列的高維向量表示,解碼器則可以根據這些向量表示生成輸出序列。
訓練數據
訊飛星火認知大模型使用了TB級的訓練數據和億級的參數進行模型訓練,通過對海量數據的學習和訓練,能夠不斷地提高自己的預測和推理能力,從而在各種任務中取得更好的性能表現。
版本疊代
版本 | 升級特性 |
---|---|
V1.0 | 具備文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模互動七大核心能力 |
V1.5 | 提升開放式知識問答、多輪對話、邏輯和數學能力 |
V2.0 | 提升代碼能力、多模態能力 |
V3.0 | 提升七大核心能力,中文語境下超越ChatGPT |
V3.5 | 提升邏輯推理、語言理解、文本生成、數學答題、多模態能力,語言理解、數學能力超越GPT4-Turbo |
研發人員
訊飛星火認知大模型由科大訊飛研究院負責研發,核心研究團隊超過200人,其院長為劉聰,團隊內還有2名《麻省理工科技評論》“35歲以下科技創新35人”榜單中的青年科學家。此外,科大訊飛與中國科學技術大學共建的“認知智慧型全國重點實驗室”也參與了“1+N認知大模型技術及套用”專項攻關。
認知智慧型實驗室副主任、中國科學技術大學大數據學院執行院長。 | |
認知智慧型實驗室副主任、科大訊飛AI研究院常務副院長。 | |
認知智慧型實驗室主任、科大訊飛高級副總裁。 |
模型套用
行業模型
星火認知大模型採用“1+N”架構,其中“1”是通用認知智慧型大模型算法研發及高效訓練底座平台,“N”是套用於教育、醫療、人機互動、辦公、翻譯、工業等多個行業領域經過“預訓練”+“精調”的專用大模型版本。
訊飛星火“1+N”大模型體系有助於觸達更多行業場景,獲取高質量的行業數據,更深入地強化星火大模型的能力,帶來更快的技術疊代速度,使得行業大模型可以更好地滿足不同領域的需求和挑戰。
科大訊飛已發布金融、汽車、運營商、工業、住建、法律等十二個行業大模型,並且在教育、辦公、汽車、金融、工業、醫療等行業推進相關套用落地。
原生套用
智慧型硬體
科大訊飛基於訊飛星火認知大模型,推出了學習機、智慧型辦公本、翻譯機、錄音筆、智慧型助聽器、掃地機器人等硬體產品。
模型影響
影響綜述
訊飛星火認知大模型作為科大訊飛推出的創新性人工智慧產品,自發布以來便受到廣泛關注。儘管在發布前外界對其持保留態度,但發布會後的實際效果遠超預期,不僅在技術層面展現了先進性能,更在資本市場和套用市場產生影響。
資本市場
在資本市場方面,訊飛星火認知大模型發布會後的首個交易日,科大訊飛公司股價漲停,市值升至1483.52億人民幣,充分體現了市場對這一大模型產品的認可與期待。此外,隨著訊飛星火認知大模型在各個領域的套用和推廣,科大訊飛在資本市場的表現持續強勁,成為投資者關注的焦點。
套用市場
在套用市場方面,據京東和天貓數據顯示,訊飛AI智慧型硬體產品在訊飛星火認知大模型發布後,保持高質量增長,尤其對訊飛學習機的銷售增長產生了顯著影響。據信達證券研報指出,在訊飛星火認知大模型的加持下,2023年5月和6月,訊飛AI學習機的商品交易總額分別同比增長136%和217%。