訊飛星火認知大模型

訊飛星火認知大模型

訊飛星火認知大模型是科大訊飛發布的大模型。該模型具有7大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模互動,該模型對標ChatGPT

2023年5月6日,科大訊飛正式發布訊飛星火認知大模型並開始不斷疊代;6月9日,星火大模型V1.5正式發布;8月15日,星火大模型V2.0正式發布;9月5日,星火大模型正式面向全民開放;10月24日,星火大模型V3.0正式發布;2024年1月30日,星火大模型V3.5正式發布。

訊飛星火認知大模型已位列中國頭部水平,通過中國信通院組織的AIGC大模型基礎能力(功能)評測及可信AI大模型標準符合性驗證,並獲得4+級評分。

基本介紹

  • 中文名:訊飛星火認知大模型
  • 外文名:Spark Desk 
  • 別名:星火大模型、訊飛星火
  • 所屬企業科大訊飛
  • 發布時間:2023年5月6日
  • 最新版本:V3.5
行業背景,名稱寓意,發展沿革,發展事記,研發階段,正式發布,功能介紹,功能綜述,文本生成,語言理解,知識問答,邏輯推理,數學能力,代碼能力,多模互動,模型測評,技術特點,訓練平台,模型結構,訓練數據,版本疊代,研發人員,模型套用,行業模型,原生套用,智慧型硬體,模型影響,影響綜述,資本市場,套用市場,

行業背景

人工智慧產業已經發展許多年,但一直並未出現“殺手級”的套用,直至2022年OpenAI公司發布ChatGPT,這款產品帶來了震撼的產品體驗,引領生成式技術浪潮,人工智慧拉開了新一輪技術和產業革命,眾多行業專家認為其是人工智慧領域的“iPhone時刻”。以ChatGPT為代表的大模型在文本生成、語言理解、邏輯推理、數學能力與代碼能力等領域具備像人類一樣觸類旁通的能力,並表現出強大的進化能力。科大訊飛為了對標ChatGPT,開始研發“訊飛星火認知大模型”

名稱寓意

訊飛星火認知大模型取名“星火”有三層寓意:
訊飛星火認知大模型
“訊飛星火認知大模型”
  • 當前認知大模型的智慧型湧現,讓科大訊飛更加看清了通用人工智慧AGI的遠景目標和實現路徑;
  • 早在2001年科大訊飛“半湯會議”上,創業團隊就提出了“燃燒最亮的火把,要么率先燎原,要么最先熄滅”;
  • “星火”來自中國傳統文化二十八星宿中的“心宿”星座,在中國傳統文化中,被視為吉祥的象徵,代表著力量、勇氣和堅韌不拔的精神。

發展沿革

發展事記

2023年5月6日
訊飛星火認知大模型

大模型正式發布

2023年5月6日,科大訊飛正式發布“訊飛星火認知大模型”。
2022年12月
訊飛星火認知大模型

大模型立項

2022年12月15日,訊飛星火認知大模型正式立項,啟動“1+N”大模型技術攻關。
2022年5月
訊飛星火認知大模型

實驗室重組

2022年5月,科大訊飛與中國科學技術大學重組“認知智慧型全國重點實驗室”。
2017年
訊飛星火認知大模型

認知智慧型全國重點實驗室

2017年,訊飛承建“認知智慧型全國重點實驗室”。

研發階段

科大訊飛在語音識別、語音合成、自然語言處理等領域有技術積累,2011年,科大訊飛就承建語音及語言信息處理國家工程研究中心。2014年,科大訊飛推出“訊飛超腦計畫”。2016年,科大訊飛開始“星火計畫”研究項目,旨在開發具有人類水平智慧型的語音識別系統。2017年,訊飛承建“認知智慧型全國重點實驗室”。
2022年5月,科大訊飛與中國科學技術大學重組“認知智慧型全國重點實驗室”。同年12月,科大訊飛啟動“1+N”大模型技術攻關。同月15日,訊飛星火認知大模型正式立項。

正式發布

2023年4月24日,科大訊飛星火認知大模型官網正式上線,並開放需求調研。
2023年5月6日,科大訊飛在安徽創新館正式發布星火認知大模型。
2023年6月9日,科大訊飛在24周年慶上正式發布訊飛星火認知大模型V1.5,升級開放式知識問答、多輪對話等能力,同時推出星火App、星火助手中心、星火語伴App等。
2023年8月15日,科大訊飛發布訊飛星火認知大模型V2.0,升級代碼能力和多模態能力。同月,訊飛星火認知大模型通過《生成式人工智慧服務管理暫行辦法》備案,可正式上線面向公眾提供服務。
2023年9月5日,科大訊飛宣布訊飛星火大模型面向全民開放,用戶可以在各大套用商店下載,直接註冊使用。
2023年10月24日,科大訊飛在合肥召開“2023科大訊飛全球1024開發者節”,發布訊飛星火認知大模型V3.0。
2024年1月9日,科大訊飛發布基於星火認知大模型的管理數字員工產品、行銷數字員工產品和辦公數字員工產品。1月30日,科大訊飛發布星火認知大模型V3.5。
訊飛星火認知大模型
訊飛星火認知大模型

功能介紹

功能綜述

訊飛星火認知大模型具有7大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模互動。
訊飛星火認知大模型
訊飛星火認知大模型使用界面

文本生成

商業文案:根據用戶要求,創作具有吸引力與情感共鳴的商業文案。
行銷方案:根據描述,創作多種形式的行銷方案。
英文寫作:使用英文完成多風格多任務的的長寫作任務。
新聞通稿:根據新聞要素,創作嚴謹詳實的新聞通稿。

語言理解

機器翻譯:翻譯多種語言的文字,包括英語、中文、法語、德語、西班牙語等常用語種。
文本摘要:根據文本提取簡潔而準確的摘要,快速理解文章的核心觀點。
語法檢查:檢查語法錯誤並提供正確的語法建議,使寫作更加規範與專業。
情感分析:分析文本中的情感色彩,如正面、負面或中性,更好了解內容觀點和態度。

知識問答

生活常識:提供有關日常生活的知識,如飲食、運動、旅遊等方面的建議。
工作技能:提供工作方面的知識,如溝通技巧、時間管理技巧、團隊協作等方面的建議。
醫學知識:提供基本的健康保健知識以及疾病預防、診斷和治療方面的建議。
歷史人文:提供有關歷史事件、文化傳承、名人故事、名言警句等方面的文案。

邏輯推理

思維推理:通過分析問題的前提條件和假設來推理出答案或解決方案,給出新的想法和見解。
科學推理:使用已有的數據和信息進行推斷、預測和驗證等科學研究中的基本任務。
常識推理:在進行對話交流時,運用已有的常識知識來分析、解釋和回套用戶的提問或需求。

數學能力

方程求解:包括一元二次方程、二元一次方程、三元一次方程等等。
幾何問題:平面幾何(如直線、圓、三角形等的性質)和立體幾何(如體積、表面積、投影等)。
微積分:處理導數、積分等微積分相關的問題,涉及基本概念如極限、連續性、導數等。
機率統計:涉及隨機變數、機率分布、假設檢驗等方面的內容。

代碼能力

代碼生成:智慧型生成單行或函式級代碼建議;根據注釋、函式名自動生成代碼。
代碼解釋:類、函式及其作用逐一詳解;支持逐行代碼注釋;學習海量範式,快速精準解讀。
代碼糾錯:精準定位拼寫、語法、邏輯錯誤;新老代碼比較,支持一鍵修改。
單元測試:選中代碼,一鍵生成單測用例;多主流單元測試框架;智慧型生成單元測試數據。

多模互動

多模理解:上傳圖片素材,大模型完成識別理解,返回關於圖片的準確描述。
視覺問答:圍繞上傳圖片素材,回響用戶的問題,大模型完成回答。
多模生成:根據用戶的描述,生成符合期望的合成音頻和視頻。
虛擬人視頻:描述期望的視頻內容,整合AI虛擬人,快速生成匹配視頻。

模型測評

2023年5月9日,中文通用大模型綜合性評測基準“SuperCLUE”正式發布,經過測評,訊飛星火認知大模型在榜單首次發布時位列總榜第三、中國第一。
在2023年7月“SuperCLUE”中文大模型排行榜中,訊飛星火排行總榜第六、中國第三;在2023年7月基礎能力榜單中,訊飛星火排行第三;在2023年7月中文特性榜單中,訊飛星火排行第四。
2023年7月“SuperCLUE”總榜得分(節選部分對比)
模型
總分
基礎能力
中文特性
學術專業
人類
83.66
85.03
82.29
-
GPT-4
70.89
70.04
72.67
69.96
GPT-3.5-turbo
59.79
64.40
63.19
51.78
訊飛星火V1.5
58.02
63.32
65.72
45.03
2023年7月“SuperCLUE”基礎能力(節選部分對比)
模型
平均分
語義理解
閒聊
對話
角色扮演
知識百科
生成創作
邏輯推理
代碼
計算
安全
人類
85.03
90.17
71.53
77.99
82.19
97.44
68.79
90.55
90.45
94.97
86.22
GPT-4
70.04
82.91
46.77
66.39
63.46
92.65
66.67
60.33
85.45
61.48
73.02
GPT-3.5-turbo
64.40
87.18
45.16
65.57
60.58
85.29
72.36
42.98
72.73
38.52
72.22
訊飛星火
V1.5
63.32
78.26
45.90
59.84
55.88
73.48
54.92
54.70
60.00
76.86
71.54
根據新華社研究院《人工智慧大模型體驗報告3.0》,訊飛星火認知大模型獲得1775最高分,在“技術實力”和“發展潛力”處於“第一象限”,並獲得基礎能力指數、智商指數、工具提效指數三項評測指標第一。
在《麻省理工科技評論》一個8個一級大類的600道題目的測試和盲評中,訊飛星火認知大模型V2.0在語言專項、數學專項、理科綜合、邏輯思維、編程能力、綜合知識6個大類中得分率排名第一,以81.5分(滿分100分)的成績獲得總分第一名。

技術特點

訓練平台

科大訊飛聯合華為打造了基於昇騰生態的自主可控大模型算力底座“飛星一號”平台,訊飛星火認知大模型V3.5正是基於支撐萬億參數大模型訓練的萬卡中國國產算力平台“飛星一號”訓練。

模型結構

訊飛星火認知大模型基於“Transformer”神經網路結構,這種結構可以直接處理整個句子或段落,而不需要分段或分句處理,從而更好地處理長文本序列。“Transformer”結構主要由編碼器和解碼器組成,編碼器負責將輸入的文本序列編碼為一系列的高維向量表示,解碼器則可以根據這些向量表示生成輸出序列。

訓練數據

訊飛星火認知大模型使用了TB級的訓練數據和億級的參數進行模型訓練,通過對海量數據的學習和訓練,能夠不斷地提高自己的預測和推理能力,從而在各種任務中取得更好的性能表現。

版本疊代

訊飛星火大模型歷次疊代升級能力點
版本
升級特性
V1.0
具備文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模互動七大核心能力
V1.5
提升開放式知識問答、多輪對話、邏輯和數學能力
V2.0
提升代碼能力、多模態能力
V3.0
提升七大核心能力,中文語境下超越ChatGPT
V3.5
提升邏輯推理、語言理解、文本生成、數學答題、多模態能力,語言理解、數學能力超越GPT4-Turbo

研發人員

訊飛星火認知大模型由科大訊飛研究院負責研發,核心研究團隊超過200人,其院長為劉聰,團隊內還有2名《麻省理工科技評論》“35歲以下科技創新35人”榜單中的青年科學家。此外,科大訊飛與中國科學技術大學共建的“認知智慧型全國重點實驗室”也參與了“1+N認知大模型技術及套用”專項攻關。
參與訊飛星火認知大模型研發的專家
訊飛星火認知大模型
科大訊飛股份有限公司副總裁、科大訊飛研究院院長。
多次在訊飛星火認知大模型發布會上為公眾演示模型。
訊飛星火認知大模型
認知智慧型實驗室副主任、中國科學技術大學大數據學院執行院長。
訊飛星火認知大模型
認知智慧型實驗室副主任、科大訊飛AI研究院常務副院長。
訊飛星火認知大模型
認知智慧型實驗室主任、科大訊飛高級副總裁。

模型套用

行業模型

星火認知大模型採用“1+N”架構,其中“1”是通用認知智慧型大模型算法研發及高效訓練底座平台,“N”是套用於教育、醫療、人機互動、辦公、翻譯、工業等多個行業領域經過“預訓練”+“精調”的專用大模型版本。
訊飛星火“1+N”大模型體系有助於觸達更多行業場景,獲取高質量的行業數據,更深入地強化星火大模型的能力,帶來更快的技術疊代速度,使得行業大模型可以更好地滿足不同領域的需求和挑戰。
科大訊飛已發布金融、汽車、運營商、工業、住建、法律等十二個行業大模型,並且在教育、辦公、汽車、金融、工業、醫療等行業推進相關套用落地。

原生套用

星火內容運營大師、訊飛智文、星火文檔問答、iFlyCode、訊飛曉醫、星火科研助手等套用軟體集成了訊飛星火認知大模型或星火行業大模型。

智慧型硬體

科大訊飛基於訊飛星火認知大模型,推出了學習機、智慧型辦公本、翻譯機、錄音筆、智慧型助聽器、掃地機器人等硬體產品。

模型影響

影響綜述

訊飛星火認知大模型作為科大訊飛推出的創新性人工智慧產品,自發布以來便受到廣泛關注。儘管在發布前外界對其持保留態度,但發布會後的實際效果遠超預期,不僅在技術層面展現了先進性能,更在資本市場和套用市場產生影響。

資本市場

在資本市場方面,訊飛星火認知大模型發布會後的首個交易日,科大訊飛公司股價漲停,市值升至1483.52億人民幣,充分體現了市場對這一大模型產品的認可與期待。此外,隨著訊飛星火認知大模型在各個領域的套用和推廣,科大訊飛在資本市場的表現持續強勁,成為投資者關注的焦點。

套用市場

在套用市場方面,據京東和天貓數據顯示,訊飛AI智慧型硬體產品在訊飛星火認知大模型發布後,保持高質量增長,尤其對訊飛學習機的銷售增長產生了顯著影響。據信達證券研報指出,在訊飛星火認知大模型的加持下,2023年5月和6月,訊飛AI學習機的商品交易總額分別同比增長136%和217%。

相關詞條

熱門詞條

聯絡我們