通義(阿里雲旗下大模型):出現背景,時代背景,技術背景,名稱由來,發展歷程,主要功

通義，由通義千問更名而來，是阿里雲推出的語言模型，於2023年9月13日正式向公眾開放。屬於(AI Generated Content，AIGC)領域，是一個MaaS（模型即服務）的底座。為多模態大模型(Multimodal Models)。

通義意為“通情，達義”，具備全副AI能力，致力於成為人們的工作、學習、生活助手。功能包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持，能夠跟人類進行多輪的互動，也融入了多模態的知識理解，且有文案創作能力，能夠續寫小說，編寫郵件等。

2023年4月7日，通義的前身通義千問開始邀請測試，4月11日，通義千問在2023阿里雲峰會上揭曉。4月18日，釘釘正式接通通義千問大模型。9月13日，通義千問大模型通過首批備案，正式向公眾開放。通義千問APP在各大手機套用市場正式上線，所有人都可通過APP直接體驗最新模型能力。12月1日，阿里雲開源通義千問720億參數模型。12月22日，阿里雲通義千問成為首個“大模型標準符合性評測”中首批通過評測的四款國產大模型之一，在通用性、智慧型性等維度均達到國家相關標準要求。

2024年4月7日，阿里雲通義千問開源320億參數模型Qwen1.5-32B，可最大限度兼顧性能、效率和記憶體占用的平衡。5月，通義千問2.5大模型發布並更名。5月9日，阿里雲正式發布了通義千問2.5版本。5月21日訊息，阿里雲宣布通義千問GPT-4級主力模型Qwen-Long，API輸入價格從0.02元/千tokens降至0.0005元/千tokens，直降97%。8月19日，通義千問宣布啟用新域名：tongyi.ai。

基本介紹

軟體名稱：通義
最近更新時間：2024年5月9日
所屬公司 ：阿里雲
原名：通義千問

出現背景,時代背景,技術背景,名稱由來,發展歷程,主要功能,系列產品,通義靈碼,通義智文,通義聽悟,通義星塵,通義點金,通義曉蜜,通義仁心,通義法睿,長文本功能,模型框架,模型修改,關鍵技術,模型訓練,平台特色,服務特性,內容特性,算力特性,個性特性,安全特性,存在問題,合作產品,社會評價,行業評價,自我評價,內部評價,相關事件,

出現背景

時代背景

大模型是人工智慧領域的熱門研究方向。專家認為，人工智慧進入產業級大模型時代。大模型將是未來一段時間科技領域裡面最重要的事情之一。大模型將開啟人工智慧的“大一統時代”。

人工智慧是引領新一輪科技革命與產業變革的戰略性技術，是賦能經濟社會數位化、綠色化雙轉型的主要引擎,具有很強的“頭雁”效應。

這些模型使用大量的多媒體數據資源作為輸入，並通過複雜的數學運算和最佳化算法來完成大規模的訓練，以學習和理解到輸入數據的模式和特徵。這些模式和特徵最終通過大模型中龐大的參數進行表征，以獲得與輸入數據和模型設計相匹配的能力，最終來實現更複雜、更廣泛的任務，如語音識別、自然語言處理、計算機視覺等。

技術背景

視覺算法基礎

傳統機器學習算法中，可通過圖像特徵描述子SIFT、SURF、BRIEF進行特徵點提取和匹配，車載自動駕駛攝像頭裡面用的圖像識別類算法基本上都是CNN的結構，為卷積神經網路。卷積神經網路認知圖像的過程跟人大腦認知圖像的原理類似。圖像輸入即輸入攝像頭的數據，以每幀信息為基礎進行檢測、分類、分割等計算，最後利用多幀信息進行目標跟蹤，輸出相關結果。

視覺算法近年來的突破在泛化性、可提示性、生成質量和穩定性等方面均取得了進展，預示著技術拐點的臨近以及爆款套用的湧現。由於擴散算法的成熟，對3D資產生成和視頻生成領域有促進作用。

行業發展基礎

隨著科技發展，AI 的開發門檻降低，人們期待小學生也能用各種模型進行開發，因此需要形成一個一個模型的不同層級的結構。一個通用的模型其實也很難解決所有問題，從設計者、開發者的角度出發，圍繞著模型作開發的範式逐漸誕生。

大模型首次出現

2022年11月30日，美國人工智慧研究實驗室OpenAI推出ChatGPT，這是一種人工智慧技術驅動的自然語言處理工具，使用了Transformer神經網路架構，也是GPT-3.5架構，這是一種用於處理序列數據的模型，擁有語言理解和文本生成能力。

Transformer神經網路架構

ChatGPT會通過連線大量的語料庫來訓練模型，語料庫包含了真實世界中的對話，使得ChatGPT具備上知天文下知地理，還能根據聊天的上下文進行互動，做到與真正人類幾乎無異的聊天場景進行交流。ChatGPT不單是聊天機器人，還能進行撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。也能夠通過學習和理解人類的語言來進行對話。

名稱由來

初期，通義前身為通義千問，前者的“通義”取自《漢書》中的“天地之常經，古今之通義也”，有“普遍適用的道理與法則”之意；後者的“千問”寓意千萬次的問，千萬的學問，能問出千問的一定是真愛，能回答千問的，也一定是真有學問，以及AI和阿里雲一樣，都有千萬次互動的熱情。

2024年5月，更名為通義，意為“通情，達義”，具備全副AI能力，致力於成為人們的工作、學習、生活助手。

發展歷程

2023年4月7日，通義千問開始邀請測試。

2023年4月11日，阿里巴巴所有產品未來將接入通義千問大模型，進行全面改造，包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等；同4月，釘釘首次發布基於阿里千問大模型的智慧型化能力，用戶輸入斜槓“/”即可喚起10餘項AI能力。通義千問 AI 大模型接入天貓精靈，開啟相關內測招募。阿里雲工程師在實驗將千問大模型接入工業機器人，在釘釘對話框輸入一句漢字，可遠程指揮機器人工作。

2023年9月，通義千問正式向公眾開放；淘寶內測套用淘寶問問接入通義千問，基於通義千問的文本理解與文本生成能力實現全新的互動體驗以及推薦；同月25日，阿里雲宣布開源通義千問140億參數模型Qwen-14B及其對話模型Qwen-14B-Chat，免費可商用；同年10月31日，2023雲棲大會現場，阿里大模型家族全面升級發布，通義千問2.0正式升級發布。通義千問App也隨之發布。

參數模型Qwen-14B-Chat

2023年11月7日，阿里雲旗下通義千問 App 上架蘋果App Store，安裝包大小為 25.9 MB，此前這款 App 已在各大安卓套用市場上架；同月16日，阿里巴巴公告，截至9月30日，釘釘17條產品線已經全面接入大模型。釘釘還面向客戶及生態體系合作夥伴開放其智慧型化底座AIPaaS，以助生態體系參與者重塑其產品。

2023年12月1日，阿里雲開源通義千問720億參數模型Qwen-72B、18億參數模型Qwen-1.8B及音頻大模型Qwen-Audio；同月2月22日，國內首個官方“大模型標準符合性評測”結果公布，阿里雲通義千問成為首批通過評測的四款國產大模型之一，在通用性、智慧型性等維度均達到國家相關標準要求。