大語言模型

大語言模型

大語言模型（LLM）是基於海量文本數據訓練的深度學習模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種自然語言任務，如文本摘要、問答、翻譯等。

2023年，大語言模型及其在人工智慧領域的套用已成為全球科技研究的熱點，其在規模上的增長尤為引人注目，參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處，更加深入地理解人類語言的複雜性。在過去的一年裡，大語言模型在吸納新知識、分解複雜任務以及圖文對齊等多方面都有顯著提升。隨著技術的不斷成熟，它將不斷拓展其套用範圍，為人類提供更加智慧型化和個性化的服務，進一步改善人們的生活和生產方式。

2023年12月26日，大語言模型入選“2023年度十大科技名詞”。

基本介紹

中文名：大語言模型
外文名：Large Language Model
LLM

技術簡介,發展歷史,社會影響,

技術簡介

大語言模型（LLM）是指使用大量文本數據訓練的深度學習模型，可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務，如文本分類、問答、對話等，是通向人工智慧的一條重要途徑。

發展歷史

2020年9月，OpenAI授權微軟使用GPT-3模型，微軟成為全球首個享用GPT-3能力的公司。2022年，Open AI發布ChatGPT模型用於生成自然語言文本。2023年3月15日，Open AI發布了多模態預訓練大模型GPT4.0。

2023年2月，谷歌發布會公布了聊天機器人Bard，它由谷歌的大語言模型LaMDA驅動。2023年3月22日，谷歌開放Bard的公測，首先面向美國和英國地區啟動，未來逐步在其它地區上線。

2023年2月7日，百度正式宣布將推出文心一言，3月16日正式上線。文心一言的底層技術基礎為文心大模型，底層邏輯是通過百度智慧型雲提供服務，吸引企業和機構客戶使用API和基礎設施，共同搭建AI模型、開發套用，實現產業AI普惠。

2023年4月13日，亞馬遜雲服務部門在官方部落格宣布推出Bedrock生成式人工智慧服務，以及自有的大語言模型泰坦（Titan）。

社會影響

2023年12月6日，大語言模型入選國家語言資源監測與研究中心發布的“2023年度中國媒體十大流行語”。

2023年12月26日，大語言模型入選“2023年度十大科技名詞”。

相關詞條

熱門詞條

聯絡我們