大語言模型(使用大量文本數據訓練的深度學習模型)

技術簡介

大語言模型（LLM）是指使用大量文本數據訓練的深度學習模型，可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務，如文本分類、問答、對話等，是通向人工智慧的一條重要途徑。

2020年9月，OpenAI授權微軟使用GPT-3模型，微軟成為全球首個享用GPT-3能力的公司。2022年，Open AI發布ChatGPT模型用於生成自然語言文本。2023年3月15日，Open AI發布了多模態預訓練大模型GPT4.0。

2023年2月，谷歌發布會公布了聊天機器人Bard，它由谷歌的大語言模型LaMDA驅動。2023年3月22日，谷歌開放Bard的公測，首先面向美國和英國地區啟動，未來逐步在其它地區上線。

2023年2月7日，百度正式宣布將推出文心一言，3月16日正式上線。文心一言的底層技術基礎為文心大模型，底層邏輯是通過百度智慧型雲提供服務，吸引企業和機構客戶使用API和基礎設施，共同搭建AI模型、開發套用，實現產業AI普惠。

2023年4月13日，亞馬遜雲服務部門在官方部落格宣布推出Bedrock生成式人工智慧服務，以及自有的大語言模型泰坦（Titan）。

2024年3月，Databricks 推出大語言模型 DBRX，號稱“現階段最強開源 AI”。

2023年12月6日，大語言模型入選國家語言資源監測與研究中心發布的“2023年度中國媒體十大流行語”。

2023年12月26日，大語言模型入選“2023年度十大科技名詞”。