大語言模型(LLM(大語言模型))

大語言模型(使用大量文本數據訓練的深度學習模型)

LLM(大語言模型)一般指本詞條

本詞條是多義詞,共3個義項
更多義項 ▼ 收起列表 ▲

大語言模型(LLM)是基於海量文本數據訓練的深度學習模型。它不僅能夠生成自然語言文本,還能夠深入理解文本含義,處理各種自然語言任務,如文本摘要、問答、翻譯等。

2023年,大語言模型及其在人工智慧領域的套用已成為全球科技研究的熱點,其在規模上的增長尤為引人注目,參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的複雜性。在過去的一年裡,大語言模型在吸納新知識、分解複雜任務以及圖文對齊等多方面都有顯著提升。隨著技術的不斷成熟,它將不斷拓展其套用範圍,為人類提供更加智慧型化和個性化的服務,進一步改善人們的生活和生產方式。

2023年12月26日,大語言模型入選“2023年度十大科技名詞”。

基本介紹

  • 中文名:大語言模型
  • 外文名:Large Language Model
    LLM
技術簡介,發展歷史,社會影響,

技術簡介

大語言模型(LLM)是指使用大量文本數據訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智慧的一條重要途徑。

發展歷史

2020年9月,OpenAI授權微軟使用GPT-3模型,微軟成為全球首個享用GPT-3能力的公司。2022年,Open AI發布ChatGPT模型用於生成自然語言文本。2023年3月15日,Open AI發布了多模態預訓練大模型GPT4.0。
2023年2月,谷歌發布會公布了聊天機器人Bard,它由谷歌的大語言模型LaMDA驅動。2023年3月22日,谷歌開放Bard的公測,首先面向美國和英國地區啟動,未來逐步在其它地區上線。
2023年2月7日,百度正式宣布將推出文心一言,3月16日正式上線。文心一言的底層技術基礎為文心大模型,底層邏輯是通過百度智慧型雲提供服務,吸引企業和機構客戶使用API和基礎設施,共同搭建AI模型、開發套用,實現產業AI普惠。
2023年4月13日,亞馬遜雲服務部門在官方部落格宣布推出Bedrock生成式人工智慧服務,以及自有的大語言模型泰坦(Titan)。
2024年3月,Databricks 推出大語言模型 DBRX,號稱“現階段最強開源 AI”。

社會影響

2023年12月6日,大語言模型入選國家語言資源監測與研究中心發布的“2023年度中國媒體十大流行語”。
2023年12月26日,大語言模型入選“2023年度十大科技名詞”。

相關詞條

熱門詞條

聯絡我們