“大模型語料數據聯盟”成立於2023年7月。
基本介紹
- 中文名:大模型語料數據聯盟
- 成立時間:2023年7月
發展歷程
2023年7月6日,2023世界人工智慧大會(簡稱2023WAIC)在上海世博中心正式開幕。會上,上海人工智慧實驗室、中國科學技術信息研究所、上海數據集團、上海市數商協會、國家氣象中心以及中央廣播電視總台、上海報業集團等單位聯合發起的大模型語料數據聯盟正式成立。
“大模型語料數據聯盟”成立於2023年7月。
“大模型語料數據聯盟”成立於2023年7月。發展歷程2023年7月6日,2023世界人工智慧大會(簡稱2023WAIC)在上海世博中心正式開幕。會上,上海人工智慧實驗室、中國科學技術信息研究所、上海數據集團、上海市數商協...
中國大模型語料數據聯盟安全治理專委會於2023年11月26日由上海人工智慧實驗室(上海AI實驗室)聯合人民網共同發起成立。發展歷史 2023年11月26日,中國大模型語料數據聯盟安全治理專委會成立。主要任務 該專委會旨在推動大模型數據安全治理...
“書生·萬卷”是大模型語料數據聯盟開源發布的高質量大模型多模態預訓練語料。“書生·萬卷” 1.0包含文本數據集、圖文數據集、視頻數據集三部分,本次開源的數據總量超過2TB。該語料數據包含超過5億個文本,2,200萬個圖文交錯文檔,...
繼8月14日發布書生·萬卷以來,語料數據聯盟推出了第二批開源語料數據集——蜜巢·花粉1.0。據悉,另有多個聯盟成員單位也已形成語料數據開源方案,將陸續進入發布佇列。據蜜度信息首席技術官劉益東介紹,蜜巢·花粉1.0以網際網路媒體數據...