GPT-4o的名稱中“o”代表Omni,即全能的意思,凸顯了其多功能的特性,GPT-4o是OpenAI為聊天機器人ChatGPT發布的語言模型,“可以實時對音頻、視覺和文本進行推理,新模型使ChatGPT能夠處理50種不同的語言,同時提高了速度和質量,並能夠讀取人的情緒。可以在短至 232 毫秒的時間內回響音頻輸入,平均為 320 毫秒,與人類的回響時間相似。
台北時間2024年5月14日凌晨,OpenAI宣布推出GPT-4o,GPT-4o在處理速度上提升了高達200%,同時在價格上也實現了50%的下降,GPT-4o所有功能包括視覺、聯網、記憶、執行代碼以及GPT Store等,將對所有用戶免費開放。5月15日,OpenAI聯合創始人兼執行長山姆·奧特曼就GPT-4o說明稱,儘管GPT-4o的文本模式已經發布,但語音模式還未發布。
基本介紹
- 外文名:GPT-4o
- 發布時間:2024年5月14日(台北時間)
- 開發者:OpenAI公司
- 產品類型:人工智慧模型
發展歷史
主要功能
模型特點
套用範圍
開發團隊
成員姓名 | 簡介 | 職務 | |
Prafulla Dhariwal | 他在本科畢業之後就以研究實習生的身份直接加入了OpenAI。一直在OpenAI工作到現在。在他的整個研究生涯中,參與過強化學習,無監督學習,Scaling Law等幾乎所有的機器學習的前沿研究,也參與了包括DALL·E 2,GPT-3,DALL·E 3等關鍵的項目。 | 團隊領導 | |
James Betker | 他在加入OpenAI之前曾經在Garmin和谷歌工作過。 | 負責圖像,音頻,數據和後期訓練等各個方面的團隊核心 | |
Rowan Zellers | 他參與了GPT-4等數個OpenAI的項目,之前的研究方向也集中在多模態上。 | 視頻負責人 | |
Alexis Conneau | 他來自法國,畢業於法國最頂尖的工程師大學,之後加入了Meta,在FAIR獲得了自己的博士學位。然後在谷歌和Meta AI工作了一段時間之後,加入了OpenAI。在谷歌和Meta,他參與影響過10億用戶的項目和產品。論文也在EMNLP上拿過最佳論文獎。 | 音頻方向的負責人 | |
Li JING | 這位畢業於北大物理系的華人小哥曾經參與了DALLE-,Sora。這次GPT-4o的發布也有他的貢獻。他本科畢業於北京大學物理系,博士畢業於麻省理工學院。他自己曾經創過業,也在Meta全職工作過2年半,在2022年加入了OpenAI。 | 做出關鍵貢獻人員 | |
Jiahui Yu | 他本科畢業於中科大,博士畢業於UIUC。他現在是OpenAI感知團隊的負責人。他曾經是谷歌Gemini多模態的負責人之一,2023年被OpenAI挖了過來。 | 做出關鍵貢獻人員 | |
Yu Zhang | 他本科畢業於上海交大,博士畢業於MIT。他在微軟亞研院實習過,之後加入了谷歌DeepMind,從2023年起加入了OpenAI。 | 做出關鍵貢獻人員 | |
HUIWEN Chang | 她本科畢業於清華大學,之後在普林斯頓大學獲得了博士學位。在加入OpenAI之前,一直在谷歌擔任研究科學家。 | 做出關鍵貢獻人員 | |
Qiming Yuan | 他在GPT-4o團隊中負責語言的預訓練數據處理,本科畢業於清華大學,碩士畢業於德州奧斯丁。在2018年加入OpenAI之前,他曾經在Dropbox和微軟工作過。 | 負責語言的預訓練數據處理 | |
參考資料: |