研究方向
多媒體內容分析與檢索、計算機視覺與深度學習、模式識別與人工智慧
教育經歷
2001/9 - 2006/3,中國科學院計算技術研究所,計算機套用技術,工學博士
1998/9 - 2001/7,湘潭大學,計算機套用技術,工學碩士
1989/10 - 1993/6,湘潭大學,機械工程系化工機械專業,工學學士
工作經歷
2008/3 - 至今,中國科學院計算技術研究所,前瞻研究實驗室,副研究員,碩士生導師,博士生導師
2009/2 - 2010/2,National University of Singapore, School of Computing, Visiting Research Fellow, Supervisor: Prof.Chua Tat-Seng
2006/7 - 2006/8,National University of Singapore, School of Computing, Visiting Scientist, Supervisor: Prof.Chua Tat-Seng
2006/3 - 2008/3,中國科學院計算技術研究所,前瞻研究實驗室,助理研究員
1993/6 - 1998/9,湘潭大學,工程師,高級程式設計師
獲獎及榮譽
1、2015年,作為計算所MCG-ICT-CAS參賽團隊負責人,帶領團隊參加國際著名的ImageNet大規模視覺識別挑戰賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC,計算機視覺領域公認的最權威國際評測),在包括微軟、高通等70家參賽隊伍的激烈競爭中,我們在競爭激烈的目標分類定位和目標檢測任務(僅使用比賽指定的數據集)中取得優異成績:目標分類定位(CLS-LOC)精度達到85.31%(即錯誤率14.69%),在23支全球參賽隊伍中排第四名;在目標檢測(DET)任務中,目標檢測精度達到45.36%,在20支全球參賽隊伍中排第五名,詳見;並應邀於2016年1月在視覺與學習青年學者研討會(Vision And Learning SEminar, 簡稱VALSE)上做 ImageNet競賽專題報告。
2、2016年,帶領計算所MCG-ICT-CAS參賽團隊第二次參加了國際著名的ImageNet大規模視覺識別挑戰賽(ILSVRC 2016)三個任務,在85家參賽隊伍的激烈競爭中,取得優異成績:傳統圖像目標檢測任務(Object Detection Task, DET)獲第四名,視頻目標檢測(Object Detection from Video, VID)的檢測和跟蹤兩個子任務均獲第三名,新增的語義分割即場景分析(Scene Parsing)任務獲第三名,並被組委會邀請在2016年歐洲計算機視覺會議(ECCV2016)的ImageNet和CCO視覺識別挑戰賽聯合工作組會議(ImageNet and COCO Visual Recognition Challenges Joint Workshop)上做大會報告,詳見ILSVRC 2016主頁,以及相應的ECCV 2016 Workshop和我們的大會報告PPT。
3、主持2014年全國首屆特定音視頻檢索識別挑戰賽視頻評測,深受清華大學、北京大學、復旦大學、中國科學院深圳先進技術研究院等28家參賽團隊好評。
4、2006年至2008年,作為計算所MCG-ICT-CAS參賽團隊負責人,帶領團隊參加國際視頻檢索權威評測TRECVID並取得優異成績(2007年取得搜尋任務第2名,2008年取得搜尋任務第1名、拷貝檢測任務第2名),應邀參加了國際視頻檢索評測會議TRECVID 2008並做大會報告,受邀在TRECVID 2008評測大會上做大會報告,詳見TRECVID 2008,以及我們的大會報告。
5、2007年聯合新加坡國立大學研發的互動式視頻檢索系統VisionGo,在國際圖像視頻檢索會議CIVR2007中獲視頻檢索現場評測最佳系統獎。
6、2014年北京市科學技術獎一等獎,獲獎項目為“大規模網路視頻處理與內容分析關鍵技術及套用”。
7、2006年北京市科學技術獎一等獎,獲獎項目為“面向體育訓練的三維人體運動模擬與視頻分析系統”。
8、2012年首屆中國計算機學會科學技術獎,獲獎項目為“大規模網路視頻內容分析關鍵技術及套用”。
9、2017年中國電子學會科學技術獎(技術發明類)一等獎,獲獎項目為“視覺大數據檢索與智慧型分析關鍵技術及套用”。
10、2018年中國電子學會科學技術獎(自然科學類)一等獎,獲獎項目為“網際網路視頻的高效流式計算理論與方法”。
科研項目
1、國家重點研發計畫項目(2017YFC0820605),354萬,2018/02-2021/12,課題負責人
2、國家重點研發計畫項目,融合多通道語境信息的類人智慧型感知機制與方法(2017YFB1002202,543萬),中科院計算所子課題負責人(85萬),2017/10-2021/09
3、國家863計畫項目,異構媒體數據的關聯與挖掘研究(2014AA015202),333萬,2014/01-2016/12,課題執行負責人。
4、國家自然科學基金面上項目,基於稀疏表示和深度學習的大規模目標檢測(61572472),78.4萬,2016/01-2019/12,主持。
5、國家自然科學基金面上項目,基於跨域遷移學習的網路視頻檢索技術研究(61173054),57萬元,2012/01-2015/12,主持。
6、國家自然科學基金面上項目,融合顯式和隱含語義概念的視頻檢索技術研究(60873165),30萬,2009/01-2011/12,主持。
7、國家973計畫項目,圖像視頻分析與檢測技術(2007CB311105),450萬,2007/07- 2011/12,核心骨幹(排名第三)。
8、北京市自然科學基金面上項目,基於稀疏表示的大規模移動視覺搜尋技術研究(4152050),18萬,2015/01-2017/12,主持。
9、國家其他項目,大規模圖像檢索與識別系統(20157300),120.8萬,2016/01-2017/12,主持。
10、冰島Videntifier科技公司,圖像語義檢測國際合作(Y505161000),20萬,2014/08-2015/07,主持。
11、華為技術有限公司,圖像場景語義概念檢測研究(YB2013080040),60萬,2013/09 -2014/12,主持。
12、華為技術有限公司,媒體檢索和識別技術研究(YBCB2011049),55萬,2011/09-2012/08,項目執行負責人。
13、三星通信技術研究有限公司,自動內容識別技術研究(4920125200),60萬,2012/04-2013/03,主持。
14、三星通信技術研究有限公司,基於語義的圖像視頻檢索(4920115100),80萬,2011/09-2012/08,項目執行負責人。
主要論文
主要國際期刊論文(黑體的作者為本人,*表示本人為通訊作者):
[1] Sheng Tang, Yan-Tao Zheng, Yu Wang, Tat-Seng Chua, “Sparse Ensemble Learning for Concept Detection”, IEEE Transactions on Multimedia, 14(1): 43-54, February 2012. (提出稀疏集成學習方法, CCF B類國際期刊)
[2] Rui Zhang, Sheng Tang*, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Perspective-adaptive Convolutions for Scene Parsing", IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), DOI: 10.1109/TPAMI.2018.2890637, Published online on January 1th, 2019. (CCF A類計算機視覺與人工智慧領域著名國際頂級期刊,通訊作者)
[3] Yu Li, Sheng Tang*, Rui Zhang, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Asymmetric GAN for Unpaired Image-to-image Translation”, IEEE Transactions on Image Processing, DOI: 10.1109/TIP.2019. 2922854,Publishedonline onJune 19th, 2019. (CCF A類國際頂級期刊,通訊作者)
[4] Yu Li, Sheng Tang*, Min Lin, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Implicit Negative Sub-categorization and Sink Diversion for Object Detection", IEEE Transactions on Image Processing, 27(4):1561-1574, April, 2018.(CCF A類國際頂級期刊,通訊作者)
[5] Linghui Li, Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian; “GLA: Global-local Attention for Image Description”, IEEE Transactions on Multimedia, 20(3): 726-737, March, 2018. (CCF B類國際期刊,通訊作者)
[6] Sheng Tang, Yu Li, Lixi Deng, Yong-Dong Zhang; “Object Localization Based on Proposal Fusion”, IEEE Transactions on Multimedia, 19(9):2105-2116, September 2017.(CCF B類國際期刊)
[7] YongDong Zhang, Yu Wang, Sheng Tang*, Steven C. H. Hoi, JinTao Li, “FSpH: Fitted spectral hashing for efficient similarity search”, Computer Vision and Image Understanding (CVIU), 124: 3-11, 2014.(CCF B類國際期刊,通訊作者)
[8] Wu Liu, Yongdong Zhang, Sheng Tang, Jinhui Tang, Richang Hong and Jintao Li, "Accurate Estimation of Human Body Orientation From RGB-D Sensors," IEEE Transactions on Cybernetics, vol.43, no.5, pp.1442-1452, Oct. 2013.(CCF B類國際期刊)
[9] Hongtao Xie, Ke Gao, Yongdong Zhang, Sheng Tang, Jintao Li, “Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Image Search”, IEEE Transactions on Multimedia, 13(6): 1319-1332, Dec. 2011.(CCF B類國際期刊)
[10] Yan Song, Yan-Tao Zheng, Sheng Tang, Xiangdong Zhou, Yongdong Zhang, Shouxun Lin, Tat-Seng Chua, “Localized Multiple Kernel Learning for Realistic Human Action Recognition in Videos”, IEEE Transactions on Circuits and Systems for Video Technology, 21(9): 1193-1202, September 2011.(CCF B類國際期刊)
主要國際會議論文:
[11] Lixi Deng, Sheng Tang*, Huazhu Fu, Bin Wang, Yongdong Zhang, “Spatiotemporal Breast Mass Detection Network (MD-Net) in 4D DCE-MRI Images”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2019), 13-17 Oct 2019, Shenzhen, China. (國際頂級會議長文,通訊作者,已接收)
[12] Bin Wang, Guojun Qi, Sheng Tang*, Tianzhu Zhang, Yunchao Wei, Linghui Li, Yongdong Zhang; “Boundary Perception Guidance: A Scribble-Supervised Semantic Segmentation Approach”, The 28th International Joint Conference on Artificial Intelligence (IJCAI-2019), August 10-16, 2019, Macao, China (CCF A類人工智慧國際頂級會議長文,通訊作者,已接收)
[13] Lixi Deng, Jingjing Chen, Qianru Sun, Xiangnan He, Sheng Tang, Zhaoyan Ming, Yongdong Zhang and Tat Seng Chua, “Mixed-dish Recognition with Contextual Relation Network”, ACM Multimedia 2019, Nice, France, 21-25 October, 2019. (CCF A類國際頂級會議長文,已接收)
[14] Rui Zhang, Sheng Tang*, Yu Li, Junbo Guo, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Style Separation and Synthesis via Generative Adversarial Networks”, ACM Multimedia 2018, Pages: 183-191, Oct.22-26, 2018, Seoul, Korea. (CCF A類多媒體國際頂級會議長文,通訊作者)
[15] Bin Wang, Guo-Jun Qi, Sheng Tang*, Liheng Zhang, Lixi Deng, Yongdong Zhang, “Automated Pulmonary Nodule Detection: High Sensitivity with Few Candidates”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2018), MICCAI 2018, LNCS 11071, Pages:759–767, September 16-20, 2018, Granada, Spain. (醫療影像處理國際頂級會議長文,通訊作者)
[16] Rui Zhang, Sheng Tang*, Luoqi Liu, Yongdong Zhang, Jintao Li, Shuicheng Yan,“High Resolution Feature Recovering for Accelerating Urban Scene Parsing”, The 27th International Joint Conference on Artificial Intelligence (IJCAI-2018), Pages: 1156-1162, Stockholm, Sweden, July 13-19, 2018(CCF A類人工智慧國際頂級會議長文,通訊作者)
[17] Yuchen Guo, Guiguang Ding, Jungong Han, Sheng Tang, “Zero-shot Learning with Attribute Selection”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智慧國際頂級會議長文)
[18] Xiaohan Ding, Guiguang Ding, Jungong Han, Sheng Tang,“Auto-balanced Filter Pruning for Efficient Convolutional Neural Networks”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智慧國際頂級會議長文)
[19] Rui Zhang, Sheng Tang*, YongDong Zhang, Jintao Li, Shuicheng Yan; “Scale-adaptive Convolutions for Scene Parsing”, The International Conference on Computer Vision (ICCV) 2017, Venice, Italy, October 22-29, 2017. (CCF A類計算機視覺國際頂級會議長文,通訊作者)
[20] Rui Zhang,Sheng Tang*, Min Lin, Jintao Li, Shuicheng Yan,“Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions”, The 26th International Joint Conference on Artificial Intelligence (IJCAI-2017),Pages:3427-3433,Melbourne, Australia, August 19-25, 2017(CCF A類人工智慧國際頂級會議長文, 通訊作者).
[21] Linghui Li,Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian,“Image Caption with Global-Local Attention”, The 31th AAAI Conference on Artificial Intelligence (AAAI-2017), Pages: 4133-4139, San Francisco, California USA, February 4–9, 2017(CCF A類人工智慧國際頂級會議長文, 通訊作者).
[22] Yu Wang, Sheng Tang, Yalin Zhang, Jintao Li, DanYi Chen, “Fitted spectral hashing”, ACM Multimedia 2013, Pages:645-648, October 21-25, Barcelona, Spain. (CCF A類多媒體國際頂級會議)
[23] Sheng Tang, Jin-Tao Li, Yong-Dong Zhang,etal; “PornProbe: an LDA-SVM based Pornography Detection System”; ACM Multimedia 2009, Beijing, China, Oct.19-24, 2009.
[24] Sheng Tang, Jin-Tao Li, Ming Li, Cheng Xie, Yi-Zhi Liu, Kun Tao, Shao-Xi Xu; “TRECVID 2008 High-Level Feature Extraction By MCG-ICT-CAS”; Proc. TRECVID 2008 Workshop, Gaithesburg, USA , Nov 2008.
[25] Sheng Tang, Jin-Tao Li, Yong-Dong Zhang, “SSF Fingerprint for Image Authentication: An Incidental Distortion Resistant Scheme”, ACM Multimedia 2005, Singapore, November 6-11, 2005.
主要專利
[1] 唐勝、伍天意、李錦濤,基於上下文信息指導的場景分割方法與系統,申請號:201811309249.5,申請日期:2018年11月5日
[2] 唐勝、伍天意、李錦濤,基於克羅內克卷積的場景分割方法與系統,申請號:201811309245.7,申請日期:2018年11月5日
[3] 唐勝、張蕊、李錦濤,基於特徵圖恢復的場景分割方法和系統,申請號:201810664250.3,申請日期:2018年6月25日
[4] 唐勝、李靈慧、張勇東、李錦濤,一種生成描述圖像內容的自然語言的方法與系統,發明專利,申請號:2017112652103,申請日期:2017年12月5日
[5] 唐勝、張蕊、李錦濤,融合局部信息的場景分割修正方法與系統,發明專利,申請號:201710650541.2,申請日期:2017年8月2日
[6] 唐勝、張蕊、李錦濤,融合全局信息的場景分割修正方法與系統,發明專利,申請號:201710650525.3,申請日期:2017年8月2日
[7] 唐勝、肖俊斌、李錦濤,一種基於目標檢測的大規模圖像檢索方法與系統,發明專利,申請號:201710574741.4,申請日期:2017年7月17日
[8] 唐勝、張勇東、 李錦濤、徐作新;字典學習、視覺詞袋特徵提取方法及檢索系統,發明專利,專利號:ZL 2014102876392,申請日期:2014年6月25日,(已授權)
[9] 唐勝、 張勇東、 李錦濤、徐作新;字典學習、視覺詞袋特徵提取方法及檢索系統,發明專利,申請號:201410287639.2,申請日期:2014年6月25日,(已授權)
[10] 唐勝、李錦濤、張勇東、謝 呈;一種數字圖像訓練和檢測方法;專利號:200910092710.0;申請日:2009.09.16(已授權)
[11] 謝呈;劉毅志;唐勝;張勇東;李錦濤;色情檢測模型建立方法和色情檢測方法;專利號:201010143777.5;申請日:2010.04.12(已授權)