集成主動學習和眾包技術的遷移學習算法研究

集成主動學習和眾包技術的遷移學習算法研究

《集成主動學習和眾包技術的遷移學習算法研究》是依託上海對外經貿大學,由邵浩擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:集成主動學習和眾包技術的遷移學習算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:邵浩
  • 依託單位:上海對外經貿大學
項目摘要,結題摘要,

項目摘要

在傳統的機器學習框架下,通常需要充分的訓練數據進行建模,並要求訓練數據和測試數據具有相同的分布。而隨著現如今數據規模的擴大和更新速度的提高,新任務往往不具備足夠多的訓練樣本,而另一方面大量的異構數據被丟棄。遷移學習算法從冗餘異構數據中提取知識,輔助新任務進行處理,打破了傳統方法的限制。但相關研究還存在一些需要解決的問題,包括避免負面遷移和大規模參數調整,以及降低獲取訓練樣本的成本。本項目基於遷移學習的研究成果,針對性的提出了自適應的遷移學習算法以避免負面遷移,同時設計結合主動學習和眾包技術的遷移機制,降低標註成本,提升算法質量。擬針對大量實際套用中的數據進行測試,驗證算法的有效性。

結題摘要

在生產實際中,一個新的任務通常和已有任務存在一定的聯繫。遷移學習方法可以將已有數據集中的有用信息,遷移到新的任務,以減少重新建模過程中大量的時間和費用消耗。然而,由於任務之間的分布差異,在異構環境下如何避免負面遷移問題,仍未得到有效的解決。除了要衡量數據間的相似性,還需要衡量實例間的相關性,而大多數傳統方法僅在一個層面進行操作。本項目從實際問題出發,尤其是針對數據結構複雜、數據分布不同的海量數據,提出了遷移學習的相關模型,實驗結果相比其他算法具有明顯優勢,取得了更好的準確率,在本項目進展的過程中發表了六篇論文,具備一定的科學意義。

相關詞條

熱門詞條

聯絡我們