一種用於視頻編碼最佳化的高效強化學習訓練方法

一種用於視頻編碼最佳化的高效強化學習訓練方法

《一種用於視頻編碼最佳化的高效強化學習訓練方法》是杭州微幀信息科技有限公司於2018年4月3日申請的專利,該專利公布號為CN110351561B,專利公布日為2021年5月7日,發明人是梅元剛、陳宇、金星、朱政、丁丹丹。

基本介紹

  • 中文名:一種用於視頻編碼最佳化的高效強化學習訓練方法
  • 授權公告號:CN110351561B
  • 授權公告日:2021.05.07
  • 專利權人:杭州微幀信息科技有限公司
  • 申請號:2018102982205
  • 申請日:2018.04.03
  • 同一申請的已公布的文:CN110351561A
  • 申請公布日:2019.10.18
  • 地址:310000浙江省杭州市西湖區西斗門路3號天堂軟體園D幢18樓D座
  • 發明人:梅元剛;陳宇;金星;朱政;丁丹丹
  • 分類號:H04N19/176(2014.01)I;H04N19/124(2014.01)I;H04N19/147(2014.01)I;G06N3/08(2006.01)I
對比檔案,專利摘要,

對比檔案

CN 103324085 A,2013.09.25; CN 107613299 A,2018.01.19; US 6775415 B1,2004.08.10; CN 107734333 A,2018.02.23
林正春.最優進化圖像閾值分割算法.《計算機輔助設計與圖形學學報》.2010,第22卷(第7期),

專利摘要

本發明公開了一種用於視頻編碼最佳化的高效強化學習訓練方法,用於解決強化學習在最佳化視頻編碼的訓練過程中收斂速度慢和訓練不穩定的問題。本發明通過首先採用進化算法得到較好的初始策略,繼而採用監督學習方法初始化強化學習網路參數,減少隨機初始化導致的訓練初始階段收斂慢的問題。在強化學習訓練過程中,保存較好的策略,並以一定的機率隨機採樣好的策略,減少強化學習在探索過程中的盲目性導致的壞策略過多的問題,提高訓練的收斂速度和穩定性。在強化學習訓練一定階段後,系統可能陷入局部最優,導致視頻編碼壓縮效率提升有限。本發明每隔一定階段,對策略網路的特定參數進行小幅度的隨機擾動,並提高系統探索的範圍,進一步提高視頻編碼的壓縮效率。

相關詞條

熱門詞條

聯絡我們