基於決策理論的半自主智慧型體決策規劃模型和算法研究

中文摘要

隨著科技的進步，各式各樣的智慧型體系統在人們的日常工作生活中發揮著越來越重要的作用。但是由於當前技術水平的限制，在很多套用領域，智慧型體依然無法完全不依賴人的介入而自主的完成複雜任務。半自主智慧型體系統是一類介於完全受控和完全自主之間的智慧型體系統。它在一些情況下能夠完全自主的決策，而在另一些情況下則需要人的介入，輔助其完成相應的任務。實際中這類系統有著極其廣泛的套用，但目前學術界卻缺乏一套通用的建模和求解方法。為此，本項目以馬爾科夫決策理論為基礎，研究半自主智慧型體系統決策規劃的通用模型表示和高效規划算法。其主要的創新之處在於，著重考慮了人的行為因素對於智慧型體決策規劃的影響，使得智慧型體能夠更好的藉助人的幫助完成任務。此外，本項目還將在服務機器人上研發半自主智慧型體決策規劃的原型系統，從套用性實驗的角度驗證模型和算法的有效性和實際表現。該項目的研究不僅具有重要的科學意義，同時擁有較高的套用價值。

結題摘要

半自主智慧型體系統是一類介於完全受控和完全自主之間的智慧型體系統，在服務機器人等領域有著廣泛的套用前景。它在一些情況下能夠完全自主的決策，而在另一些情況下則需要人的介入，輔助其完成相應的任務。本項目以決策理論為基礎，研究了半自主智慧型體系統決策規劃的通用模型表示和高效規划算法，並在服務機器人上針對感知、互動、評估等關鍵技術進行了實驗研究。項目在模型和算法的理論研究和服務機器人的實驗研究上取得了若干重要進展。在理論研究方面，提出了將半自主智慧型體系統歸結為一類特殊的多智慧型體系統，並利用分散式馬爾科夫決策過程進行建模的方法。在此基礎上，針對半自主智慧型體系統有別於一般多智慧型體系統的特點，分別提出了基於基準遺憾最小化的多智慧型體規劃方法以及具有隱私保證的多智慧型體策略疊代算法。項目發表的論文從理論上和在標準測試集的實驗上證明了新提出算法的優越性。在實驗研究方面，項目針對服務機器人的特點，分別提出了面向自然語言互動的機器人任務規劃方法以及基於運動捕捉系統的機器人行為量化評估方法，並在實際的服務機器人系統中進行了實驗和驗證。項目針對半自主智慧型體決策規劃的模型和算法的若干關鍵問題進行了攻關和突破，取得的成果為後續研究工作的開展提供了一定的理論和實驗基礎。

基於決策理論的半自主智慧型體決策規劃模型和算法研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條