關於actor的百科

強化學習中agent與actor的區別
Agent無處理邏輯,只收lambda,用lambda加工自己的狀態。Actor有邏輯,收消息,消息可以是數據也可以lambda,Actor處理消息。關鍵區別是:Actor有個主動過濾消息的過程;而agent沒有,是被動的,不論什麼lambda都要執行。強化學習,又稱...
熱門標籤