تعریف در یادگیری تقویتی، به نگاشت احتمالی عامل (agent) از حالتها (states) به عملها (actions) گفته میشود. arrow-left-small icon قبلی arrow-left-small icon بعدی آخرین ویرایش: ۱ تیر ۱۴۰۰ github icon ویرایش این ترجمه