سیاست

Policy

تعریف

در یادگیری تقویتی، به نگاشت احتمالی عامل (agent) از حالت‌ها (states) به عمل‌ها (actions) گفته می‌شود.