مسیر حرکت

Trajectory

تعریف

در یادگیری تقویتی دنباله‌ای از چندتایی‌ها(tuples) که نمایانگر توالی انتقال حالت عامل هستند، طوری که هر چندتایی مربوط به حالت، عمل، پاداش و حالت بعدی برای یک انتقال حالت معین است.