سیاست تصادفی

Random Policy

تعریف

در یادگیری تقویتی، به سیاستی گفته می‌شود که اعمال را به صورت تصادفی انتخاب می‌کند.