خط‌مشی حریصانه

Greedy Policy

تعریف

در یادگیری تقویتی، خط‌مشی‌ای که همیشه عملی با بالاترین بازده مورد انتظار را انتخاب می‌کند.