Tabular Q-Learning

در یادگیری تقویتی با استفاده از یک جدول برای ذخیره توابع Q برای هر ترکیبی از حالت و عملکرد می‌توان یادگیری Q را پیاده سازی کرد.

Target

مترادف برچسب است.

Target Network

در یادگیری عمیق Q، شبکه عصبی‌ای است که یک تقریب پایدار از شبکه عصبی اصلی باشد که در آن شبکه عصبی اصلی، یک تابع Q یا یک خط‌مشی را پیاده سازی می‌کند. می‌توان شبکه اصلی را روی مقادیر Q پیش‌بینی شده توسط شبکه هدف آموزش داد تا از حلقه‌ی بازخوردی که در هنگام تمرین شبکه اصلی روی مقادیر Q که توسط خودش پیش‌بینی می‌شود جلوگیری کرد. با اجتناب از این بازخورد،‌ آموزش تمرین افزایش می‌یابد.

Temporal Data

داده‌هایی هستند که در زمان‌های مختلف ثبت می‌شوند. به عنوان مثال فروش پالتو زمستانه ثبت شده برای هر روز از سال، نمونه‌ای از داده‌های زمانی است.

Termination Condition

در یادگیری تقویتی، شرایطی است که زمان پایان یک قسمت را تعیین می‌کنند بطور مثال زمانی که عامل به حالت خاصی می‌رسد یا از یک حد انتقال حالت گذر می‌کند. به عنوان مثال در tic-tac-toe بازی زمانی خاتمه می‌یابد که یک بازیکن سه فاصله متوالی را علامت گذاری می‌کند یا وقتی که تمام فاصله‌ها مشخص می‌شوند.

Test Set

زیرمجموعه‌ای از مجموعه داده‌ای که برای آزمایش مدل استفاده می‌شود، بعد از اینکه مدل بررسی اولیه را با مجموعه اعتبار سنجی انجام داد.

در تضاد با مجموعه آموزشی و اعتبار سنجی است.

Time Series Analysis

زیرمجموعه‌ای از یادگیری ماشین و آمار که داده‌های زمانی را تجزیه و تحلیل می‌کند. بسیاری از انواع مسائل یادگیری ماشین به تجزیه و تحلیل سری زمانی نیاز دارند. از جمله طبقه بندی، خوشه بندی، پیش‌بینی و تشخیص ناهنجاری. به عنوان مثال می‌توان با استفاده از تجزیه و تحلیل سری زمانی، فروش آینده کت‌های زمستانی را بر اساس سوابق داده‌های فروش پیش‌بینی کرد.

Timestep

یک سلول باز نشده (unrolled) در یک شبکه عصبی بازگشتی است. به عنوان مثال شکل زیر سه گام را نشان می‌دهد (با زیرنویس‌های t-1 ،t و با برچسب t + 1):

Tower

یک جزء(component) از شبکه عصبی عمیق است، که فاقد لایه خروجی است. به طور معمول هر برج از یک منبع داده مستقل می‌خواند و تا زمانی که خروجی آن‌ها در یک لایه نهایی ترکیب نشود، مستقل هستند.

Training

روند تعیین پارامترهای ایده آل متشکل از یک مدل است.

Training Set

زیر مجموعه‌ای از مجموعه داده که برای آموزش مدل استفاده می‌شود.

در تضاد با مجموعه اعتبارسنجی و آزمون است.

Trajectory

در یادگیری تقویتی دنباله‌ای از چندتایی‌ها(tuples) که نمایانگر توالی انتقال حالت عامل هستند، طوری که هر چندتایی مربوط به حالت، عمل، پاداش و حالت بعدی برای یک انتقال حالت معین است.

Transfer Learning

انتقال اطلاعات از یک کاربرد یادگیری ماشین به کاربرد دیگر. به عنوان مثال، در یادگیری چند-وظیفه‌ای، یک مدل چندین مساله را حل می‌کند، مثل یک مدل عمیق که برای حل مساله‌های مختلف چندین گره خروجی دارد. یادگیری انتقال می‌تواند به معنای انتقال دانش حل یک مساله ساده‌تر به یک مساله پیچیده‌تر باشد، یا به معنای انتقال دانش از یک مساله به داده‌های زیاد به مساله‌ای با داده‌ی کمتر باشد.

بیشتر سامانه‌هایی که از یادگیری ماشین استفاده می‌کنند یک مساله را حل می‌کنند. یادگیری انتقال گام اولیه به سمت هوش مصنوعی‌ای است که در آن یک برنامه بتواند چندین وظیفه داشته باشد.

Translational Invariance

در یک مساله طبقه‌بندی تصاویر، به توانایی الگوریتم در دسته‌بندی درست عکس در شرایطی که جایگاه اشیا در تصویر تغییر می‌کند گفته می‌شود. به عنوان مثال، الگوریتم باید بتواند سگ را در تصویر تشخیص دهد، چه سگ در مرکز تصویر باشد و چه در سمت راست یا چپ آن.

مطالعه بیشتر: ناوردایی اندازه‌ای (size invariance) ، ناوردایی چرخشی (rotational invariance)

Trigram

یک N-کلمه‌ای که در آن مقدار N برابر ۳ است.

True Negative (TN)

مثالی که در آن مدل کلاس منفی را به درستی پیش‌بینی کرده است. به عنوان مثال، این مدل استنباط می‌کند که یک پیام الکترونیکی خاص اسپم نیست و آن پیام واقعا اسپم نبوده است.

True Positive (TP)

مثالی که در آن مدل به درستی کلاس مثبت را پیش‌بینی کرده است. به عنوان مثال، این مدل استنباط می‌کند که یک پیام الکترونیکی خاص هرزنامه است و آن پیام واقعا هرزنامه بوده است.

True Positive Rate (TPR)

نرخ مثبت حقیقی به شکل زیر محاسبه می‌شود:

این مقدار بر روی محور y ها در منحنی ROC نوشته می‌شود.

مترادف: بازخوانی (recall)