Machine Learning

برنامه یا سیستمی که از داده های ورودی، یک مدل پیش بینی کننده را ایجاد می‌کند (آموزش می دهد). این سیستم با استفاده از مدل یادگرفته شده، پش‌بینی‌های مفیدی را از داده های جدید (قبلاً هرگز دیده نشده) که از همان توزیع داده‌های ورودی است، می‌کند. یادگیری ماشین به رشته تحصیلی مربوط به این حوزه هم اشاره دارد.

Majority Class

نامی که در مجموعه‌داده دسته نامتوازن به کلاس دارای داده بیشتر گفته می شود. به عنوان مثال در مجموعه داده‌ای که ۹۹ درصد برچسب داده ها غیر هرزنامه و ۱ درصد برچسب ها هرزنامه باشد. کلاس با برچسب غیرهرزنامه کلاس اکثریت نامیده می‌شود.

Markov Decision Process (MDP)

یک چارچوب ریاضی است برای مدل‌سازی تصمیم‌گیری در شرایطی که نتایج تا حدودی تصادفی و تا حدودی تحت کنترل یک تصمیم‌گیر است. MDPs برای مطالعه طیف گسترده‌ای از مسائل بهینه سازی که از طریق برنامه‌نویسی پویا و تقویت یادگیری حل می‌شوند مفید است.

تصویر زیر یک نمونه ساده از MDP است:

این نمونه دارای ۳ حالت (دایره های سبز رنگ) و ۲ عمل (a0 , a1) و ۲ پاداش ( خط های نارنجی رنگ) است

Markov Property

ویژگی از محیط های قطعی که اطلاعات جاجایی در بین حالت ها با داشتن حالت فعلی و عمل عامل به صورت کاملا قطعی مشخص شده است.

matplotlib

کتابخانه ای در زبان برنامه نویس پایتون که برای رسم نمودار و بصری سازی استفاده می‌شود.

Matrix Factorization

در ریاضیات، مکانیزمی برای یافتن ماتریس هایی که حاصلضرب آنها به یک ماتریس هدف نزدیک است. گفته می‌شود.

در سامانه پیشنهادگر, ماتریس هدف امتیاز کاربر ها براساس آیتم هاست. برای مثال، ماتریس هدف یک سامانه پیشنهادگر فیلم چیزی شبیه جدول زیر است که عدد مثبت به معنای امتیاز کاربر به فیلم و صفر به معنی امتیاز ندادن کاربر است.

Casablanca The Philadelphia Story Black Panther Wonder Woman Pulp Fiction
کاربر ۱ 5.0 3.0 0.0 2.0 0.0
کاربر ۲ 4.0 0.0 0.0 1.0 5.0

سامانه پیشنهادگر فیلم هدف‌اش این است که امتیاز برای فیلم های بدون امتیاز پیش بینی می‌کند. مثلا آیا کاربر ۱ فیلمBlack Panther را دوست دارد؟ هدف سامانه های پیشنهادگر این است که با استفاده از ماتریس عامل‌بندی دو ماتریس، ماتریس آیتم و ماتریس کاربر را تولید کند.

برای مثالو با استفاده از ماتریس عامل‌بندی در ۳ کاربر و ۵ آیتم بالا، ماتریس آیتم و کاربر زیر را داریم:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

که حاصل ضرب دو ماتریس بالا به ما ماتریس پیشنهادگر را می‌دهد که هم شامل امتیاز واقعی کاربران و هم شامل امتیاز پیش بینی شده برای فیلم هایی که کاربر هنوز مشاهده نکرده.

Mean Absolute Error (MAE)

یک معیار اندازه گیری خطا به صورت میانگین گیری از خطای مطلق محاسبه می‌شود. در مبحث خطای های مدل. MAE میانگین تفاوت بین مقدار واقعی و مقدار پیش‌بینی شده بر روی تمام نمونه های آموزش است. مثلا برای n نمونه آزمایش، برای هر مقدار واقعی y و مقدار پیش‌بینی شده y^ فرمول MAEبه صورت زیر است:

Mean Squared Error (MSE)

میانگین مجذورخطا در در نمونه، MSE با تقسیم مجذور خطا بر تعداد نمونه ها. به صورت پیش فرض در تنسورفلو برای خطای آموزش و خطای آزمایش از این MSE استفاده می‌کنند.

Metric

عددی که برای شما مهم است. ممکن است به صورت مستقیم در سامانه یادگیری ماشین بهینه نشود

Metrics API (tf.metrics)

یک ماژول در پکیج تنسرفلو که مجموعه فعالیت های مربوط به بررسی مدل

برای مثال: tf.metrics.accuracy` برای مشخص کردن اینکه چقدر پیش‌بینی های مدل درست بوده است، استفاده می‌شود.

Mini Batch

یک دسته کوچک و اتفاقی از دسته های کل نمونه ها که باهم در یک حلقه آموزش یا اجرا می‌شوند.
اندازه دسته‌ی یک دسته کوچک معمولا بین ۱۰ تا ۱۰۰۰ است. محاسبه خطا بر روی دسته کوچک بهینه تر از محاسبه خطا بر روی کل نمونه های آموزش است.

mini-batch Stochastic Gradient Descent (SGD)

الگوریتم کاهش شیب که از دسته کوچک استفاده می‌کند. می‌توان گفت که کاهش شیب با دسته کوچک، کاهش شیب را براساس مقدار کوچکی از داده های آموزش تخمین می‌زند. کاهش شیب تصادفی از سایز دسته کوچک ۱ استفاده می‌کند.

Minimax Loss

تابع خطایی که برای شبکه های مولد تخاصمی است،که بر اساس آنتروپی متقاطع بین توزیع داده های تولید شده و داده واقعی است.

این خطا در اولین مقاله‌ای که برای توضیح شبکه‌های مولد تخاصمی استفاده شده است.

Minority Class

نامی که در مجموعه‌داده دسته نامتوازن به کلاس دارای داده کمتر گفته می شود. به عنوان مثال در مجموعه داده‌ای که ۹۹ درصد برچسب داده ها غیر هرزنامه و ۱ درصد برچسب ها هرزنامه باشد. کلاس با برچسب هرزنامه کلاس اقلیت نامیده می‌شود.

ML

مخففی از کلمه یادگیری ماشین

MINST

مجموعه داده با دسترسی رایگان و عمومی جمع‌آوری شده LeCun, Cortes, and Burges حدود ۶۰۰۰۰ تصویر، هر تصویر یک عدد از ۰ -۹ از دستخط افراد مختلف است. هر تصویر در سایر ۲۸ در ۲۸ ذخیره شده‌اند. تصاویر به صورت خاکستری ذخیره شده‌اند یعنی تنها یک آرایه از اعداد بین ۰ تا ۲۵۵ هستند.

این مجموعه‌داده یکی از مجموعه‌داده استاندار و معتبر در حوزه یادگیری ماشین است برای رویکرد های جدید یادگیری ماشین استفاده می‌شود.

Model

نمایشی از آنچه یک سامانه یادگیری ماشین از داده‌های آموزش یاد گرفته است. در Tensorflow مدل می‌تواند بیش از یک معنی داشته باشد که عبارتند از:

Model Capacity

پیچیدگی مساله هایی که مدل میتونه حل کنه. هرچقدر مساله پیچیده‌تر باشه،مدل برای اینکه بتونه حل کنه باید ظرفیت بیشتری داشته باشه. که ظرفیت مدل وقتی زیاد میشه که تعداد پارامتر های مدل بیشتر بشه.

Model Training

مراحل تعیین بهترین مدل

Momentum

یک الگوریتم کاهش شیب پیچیده که در آن یک نرخ یادگیری نه تنها به مشتق در مرحله فعلی، بلکه به مشتقات مرحله (های) بلافاصله قبل از آن نیز بستگی دارد. مومنتوم شامل محاسبه میانگین متحرک با وزن نمایی از گرادیان ها در طول زمان است که مشابه تکانه در فیزیک است. حرکت گاهی اوقات مانع از گیرکردن در حداقل‌های محلی می شود.

multi-class Classification

یک مساله طبقه‌بندی که دارای بیشتر از ۲ کلاس است، برای مثال تقریبا ۱۲۸ گونه درخت افرا وجود دارد، بنابراین مدلی که گونه‌های درخت افرا را طبقه‌بندی می‌کند، چند کلاسه است. برعکس، مدلی که ایمیل ها را تنها به دو دسته تقسیم می‌کند (هرزنامه و غیرهرزنامه) یک مدل طبقه‌بندی باینری خواهد بود.

multi-class Logistic Regression

استفاده از رگرسیون لجستیک در طبقه بندی چند کلاس

Multinomial Classification

معادلی برای طبقه بندی چندکلاسه.