Unawareness(To A Sensitive Attribute)

موقعیتی که در آن ویژگی‌های حساس وجود دارند، اما در میان داد‌ه‌های آموزش نیستند. از آنجایی که ویژگی‌های حساس اغلب با سایر ویژگی‌های داده‌ ارتباط دارند، مدلی که با عدم آگاهی نسبت به یک ویژگی حساس آموزش داده شده است، می‌تواند تاثیر متفاوتی نسبت به آن ویژگی داشته باشد یا سایر محدودیت‌های انصاف را نقض کند.

Underfitting

زمانی رخ می‌دهد که مدل پیچیدگی داده‌های آموزش را به دست نیاورده است و توانایی پیش‌بینی آن ضعیف است. بسیاری از مسائل می‌توانند باعث کم‌برازش شوند از جمله:

Unlabeled Example

نمونه‌ای که شامل یک سری ویژگی، اما فاقد برچسب است. نمونه‌های بدون برچسب ورودی استنتاجی هستند که در حین آموزش یادگیری نیمه نظارت شده و بدون نظارت از آن‌ها استفاده می‌شود.

Unsupervised Machine Learning

آموزش یک مدل برای یافتن الگوها در یک مجموعه داده که به طور معمول یک مجموعه داده بدون برچسب است.

متداول‌ترین کاربرد یادگیری ماشین بدون نظارت، خوشه‌بندی داده‌ها در گروه‌هایی از نمونه‌های مشابه است. به عنوان مثال این الگوریتم می‌تواند آهنگ‌ها را براساس ویژگی‌های مختلف موسیقی خوشه‌بندی کند که خوشه‌های حاصل می‌توانند به ورودی دیگری، برای الگوریتم‌های یادگیری ماشین (به عنوان مثال برای یک سرویس توصیه موسیقی) تبدیل شوند. در دامنه‌هایی که به سختی می‌توان برچسب واقعی را به دست آورد، استفاده از خوشه‌بندی می‌تواند مفید باشد. به عنوان مثال در حوزه‌هایی مانند ضد سو استفاده و تقلب می‌توانند به درک بهتر انسان از داده‌ها کمک کنند.

مثالی دیگر از یادگیری ماشین بدون نظارت، تحلیل مولفه اصلی(PCA) است. استفاده از PCA بر روی یک مجموعه داده که حاوی محتوای میلیون‌ها سبد خرید، ممکن است نشان دهد که سبدهای خرید حاوی لیمو به طور مکرر دارای آنتی اسیدها نیز هستند.

مقایسه با یادگیری ماشین تحت نظارت.

Upweighting

افزودن وزن برای کلاس نمونه‌کاهی برابر با فاکتوری که در آن نمونه برداری صورت گرفته است.

User Matrix

در سیستم‌های توصیه‌گر یک تعبیه است، که توسط فاکتوراسیون ماتریس ایجاد می‌شود و سیگنال‌های نهان درباره تنظیمات کاربر را در خود نگه می‌دارد.

هر ردیف از ماتریس کاربر، اطلاعاتی در مورد قدرت نسبی سیگنال‌های نهان مختلف برای یک کاربر خاص را دارد. به عنوان مثال یک سیستم توصیه فیلم را در نظر بگیرید، در این سیستم سیگنال‌های نهان در ماتریس کاربر ممکن است نشان دهنده‌ی علاقه هر کاربر به ژانرهای خاص باشد یا تفسیر سیگنال‌های سخت‌تری که شامل تعاملات پیچیده در چندین عامل است.

ماتریس کاربر برای هر ویژگی نهان یک ستون و برای هر کاربر یک ردیف دارد. یعنی ماتریس کاربر همان تعداد ردیف با ماتریس هدف را دارد که فاکتور می‌شود. به عنوان مثال با توجه به سیستم توصیه فیلم برای 1،000،000 کاربر، ماتریس کاربر 1،000،000 ردیف خواهد داشت.