ترسیم

Sketching

تعریف

دسته‌ای از الگوریتم‌ها در یادگیری بدون نظارت، که یک تحلیل شباهت اولیه بر روی داده‌ها انجام می‌دهد. الگوریتم‌های ترسیم از تابع درهم‌سازی (hash) حساس به مکان استفاده می‌‌کند تا مواردی را که به احتمال زیاد مشابه هستند تشخیص دهد و آن‌ها را در پیاله‌ها گروه‌بندی می‌کند.

استفاده از الگوریتم‌های ترسیم، محاسبات لازم برای محاسبه شباهت بر روی مجموعه داده‌های بزرگ را کاهش می‌دهد. به جای محاسبه شباهت برای هر کدام از نمونه‌های موجود در مجموعه داده، ما شباهت را فقط برای هر جفت نقطه در هر سطل محاسبه می‌کنیم.