K-means

یکی از الگوریتم‌های محبوب خوشه‌بندی است که برای گروه‌بندی دسته‌ها در یادگیری بدون نظارت استفاده می‌شود. الگوریتم k-means بطور کلی موارد زیر را انجام می‌دهد:

الگوریتم k-means مکان‌های مرکزی را انتخاب می‌کند تا مربع تجمعی فواصل هر مثال، تا نزدیک‌ترین مرکز خود را به حداقل برساند.

به عنوان مثال نمودار زیر را از قد سگ تا عرض سگ در نظر بگیرید:

اگر k = 3 باشد‌، الگوریتم k-mean سه مرکز را معین می‌کند. هر مثال به نزدیک‌ترین مرکز خود اختصاص داده شده که دارای سه گروه است:

تصور کنید که یک تولید کننده می‌خواهد اندازه‌های ایده‌آل ژاکت‌های کوچک، متوسط و بزرگ را برای سگ‌ها مشخص کند. سه مرکز نمایانگر متوسط قد و عرض هر سگ را در آن خوشه است. بنابراین تولید کننده احتمالا باید اندازه ژاکت را براساس این سه مرکز تولید کند. توجه داشته باشید که مرکز خوشه معمولا نمونه‌ای در خوشه نیست.

تصاویر قبلی k-Mean را برای مثال‌هایی با تنها دو ویژگی (قد و عرض) نشان می‌دهداما این الگوریتم می‌تواند مثال‌ها را در بسیاری از ویژگی‌ها گروه بندی کند.

K-median

یک الگوریتم خوشه‌بندی که مرتبط با k-means است. تفاوت عملی بین این دو به صورت زیر است:

توجه داشته باشید که تعاریف فاصله نیز متفاوت است:

k-mean به فاصله اقلیدسی از مرکز تا یک مثال متکی است. (در دو بعد، فاصله‌ی اقلیدسی به معنای استفاده از قضیه فیثاغورث برای محاسبه وتر است.) به عنوان مثال k-means بین (2،2) و (5 ، -2) خواهد بود:

k-median به فاصله منهتن از مرکز تا یک مثال متکی است. این فاصله جمع دلتاهای مطلق در هر بعد است. به عنوان مثال ، فاصله k-median بین (2،2) و (5 ، -2) خواهد بود:

Keras

کراس یک API پایتونی محبوب یادگیری ماشین است که با چندین چارچوب یادگیری عمیق، از جمله تنسورفلو اجرا می‌شود.(به عنوان tf.keras در دسترس است)

مطالعه بیشتر: keras.io

Kernel Support Vector Machines(ksvms)

یک الگوریتم طبقه‌بندی است که با نگاشت بردارهای داده ورودی به فضای بعدی بالاتر، حاشیه بین طبقات مثبت و منفی را به حداکثر می‌رساند. به عنوان مثال یک مسئله‌ی طبقه‌بندی را در نظر بگیرید که در آن مجموعه داده ورودی دارای صد ویژگی باشد. برای به حداکثر رساندن حاشیه بین طبقات مثبت و منفی، یک KSVM می‌تواند این ویژگی‌ها را به صورت داخلی در یک فضای یک میلیون بعدی قرار دهد. KSVM ها از یک تابع زیانی به نام هزینه‌ی hinge استفاده می‌کنند.

Keypoints

نقاط کلیدی شامل مختصات ویژگی‌های خاص، در یک تصویر هستند. به عنوان مثال برای یک مدل تشخیص تصویر که گونه‌های گل را از یکدیگر متمایز می‌کند، نقاط کلیدی ممکن است مرکز هر گلبرگ، ساقه، پرچم و غیره باشد.