ماتریس درهم‌ریختگی

Confusion Matrix

تعریف

یک ماتریس n×n که میزان موفقیت یک مدل دسته‌بندی در پیش‌بینی را طور مختصر نمایش می‌دهد. برای این کار هم‌بستگی بین برچسب‌ها و دسته‌بندی‌های مدل بررسی می‌شود. یک محور ماتریس درهم‌ریختگی برچسب‌های پیش‌بینی شده توسط مدل است و محور دیگر برچسب‌های واقعی. n بیانگر تعداد دسته‌هاست. در یک مساله دسته‌بندی دوتایی n برابر ۲ است. به عنوان مثال، جدول زیر یک ماتریس درهم‌ریختگی برای یک مساله دسته‌بندی دوتایی است.

غیر تومور (پیش‌بینی) تومور (پیش‌بینی)
۱ ۱۸ تومور (مقدار واقعی)
۴۵۲ ۶ غیر تومور (مقدار واقعی)

این ماتریس درهم‌ریختگی نشان می‌دهد که مدل از میان ۱۹ نمونه که تومور داشته‌اند، ۱۸ عدد را به درستی به عنوان تومور دسته‌بندی کرده است (۱۸ مثبت حقیقی (true positive)) و ۱ نمونه را به اشتباه در دسته بدون تومور قرار داده است (۱ منفی کاذب (false negative)). هم‌چنین، مدل از ۴۵۸ نمونه که تومور نداشته‌اند، ۴۵۲ عدد را به درستی دسته‌بندی کرده است (۴۵۲ منفی حقیقی (true negative)) و ۶ عدد را در دسته‌های اشتباه قرار داده است (۶ مثبت کاذب (false positive)).

ماتریس درهم‌ریختگی می‌تواند به تشخیص الگوهای اشتباه در یک مساله دسته‌بندی چندتایی کمک کند. به عنوان مثال، ماتریس درهم‌ریختگی می‌تواند آشکار کند که مدلی که برای تشخیص اعداد دست‌نویس آموزش دیده است، در تشخیص اعداد ۲ و ۳ اشتباه می‌کند.

ماتریس درهم‌ریختگی اطلاعات کافی برای محاسبه برخی از معیارهای عملکرد را دارد، مانند دقت (precision) و یادآوری (recall).