سوگیری گزارش

Reporting Bias

تعریف

این واقعیت که فراوانی نوشتن افراد درباره اعمال، نتایج یا ویژگی‌ها بازتابی از فراوانی آن‌ها در دنیای واقعی یا میزانی که یک ویژگی در اعضای یک دسته مشخص است، نیست. سوگیری گزارش می‌تواند بر ترکیب داده‌هایی که سیستم‌های یادگیری ماشین از آن‌ها می‌آموزند تاثیر بگذارد.

به عنوان مثال، در کتاب‌ها کلمه «خندید» بیشتر از «نفس کشید» تکرار می‌شود. یک مدل یادگیری ماشین که تعداد نسبی خنده و تنفس را از یک مجموعه کتاب برآورد می‌کند، احتمالاً تصور می‌کند که خندیدن بیشتر از نفس کشیدن رایج است.