N-gram

یک دنباله‌ی ترتیبی از N کلمه. به عنوان مثال، «واژه شروع» یک دو کلمه‌ای است. با توجه این که ترتیب در دنباله‌ها اهمیت دارد، «شروع واژه» یک دو کلمه‌ای متفاوت است.

N نام نمونه
2 دو کلمه‌ای (bigram) برای رفتن، رفتن برای، خوردن ناهار، خوردن شام
3 سه کلمه‌ای (trigram) بسیار زیاد خوردن، سه موش کور
4 چهار کلمه‌ای راه رفتن در پارک، ذره غبار در باد

بسیاری از مدل‌های درک زبان طبیعی از N کلمه‌ای‌ها جهت پیش‌بینی کلمه‌ بعدی کاربر استفاده می‌کنند. به عنوان مثال، فرض کنید یک کاربر عبارت «سه موش» را بنویسد. یک مدل درک زبان طبیعی بر اساس سه‌ کلمه‌ای‌ها احتمالا کلمه بعدی کاربر را «موش» پیش‌بینی خواهد کرد.

متضادها: کیف کلمات (bag of words) که مجموعه‌ای از کلمات بدون در نظر گرفتن ترتیب است

NaN Trap

هنگامی که یک عدد در فرآیند آموزش مدل تبدیل به ناعدد (NaN - Not a Number) شود، باعث می‌شود برخی یا همه اعداد در مدل به ناعدد تبدیل شوند.

Natural Language Understanding

درک مقصود کاربر با توجه به آنچه گفته یا نوشته است. به عنوان مثال، یک موتور جستجو از فهم زبان طبیعی جهت تشخیص این که کاربر به دنبال چه می‌گردد استفاده می‌کند.

Negative Class

در طبقه‌بندی دوتایی، یکی از دسته‌ها کلاس مثبت و دیگری کلاس منفی نام‌گذاری می‌شود. کلاس مثبت شامل آن چیزی است که به دنبال آن می‌گردیم و کلاس منفی فاقد آن است. به عنوان مثال، در یک تست پزشکی کلاس منفی می‌تواند «بدون تومور» باشد، یا در یک مساله دسته‌بندی پیام‌های الکترونیکی می‌تواند به «غیر هرزنامه» اشاره کند.

مطالعه بیشتر: کلاس مثبت

Neural Network

مدلی که از ساختار مغز الهام گرفته شده است و شامل چندین لایه (حداقل یک لایه مخفی) است. در هر لایه چندین واحد یا نورون ساده وجود دارد که یک تابع غیرخطی بر روی نتایج آن‌ها اعمال می‌شود.

Neuron

گرهی در شبکه عصبی که معمولا چندین ورودی را دریافت کرده و یک خروحی تولید می‌کند. نورون‌ها مقدار خروجی را با اعمال یک تابع فعال‌ساز غیرخطی (activity function) بر روی حاصل جمع وزن‌دار مقادیر ورودی محاسبه می‌کنند.

NLU

مخفف Natural Language Understanding یا درک زبان طبیعی است.

Node (Neural Network)

نورونی در یک لایه پنهان شبکه عصبی.

Noise

به صورت کلی، هر چیزی که باعث ابهام در سیگنالی از مجموعه داده بشود. نوفه یا نویز به اشکال متفاوتی در داده ایجاد شود. به عنوان مثال:

Non-response Bias

مترادف: سوگیری انتخاب

Normalization

روند تبدیل بازه واقعی مقادیر به یک بازه استاندارد. (معمولا بین ۱- و ۱+، یا ۰ و ۱+) به عنوان مثال، فرض کنید که بازه طبیعی یک ویژگی مشخص بین ۸۰۰ تا ۶۰۰۰ است. با استفاده از تفریق و تقسیم، شما می‌توانید مقادیر را بین ۱- و ۱+ نرمال کنید.

مطالعه بیشتر: مقیاس‌گذاری (scaling)

Numerical Data

ویژگی‌هایی که به شکل اعداد حقیقی یا صحیح نمایش داده می‌شوند. به عنوان مثال، در یک مدل مشاور املاک، اندازه خانه (با واحد متر مربع) به شکل یک داده عددی نمایش داده می‌شود. نمایش دادن ویژگی‌ها تحت عنوان داده‌های عددی بیان می‌کند که مقادیر آن ویژگی‌ها با هم رابطه ریاضی دارند و احتمالا می‌توان آن‌ها را برچسب‌گذاری کرد. به عنوان مثال، نشان دادن اندازه خانه به شکل داده‌های عددی بیان می‌کند که یک خانه ۲۰۰ متر مربعی دو برابر بزرگ‌تر از یک خانه با مساحت ۱۰۰ متر مربع است. علاوه بر این، بیان می‌کند که احتمالا بین اندازه خانه و قیمت آن نیز یک رابطه ریاضی برقرار است.

تمامی داده‌های صحیح نباید به شکل داده‌های عددی نمایش داده شوند. به عنوان مثال، کد پستی یک عدد صحیح است؛ با این حال آن‌ها را نباید به شکل داده‌ی عددی در مدل‌ها نمایش داد. زیرا کد پستی ۲۰۰۰۰ دو برابر (یا نصف) کد پستی ۱۰۰۰۰ اهمیت ندارد. هم‌چنین، با وجود این که کد پستی‌های متفاوت می‌توانند بر روی قیمت قیمت خانه تاثیر بگذارند، اما نمی‌توان فرض کرد که خانه‌هایی با کد پستی ۲۰۰۰۰ دو برابر ارزشمندتر از خانه‌هایی با کد پستی ۱۰۰۰۰ هستند. به جای این کار، کدهای پستی به شکل داده‌های داده‌های رسته‌ای (categorical) نمایش داده می‌شوند.

داده‌های عددی گاهی داده‌های پیوسته نیز نامیده می‌شوند.

Numpy

یک کتابخانه متن‌باز ریاضی که امکان اجرای عملیات وکتوری به صورت بهینه را فراهم می‌کند. کتابخانه pandas نیز با استفاده از این کتابخانه ساخته شده است.