تحليل الجار الأقرب
تحليل الجار الأقرب
تحليل الجار الأقرب أو أقرب جار Nearest Neighbor Analysis هو طريقة لتصنيف الحالات بناءً على تشابهها مع الحالات الأخرى. في التعلم الآلي، تم تطويره كطريقة للتعرف على أنماط البيانات دون الحاجة إلى تطابق تام مع أي أنماط أو حالات مخزنة. الحالات المماثلة قريبة من بعضها البعض والحالات المتباينة بعيدة عن بعضها البعض. وبالتالي، فإن المسافة بين حالتين هي مقياس للاختلاف بينهما.
يقال إن الحالات القريبة من بعضها البعض هي "جيران". عندما يتم عرض حالة جديدة (معارضة)، يتم حساب المسافة بين كل حالة من الحالات في النموذج. يتم حصر تصنيفات الحالات الأكثر تشابهًا - أقرب الجيران - ويتم وضع الحالة الجديدة في الفئة التي تحتوي على أكبر عدد من أقرب الجيران.
يمكنك تحديد عدد أقرب الجيران لفحصها؛ هذه القيمة تسمى k. توضح الصور كيف يمكن تصنيف حالة جديدة باستخدام قيمتين مختلفتين لـ k. عندما k = 5، يتم وضع الحالة الجديدة في الفئة 1 لأن غالبية أقرب الجيران ينتمون إلى الفئة 1. ومع ذلك، عندما k = 9، يتم وضع الحالة الجديدة في الفئة 0 لأن غالبية الجيران الأقرب ينتمون إلى الفئة 0.
يمكن أيضًا استخدام تحليل الجار الأقرب لحساب القيم لهدف متصل continuous. في هذه الحالة، يتم استخدام متوسط القيم المستهدفة أو الوسيط لأقرب الجيران للحصول على القيمة المتوقعة للحالة الجديدة.