مطالعه ی مشخصه های هندسی در تحلیل توپولوژیک داده ها

مطالعه ی مشخصه های هندسی در تحلیل توپولوژیک داده ها

چگونه از توپولوژی برای مطالعه ی مشخصه های هندسی داده ها استفاده می شود؟

در اینجا قصدمان توضیح کامل پاسخ این سوال نیست و تنها به معرفی چند ایده ی مقدماتی می پردازیم.

همانطور که می دانیم توپولوژی ابزاری برای محاسبه و شمردن تعداد سوراخ ها و مولفه های یک شکل هندسی به ما می دهد، که برای مطالعه داده هایمان می توانیم از آن استفاده کنیم.

بطور کلی یک مجموعه داده X متشکل از n نقطه در فضا، دارای n مولفه می باشد و هیچ سوراخ و حفره ای ندارد، بنابراین محاسبه تعداد سوراخ ها و مولفه های X  هیچ چیز جالبی در مورد خصوصیات (مشخصه های) هندسی داده ها به ما  نمی گوید.

برای مطالعه X به وسیله توپولوژی، ویژگی های توپولوژیکی X  را بررسی نمی کنیم، بلکه ابتدا آنرا ضخیم(thicken) می کنیم و بعد به مطالعه آن می پردازیم.

حال ببینیم منظور از ضخیم کردن (thickening) چیست؟

فرض کنید که X مجموعه ای متناهی از نقاطی است که در یک سطح(فضای دو بعدی) قرار گرفته اند.  δ را یک عدد مثبت و (T(X, δ را مجموعه ای از تمام این نقاط با فاصله ی δ از برخی نقاط X  در نظر بگیرید. حال ( T(X, δ را ضخیم شده مجموعه داده های X می نامیم.

برای مثال X1  را مجموعه داده شکل 1 در نظر بگیرید. برای عدد مثبت δ1 نقاط سیاه نقاط اصلی X1  و ناحیه قرمز در شکل 2، (T(X1δ1 را نشان می دهد.

شکل 1

شکل 2

حال X2  را مجموعه داده ی شکل 3 در نظر بگیرید. برای عدد مثبت δ2 نقاط سیاه نقاط اصلی  X2  و ناحیه قرمز در شکل 4، (T(X2δ2 را نشان می دهد.

 

شکل 3

شکل 4

برای یک مجموعه داده مناسب و δ ای که به درستی انتخاب شده باشد، خوشه های(clusters) موجود در X معادل مولفه های (T(X, δ و همچنین حلقه های (loops) موجود در X معادل با سوراخ ها یا حفره ها (holes) در (T(X, δ می باشد.

پی نوشت: مطلب بالا ترجمه ای آزاد از بخشی از مقاله ی studying the shape of data using topology از Michael Lesnick می باشد.

 

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *