عنوان فارسی ترجمه مقاله SISC: یک روش طبقه بندی با استفاده از خوشه بندی زیرفضای شبه ناظر

<
:
:
:
:

ترجمه مقاله SISC: یک روش طبقه بندی با استفاده از خوشه بندی زیرفضای شبه ناظر
/div>
این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:
مقاله درباره SISC
طبقه بندی متن
مقاله درباره روش خوشه بندی نیمه نظارتی
خوشه بندی نیمه نظارتی
SISC
Semi Supervised Subspace Clustering
چکیده
طبقه بندی متن (Text classification)، چالش های ویژه ای دارد. یکی از این چالش ها، تعداد ابعاد زیاد آن است، که هر سندی (نقطه داده) تنها تعداد بسیار کمی از آن ها را شامل می شود.
در این مقاله، ما یک روش ناخالصی نیمه نظارتی بر پایه روش خوشه بندی نیمه نظارتی (Semi-supervised Impurity based Subspace Clustering (SISC)) در زیرمجموعه فضای ترکیب شده با روش نزدیک ترین همسایه k ام (κ-Nearest Neighbor) ارائه کرده ایم.
این روش برپایه خوشهبندی نیمه نظارتی زیرفضا می باشد که ابعاد بالا را به همان اندازه ماهیت پراکنده شان در داده های متنی مورد بررسی قرار می دهد. SISC، خوشه هایی را در زیرفضاهای داده های متنی چند بعدی پیدا می کند که در آن هر سندی عضوی از یک خوشه فازی (fuzzy) است.
این خوشه بندی فازی، از دو عامل استفاده می کند. آمار مجذور چی (chi square statistic) ابعاد و اندازه ناخالصی درون هر خوشه ارزیابی تجربی این روش بر روی مجموعه داده های دنیای واقعی، موثر بودن روش ما را نشان داده است.