دسته‌ها
فناوری اطلاعات - ترجمه مقاله مقالات انگلیسی رایگان مقالات ترجمه شده

ترجمه مقاله آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد

عنوان مقاله انگلیسی
Joint Learning of Single-image and Cross-image Representations for Person Re-identification
عنوان ترجمه فارسی
ترجمه مقاله آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد

 

دسته : فناوری اطلاعات

ترجمه مقاله آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد

این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:
مقاله درباره پردازش تصویر
مقاله درباره الگوی تک تصویری
مقاله درباره SIR
مقاله درباره الگوی تصویر روبرو
مقاله درباره CIR
مقاله درباره شبکه عصبی پیچیده
مقاله درباره CNN
Image Processing single-image representation
cross-image representation
neural network

چکیده

شناسایی افراد معمولاً یا به صورت انطباق الگوی تک تصویری (SIR) و یا دسته بندی الگوی تصویر روبرو (CIR) صورت می گیرد. در این تحقیق، ما به دنبال ایجاد ارتباط بین این دو دسته از روش ها می باشیم و یک چارچوب آموزش مشترک را برای یکپارچه سازی SIR و CIR با استفاده از شبکه های عصبی پیچیده (CNN) پیشنهاد می کنیم.

در حالت خاص، ساختار عمیق مورد نظر شامل یک زیر شبکه مشترک با دو زیر شبکه دیگر است که SIR ها را از یک سری تصاویر مشخص و CIR ها را از جفت تصاویر داده شده استخراج می کند. زیر شبکه SIR می بایست هر بار برای هر یک از تصاویر (هم در مجموعه‌های پروب و هم گالری) محاسبه شود و عمق زیر شبکه CIR نیز می بایست به حداقل برسد تا حجم بار محاسباتی کاهش پیدا کند.

بنابراین، دو نوع الگوی نمایشی را می توان به صورت مشترک به منظور کسب بهترین دقت انطباق با صرف کمترین بار محاسباتی، بهینه سازی نمود.

علاوه بر این، الگوهای نمایشی که با استفاده از اهداف مقایسه دوتایی سه تایی آموزش دیده اند (منظور در شبکه عصبی آموزش داده شده اند) را می توان برای بهبود عملکرد انطباق با هم ترکیب نمود.

آزمایش های صورت گرفته روی مجموعه داده های CUHK03 ، CUHK01 و VIPeR نشان می دهد که روش پیشنهادی قادر است دقت بالایی را در مقایسه با سایر الگوهای جدید ارائه شده از خود به نمایش بگذارد.

1-مقدمه

شناسایی افراد در واقع انطباق دو تصویر از اشخاص در حال پیاده روی از دو منظر متفاوت است. این مفهوم در سال های اخیر به خاطر کاربردهای گسترده ای که در تجسس های ویدئویی دارد، توجه بسیاری را به خود جلب کرده و تحقیقات قابل توجهی در مورد آن صورت گرفته است. اما این مسئله، همچنان به عنوان یک چالش شناخته شده و مطالعات بیشتری را می طلبد، که دلیل آن تغییرات زیاد شدت نور، ژست ها، منظرها و پیش زمینه تصاویر افراد پیاده می باشد.

شناسایی افراد را می توان بر اساس دو دسته از روش ها انجام داد: 1) روش های سنجش فاصله و یا شباهت بر اساس الگوی تک تصویری که در واقع الگویی را از یک تصویر مشخص نتیجه می دهد [13, 14, 16, 28, 20, 17, 26, 7] و (2) دسته بندی مربوط به الگوهای تصویر روبرو که الگویی بر اساس یک جفت تصویر است [19, 1, 24]. در دسته اول، الگوی نمایش تک تصویری (SIR) ابتدا با استفاده از روش های دستی و یا با کمک روش های شبکه عصبی پیچیده (CNN) به دست می آید و سپس سنجش فاصله به همراه یک مقدار آستانه برای پیش‌بینی اینکه آیا دو تصویر فرد پیاده با هم انطباق دارند یا خیر، به کار می رود.

در دسته روش های دوم، پس از تهیه الگوی نمایشی تصویر روبرو (CIR)، شناسایی فرد مورد نظر را می توان به عنوان یک الگوی دسته بندی باینری ترتیبی در نظر گرفت…

 


ادامه مطلب و دانلود منبع