برنامه نویسی بینایی ماشین
راهنمای جامع زبانهای برنامهنویسی و ابزارها برای بینایی ماشین و بینایی کامپیوتر شرکت بینا پردازان هوشمند سپاهان
یادگیری ماشین به عنوان یکی از شاخههای «هوش مصنوعی» (Artificial Intelligence | AI) محسوب میشود که شامل روشها و الگوریتمهایی است که کامپیوتر با کمک آنها میتواند به طور خودکار مسائل مختلف را حل کند. به عنوان مثال، از الگوریتم های یادگیری ماشین میتوان برای دستهبندی تصاویر حیوانات مشابه استفاده کرد. با گذراندن دورههای بینایی ماشین، شما میتوانید بدون نیاز به کدنویسی و تنها با دانستن مفاهیم پردازش تصویر، پروژههای بینایی ماشین را در صنعت پیادهسازی کنید و به درآمد برسید. بینایی ماشین یکی از فناوریهای کلیدی است که میتواند تحول عظیمی در صنعت ایجاد کند و با کاربردهای گستردهای که دارد، به بهبود عملکرد و بهرهوری کمک کند. با توجه به اهمیت ویژه این دو حوزه، ما در مکتب خونه با افتخار دورههای آموزش هوش مصنوعی و آموزش پردازش تصویر را برای شما عزیزان برگزار میکنیم. این دورهها با همکاری اساتید مجرب و تخصصی در این زمینهها، به شما کمک خواهند کرد تا مهارتهای لازم برای کار با الگوریتمها، تکنیکها و ابزارهای مورد نیاز را بدست آورید.
با یادگیری و آموزش بینایی ماشین، میتوانید از آخرین پیشرفتها بهروز بمانید، به نوآوری کمک کنید و تکنیکهای پیشرفته را برای حل مشکلات دنیای واقعی به کار ببرید. در این بخش، به پرسشهای متداول پیرامون زبانهای برنامه نویسی حوزه یادگیری ماشین میپردازیم و با توجه به توضیحاتی که در بخشهای قبل مطلب حاضر به آنها پرداختیم، به این سوالات پاسخ خواهیم داد. در ادامه این مطلب از مجله فرادرس، به توضیح هر یک از زبانهای ذکر شده در فهرست بالا میپردازیم وبه امکانات آنها برای پیادهسازی مدلهای هوش مصنوعی و یادگیری ماشین اشاره خواهیم کرد و ویژگیهای مثبت و نقاط ضعف آنها را شرح میدهیم. هر سطح از پردازش در بینایی ماشین نقش مهمی در تجزیه و تحلیل تصاویر ایفا میکند و با ترکیب این سطوح، ماشین قادر به درک دقیق تصاویر و اطلاعات بصری میشود و براساس آنها تصمیمهای خود را میگیرد. برای همین بسیاری از کسانی که شغل اصلی آنها برنامهنویسی نیست از آن برای انجام کارهای کامپیوتری مانند حسابداری و پژوهش استفاده میکنند.Python یک زبان برنامهنویسی پرمخاطب و قابل دسترس است.
تا به حال شده آرزو کنید کامپیوترتان بتواند دنیای اطراف را به همان شکلی که شما میبینید، درک کند؟ دنیایی از تصاویر، ویدیوها و اشیاء که بتواند با آنها ارتباط برقرار کند و کارهای مفیدی انجام دهد. با ورود به دنیای پردازش تصویر و بینایی ماشین (Computer Vision) این قابلیت برای کامپیوترها در حال تبدیلشدن به یک واقعیت است که در دوره آموزش پردازش تصویر و بینایی ماشین با OpenCV در مکتب خونه با این مفهوم به خوبی آشنا خواهیم شد. به عبارت دیگر، تشخیص یا بازشناسی اشیاء زیر مجموعه فناوریها و سیستمهای کامپیوتری هستند که در حوزه بینایی کامپیوتر و پردازش تصویر فعالیت دارند. در سیستمهای بینایی ماشین و کاربردهای مرتبط، بازشناسی اشیاء به فرایند شناسایی یک شیء و موقعیت آن درون یک تصویر یا صحنه گفته میشود. از ابتدای پیدایش حوزه پردازش تصویر دیجیتال، بینایی ماشین و بینایی کامپیوتر، عمل بازشناسی (Recognition)، معمولا با استفاده از یک مجموعه داده مرجع و روی دادههای تصویری دوبُعدی انجام میشد.
یکی از مزایایی اصلی یادگیری عمیق، حذف مهندسی دستی ویژگیها (hand-engineering of features) میباشد، این بدان معنی است که یادگیری عمیق این امکان را به ماشین میدهد تا به صورت خودکار، ویژگیها را از روی دادهها یاد بگیرد. از دیگر مزایای یادگیری عمیق میتوان به توانایی مدیریت دادههای بزرگ و پیچیده، مدیریت دادههای دنبالهای (sequential data)، مقیاسپذیری و قابلیت تعمیم اشاره کرد. هدف بینایی ماشین این است که بتوان امکان پایش و تحلیل محیط مبتنی بر تصاویر گردآوری شده را به یک ماشین داد. مواردی مانند نظارت خودکار ، کنترل فرآیند و سیستم راهبر ربات از کاربردهای بینایی ماشین هستند. این فصل به شما کمک میکند تا اشیاء مختلف را در شرایط واقعی از پسزمینه جدا کرده و ویژگیهای آنها را برای تحلیل بیشتر استخراج کنید. یکی از معروفترین کتابخانههای بینایی کامپیوتر که علاوه در کارهای تحقیقاتی در صنعت برای پروژههای بلادرنگ نیز کاربرد دارد OpenCV است.
در این سطح، تصاویر ورودی قبل از ورود به مراحل پیچیدهتر پردازش، تمیز میشوند و مقداری از نویزها و اشکالات موجود در تصاویر برطرف میشوند. مراحلی مانند تراشهبندی (Thresholding)، تقویت رنگ (Color Enhancement) و حذف نویز (Noise Removal) از جمله فعالیتهای این سطح هستند. همانطور که پیش تر اشاره شد بینایی ماشین شامل دوربین های سیاه و سفید یا رنگی برای ضبط تصاویر ، حسگر و پردازنده است. بینایی ماشین کاربردهای مختلفی در صنایع دارد و با رشته های مختلفی مانند علوم رایانه ای ، مهندسی مکانیک ، برق و الکترونیک ارتباط دارد و برای اتوماتیک کردن کارهایی که برای انسان خسته کننده است نیز استفاده میشود. کاربردهای بینایی ماشین شامل کنترل کیفیت، اتوماسیون و رباتیک، ایمنی و نگهداری است. شما برای کار در این فیلد نیاز داری با زبان پایتون (Python) و کتابخانه هایی نظیر Numpy، Matplotlib آشنا باشید.
همچنین، ساختار مورد انتظار برای تحقیقات، جهتگیریهای پژوهشی و تکنیکهایی که ممکن است در آینده، در این حوزه توسعه داده شوند، ارائه خواهد شد. کارشناسان صنعت معتقدند که جاوا اسکریپت دارای چندین مزیت نسبت به زبانهای Python و R است. این زبان در مقایسه با Python سریعتر است و فرایندهای توسعه را برای سازمانها تسریع میبخشد. علاوهبراین، سطح ایمنی این زبان در قیاس با پایتون و R بیشتر است و دادهها را ایمن نگه میدارد زیرا قادر به دسترسی به فایلهای موجود در رایانه کاربر نیست. دستگاه منبع نور در بینایی ماشین به منظور روشنایی و بهبود کیفیت تصاویر بسیار مهم است که معمولا از LED با اندازه و طراحی مناسب استفاده میشود.در صورت آنالوگ بودن دوربین ها نیاز به مبدل آنالوگ به دیجیتال نیز هست. پیشنهاد میشود برای شروع این دوره با اصول و مبانی پایتون، یادگیری ماشین و مفاهیم پایه ای در شبکههای عصبی آشنایی داشته باشید.
تحقیقات بنیادی و اساسی که توسط محققان و دانشمندان پیشین در حوزه بینایی ماشین انجام شده است، بنیان مستحکمی را برای تحقیقات بدیع و مدرن در این زمینه فراهم آورده است. روی پروژههایی کار کنید که شامل مجموعه دادههای دنیای واقعی هستند یا مجموعه دادههای خود را برای کارهای خاص ایجاد کنید. با پروژههای ساده مانند طبقهبندی تصویر یا تشخیص اشیا شروع کنید و به تدریج به سمت کارهای پیچیدهتر مانند تقسیمبندی معنایی یا بازسازی سهبعدی بروید. یادگیری سرمایهگذاری روی آموزش بینایی ماشین میتواند مزایا و فرصتهای متعددی را ارائه دهد. در اینجا چند دلیل آورده شده است که چرا یادگیری بینایی ماشین ارزش افزوده بسیار مناسبی برای افراد محسوب میشود.
زبان جاوا از شی گرایی پشتیبانی میکند و زبانی همه منظوره محسوب میشود و برنامههای ساخته شده به این زبان را میتوان بر روی هر پلتفرمی اجرا کرد. بسیاری از سازمانها در حال حاضر پروژههای مختلفی را با استفاده از زبان جاوا توسعه دادهاند و اکثر ابزارهای منبع باز برای پردازش دادههای حجیم مانند «هادوپ» (Hadoop) و «آپاچی اسپارک» (Spark) به زبان جاوا نوشته شدهاند. به علاوه، از این زبان به وفور در حوزههای شبکه و امنیت سایبری و تشخیص کلاهبرداریهای مالی استفاده میشود. این تولکیت به بهینهسازی مدل آموزش دیده پرداخته و میتواند بطور مستقیم ابزارهایی را برای استفاده از آن مدل فراهم نماید تا استنتاج بصری به سرعت انجام پذیرد. بسیاری از شرکت های حوزه هوش مصنوعی مثل Open ai و Deep mind با سرمایه گذاری روی بینایی ماشین، محصولات بسیار جذاب و استراتژیک طراحی کرده اند. یادگیری عمیق در حوزههای مختلف بیزینس از جمله تجارت الکترونیک، پزشکی، تبلیغات، لجستیک، امنیت، تولید، مدیریت انبار، مدیریت شهری و ...
محققان این سیستم را با مدلهای رایج یادگیری عمیق مقایسه کردهاند و در اکثر موارد، سیستم ۳DP۳ توانسته است دقت بالاتری در شبیهسازی اشیا و صحنهها ارائه دهد. برای مثال، وقتی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم قادر است بهدرستی موقعیت آن را تصحیح کند. این ویژگی بهویژه در محیطهای پیچیده و زمانبر برای کاربردهایی مانند خودروهای خودران و رباتهای پیچیده بسیار حیاتی است. سی پلاس پلاس به عنوان زبان برنامه نویسی سطح پایین تلقی میشود و سرعت اجرای برنامههای نوشته شده به این زبان در مقایسه با سایر زبانهای سطح بالا و انتزاعی مانند Python بیشتر است. مجموعه ای از کتابخانههای برنامهنویسی پردازش تصویر و یادگیری ماشین است؛ در ابتدا توسط اینتل ساخته و پشتیبانی میشد و هماکنون توسط Willow Garage و Itseez پشتیبانی میگردد.
در یک پیشبینی برآورد شده است که بازار جهانیِ دوربینهای صنعتی و اتوماسیون به 5.5 میلیارد دلار در سال 2026 خواهد رسید. توسعۀ روشهای تصویربرداری چون فناوری سه بعدی و تصویربرداری چند طیفی در دوربینهای صنعتی باعث تنوع در کاربرد بینایی ماشین در صنعت شده است. بنابراین نفوذ فناوریهای جدید افزایش مییابد.این فناوری در توسعۀ کلی تولید لوازم الکترونیکی مصرفی، خودروسازی و صنایع تولیدی استفاده میشود و باعث ارتقای این بخشها خواهد شد. دقت تولید را بهبود و پیشرفت اتوماسیون را سرعت میبخشد و همچنین باعث ارتقای بینایی ماشین نیز خواهد شد.یکی از دلایل توجه به این بخش همهگیری کووید 19 بود که باعث تسلط تجارت الکترونیک و گسترش اتوماسیون شد. از صنعت بینایی ماشین میتوان در بازرسی، شمارش، تعیین موقعیت و بسیاری موارد دیگر استفاده کرد. وسایل نقلیۀ خودران که میتوانند محیط اطراف خود را پردازش و بدون دخالت انسان عمل کنند، تنها برای خودروهای سواری قابل استفاده نیستند، بلکه میتوانند به جای انسان در بخشهای مختلف کارخانهها، کامیونهای تدارکات و انواع ابزارهای متحرک دیگر کار کنند.
پیش از ادامه این مبحث لازم است یادآور شویم که میتوانید بینایی ماشین را با استفاده از مجموعه آموزش بینایی ماشین فرادرس یاد بگیرید. این رویدادها فرصتهایی را برای یادگیری از متخصصان، ایجاد شبکه با متخصصان در این زمینه و بهروز ماندن از آخرین روندها و پیشرفتها ارائه میدهد. به کامیونیتی و انجمنهای آنلاین اختصاص داده شده به بینایی ماشین و بینایی رایانه بپیوندید. این جوامع اغلب بینشها، منابع و مخازن کد ارزشمندی را ارائه میدهند که میتوانند یادگیری شما را تسریع کنند. همه راهحلهای ابری به این جهت ایجاد شدهاند که کاربران بتوانند به راحتی مدلهای بینایی ماشین را توسعه داده و به کار گیرند؛ بدون اینکه تخصص فنی بالایی در این زمینه داشته باشند.
اگر علاقه دارید متخصص بینایی کامپیوتر و بینایی ماشین شوید، خلاصهی این مسیر یادگیری را در زیر میتوانید مشاهده کنید. انتخاب زبان برنامهنویسی مناسب برای یادگیری OpenCV به سلیقه و تجربه شما بستگی دارد. برای یادگیری OpenCV، به دانش پایهای از برنامهنویسی و ریاضیات، به خصوص ماتریسها و بردارها نیاز دارید. همچنین باید با مفاهیم اولیه پردازش تصویر مانند پیکسلها، کانالهای رنگی و انواع تصاویر آشنا باشید. برای چنین کاری، در گام اول باید موقعیت و جهت جدید دوربین نسبت به وضعیت قبلی مشخص شود.
به کمک بینایی ماشین میتوان تصاویر پزشکی را به صورت دقیق و سریع بررسی کرد و نوع بیماری و محل آن را تعیین کرد که باعث میشوند روند تشخیص سریع شود و احتمال خطا کاهش یابد. استخراج ویژگیها از تصاویر به منظور تمثیل دادههای بصری به صورت اعداد قابل پردازش توسط الگوریتمهای ماشینی است. در حقیقت بینایی ماشین بر تحلیل و بررسی تصاویر و استخراج اطلاعات تصاویر و فهم اشیا موجود پیرامون تاکید میکند. در این فصل، با دوربینهای تحت شبکه باسلر آشنا خواهید شد و نحوه اتصال آنها به نرمافزار هالکن را یاد میگیرید. شما همچنین تنظیمات دوربین را در نرمافزار پایلون انجام داده و برنامههای مورد نیاز برای خواندن بارکد و دریافت سیگنال ریجکت را در هالکن پیادهسازی خواهید کرد. این فصل شامل نصب دوربین روی استراکچر آزمایشگاهی برای پروژههای کنترل کیفیت نیز میشود.
پروژهها و مخازن منبع باز بینایی ماشین را در پلتفرمهایی مانند GitHub بررسی کنید. پایگاههای کد موجود را تجزیهوتحلیل و اصلاح کرده در پروژهها مشارکت کنید یا بر اساس آنها برای برنامههای کاربردی خود بسازید. بینایی ماشینی در درجۀ اول بر تکنیکهای تشخیص الگو برای خودآموزی و درک دادههای بصری متکی است. دسترسی گسترده به دادهها و تمایل شرکتها در به اشتراک گذاشتن آنها این امکان را برای کارشناسان یادگیری عمیق فراهم کرده است تا از این دادهها برای انجام فرآیند دقیقتر و سریعتر استفاده کنند. در این فصل، با نحوه الگوریتمنویسی پیشرفته در نرمافزار Halcon آشنا میشوید و یاد میگیرید چگونه از قابلیتهای دیکشنری و آبجکتها برای نوشتن برنامههای استاندارد و قابل آموزش استفاده کنید. همچنین، نحوه پیادهسازی پروژههای واقعی مانند کنترل موقعیت چاپ را بررسی کرده و یاد میگیرید که چگونه برنامههای خود را در زبانهای برنامهنویسی دیگر مانند C، C++ و .NET فراخوانی کنید.
در واقع ماشین با استفاده از دادههای برچسب گذاری شده برای تشخیص الگوهای رایج در نمونهها، خود به یادگیری میپردازد.پایتون با کدگذاری برای اشیا، بینایی ماشین را ممکن میسازد. پایتون توانسته است در زمینۀ بینایی ماشین نسبت به سایر زبانهای برنامهنویسی سبقت بگیرد. در حال حاضر این زبان یکی از رایجترین و کاملترین زبانهای برنامهنویسی در زمینۀ یادگیری ماشین است که از پشتیبانی خوبی نیز بهرهمند است. به همین دلیل بسیاری از توسعه دهندگان از پایتون برای بینایی ماشین استفاده میکنند. «بازشناسی اشیاء» (Object Recognition) یکی از تکنیکهای تعریف شده در حوزه بینایی ماشین و بینایی کامپیوتر محسوب میشود که جهت شناسایی اشیاء در تصاویر یا ویدئوها مورد استفاده قرار میگیرند.
هندسه Epipolar، شکلی از «هندسه تصویری» (Projective Geometry) محسوب میشود که برای مشخص کردن موقعیت سهبُعدی یک شیء، از منظر دو دوربین مورد استفاده قرار میگیرد. به طور خلاصه، یادگیری و سرمایهگذاری روی آموزش بینایی ماشین شما را به مهارتهای ارزشمندی برای خودکارسازی فرآیندها، افزایش تصمیمگیری، بهبود کنترل کیفیت، کشف برنامههای کاربردی نوآورانه و دنبال کردن فرصتهای شغلی پرارزش مجهز میکند. این حوزه فناوری شما را قادر میسازد تا از قدرت ادراک بصری و تجزیهوتحلیل برای حل چالشهای دنیای واقعی و کمک به پیشرفتهای تکنولوژیکی استفاده کنید. با این تفاوتها، هر دو بینایی ماشین و بینایی کامپیوتر به طرزی مهم و حیاتی در حوزههای مختلف فناوری و صنعتی مورد استفاده قرار میگیرند و به توسعه و بهبود سیستمهای هوشمند و خودکار کمک میکنند. در این سطح، تصاویر تجزیه و تحلیل شده و با استفاده از الگوریتمهای یادگیری ماشینی و هوش مصنوعی، تفسیر میشوند.
اهداف گوناگون و کاربرد در صنایع مختلف موجب شده است که آموزش بینایی ماشین و یادگیری آن بسیار ترند پرطرفداری باشد. هدف بینایی ماشین تکرار و تقویت قابلیتهای بینایی انسان مانند تشخیص اشیا، تشخیص الگوها، اندازهگیری ابعاد، شناسایی رنگها و تفسیر صحنههای بصری است. این برنامه در زمینههای مختلف از جمله تولید، رباتیک، کنترل کیفیت، وسایل نقلیه خودران، تصویربرداری پزشکی، نظارت و بسیاری موارد دیگر کاربرد دارد. محققان این سیستم را با مدلهای رایج یادگیری عمیق مقایسه کردهاند و نتایج نشان دادهاند که سیستم جدید دقت بالاتری در شبیهسازی اشیاء و صحنهها دارد. بهویژه در مواقعی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم میتواند موقعیت آن را به درستی پیشبینی کند. این ویژگی برای کاربردهای پیچیده مانند خودروهای خودران و رباتهای خدماتی بسیار حیاتی است.
همچنین، این زبان را میتوان به عنوان یکی از زبانهای سطح بالا و همه کاره در نظر گرفت که به طور گسترده برای توسعه وب، توسعه بازی و اخیراً برای یادگیری ماشین استفاده میشود و برنامههای تولید شده به این زبان را میتوان بر روی مرورگرهای مختلف اجرا کرد. جولیا یک زبان برنامه نویسی پویا و همه منظوره با عملکرد بالا است که با داشتن ویژگیهای منحصربفرد به عنوان یک رقیب بالقوه برای زبانهای برنامه نویسی پایتون و R محسوب میشود. از این زبان میتوان برای توسعه انواع برنامهها استفاده کرد و بهترین عملکرد را برای تجزیه و تحلیل عددی با کارایی بالا و علم محاسباتی از آن گرفت. بینایی ماشین، به عنوان یک زیرشاخه از بینایی کامپیوتر، به بررسی و تحلیل تصاویر با هدف درک و تفسیر محتوا و معنای تصاویر میپردازد. برخلاف بینایی کامپیوتر که بیشتر تمرکز خود را بر روی تشخیص و شناسایی موارد خاص میگذارد، بینایی ماشین تلاش میکند تا به سطح بالاتری از درک تصاویر بپردازد و برای انجام وظایفی مانند توصیف تصاویر، تفسیر رویدادها و تعامل با محیط اطراف انسانی، استفاده شود. بینایی ماشین در زمینههایی مانند رباتیک پیشرفته، خانه هوشمند، تجربه کاربری و پزشکی مورد استفاده قرار میگیرد.
توضیح هر یک از این مراحل را در جلسه اول دوره آوردهایم و در اینجا به آن نمیپردازیم. در این دوره، دو پروژه عملیاتی ("تشخیص ارقام دست نویس" و "تشخیص چهره") تعریف شده و نحوه انجام این 5 مرحله، به تفصیل و به صورت کاملا کاربردی روی این دو موضوع، توضیح داده میشود. با توجه به آنکه امروزه تقریبا کلیه الگوریتمهای مطرح در بینایی ماشین مبتنی بر شبکههای عصبی عمیق (Deep neural networks) یا DNNها هستند، روی طراحی سامانههای بینایی ماشین در این حوزه، تمرکز خواهد شد. برای بازسازی صحنه در بینایی ماشین و کاربردهای مرتبط، معمولا دو مدل دوربین (Camera Model) مختلف در نظر گرفته میشود؛ «دوربین کالیبره شده» (Calibrated Camera) و «دوربین کالیبره نشده» (Uncalibrated Camera). اصطلاح دوربین کالیبره شده در بینایی ماشین و کاربردهای مرتبط، به دوربینی اطلاق میشود که «نقطه کانونی» (Focal Points)، «میدان دید» (Field of View) و «نوع لنز» (Type of Lens) مشخص داشته باشد.
زبانهای برنامه نویسی مختلفی وجود دارند که با کمک ابزارها و امکانات آنها میتوان پروژههای یادگیری ماشین را توسعه داد. چهار عامل اصلی را میتوان برای انتخاب بهترین زبان برنامه نویسی برای یادگیری ماشین در نظر گرفت. اولین عامل، نیازمندیهای پروژه است که باید آنها را با امکانات زبانهای برنامه نویسی مطابقت دهیم تا بدین طریق، مناسبترین زبان را برگزینیم. پیچیدگی و حجم داده را نیز باید در هنگام انتخاب مناسبترین زبان برنامه نویسی مد نظر قرار دهیم و اگر پروژه شما با دادههای حجیم سر و کار دارد، باید از زبانهایی برای توسعه برنامه استفاده کنید که با سرعت بالایی بتوانند این حجم داده را پردازش کنند. جامعه پشتیبانی از زبان و منابع آموزشی در دسترس و همچنین نوع پلتفرم استقرار برنامه نیز میتوانند به عنوان عوامل مهم دیگر برای انتخاب بهترین زبان برنامه نویسی برای یادگیری ماشین محسوب شوند. حال برای ورود به فیلد پژوهشی و یا کاربردی و عملی بینایی کامپیوتر فراگیری زبان پایتون توصیه میگردد.
این سیستم نهتنها از دقت بالاتری برخوردار است، بلکه به شکلی قابلتوجه سرعت پردازش را نیز افزایش میدهد که میتواند در بسیاری از سیستمهای واقعی کاربرد داشته باشد. از وظایف اصلی یادگیری ماشین با نظارت پشتیبانی میکند مانند تشخیص اشیا ، طبقه بندی تصویر و تقسیم بندی تصویر. یک ابزار رایگان ،متن باز، مبتنی بر وب و حاشیه نویسی تصویر و ویدیو است که برای برچسب زدن داده ها برای الگوریتم های بینایی ماشین استفاده میشود. تمرکز بیشتری بر روی تشخیص ویژگیهای سطحی مانند خطوط، لبهها و الگوها قرار دارد. این الگوریتمها بر اساس قوانین و قواعد مشخص کار میکنند و برای وظایف خاص طراحی شدهاند.
در این قطعه کد، 1000 تصویر (متشکل از تصاویر RGB و تصاویر عمق متناظر آنها) از مجموعه داده 7scenes انتخاب شدهاند. سپس، الگوریتمهای هموارسازی (Smoothing) روی مِشهای (Mesh) حاصل اجرا میشوند تا اثر نویز در آنها کاهش پیدا کند. بافت صحنه نیز با ترکیب رنگبندی (Coloration) پیکسلهای سهبُعدی همسایه تخمین زده میشود. اتخاذ چنین روشی در گذشته، برای ذخیرهسازی پیکسلهای سهبُعدی، منجر به کاهش دقت دادهها و از بین رفتن ویژگیهای کوچک در تصویر میشد. در ادامه این بخش چند مرحله برای کمک به شما برای شروع یادگیری ماشین بینایی آورده شده است.
در این فصل، نحوه استفاده از این پلتفرم جهت پیادهسازی الگوریتمهای بینایی ماشین و تحلیل دادههای تصویری رو یاد میگیرید. OpenCV که بیشتر روی پردازش تصویر Real time یا بیدرنگ متمرکز است دارای بیش از 2500 الگوریتم ... C# اغلب در محیطهای ویندوزی استفاده میشود، بهویژه برای برنامههای اتوماسیون صنعتی و سیستمهای بینایی ماشینی مبتنی بر رابطهای کاربری گرافیکی. بینایی کامپیوتر حوزهای گستردهتر از هوش مصنوعی (AI) است که به ماشینها امکان میدهد دادههای بصری از محیط اطرافشان را تفسیر و تحلیل کنند. بینایی ماشین، شاخه ای از "یادگیری ماشین" (Machine learning) است که این موضوع نیز، شاخهای مهم از "هوش مصنوعی" (Artificial intelligence) میباشد. با توجه به این ارتباط، بیاییم از تعریف هوش طبیعی شروع کرده و در نهایت به تعریف بینایی ماشین برسیم.
همچنین، صحنه را میتوان از طریق رنگ کردن Voxelها به وسیله میانگین گرفتن از رنگ پیکسلهای اصلی (در تصاویر دوبُعدی)، بافتزنی (Texturing) کرد. در طی چند سال اخیر، مرز میان سیستمهای بینایی کامپیوتر و بینایی ماشین باریک شده است و در حال از بین رفتن است. همچنین، برای توصیف تکنیکهایی که با هدف بهبود قابلیتهای «موتورهای جستجو» (Search Engines) و ارائه سرویسهای «بازشناسی مبتنی بر تصویر» (Image-based Recognition) در جستجو ارائه شدهاند، از اصطلاح بینایی ماشین استفاده میشود. در دنیای هوش مصنوعی، یکی از بزرگترین چالشها شبیهسازی نحوه پردازش اطلاعات بصری توسط انسانهاست. اخیراً تیمی از محققان MIT سیستمی جدید ساختهاند که به ماشینها این امکان را میدهد تا دنیای اطراف خود را به شیوهای مشابه انسانها تحلیل کنند.
در این مطلب، روی تکنیکهای بینایی غیر فعال یا بینایی منفعل تمرکز میشود؛ به عنوان نمونه، جمعآوری نور از محیط عملیاتی (همانند فرایندی که در سیستم بینایی انسان انجام میشود). این دسته از تکنیکهای بینایی ماشین از آن جهت حائز اهمیت هستند که به صورت «مخفیانه» (Stealthy) عمل میکنند و محیط را با انتشار صدا، نور و یا موج ناهنجار مختل نمیکنند. علاوه بر این، پیادهسازی سختافزار موردنیاز برای راهاندازی این دسته از سیستمهای بینایی ماشین به مراتب ارزانتر از سیستمهای بینایی فعال است. الگوریتمهای بینایی ماشین میتوانند مقادیر زیادی از دادههای بصری را تجزیهوتحلیل کرده و اطلاعات معنیدار را استخراج کنند. با یادگیری بینایی ماشین، میتوانید از این قابلیتها برای تصمیمگیری آگاهانه بر اساس ورودیهای بصری، مانند تشخیص اشیا، تشخیص ناهنجاری، یا نگهداری پیشبینی کننده استفاده کنید. با اعمال قدرت بینایی ماشین، صنایع میتوانند فرآیندها را خودکار و ساده کنند، دقت و ثبات را بهبود بخشند، کنترل کیفیت و کارایی محصول را افزایش دهند و ماشینها را قادر سازند تا با دنیای بصری بهگونهای تعامل کنند که زمانی محدود به ادراک انسان بود.
حال ممکن است که این درک تصاویر برای کاربردهای صنعتی و با برخی از سنسورهای دیگر باشد که در اینجا عبارت بینایی ماشین نیز به کار برده میشود (تفاوت بینایی کامپیوتر با بینایی ماشین). هوش مصنوعی به عنوان یکی از پیشرفتهای فناوری، توانمندیهایی فراوانی از جمله تحلیل دادهها، پیشبینی، خودکارسازی فرآیندها و اتخاذ تصمیمات هوشمند را به ما ارائه میدهد. از سوی دیگر، پردازش تصویر به ما امکان میدهد تا از تصاویر و ویدئوها برای استخراج اطلاعات، تشخیص الگوها، شناسایی اشیاء و حتی تصمیمگیریهای هوشمند استفاده کنیم. بازشناسی اشیاء در سیستمهای بینایی ماشین معمولا در دو مرحله «گردآوری» (Acquisition) یا «آموزش» (Training) و «بازشناسی» (Recognition) انجام میشود. در مرحله اول، سیستم بینایی ماشین باید اشیاء (Objects) موجود در تصویر را در حافظه خود گردآوری کند تا در مراحل بعدی بتواند آنها را شناسایی کند و تشخیص دهد. نکته شایان توجه در مورد این دسته از سیستمهای بینایی ماشین این است که روشهای بازسازی صحنه، یک فرض اساسی را در سیستم مطرح میکنند؛ صحنههای موجود در تصاویر، «مانا» (Static | ایستا) هستند.
برای شرکت در این دوره نیازی به دانش قبلی در زمینه بینایی ماشین یا نرمافزار هالکن ندارید. با تمرکز بر پروژههای عملی، در این دوره آنچه برای اجرای واقعی پروژههای بینایی ماشین نیاز دارید، به شما آموزش داده میشود. دوره بینایی ماشین شامل مباحثی مانند معرفی دوربینهای اسمارت، شرکتهای سازنده، نرمافزار Visor و کاربردهای مختلف بینایی ماشین در صنعت است. اگر شما نیز تمایل دارید تا در دنیای هوش مصنوعی و پردازش تصویر به چالش بکشید و مهارتهای جدیدی را یاد بگیرید، از شما دعوت میکنیم تا به این دورههای آموزشی ما ملحق شده و از این فرصت بینظیر بهرهمند شوید. ++C پایه بسیاری از کتابخانههای بینایی کامپیوتر است و اغلب برای برنامههای حساس به عملکرد که نیاز به پردازش بلادرنگ دارند، انتخاب میشود.
به عنوان مثال، در خطوط تولید، رباتها میتوانند با استفاده از بینایی ماشین، قطعات مختلف را شناسایی و مونتاژ کنند. بازشناسی اشیاء یکی از فناوریهای کلیدی در توسعه «اتومبیلهای خودران» (Driverless Vehicles) است و آنها را قادر میسازد تا افراد عابر پیاده، علامت توقف و سایر موارد را شناسایی کنند و میان یک عابر پیاده و پایه چراغهای روشنایی جادهها تمایز قائل شوند. همچنین روشهای بازشناسی اشیاء در کاربردهای متنوعی نظیر شناسی بیماریها در تصویربرداری زیستی (Bioimaging)، «بازرسی صنعتی» (Industrial Inspection) و «بینایی روباتیک» (Robotic Vision) مفید واقع میشوند. مدل «قاب سیمی» (قاب سیمی) نیز برای نمایش نمای کلی (Outline) یک مدل سهبُعدی مورد استفاده قرار گرفته شده است. با این حال، مشکل بزرگ مدل قاب سیمی این است که مدلهای تولید شده از یک شیء (در چشماندازهای متفاوت)، «ظاهر تصویری» (Projective Appearance) مشابهی دارند؛ در نتیجه، این روش، برای مدلسازی سهبُعدی اشیاء مختلف مطلوب نیست. علاوه بر این، روشهای ذخیرهسازی مبتنی بر پیکسلهای سهبُعدی میتوانند از تکنیکهای «اشغال مکانی» (Spatial Occupancy) برای مدلسازی سهبُعدی استفاده کنند؛ در این دسته از تکنیکها، پیکسلهای سهبُعدی درون یک آرایه باینری سهبُعدی و گسسته محصور میشوند.
برنامه نویسی وب با پایتون