هوش مصنوعی

چگونه هوش مصنوعی صنعت عکاسی را تغییر می‌دهد؟

اگر کنجکاوید بدانید دوربین گوشی آینده شما چقدر حرفه‌ای خواهد بود، باید دقت کنید و ببینید شرکت سازنده گوشی مد نظر شما تا چه اندازه در زمینه تکنولوژی هوش مصنوعی پیشرفت دارد. در حوزه عکاسی طی چند سال گذشته، به واسطه تکنولوژی هوش مصنوعی، پیشرفت‌های زیادی شاهد بوده‌ایم و به نظر نمی‌رسد که این روند به این زودی تغییر کند.

مهم‌ترین و چشم‌گیر‌ترین پیشرفت‌های اخیر صورت گرفته در این حوزه، در قسمت نرم افزار و اکثرا مرتبط با تکنولوژی هوش مصنوعی بوده است.

یکی از دستاوردهای بزرگ در این زمینه، در برنامه Google Photos دیده شد، اپلیکیشنی که در سال 2015 معرفی شد و ترکیب نوین و جذابی از تکنولوژی هوش مصنوعی و صنعت عکاسی محسوب می‌شود. تا قبل از معرفی این برنامه، این شرکت برای مدیریت تصاویر در قسمت Google+، از تکنولوژی یادگیری ماشینی (machine learning) استفاده می‌کرد اما با معرفی برنامه Photos، قابلیت‌های جدیدی مانند تشخیص هوشمند چهره معرفی شد که به نوبه خود بسیار منحصر به فرد بود. این قابلیت می‌توانست چهره افراد داخل عکس را شناسایی کند و تمامی عکس‌ها را بر این اساس منظم و مرتب کند.

با گوگل فوتوز، قابلیت‌های جدیدی مانند تشخیص هوشمند چهره معرفی شد که به نوبه خود بسیار منحصر به فرد بود.

در سال 2013، گوگل شرکت DNNresearch را خریداری کرد و بعد از آن مجموعه‌ای از شبکه‌های عصبی را توسعه داد که داده‌های آن، توسط تیمی انسانی مدیریت و نظارت می‌شدند. این پروسه، یادگیری نظارت شده نام گرفت، پروسه‌ای که در آن برای دسته بندی تصاویر، از سرنخ‌های تصویری داخل میلیون‌ها عکس استفاده می‌شد. این الگوریتم در طول زمان در زمینه تشخیص، پیشرفت زیادی کرد. با آموزش‌های حرفه‌ای‌تر، جستجوی عبارات انتزاعی‌تر مثلا «حیوان» یا «صبحانه» امکان پذیر شد، عباراتی که شاید در نگاه اول سرنخ های تصویری در آنها موجود نباشد.

برای آموزش الگوریتم‌های تحلیلی پیشرفته، زمان و قدرت پردازشی زیادی صرف شد و حالا تمامی کارها توسط دیتا سنترهای قدرتمند انجام شده و این تکنولوژی حتی روی موبایل‌های نه چندان حرفه‌ای هم به خوبی کار می‌کند. بیشتر کارها بعد از اپلود عکس‌ها به روی فضای ابری انجام می‌گیرد، و بعد از آن گوگل با استفاده از مدل‌های تحلیلی خود، تمامی گالری عکس‌های شما را مرتب و منظم می کند.

یک سال بعد از اینکه Google Photos معرفی شد، شرکت اپل نیز قابلیت مشابهی را معرفی کرد اما به دلایل مربوط به حریم شخصی، این پردازش توسط پردازنده‌های گوشی شخص انجام می‌گیرد و هیچ گونه داده‌ای به هیچ جا ارسال نمی‌شود. به همین دلیل، این کار به روی گوشی‌های اپل ممکن است روزها زمان ببرد.

نرم افزار مدیریت هوشمند عکس‌ها توسعه‌های زیادی داشته اما تکنولوژی‌های هوش مصنوعی و یادگیری ماشینی تاثیرات به مراتب بزرگ تری در دنیای عکاسی داشته اند. لنز‌ها، پر سرعت‌تر شده و سنسورهای پیشرفته‌تر و به مراتب بزرگ‌تری به روی آنها تعبیه شده است. البته با پیشرفت در این حوزه، مسیر تکنولوژی به سمت کوچک‌تر شدن فیزیکی تراشه‌ها و قطعات حرکت کرده و حالا شاهدیم که در بسیاری از شرایط، دوربین گوشی‌های موبایل خیلی بهتر از دوربین‌های حرفه ای عکاسی، تصاویر را ثبت می‌کنند.

به لطف هوش مصنوعی، عکس های موبایلی در بسیاری اوقات از دوربین های حرفه ای عکاسی نیز با کیفیت تر هستند.

تراشه‌های کوچک سوار شده به روی گوشی‌های موبایل، قدرت پردازشی بالاتر و حرفه‌ای‌تری دارند و به همین دلیل سیستم اکثر دوربین‌های حرفه ای عکاسی، قدرت رقابت با آنها را ندارند.

سخت افزارهای کنونی در این حوزه در واقع تحت عنوان سخت افزارهای مخصوص «عکاسی محاسبه‌ای» شناخته می‌شوند. این عنوان طیف وسیعی از از قابلیت‌ها و امکانات دوربین‌های عکاسی موبایل را پوشش می‌دهد از جمله افکت depth-of-field effects که در حالت پرتره استفاده می‌شود، یا الگوریتم‌هایی که در ذخیره‌سازی تصاویر با کیفیت Google Pixel کمک می‌کنند. البته تمام قسمت‌های عکاسی محاسبه‌ای، از هوش مصنوعی استفاده نمی شود اما این تکنولوژی بدون شک یکی از اصلی‌ترین قسمت‌های این حوزه است.

افکت depth-of-field effects

اپل هم از این تکنولوژی استفاده کرده و برای قسمت «حالت پرتره» که مخصوص آیفون‌های دو دوربینه است، استفاده می‌کند. پردازنده سیگنالی تصویر در آیفون با استفاده از تکنیک‌های یادگیری ماشینی قادر است افراد را با یک دوربین شناسایی کرده و با دوربین دوم، یک نقشه عمق دار ساخته می‌شود که برای شناسایی اجسام و یا مات کردن پشت صحنه استفاده می‌شود.

گوگل در زمینه  استفاده هوش مصنوعی در عکاسی، همچنان سردمدار است با تولید سه نسل از گوشی Pixel  این برتری را اثبات کرده است. گوگل سیستم‌های هوش مصنوعی خود را به گونه‌ای منحصر به فرد تمرین می‌دهد و با کمک مراکز داده‌های عظیمی که دارد، عکس‌ها را لیبل گذاری کرده- کاری که دقیقا سیستم نرم افزاری Google Photos انجام می‌دهد-که این کار در عکس برداری های بعدی دوربین دستگاه تاثیر گذار خواهد بود. به عنوان مثال گوشی Pixel 2 تصاویر فوق العاده با کیفیت و حرفه ای ثبت می‌کند.

چند ماه پیش، گوگل قابلیتی برای گوشی پیکسل جدید معرفی کرد تحت عنوان Night Sight که در آن با استفاده از الگوریتم‌های یادگیری ماشینی، محاسبات دقیق‌تری از وضعیت رنگ‌ها و نور تصویر انجام می‌گیرد. نتیجه‌ای که عکاسی با این قابلیت در پی دارد، خیره کننده است. این قابلیت بهترین اثر را در گوشی‌های پیکسل 3 دارد زیرا این الگوریتم برای جدیدترین سخت افزار طراحی شده است، البته گوگل این قابلیت را برای دیگر گوشی‌های پیکسل نیز ارائه کرده است.

این شرکت ثابت کرده که این نرم افزارها هستند که همیشه بیشترین تغییر را ایجاد می‌کنند به خصوص اگر با تکنولوژی هوش مصنوعی مرتبط باشند. گوشی جدید Honor، که View 20 نام دارد، همراه با Huawei’s Nova 4, اولین گوشی‌هایی هستند که از سنسورهای تصویری Sony IMX586 بهره برده‌اند. این سنسور کمی از رقبای دیگر خود بزرگ‌تر است و با 48 مگاپیکسل، بیشترین رزولوشونی را ارائه می‌دهد که تا کنون برای یک گوشی موبایل در نظر گرفته شده است. اما موضوع کوچک بودن فضا برای این سنسور، کمی مشکل ساز شده است و همین مسئله به روی کیفیت تصویر بی تاثیر نبوده است. در آزمایش‌های Sony IMX586 شرکت  Honorاز قابلیت هوش مصنوعی AI Ultra Clarity استفاده کرده که برای ارائه حداکثری رزولوشن تصویر کاربرد دارد. این قابلیت نیز نتیجه بسیار چشم گیری در کیفیت عکس‌های ثبت شده با دوربین این گوشی داشته است.

پردازنده‌های سیگنال تصویر هم تا مدت‌ها برای عملکرد بهتر دوربین گوشی‌ها، مهم بوده‌اند اما حالا به نظر می‌رسد که NPU یا پردازنده‌های هسته‌ای با پیشرفت عکاسی محاسبه‌ای، بیشتر از بقیه تاثیر گذارهستند. هواوی اولین شرکتی بود که سیستم داخل چیپ مجهز به هوش مصنوعی که Kirin 970 نام دارد را معرفی کرد. شرکت اپل هم تراشه اختصاصی A11 Bionic  خود را خیلی زودتر از دیگر رقبا به مشتریان عرضه کرد.

کوالکام، بزرگ‌ترین تامین کنند پردازنده‌های اندرویدی در سرتاسر دنیا، فعلا هیچ محصول مرتبط با تکنولوژی یادگیری ماشینی عرضه نکرده اما گوگل نیز تراشه اختصاصی خود را با نام Pixel Visual Core معرفی کرد که برای انجام امور مرتبط با هوش مصنوعی کارامد است.

تراشه جدید A12 Bionic اپل مجهز به یک موتور 8 هسته‌ای است و مخصوصی سیستم Core ML اپل طراحی شده-Core ML یک فریمورک مجهز به یادگیری ماشینی است که مختص اپل است. سرعت تراشه جدید اپل 9 برابر بیشتر از A11 است و برای اولین بار مستقیما به پردازنده تصویر متصل است. اپل می‌گوید که این تکنولوژی به دوربین دستگاه این امکان را می‌دهد تا عمق واقع گرایانه‌تری در تصاویر ثبت شود.

طی چند سال اخیر، از بین تمام اپلیکیشن‌ها و امکاناتی به لطف تکنولوژی هوش مصنوعی تولید شده، حیطه‌ای که بیشترین تاثیر را از این تکنولوژی گرفته بی‌ شک عکاسی است. دوربین‌ها حالا یکی از اجزای اصلی گوشی‌های هوشمند محسوب می‌شوند و هوش مصنوعی نیز در این بین کمک می‌کند که این دوربین‌ها روز به روز حرفه‌ای‌تر و بهتر شوند.

منبع: How AI is changing photography – T

 

 

 

 

منبع
The Verge

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا