اینترنتتکنولوژیهوش مصنوعی

توسعه سیستمی که می‌تواند مطالب داخل ویدیوها را درک کند

نزدیک‌تر شدن هوش مصنوعی به دنیای انسان‌ها

در دنیای اینترنت، انواع و اقسام ویدیوها وجود دارد. حجم ویدیوها در دنیای دیجیتال به حدی است که اگر تا آخر عمرتان هم زمان بگذارید، بازهم موفق نخواهید شد که تمام ویدیوهایی که فقط در یک روز، روی سرویس یوتیوب آپلود می‌شود را ببینید.

اما محققان موفق شده اند با استفاده از الگورتم‌های هوش مصنوعی، سیستمی هوشمند طراحی کنند که می تواند اتفاقات داخل ویدیوها را درک کرده و بفهمد.

گروهی از محققین MIT  و IBM ، الگوریتمی توسعه داده‌اند که می‌تواند فعالیت‌های داخل ویدیوها را با درصد بالایی، درست تشخیص دهد و در عین حال، انرژی پردازشی بسیار کمی نسبت به سیستم‌های دیگر، می‌طلبد.

تکنیک جدیدی که حالا برای تشخیص ویدیوها استفاده می‌شود، تا پیش از این برای تشخیص مفاهیم داخل تصویر به کار گرفته شده بود و حالا می‌تواند حتی برای تعداد زیادی ویدیو نیز استفاده شود. این تکنولوژی در راستای کمک به به تشخیص مطالب داخل ویدیو طراحی شده، ویدیوهایی که هر روز به تعداد آنها افزوده می‌شود و هر روز، پیگیری مطالب داخل آنها سخت‌تر از روز قبل می‌شود.

گزارش شده که تنها در سرویس یوتیوب، در ماه می امسال، در هر دقیقه بیش از 500 ساعت ویدیو آپلود شده است.

این دستاورد جدید محققان، به زودی قادر خواهد بود که به صورت اتوماتیک جزئیات مطالب داخل ویدیو را اعلام کند تا جدا کردن ویدیوهایی با مطالب نا مناسب، راحت‌تر شود. به علاوه، دنیای تبلیغات نیز از این دستاورد می‌تواند حسابی استفاده ببرد زیرا با طبقه بندی مطالب داخل ویدیو، تشخیص مخاطب مناسب نیز راحت‌تر خواهد شد. شرکت‌های تکنولوژیک مانند فیس بوک و گوگل نیز می‌توانند با کمک هوش مصنوعی، به صورت اتوماتیک ویدیوهایی که حاوی بدافزار یا مطالب نامناسب است را جدا کنند.

هوش مصنوعی، تکنولوژی مورد علاقه بسیاری از شرکت‌های تکنولوژیک است ولی تا کنون برای تحلیل ویدیو از ان استفاده نشده بود. یوتیوب، فیس بوک و تیک توک برای مرتب سازی و پیشنهاد کلیپ‌های مختلف به کاربران، از الگوریتم‌های یادگیری ماشینی استفاده می‌کنند. چنین شرکت‌هایی، بدون شک از ورود هوش مصنوعی به صنعت ویدیو، استقبال خواهد کرد که البته لازمه آن، توسعه و پیشرفت قدرت پردازشی کامپیوترهاست.

Song Han، دستیار پروفسور در ام‌آی‌تی است که رهبری تیم این پروژه تحقیقاتی را بر عهده دارد. وی می‌گوید:« درک ویدیوها، بسیار با اهمیت است. اما تا کنون، میزان پیشرفت ما در حوزه پردازشی محدود بوده است.»

الگوریتم‌های هوش مصنوعی، انرژی زیادی مصرف می‌کنند که میزان این انرژی به طرز هشدار دهنده‌ای در حال افزایش است. میزان قدرتی که کامپیوترها برای توسعه تحقیقات هوش مصنوعی استفاده می‌کنند، تقریبا هر سه سال و نیم، دو برابر می‌شود. در ماه جولای، محققان موسسه هوش مصنوعی Allen از دیگر محققین این حوزه دعوت کردند تا برای پیدا کردن راهکاری برای به صرفه سازی مصرف انرژی این تکنولوژی جدید، همفکری کنند.

طی سال‌های اخیر، پیشرفت‌های چشم گیری در حوزه تشخیص تصویر انجام شده است که عموما با استفاده تکنولوژی یادگیری ماشینی انجام می‌شود. یادگیری ماشینی نوعی تکنیک آماری است که برای دریافت معنی داده‌های پیچیده کاربرد دارد. الگوریتم‌های یادگیری ماشینی و یادگیری عمیق می‌توانند اشیا را بر اساس پیکسل‌های نمایان داخل تصویر، تشخیص دهند.

اما یادگیری ماشینی  به شکل کنونی، در تعبیر و تفسیر ویدیوها، کارایی زیادی ندارد چرا که تحلیل فریم‌های یک ویدیو نمی‌تواند نشان دهد که در داخل مطالب ویدیو چه اتفاقاتی روی می‌دهد، مگر اینکه با فریم‌های پیش و پس، مقایسه شود. این یعنی حجم عظیم تری از داده ها.

آقای هان تخمین زده است که این سیستم در حال توسعه جدید می‌تواند 50 برابر بیشتر از سیستم‌های قبل، داده تحلیل کرده و قدرت پردازش 8 برابر بیشتر ارائه دهد. با این ویژگی‌ها، سیستم قادر خواهد بود با استفاده از تکنیک ارتقا یافته تری از آموزش یادگیری ماشینی، مطالب داخل ویدیو و یا تصویر را تحلیل کرده و درک کند.

آقای هان نتایج تحقیقات خود را اولین بار، سال گذشته منتشر کرد که توجه بسیاری از شرکت های تکنولوژیک را جلب کرد. وی می‌گوید که شرکت چینی Baidu  همین حالا از تکنیک جدید این تیم بهره برداری می‌کند و آن را داخل چهارچوب سیستم‌های خود اعمال کرده است.

بهینه سازی تکنولوژی پردازش داده، می‌تواند اهمیت زیادی، به خصوصی برای صنعت گوشی‌های هوشمند به همراه داشته باشد. این تکنولوژی می‌تواند در اپلیکیشن‌های متعدد در زمینه‌های مختلف مانند سرگرمی، ورزشی، رباتیک و غیره کارایی داشته باشد. در این حوزه ها، زمان پردازش داده اهمیت زیادی دارد.

آقای هان می‌گوید که الگوریتم‌های جدید می‌توانند دستگاه‌های مختلف زیادی را هوشمندتر از قبل کنند زیرا قابلیت تحلیل ویدیو را به آنها با کمترین سخت افزارهای ممکن، اضافه می‌کنند. با کمک این تکنولوژی، گوشی‌های هوشمند آینده قادر خواهند بود جسچرها و حرکات بدنی بیشتری از کاربر تشخیص دهند.  همنچنین، دوربین‌های مدار بسته علاوه بر تشخیص چهره افراد قادر خواهند بود کاری که افراد انجام می‌دهند را نیز ضبط کند.

این طور که به نظر می‌آید ظاهرا سیستم‌های هوش مصنوعی روز به روز به دنیای انسان‌ها و درک رفتارهای انسانی نزدیک و نزدیک‌تر می‌شوند.

منبع: وایرد

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا