توسعه سیستمی که میتواند مطالب داخل ویدیوها را درک کند
نزدیکتر شدن هوش مصنوعی به دنیای انسانها
در دنیای اینترنت، انواع و اقسام ویدیوها وجود دارد. حجم ویدیوها در دنیای دیجیتال به حدی است که اگر تا آخر عمرتان هم زمان بگذارید، بازهم موفق نخواهید شد که تمام ویدیوهایی که فقط در یک روز، روی سرویس یوتیوب آپلود میشود را ببینید.
اما محققان موفق شده اند با استفاده از الگورتمهای هوش مصنوعی، سیستمی هوشمند طراحی کنند که می تواند اتفاقات داخل ویدیوها را درک کرده و بفهمد.
گروهی از محققین MIT و IBM ، الگوریتمی توسعه دادهاند که میتواند فعالیتهای داخل ویدیوها را با درصد بالایی، درست تشخیص دهد و در عین حال، انرژی پردازشی بسیار کمی نسبت به سیستمهای دیگر، میطلبد.
تکنیک جدیدی که حالا برای تشخیص ویدیوها استفاده میشود، تا پیش از این برای تشخیص مفاهیم داخل تصویر به کار گرفته شده بود و حالا میتواند حتی برای تعداد زیادی ویدیو نیز استفاده شود. این تکنولوژی در راستای کمک به به تشخیص مطالب داخل ویدیو طراحی شده، ویدیوهایی که هر روز به تعداد آنها افزوده میشود و هر روز، پیگیری مطالب داخل آنها سختتر از روز قبل میشود.
گزارش شده که تنها در سرویس یوتیوب، در ماه می امسال، در هر دقیقه بیش از 500 ساعت ویدیو آپلود شده است.
این دستاورد جدید محققان، به زودی قادر خواهد بود که به صورت اتوماتیک جزئیات مطالب داخل ویدیو را اعلام کند تا جدا کردن ویدیوهایی با مطالب نا مناسب، راحتتر شود. به علاوه، دنیای تبلیغات نیز از این دستاورد میتواند حسابی استفاده ببرد زیرا با طبقه بندی مطالب داخل ویدیو، تشخیص مخاطب مناسب نیز راحتتر خواهد شد. شرکتهای تکنولوژیک مانند فیس بوک و گوگل نیز میتوانند با کمک هوش مصنوعی، به صورت اتوماتیک ویدیوهایی که حاوی بدافزار یا مطالب نامناسب است را جدا کنند.
هوش مصنوعی، تکنولوژی مورد علاقه بسیاری از شرکتهای تکنولوژیک است ولی تا کنون برای تحلیل ویدیو از ان استفاده نشده بود. یوتیوب، فیس بوک و تیک توک برای مرتب سازی و پیشنهاد کلیپهای مختلف به کاربران، از الگوریتمهای یادگیری ماشینی استفاده میکنند. چنین شرکتهایی، بدون شک از ورود هوش مصنوعی به صنعت ویدیو، استقبال خواهد کرد که البته لازمه آن، توسعه و پیشرفت قدرت پردازشی کامپیوترهاست.
Song Han، دستیار پروفسور در امآیتی است که رهبری تیم این پروژه تحقیقاتی را بر عهده دارد. وی میگوید:« درک ویدیوها، بسیار با اهمیت است. اما تا کنون، میزان پیشرفت ما در حوزه پردازشی محدود بوده است.»
الگوریتمهای هوش مصنوعی، انرژی زیادی مصرف میکنند که میزان این انرژی به طرز هشدار دهندهای در حال افزایش است. میزان قدرتی که کامپیوترها برای توسعه تحقیقات هوش مصنوعی استفاده میکنند، تقریبا هر سه سال و نیم، دو برابر میشود. در ماه جولای، محققان موسسه هوش مصنوعی Allen از دیگر محققین این حوزه دعوت کردند تا برای پیدا کردن راهکاری برای به صرفه سازی مصرف انرژی این تکنولوژی جدید، همفکری کنند.
طی سالهای اخیر، پیشرفتهای چشم گیری در حوزه تشخیص تصویر انجام شده است که عموما با استفاده تکنولوژی یادگیری ماشینی انجام میشود. یادگیری ماشینی نوعی تکنیک آماری است که برای دریافت معنی دادههای پیچیده کاربرد دارد. الگوریتمهای یادگیری ماشینی و یادگیری عمیق میتوانند اشیا را بر اساس پیکسلهای نمایان داخل تصویر، تشخیص دهند.
اما یادگیری ماشینی به شکل کنونی، در تعبیر و تفسیر ویدیوها، کارایی زیادی ندارد چرا که تحلیل فریمهای یک ویدیو نمیتواند نشان دهد که در داخل مطالب ویدیو چه اتفاقاتی روی میدهد، مگر اینکه با فریمهای پیش و پس، مقایسه شود. این یعنی حجم عظیم تری از داده ها.
آقای هان تخمین زده است که این سیستم در حال توسعه جدید میتواند 50 برابر بیشتر از سیستمهای قبل، داده تحلیل کرده و قدرت پردازش 8 برابر بیشتر ارائه دهد. با این ویژگیها، سیستم قادر خواهد بود با استفاده از تکنیک ارتقا یافته تری از آموزش یادگیری ماشینی، مطالب داخل ویدیو و یا تصویر را تحلیل کرده و درک کند.
آقای هان نتایج تحقیقات خود را اولین بار، سال گذشته منتشر کرد که توجه بسیاری از شرکت های تکنولوژیک را جلب کرد. وی میگوید که شرکت چینی Baidu همین حالا از تکنیک جدید این تیم بهره برداری میکند و آن را داخل چهارچوب سیستمهای خود اعمال کرده است.
بهینه سازی تکنولوژی پردازش داده، میتواند اهمیت زیادی، به خصوصی برای صنعت گوشیهای هوشمند به همراه داشته باشد. این تکنولوژی میتواند در اپلیکیشنهای متعدد در زمینههای مختلف مانند سرگرمی، ورزشی، رباتیک و غیره کارایی داشته باشد. در این حوزه ها، زمان پردازش داده اهمیت زیادی دارد.
آقای هان میگوید که الگوریتمهای جدید میتوانند دستگاههای مختلف زیادی را هوشمندتر از قبل کنند زیرا قابلیت تحلیل ویدیو را به آنها با کمترین سخت افزارهای ممکن، اضافه میکنند. با کمک این تکنولوژی، گوشیهای هوشمند آینده قادر خواهند بود جسچرها و حرکات بدنی بیشتری از کاربر تشخیص دهند. همنچنین، دوربینهای مدار بسته علاوه بر تشخیص چهره افراد قادر خواهند بود کاری که افراد انجام میدهند را نیز ضبط کند.
این طور که به نظر میآید ظاهرا سیستمهای هوش مصنوعی روز به روز به دنیای انسانها و درک رفتارهای انسانی نزدیک و نزدیکتر میشوند.
منبع: وایرد