سرویس تکس ترکت آمازون Textract چه قابلیتهایی دارد؟
سرویس تکس ترکت آمازون (Textract) چند روزی است که راهاندازی شده است. سرویس مبتنی بر فضای ابری و کاملا پیشرفته که قادر است با بهرهگیری از فناوری یادگیری ماشینی جداول، فرمها و صفحات مختلف را برای پیدا کردن متن و اطلاعات مورد نظر تجزیه و تحلیل کند.
آیا برای شما نیز پیش آمده که بخواهید اطلاعاتی را از یک فایل در سریعترین زمان ممکن استخراج کنید؟ اگر از کاربران سرویسهای وب آمازون و یا همان AWS هستید، از این پس میتوانید براحتی از این امکان استفاده کنید.
این سرویس از امروز برای کاربران برخی از مناطق جهان قابل استفاده است و قرار است به زودی در اختیار دیگر کاربران در سراسر جهان برسد.
تکسترکت (Textract) از قابلیت و دقت به مراتب بیشتری نسبت به سیستم شناخت حروف بصری برخوردار است. این سرویس میتواند با توجه به فایلهای ذخیره شده در Amazon S3، اطلاعات مدنظر از قبیل اسامی، شماره تماس و یا غیره را از نمودارها، جداول و محتوای اسناد تشخیص و ارائه دهد.
آمازون در بیانیه خود در این خصوص نوشت که تکسترکت از فرمتهای عکس و فایلهای PDF پشتیبانی میکند و قادر است جستوجوی خود را در دل انواع فرمتها به بهترین شکل انجام دهد.
پروژه Kuiper : اینترنت ماهواره ای آمازون
سرویس تکس ترکت آ»ازون ، نتایج حاصل از تجزیه و تحلیل اسناد را در قالب فایل JSON به همراه اطلاعاتی همچون شماره صفحه، بخش و غیره مربوطه ارائه میدهد و اطلاعات از طریق یک API تایپ میشود. در صورت تمایل کاربران، این اطلاعات برای فرآیند پیشپردزاش با دیتابیس و سرویسهای تحلیلی همچون Elasticsearch، DynamoDB، Athena آمازون و محصولات مبتنی بر فناوری یادگیری ماشینی این شرکت همانند Comprehend، comprehend Medical، Translate و SegaMajer یکپارچه خواهد شد.
همچنین، این اطلاعات را میتوان به منظور انطباق بر روی فضای ابری ارائه شده توسط دیگر شرکتها نیز پیاده کرد و سرچهای هوشمندتری را بروی آرشیو اسناد انجام داد.
طبق گفته آمازون، تکسترکت قادر است ظرف چند ساعت، فرآیند پردازش و تجزیه و تحلیل بر روی میلیونها سند و صفحه را با دقت بسیار بالایی انجام دهد.
تاکنون برخی از کاربران AWS، از سرویس تکسترکت آمازون استفاده کردهاند که از جمله آنها میتوان به Globe and Mail، سرویس هواشناسی ملی بریتانیا، PriceWaterhouseCoopers ، سازمان خدمات درمانی Healthfirst و چند شرکت فعال در حوزه رباتیک همانند UiPath، Ripcord و Blue Prism اشاره کرد.
سوامیسیواسوبرامانیان، از مدیران ارشد بخش یادگیری ماشینی شرکت آمازون در این خصوص عنوان کرد:
قابلیتها و تواناییهای تکسترکت به گونهای است که میتواند با دقت بسیار بالا، متون و اطلاعات ساختاریافته را از هر نوع متنی استخراج کند. همچنین، با ادغامسازی این سرویس با دیگر خدمات آمازون، شرکتها و سازمانها میتوانند عملکردی بهتر، امنیتی بالاتر و تصمیمگیری سریعتر را در کسبوکار خود تجربه کنند.
مرتبط:
کارمندان آمازون میتوانند در حین ساعات کاری بازی کامپیوتری انجام دهند