داده‌ها نقش مهمی در فعالیت­های جاری سازمان­ها بازی می‌کنند. در واقع امکان حرکت درست و سریع داده‌های در یک سازمان مانند جریان خون در بدن، تندرستی و صحبت فرایندها و کارکردهای اصلی سازمان را تضمین می‌کند. اما به دلیل وجود کانال­های مختلف ایجاد و تولید داده در سازمان­ها بسیاری از اوقات اسناد ساخت‌یافته(Unstructured Documents) تولید می‌شوند.
اسناد ساخت‌یافته مانند اسناد اسکن‌کننده، فایل­های word و pdf و حتی فایل­های صوتی و تصویری ذخیره­ شده‌اند. در این  داده‌ها امکان جستجو، پردازش و تحلیل وجود ندارد و این مساله بسیاری از اوقات موجب می‌شود که یک سازمان به بخش زیادی از داده‌های خود دسترسی قابل استفاده نداشته باشد.
 

استخراج­ گر اسناد انیگمایند

این سرویس با استفاده از فناوری­­های مختلف مرتبط با استخراج متن اطلاعات ذخیره‌شده در اسناد مختلف را بازیابی می‌نماید. فهرست مستنداتی که در این سرویس پشتیبانی می‌شود عبارت است از:

  • تصاویر اسکن شده از اسناد چاپی
  • فایل­های Word و PDF

در استخراج اطلاعات از اسکن‌کننده از فناوری OCR یا تشخیص نویسه‌های نوری(Optical Character Recognition) استفاده می‌شود. این فناوری با استفاده از روش­های پردازش تصویر متن­های تصویر را استخراج می‌نماید.
یکی از مهم ترین مزیت های این سیستم صرفه جویی در نیروی انسانی و استفاده بهینه از نیروی انسانی است. این سیستم می تواند کمک افرادی شود که صرفا وظیفه تبدیل عکسها و فایل های پی دی اف را به متن قابل ویرایش دارند. همچنین چون کل فرآیند به وسیله ماشین انجام می شود می توان از خطای انسانی و اشتباه تایپی نیز جلوگیری کرد.
موارد زیر از کاربردهای قابل ذکر برای این سرویس است:

  • تبدیل اسناد پرینت شده به اسناد قابل ویرایش و ذخیره سازی
  • اتومات کردن ورود داده به سیستم
  • ایندکس کردن اسناد برای جستجو و تحلیل
  • دسترسی بهتر به اسناد و مدارک
  • قابلیت ذخیره سازی بهتر و راحت تر
  • قابلیت پشتیبان گیری از داده های فیزیکی به صورت دیجیتالی