Young Managers
مرکز مقالات علمی مدیریت 
پيوندهای روزانه

 اگر تاکنون دقت کرده باشید، همراه با نرم افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب میشود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.

یکی از این ابزارها، قابلیت OCR یا Optical Character Recognition نام دارد که در قالب دو نرمافزار Microsoft Office Document Scanning و Microsoft Office Document Imaging در قسمت Office Tools قرار گرفته است. قابلیت OCR صفحه اسکن شده را تحلیل و سپس متون موجود در آن را استخراج میکند.
همانطور که میبینید روش کار واضح است. ابتدا باید اسناد مورد نظر خود را به فرمت TIFF یا Tagged Image File Format اسکن کنید و سپس به کمک قابلیت OCR، آنها را به صورت Text درآورید. بدین ترتیب میتوانید متون یک کتاب یا هر نوشته دیگری را در نرمافزار Word یا سایر نرمافزارهای آفیس وارد و آنها را ویرایش کنید (این قابلیت تنها برای متون انگلیسی، فرانسه و اسپانیایی کاربرد دارد).

بدین منظور باید مراحل زیر را دنبال کنید:

روی دکمه استارت کلیک کنید.
عبارت All Programs را انتخاب کنید.
عبارت Microsoft Office را انتخاب کنید.
عبارت Microsoft Office Tools را انتخاب کنید.
در فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن کلیک کنید. اگر این عبارت وجود نداشت، باید آن را نصب کنید. بدین منظور سیدی نصب آفیس را در درایو سیدی قرار دهید. پس از نمایش صفحه Autorun، تیک عبارت Add or Remove Features را بزنید و روی دکمه Continue کلیک کنید. اکنون شما به صفحه سفارشی کردن نصب آفیس هدایت شدهاید. روی علامت (+) کنار عبارت Office Tools کلیک کنید تا شاخه مربوطه باز شود.

در این قسمت، روی آیکون عبارت Microsoft Office Document Imaging کلیک کنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب کنید. با فشردن دکمه Continue، فرآیند نصب آغاز میشود. پس از پایان مراحل نصب، مراحل یک تا پنج را بار دیگر تکرار کنید تا کادر محاورهای با عنوان Scan New Document نمایش داده شود.

در این پنجره میتوانید یکی از تنظیمات پیشفرض را برای اسکن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پیشفرض و یا ایجاد تنظیمات پیشفرض جدید، میتوانید روی دکمه Preset Options کلیک کنید و عملیات مورد نظر خود را (ساخت، ویرایش یا حذف تنظیمات پیشفرض) انتخاب کنید.
پیشنهاد میکنیم برای دستیابی به یک نتیجه مطلوب، تنظیمات پیشفرض اسکن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید. در عین حال اگر از چند اسکنر استفاده میکنید، میتوانید با کلیک روی دکمه Scanner...، اسکنر مورد نظر خود را انتخاب کنید.

پس از پایان تنظیمات اسکن، روی دکمه Scan کلیک کنید تا صفحه مورد نظر اسکن شود. اگر هنگام عملیات اسکن با پیغام خطایی مواجه شدید، به کادر Scan New Document بازگردید و در قسمت انتخاب اسکنر، تیک عبارتهای Use Automatic Document Feeder و Show Scanner Driver Dialog Before Scanning را بزنید و برای تأیید تنظیمات روی دکمه Ok کلیک کنید.

پس از پایان عملیات اسکن، روی دکمه Close کلیک کنید. اکنون صفحه اسکن شده در قالب فرمت تصویری TIFF و در نرمافزار Office Document Imaging Window نمایش داده شده است.

اگر مایلید که تنها قسمت خاصی از این فایل را استخراج کنید، باید دکمه چپ ماوس را نگه دارید و آن را روی قسمت مورد نظر بکشید.

در بالای صفحه، منوی Tools را انتخاب کنید.
زیرمنوی Send Text to Word را کلیک کنید تا پنجره مربوطه نمایش داده شود.
برای استخراج تمام متون فایل TIFF، تیک عبارت All Pages را بزنید. اما اگر میخواهید تنها متون انتخاب شده استخراج شوند، تیک عبارت Current Selection را بزنید.
اگر میخواهید خروجی عملیات تبدیل فایل TIFF به Text، فاقد تصاویر سند اسکن شده باشد، تیک عبارت Maintain Pictures in Output را بردارید.

پس از اتمام تنظیمات مربوطه، روی دکمه Ok کلیک کنید. با این کار، نرمافزار Word باز شده و فایل TIFF در قالب سند نوشتاری (Text) نمایش داده میشود. در صورت نیاز میتوانید آنها را ویرایش کنید.

علاوه بر روشی که در بالا به آن پرداختیم، در نرمافزار Document Imaging میتوانید فایلهای TIFF را به Text تبدیل کنید. بدین منظور از منوی File عبارت ... Import را انتخاب کنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دکمه Import کلیک کنید. اکنون میتوانید با طی کردن مراحل نه تا چهارده، متون فایل TIFF را استخراج نمایید.

باید به این نکته توجه داشته باشید که هنگام تحلیل یک صفحه توسط قابلیت OCR، احتمالاً با این پیغام خطا مواجه خواهید شد.

Unable to perform OCR in Farsi: این پیغام زمانی نمایش داده میشود که زبان انتخابی پیشفرض سیستم شما، فارسی باشد. برای رفع این مشکل از منوی Tools نرمافزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی کرکرهای OCR Language، زبان English را انتخاب کنید.

پوریا هدایتی شهیدانی

[ ] [ ] [ مدیر ]
.: Weblog Themes By Iran Skin :.

درباره وبلاگ

وبلاگ گروهی اساتید و دانشجویان رشته مدیریت دولتی مقطع کارشناسی ارشد دانشگاه آزاد اسلامی واحد بناب
موضوعات وب
RSS Feed