Từ nhiều năm nay, Abbyy FineReader được biết đến như một đại gia trong lĩnh vực nhận dạng ký tự quang học (OCR). Đặc biệt, gần đây nhà sản xuất đã nâng cấp lên phiên bản mới Pro 8.0 với nhiều chức năng nổi bật. Bạn có thể download chương trình (dung lượng 56.8 MB) tại địa chỉ: http://fr7.abbyy.com/fr80/FR80PE_TB_EGFD.exe hay http://tinyurl.com/2mmbs7 (xem hướng dẫn cách đăng ký tại http://tinyurl.com/28ntdh).
Sau đây là những gợi ý khai thác:
- Hỗ trợ nhận dạng nhiều ngôn ngữ: tính đến thời điểm này, chương trình hỗ trợ đến 179 ngôn ngữ, trong đó có 36 ngôn ngữ được tích hợp từ điển dùng để kiểm tra lỗi chính tả nội dung văn bản sau khi xử lý.
- Tăng 30% (so với phiên bản 7.0) về độ chính xác: trong phiên bản mới này, chương trình nhận dạng tốt cả những hình ảnh hay bản fax có độ phân giải thấp. Tuy nhiên, nếu kết quả thu được vẫn chưa làm bạn thật sự hài lòng, bạn hãy sử dụng chức năng Correct resolution (Ctrl+Shift+T), chắc chắn kết quả sẽ làm cho bạn ưng ý hơn. Ngoài ra, đối với những bản scan có đường biên (border) bị lẹm đen ảnh hưởng phần nào đến độ chính xác, bạn nên dùng công cụ Crop (Ctrl+Shift+C) để xén bỏ.
- Hỗ trợ nhiều định dạng: chương trình nhận dạng được hầu hết các file ảnh phổ biến (không nhất thiết phải là ảnh đen trắng) kể cả tập tin pdf hoặc tiff nén theo chuẩn lzw. Ngoài ra, nó còn “ôm” luôn cả những file ảnh được chụp bằng máy ảnh kỹ thuật số và cho phép bạn tùy chọn xuất ra đến 11 định dạng: rtf, doc, xml, xls, pdf, html, ppt, txt, dbf, csv, lit. Nếu cần, bạn có thể thiết lập lại các thông số liên quan cho từng định dạng trong cửa sổ Formats settings (Ctrl+Shift+X).
- Hỗ trợ các siêu liên kết: trong khi xử lý, nếu gặp các siêu liên kết (hyperlink) như địa chỉ email, trang web..., chương trình sẽ tái lập y như văn bản gốc.
- Hỗ trợ hai chế độ nhận dạng: ngoài chế độ mặc định là Thorough (kỹ), chương trình hỗ trợ thêm chế độ Fast giúp bạn nhận dạng nhanh chóng những văn bản có “cấu trúc” giản đơn hay có độ phân giải tối ưu (Ctrl+Shift+O, chọn thẻ Read trong cửa sổ Options để thay đổi).
- Thêm thông tin liên quan: trước khi xuất nội dung đã xử lý ra file kết quả, bạn có thể “add” các thông tin về người chủ sở hữu của tài liệu thông qua hộp thoại Properties (menu File > Document properties) như tiêu đề (title), tên tác giả (author), từ khóa...
- Hỗ trợ mở nhiều file ảnh: bạn có thể kết hợp với phím Ctrl hoặc Shift để mở nhiều file ảnh (trong cùng một thư mục) cho chương trình xử lý cùng lúc.
- Nhận dạng text trong các màn hình hiển thị: đây là một chức năng hết sức hữu ích và tiện lợi khi bạn muốn trích xuất nội dung hiển thị trong các cửa sổ. Để kích hoạt, bạn truy cập đến menu Start > Programs > ABBYY FineReader 8.0 và bấm chọn lệnh ABBYY Screenshot Reader. Tùy theo ngôn ngữ xuất hiện, bạn hãy chọn ngôn ngữ nhận dạng cho phù hợp (tùy chỉnh thông qua biểu tượng hình bánh xe xích). Chương trình hỗ trợ cho bạn đến 9 tùy chọn như Text to clipboard, Table to MS Excel, Image to file...
- Chức năng tự động xử lý nhiều thao tác: không gì tiện lợi bằng chỉ cần ra lệnh một lần và đợi lấy kết quả. Điều này là nhờ vào chức năng Automation manager (Ctrl+T), giúp bạn tùy biến để xử lý hàng loạt các tác vụ theo kiểu “1-2-3” mà theo cách thông thường bạn phải tốn nhiều thời gian. Để tạo ra các lệnh “batch”, bạn hãy bấm chọn vào tên một trong 3 lệnh sẵn có, bấm nút Copy, bấm tiếp nút Modify để tùy biến. Sau đó, bạn nhớ đặt lại tên cho khác biệt và cũng là để dễ hình dung.
- Chức năng lập lịch xử lý: chỉ có khi được nâng cấp lên phiên bản ABBYY FineReader 8.0 Corporate Edition. Nếu bạn có quá nhiều tài liệu cần xử lý, nhưng “đêm đã khuya”, thì chức năng ABBYY Hot Folder & Scheduling sẽ thật sự hữu dụng. Công việc của bạn là chỉ định thư mục lưu file ảnh và ấn định thời gian, các thao tác còn lại, chương trình sẽ đảm nhận hết.
Chương trình vẫn còn một số tính năng quan trọng khác như tìm kiếm nội dung văn bản sau khi xử lý, nhận dạng nền (background recognition)... đang chờ bạn khám phá.
n Lưu ý:
Mặc dù Abbyy FineReader hỗ trợ nhận dạng được rất nhiều ngôn ngữ, nhưng vẫn vắng bóng các ngôn ngữ châu Á như Nhật, Trung, Hàn. Vì thế nếu cần, bạn phải nhờ đến “người anh em” Readiris 11 Pro Asian - xem thông tin tại http://tinyurl.com/26o7un. Riêng với tiếng Việt, bạn hãy sử dụng “mẹo” đã áp dụng cho phần mềm Aqua Deskperience (LBVMVT 193).
NGUYỄN THÁI VŨ