Dưới sự hướng dẫn của các giảng viên, hai sinh viên Huỳnh Hữu Lộc và Lưu Quốc Hải, Khoa Khoa học và Kỹ thuật máy tính Trường ĐH Bách khoa (ĐH Quốc gia TPHCM), đã viết nên phần mềm nhận dạng chữ viết tay, từ đó đem đến nhiều ứng dụng hữu ích trong cuộc sống.
Sinh viên Huỳnh Hữu Lộc đang thử nghiệm chương trình nhận dạng chữ viết tay. Ảnh: H.L
Độ chính xác là 84%
Nhận dạng chữ viết tay là một đề tài rất quan trọng trong những ứng dụng khác nhau như tình báo, kỹ thuật robot... Các nghiên cứu về nhận dạng chữ viết tay đã được phát triển từ hơn nửa thập kỷ qua và đạt được nhiều thành quả thiết thực tại nhiều nước trên thế giới. Tuy nhiên, ở VN vẫn còn ít người nghiên cứu. Theo Lưu Quốc Hải, nghiên cứu này tập trung vào nhận dạng chữ viết gián tiếp dựa trên thông tin tĩnh, nghĩa là chương trình sẽ thông dịch các ký tự, các chữ hay các đoạn văn được viết trên các mẩu giấy hoặc các bề mặt khác. Từ đó, có thể ứng dụng trên các thiết bị di động như viết trực tiếp lên màn hình mà các thiết bị này vẫn hiểu được, thay vì phải dùng đến bàn phím. Hoặc có thể giúp máy tính đọc chữ được scan lại dưới dạng hình ảnh và chuyển thành dạng văn bản. Ngoài ra, có thể dùng phần mềm này để giúp máy tính, robot đọc các văn bản viết trên giấy.
Phương pháp nhận dạng của Hải và Lộc bao gồm hai bước: làm mỏng nét ký tự và rút trích thông tin đặc trưng. Cụ thể, làm mỏng nét ký tự là loại bỏ các thông tin dư thừa về hình dạng để giữ lại bộ khung ký tự. Quá trình này sẽ giúp giảm nhiễu cho các lỗi trong quá trình quét ảnh, hoạt động viết của con người, chuẩn hóa dữ liệu và nén dữ liệu. Kế đó, bước rút trích thông tin đặc trưng sẽ được thực hiện. Bước này đóng vai trò quan trọng nhất trong nhận dạng chữ viết tay vì giúp tránh những phức tạp của chữ viết tay cũng như tăng cường độ chính xác. Khi đó, ta cần phải biểu diễn thông tin chữ viết dưới những dạng đặc biệt hơn và cô đọng hơn, rút trích các đặc điểm riêng nhằm phân biệt các ký tự khác nhau.
Theo các tác giả, do chữ viết tay của mỗi người mỗi khác nên không thể thu thập được tất cả các nét chữ của từng người để cho máy có thể nhận diện mà chỉ có thể dựa trên một số mẫu nào đó để nhận ra các nét chữ của những người viết khác nhau. Vì thế, các tác giả đã xây dựng một mạng nơ ron nhân tạo để giải quyết vấn đề này. Mạng này bao gồm một tập mẫu gồm các chữ viết tay của 30 người khác nhau. Mỗi mẫu là 26 file tương ứng với 26 ký tự Latin. Chương trình cũng đã được đưa vào kiểm tra thực tế trên nhiều người dùng khác nhau. Theo đó, mỗi người sẽ sử dụng phần mềm viết 26 ký tự và cho chương trình chạy. Kết quả cho thấy độ chính xác trung bình thu được là 84%.
Tốc độ nhận dạng 1.000 ký tự/giây
Theo Lưu Quốc Hải, hiện nay công trình đã đạt được kết quả ở giai đoạn nhận dạng từng ký tự riêng lẻ. Tốc độ nhận dạng trung bình là 1.000 ký tự/giây. Không dừng lại ở đó, hướng phát triển sắp tới của nhóm là tăng cường và bổ sung một số đặc điểm khác để tăng độ tin cậy và lưu những thông tin chính xác hơn về đặc trưng của ký tự. Mặt khác, sẽ cố gắng áp dụng các giải thuật phân mảnh có khả năng đọc một từ gồm nhiều ký tự viết dính liền nhau, dẫn tới khả năng có thể đọc được cả một đoạn văn bản.
Với kỹ thuật này, chúng ta có thể thay thế hoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các thiết bị di động và mở rộng việc nhận dạng lên các bề mặt khác như giấy viết, bảng, biển số xe cũng như khả năng đọc chữ cho robot.
Hải cho biết rằng nhóm còn có ý tưởng lấy nghiên cứu này làm tiền đề để tạo thị giác cho máy tính, giúp tạo nên những robot biết nhìn chữ viết của người để đọc thành tiếng, ứng dụng cho việc dạy trẻ em tập đọc, giúp người khiếm thị có thể hiểu được các đoạn văn bản sau khi được các robot này “phiên dịch” và đọc lại...