Thỉnh thoảng bạn phải quét các tài liệu tất cả chứa những ghi chú viết tay hoặc những trang xuất phát từ một cuốn sách. Thì giờ đây công nghệ dìm dạng ký kết tự quang học tập (OCR) sẽ có lại công dụng cho bạn. Công nghệ hữu ích này so với văn bạn dạng in hoặc viết tay và trở nên nó thành một tệp tin kỹ thuật số thường thì TIF có thể chỉnh sửa. Trong nội dung bài viết dưới đây, cửa hàng chúng tôi sẽ bàn bạc về cách thức công nghệ này hoạt động và lý do nó lại hữu ích.
Bạn đang xem: Phần mềm đặc biệt để nhận dạng chữ (ocr).
Đang xem: Phần mềm đặc biệt quan trọng để dấn dạng chữ (ocr).
OCR là gì?
OCR chế tạo một bạn dạng sao chuyên môn số của những ký từ bỏ viết tay, in hoặc tiến công máy đã có quét. Nghệ thuật này được sử dụng thoáng rộng để nhập dữ liệu, đặc biệt đối với các loại dữ liệu khác biệt được thu thập trên giấy, có thể là hóa đơn, hộ chiếu, tài liệu, danh thiếp, thư hoặc bản in.
tiện ích công nghệ dấn dạng ký tự quang học tập OCR 1″>
Khi văn bạn dạng được số hóa, tìm kiếm và chỉnh sửa văn bạn dạng có thể được thực hiện bằng điện tử. Cung cấp đó, bộ lưu trữ nhỏ dại gọn hơn và các tài liệu hoàn toàn có thể được hiển thị trực tuyến.
tác dụng công nghệ dìm dạng ký kết tự quang học tập OCR 2″>
Với công nghệ OCR này, doanh nghiệp công nghệ bậc nhất thế giới Google cũng mang đến ra phần mềm nguồn mở từ thời điểm năm 2006 với cái thương hiệu Tesseract OCR với giấy tờ của Apache.
lợi ích công nghệ nhấn dạng ký kết tự quang học OCR 3″>
ORC vận động như cố kỉnh nào?
Khi một trang in hoặc viết tay được quét, nó được lưu dưới dạng tệp ánh xạ bit có định dạng TIF. Bạn có thể đọc hình hình ảnh này lúc nó được hiện trên màn hình. Mặc dù nhiên, với đồ vật tính, nó chỉ là 1 trong những loạt những dấu chấm white color và đen. Nó chú ý vào từng loại của hình hình ảnh và xác minh xem chuỗi các chấm bao gồm khớp với một số hoặc chữ cái rõ ràng không.
Xem thêm: Bây Giờ Còn Nhớ Hay Không Đàm Vĩnh Hưng ), Lời Bài Hát Hoa Học Trò
tiện ích công nghệ thừa nhận dạng cam kết tự quang học tập OCR 4″>
Lợi ích OCR
Tìm tìm và thao tác dữ liệu
Khả năng của OCR để tạo nên văn bản nội dung của tư liệu được quét làm cho nó hoàn toàn có thể để tra cứu kiếm cùng xác xác định trí những phần của tài liệu bằng cách tìm kiếm mang đến từ khóa. Nó cũng được cho phép bạn chỉnh sửa tài liệu bằng trình xử lý văn bản.
Trợ giúp cho người mù và khiếm thị
Trình đọc màn hình rất có thể giải mã văn phiên bản và đọc những từ trên screen để những người khiếm thị rất có thể hiểu được.
Nhập tài liệu nhanh rộng
Nhìn chung, technology OCR gồm thể nâng cao đáng kể hiệu lực hiện hành và công dụng của quá trình văn phòng. Điều này là do trong phần lớn các văn phòng công sở cần nhu yếu lớn cho vấn đề quét tài liệu với năng suất cao và quy trình tác dụng hơn.
Câu hỏi thường gặp
OCR là một công nghệ rộng rãi để nhận dạng văn phiên bản bên vào hình ảnh, ví dụ điển hình như các tài liệu được quét và ảnh. Technology OCR được thực hiện để thay đổi hầu như ngẫu nhiên loại hình hình ảnh nào có chứa văn bạn dạng viết (đánh máy, viết tay hoặc in) thành dữ liệu văn bạn dạng có thể gọi được bằng máy.
Có lẽ ngôi trường hợp sử dụng được biết đến nhiều nhất mang lại OCR là biến hóa tài liệu giấy in thành tư liệu văn bản có thể đọc được bởi máy. Khi 1 tài liệu giấy được quét trải qua quá trình xử lý OCR, văn bản của tài liệu rất có thể được chỉnh sửa bằng những trình xử trí văn bản như Microsoft Word hoặc Google Docs.
Tesseract là một trong công cụ nhận dạng ký kết tự quang đãng học cho các hệ quản lý và điều hành khác nhau. Đây là phần mềm miễn phí, được desgin theo giấy tờ Apache, Phiên phiên bản 2.0 cùng sự phát triển đã được Google tài trợ từ thời điểm năm 2006. Năm 2006, Tesseract được coi là một một trong những công nắm OCR nguồn mở đúng đắn nhất.
Microsoft OneNoteSimpleOCRMicrosoft Office Document Imaging (MODI)Boxoft miễn phí OCRFreeOCR khổng lồ WordgImageReaderVueScan