Trang chủ » Máy tính để bàn » Công cụ OCR miễn phí để trích xuất văn bản từ hình ảnh - Tốt nhất

    Công cụ OCR miễn phí để trích xuất văn bản từ hình ảnh - Tốt nhất

    Nếu bạn đang tìm cách trích xuất văn bản từ một hình ảnh, thì công cụ OCR là thứ nên sử dụng. Công cụ nhận dạng ký tự quang học (OCR) có thể quét và trích xuất văn bản ra khỏi hình ảnh và cho phép bạn thực hiện bất kỳ thay đổi cần thiết.

    Trong bài viết này, tôi sẽ liệt kê công cụ OCR miễn phí tốt nhất có sẵn cho các nền tảng khác nhau. Để thử nghiệm, tôi đã thay đổi định dạng của một vài đoạn văn bản thành một phông chữ viết tay khá phức tạp và chụp ảnh màn hình. Tôi cũng đã thử văn bản bình thường, nhưng những công cụ này tạo ra kết quả hoàn hảo.

    Giới hạn của OCR

    Trước khi đi vào các công cụ OCR, điều quan trọng là phải hiểu OCR có thể làm gì cho bạn và những hạn chế của nó là gì.

    Nếu văn bản trong ảnh bị mờ hoặc nó không tập trung, thì quét OCR sẽ không hoạt động đúng và kết quả sẽ không được hài lòng ở tất cả. Điều này cũng đúng với hình ảnh có sét kém và bất kỳ loại biến dạng nào khác. Trong trường hợp như vậy, văn bản trích xuất chủ yếu sẽ bao gồm các nhân vật ngẫu nhiên.

    Tôi cũng nên đề cập đến điều đó cả máy được tạo và văn bản viết tay đều có thể được trích xuất sử dụng công nghệ OCR. Mặc dù độ chính xác của văn bản viết tay có thể không cao bằng văn bản do máy tạo.

    Ngoài ra, có nhiều các loại OCR phương pháp được sử dụng bởi các công cụ này và vì vậy độ chính xác của văn bản trích xuất cũng phụ thuộc vào phương pháp được sử dụng.

    Công cụ Windows OCR

    FreeOCR

    FreeOCR chắc chắn là công cụ OCR miễn phí dễ sử dụng nhất cũng mang lại kết quả hài lòng. Nó có thể mở tệp PDF, quản lý hình ảnh, chọn vị trí trong hình ảnh bạn muốn quét và thậm chí quét trực tiếp tài liệu bằng máy quét. Thật thú vị, nó cquét tài liệu nhiều trang cùng một lúc, và bạn cũng có thể quét văn bản bằng nhiều ngôn ngữ.

    Tải xuống FreeOCR

    OCR sang Word

    Như tên cho thấy, OCR to Word cho phép bạn trích xuất văn bản từ hình ảnh và sau đó xuất văn bản thành tập tin từ. Mặc dù nó không làm tốt việc trích xuất văn bản từ hình ảnh thử nghiệm mà tôi đang sử dụng, nhưng khi tôi sử dụng nó một chút dễ đọc văn bản nó đã làm một công việc thậm chí còn tốt hơn công cụ FreeOCR đã đề cập ở trên.

    Tải xuống OCR về Word

    Microsoft OneNote

    Nếu bạn có bộ Microsoft Office, thì bạn đã cài đặt Microsoft OneNote. Nếu không, bạn cũng có thể tải về riêng. OneNote cũng cho phép bạn quét hình ảnh trong ghi chú của mình để trích xuất văn bản. Chỉ cần nhấp chuột phải vào hình ảnh và chọn “Sao chép văn bản từ hình ảnh”. Văn bản sẽ được sao chép vào bảng tạm và bạn có thể dán nó vào bất cứ đâu bạn muốn.

    Tải xuống Microsoft OneNote

    Công cụ OCR trực tuyến

    OCR trực tuyến miễn phí

    Công cụ OCR trực tuyến miễn phí cho phép bạn trích xuất văn bản trong tối đa 46 ngôn ngữ và bạn có thể nhận kết quả dưới dạng tệp từ hoặc văn bản thuần túy. Kết quả cũng không quá tệ và có thể được chỉnh sửa để hoàn thiện. Bạn sẽ phải đăng ký nếu bạn muốn truy cập tất cả các ngôn ngữ và hình ảnh hàng loạt OCR.

    OCR miễn phí

    OCR miễn phí cũng là một công cụ tốt nếu hình ảnh bạn có dưới giới hạn kích thước tệp tối đa 6MB. Nó hỗ trợ tới 29 ngôn ngữ và kết quả quét OCR cũng khá tốt.

    Quét Google Drive OCR

    Google Drive cũng có một hệ thống OCR tích hợp để trích xuất văn bản từ hình ảnh. Nếu hình ảnh văn bản trên Google Drive, nhấp chuột phải vào nó và chọn Tài liệu Google từ Mở với thực đơn.

    Hình ảnh sẽ mở trong Google Docs dưới dạng tài liệu mới và văn bản trích xuất sẽ ở dưới nó. Theo kinh nghiệm của tôi, quét Google Drive OCR đã mắc nhiều lỗi chính tả, nhưng có ít ký tự ngẫu nhiên hơn, không giống như các công cụ OCR khác. Bạn có thể đọc thêm về nó từ bài viết của chúng tôi ở đây.

    Tiện ích mở rộng OCR Chrome

    Nếu hình ảnh bạn muốn trích xuất văn bản được tìm thấy trực tuyến, bạn có thể sử dụng một số tiện ích mở rộng OCR tiện dụng trên Google Chrome cho điều đó.

    Cá chép

    Copyfish sẽ cho phép bạn chọn bất kỳ khu vực nào trong trình duyệt của bạn để quét và sử dụng công nghệ OCR. Thật thú vị, Copyfish bỏ qua tất cả những từ mà nó không hiểu hoàn toàn và chỉ cho thấy cái mà nó trích xuất hoàn hảo hoặc ít nhất là rất gần. Nó sẽ hiển thị từ được quét trong màu cam.

    Dự án Naptha

    Một phần mở rộng rất tuyệt tự động làm cho tất cả các hình ảnh trên trang web có thể chỉnh sửa và bạn có thể chọn chúng để sao chép văn bản của chúng. Tôi không tìm thấy phần mở rộng để hoạt động tốt trên văn bản nhỏ hơn trong hình ảnh, nhưng nó làm việc hoàn hảo trên văn bản kích thước lớn với một vài vấn đề về định dạng.

    Công cụ Linux OCR

    Tesseract OCR

    Đây là công nghệ OCR mã nguồn mở đang được sử dụng bởi nhiều công cụ OCR, bao gồm FreeOCR mà tôi đã đề cập khi bắt đầu. Hiện tại, nó đang được quản lý bởi Google và cung cấp trích xuất văn bản đáng tin cậy.

    Tải xuống Tesseract OCR

    Hình nêm

    Cuneiform cũng là một công cụ OCR mã nguồn mở đáng tin cậy hoạt động cho người dùng Linux. Và nó được biết đến với làm việc tốt hơn cho văn bản viết tay so với các công cụ OCR khác.

    Tôi không có cơ hội dùng thử các công cụ này trên Linux, nhưng đây là một cách nhanh chóng so sánh các công cụ OCR này để cho bạn một ý tưởng.

    Tải về chữ hình nêm

    Công cụ di động OCR

    Văn bản cổ tích

    Text Fairy là một trong những ứng dụng OCR phổ biến nhất dành cho Android hoàn toàn miễn phí và không hiển thị bất kỳ quảng cáo nào. Nó có một biên tập viên đáng tin cậy để chỉnh sửa cả quan điểm văn bản và hình ảnh và bạn có thể trích xuất văn bản trong tối đa 50 ngôn ngữ.

    Tải xuống Text Fairy cho Android

    Google Keep

    Ứng dụng ghi chú phổ biến của Google cũng được tích hợp công cụ OCR tiện dụng. Chỉ cần nhập hình ảnh trong ghi chú và nhấn vào ba chấm thực đơn. Từ menu chọn Lấy văn bản hình ảnh và Google Keep sẽ bắt đầu quét. Sau khi quét, văn bản sẽ được hiển thị ngay trên ghi chú.

    Với Google, kết quả thật đáng kinh ngạc cho hình ảnh thử nghiệm của tôi và nó trích xuất văn bản với độ chính xác hơn 90%. Phải thử tôi sẽ nói.

    Tải xuống Google Keep cho Android | iOS

    Tiếng Anh OCR

    Một công cụ OCR rất tốt cho người dùng iOS đó là hoàn toàn miễn phí và cung cấp độ chính xác đáng tin cậy khi trích xuất văn bản. Mặc dù nó có chứa quảng cáo, nhưng bạn có thể mua Phiên bản chuyên nghiệp không có quảng cáo.

    Tải xuống tiếng Anh OCR cho iOS

    Tóm lược

    Cần lưu ý rằng hình ảnh tôi sử dụng để thử nghiệm rất phức tạp, đó là lý do tại sao những hình ảnh này công cụ hoàn toàn thất bại hoặc kết quả không hoàn hảo. Trong hầu hết các trường hợp, bạn sẽ không phải xử lý các hình ảnh văn bản phức tạp như vậy và kết quả của bạn sẽ tốt.

    Google Keep cho thấy kết quả tốt nhất cho hình ảnh thử nghiệm Tôi đã sử dụng, nhưng điều này không có nghĩa là nó tốt nhất vì nó vẫn phụ thuộc vào loại hình ảnh và phương pháp OCR.

    tôi cũng vậy khuyên bạn nên kiểm tra phần mềm OCR trả phí Abbyy Finerhead nếu những điều trên không làm việc cho bạn. Đây là một phần mềm thương mại mạnh hơn nhiều so với bất kỳ công cụ miễn phí nào. Tuyệt vời nhất, bạn có thể dùng thử phiên bản dùng thử miễn phí để xem nó có hoạt động tốt cho tệp hình ảnh văn bản của bạn hay không.