Trích xuất nội dung văn bản từ hình ảnh nhanh chóng

Hiện tại, vì công việc quá bận rộn nên mình không còn thời gian để post bài và duy trì nội dung cho blog nữa. Do đó tại thời điểm này, mình quyết định ngừng phát triển blog. Mọi bài viết sẽ vẫn được lưu trữ và mình sẽ cố gắng hỗ trợ tất cả các bạn khi có comment hỏi. Cảm ơn các bạn đã ủng hộ blog suốt thời gian qua !
I2OCR là một dịch vụ nhận dạng kí tự quang học mạnh mẽ có thể chuyển các văn bản, fax, ảnh chụp đã được scan thành định dạng văn bản thuần túy để bạn có thể chỉnh sửa với tốc độ làm việc cực nhanh và kết quả tốt mà không phải trải qua các quá trình đăng kí phức tạp.

Đầu tiên bạn truy cập vào địa chỉ http://www.sciweavers.org/free-online-ocr. Trong mục Image bạn chọn File để sử dụng tập tin ảnh sẵn có trên máy tính hay chọn URLđể sử dụng liên kết ảnh trên Internet. i2OCR hỗ trợ rất nhiều các định dạng ảnh như TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM với file ảnh upload lên có dung lượng tối đa 10MB.Kế đến chọn ngôn ngữ ở mục Language xong nhấn nút Convert. Kết quả sẽ được hiển thị ở phần Download Text ở ngay bên dưới. Bạn bôi đen nội dung văn bản và sao chép vào các trình soạn thảo văn bản để xử lý.
Dịch vụ này có thể nhận diện các tài liệu của hơn 30 ngôn ngữ phổ biến như tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, Ý, Nga, Trung Quốc.. và có cả Việt Nam. Tuy nhiên khả năng nhận diện Tiếng Việt thực sự chưa được tốt cho lắm. Ngoài ra để việc nhận diện được tốt nhất, ảnh phải có độ phân giải ít nhất 200dpi.
 

Web Design Technology blogs [ itdl ] Auto Backlink

HomeBlog ArchiveServicesLink2MeContactSubmit your PostPost RSS

Copyright © 2012 [ itdl ] Just for Share. Designed by Ngoc Luong - Freelancer

Best view in Chrome 11+, Firefox 5+ with resolution 1024 x 768 pixel. Powered by Blogger.