View Single Post
Old 24-03-2009, 08:13 AM   #1
Hồ sơ
myhanh
 
myhanh's Avatar
 
Tham gia ngày: Dec 2004
Cư ngụ: Love Planet
Tuổi: 43
Số bài viết: 7,404
Tiền: 0
Thanks: 2,122
Thanked 5,464 Times in 2,040 Posts
myhanh is on a distinguished road
Default Chuyển tập tin hình thành doc

Hôm qua có người nhờ myhanh chuyển những tập tin hình ảnh từ máy scan (jpg) thành những tập tin microsoft word. Nếu như đây là những văn bản Tiếng Anh thì rất dễ rùi nhưng lại là văn bản Tiếng Việt.
Văn bản Tiếng Việt thì phải dùng VNDocr của Viện công nghệ thông tin rùi.
Tải VNDocr 4.0 phiên bản thử nghiệm tại đây
Phần mềm này chỉ nhận dạng được ảnh đen trắng thôi.
Vậy chúng ta cần phần mềm xử lý ảnh. Tốt nhấn cho ảnh .tif là IrfanView
. Irfanview là phần mềm miễn phí có thể tải về tại đây.
Để chuyển hình màu thành đen trắng bằng Irfanview ta làm như sau:
- Mở chương trình IrfanView 4.1, chọn File > Patch conversion/rename. Một hộp thoại xuất hiện. Trong phần Look in bạn chọn dường dẫn tới nơi bạn đã lưu file ảnh ở bước 2. Chọn tất cả hình cần rồi bấm Add.
- Bấm chọn vào Use advanced options > Advanced > Change color depth > 2 color (black/white) (1BPP) > OK.
- Chọn nơi lưu file trong mục Output directory for result files, chọn Patch để chương trình bắt đầu làm việc.
Sau đó dùng VnDocr để nhận dạng các file hình TIF.
Tuy nhiên đây là bảng trial nên không cho phép chúng ta lưu lại. Bạn hãy mở tập tin MS Wordrồi drag & drop từng khối văn bản trong VnDocr sang tập tin MS Word.

__________________
Necessity is the mother of in(ter)vention.
Speak softly & carry a big stick.
My Technical Blog
myhanh is offline   Trả Lời Với Trích Dẫn
Đã có thành viên gửi lời cám ơn đến myhanh vì bạn đã đăng bài:
phanphuong (24-03-2009)