Convert Image

**tuthan7388** · 19-08-2009, 14:37

Nếu bạn chỉ đơn giản là muốn convert image sang text chỉ để đọc hiểu cơ bản tình tiết truyện thì các bạn nên dùng Readiris Pro 11 Mr.Underground Edition --> hiểu được 85-90% đó.

Còn nếu bạn muốn đọc chính xác thì sẽ phải mất nhiều công sức hơn.
Theo kinh nghiệm bản thân thì mình vẫn thường kết hợp 2 file convert từ 2 phần mềm ABBYY FineReader 9.0 Professional Edition+Readiris Pro 11 Mr.Underground Edition+ chỉnh sửa lại mới được bản text hoàn chỉnh.
Đây là link tui mới up lên. Đảm bảo sạch.
phần mềm ABBYY FineReader 9.0 Professional Edition

http://www.megaupload.com/?d=UCE0OV42
http://www.megaupload.com/?d=3AY3A13F
http://www.megaupload.com/?d=JASVUS32

Phần mềm Readiris Pro 11 Mr.Underground Edition

http://www.megaupload.com/?d=HYYBTWL0
http://www.megaupload.com/?d=289ASE0T

add on để Readiris 11 convert được tiếng trung

http://www.megaupload.com/?d=9HGPL3D2

Đầu tiên là cài đặt.
Bạn cài Readiris11 xong thì phải coppy hết các file nhỏ trong foder Readiris11 add-on vào thì mới có thể đọc được tiếng Trung.
Cài ABBY xong phải chọn tiếng Trung ( cái chinese Simpli..ấy )

Bây giờ là convert:
Bước 1
Bạn mở Readiris11 cho đến khi hiện như bảng sau. Bạn phải chọn 2 cái đánh dấu nó mới chạy được mà không lỗi.

Tiến hành convert được file .rtf dạng như sau. Bạn sẽ thấy các chữ nó chồng lên nhau không thể nhìn được.
Ấn ctrl+A để bôi đen rùi coppy

Paste vào chương trình dịch. ( mình dùng chương trình của bác vvtlove -có trong ttv đó)

Ấn thực hiện . Rùi coppy phần tiếng Trung . ( bây giờ nó không bị trùng nữa rùi)

Coppy phần Tiếng Trung đó ra Word .

Bước 2:
Mở ABBYY ra. tiến hành convert file ảnh. ( nhớ phải chọn phần tiếng Trung rùi nhé.)
Ấn F8 được giao diện. Phần trên là file doc bạn convert được. Phần dưới là file ảnh Gốc. ( bạn có thể chỉnh zoom để nó to lên cho dễ nhìn)

Bây giờ bạn bắt đầu xoát từng chữ một. Mỗi khi đến một chữ nó sẽ ảnh vàng của chữ gốc bên dứoi.
Trong hình vẽ là một chữ convert ra sai. Bạn Click chuột phải.
Số 1 là vị trí của chữ trong file doc
Số 2 là vị trí của chữ trong file image.
Số 3 là chữ chuẩn.
Số 4 là danh sách chữ đồng dạng.
(bạn hãy so sánh trong 4 với 3 xem cái nào trùng thì chọn)

Tuy nhiên không phải lúc nào bạn cũng có được chữ trùng hợp.
Đôi khi click chuột phải lại không ra mà chỉ được như hình vẽ

Lúc này bạn cần đến file doc thu được sau khi convert bằng Read..11 ( file coppy ra Word ở bước 1 )
Bạn hãy dò từng dòng với file ảnh để tìm chữ phù hợp

Bạn hãy chọn chữ đó rùi coppy vào ABBYY đúng với vị trí của chữ cần tìm.
Tuy nhiên không phải lúc nào cũng có chữ trùng trong file doc với ảnh gốc.
VD :

Lúc này bạn mở file ảnh gốc ra ( bằng Paint cũng được)
Bạn Cut riêng cái chữ khó chju ấy ra. Để riêng một chỗ.

Đồng thời đánh dấu vị trí của chữ đó trong ABBYY ( Cái chữ No đó)

Cứ như vậy xoát từng chữ cho hết chương.
Tập hơp nhũng chữ riêng bạn không tìm được ở trên lưu lại trong thành file image sau đó lại sử dụng ABBYY convert cái file image mới có để tìm được những chữ đó.
Vd như trong hình vẽ.
Ô khoanh tròn là những chữ không tìm được trong chương truyện.
Những hàng còn lại là mình coppy ra mấy lần để cho khi convert lại dễ tìm hơn.

Bạn cứ làm như vậy là có thể hoàn thành chương truyện thui.
Khá tốn time đó.

Vấn đề bạn convert ra file ảnh thì thỉnh thoảng vẫn gặp với một số image quá ngắn.
Khuyến khích bạn sử dụng với file ảnh truyện . DCLM chẳng hạn

Note:
Đôi khi có những từ tiếng Trung khá là giống nhau, nhưng nghĩa thì khác hẳn.
Vì vậy sau khi chỉnh image được một đoạn bạn nên dịch sang Vietphrase để xem nghĩa. Thấy nó chuối chuối hoặc hơi khó hiểu thì 90% là đoạn đó vẫn còn sót chữ sai.

**vaan_2410** · 19-08-2009, 15:45

hướng dẫn của bạn khá dễ hiểu. cho mình hỏi cái ABBYY FineReader 9.0 Professional Edition có chức năng ghi nhớ lại các chữ đã bị nhận sai được chỉnh sửa lại không để nếu lần sau convert file ảnh khác lại gặp phải đúng chữ đó thì sẽ nhận dạng đúng chứ không bị sai nữa.

Nếu như có chức năng ghi nhớ lại thì mình có 1 mẹo nhỏ đó là tìm 1 file ảnh có nguồn từ qidian.com (trang truyện chính). sau đó kiếm file text của file ảnh này (các truyện sau 1 thời gian sẽ có text chính xác).

khi convert file ảnh ra có thể dùng bản kết quả để so sánh với file text gốc, sửa những từ sai và ghi nhớ lại để lần sau không mắc phải. cứ thế sẽ dần ít từ bị lỗi. khi từ điển lỗi tích cóp được khoảng vài nghìn từ thì hầu như đều đã convert được hết các chương truyện mà ko bị lỗi

**InSoul** · 20-08-2009, 01:10

Nghề chơi của bạn cũng lắm công phu

**tuthan7388** · 20-08-2009, 05:53

Gửi bởi vaan_2410

hướng dẫn của bạn khá dễ hiểu. cho mình hỏi cái ABBYY FineReader 9.0 Professional Edition có chức năng ghi nhớ lại các chữ đã bị nhận sai được chỉnh sửa lại không để nếu lần sau convert file ảnh khác lại gặp phải đúng chữ đó thì sẽ nhận dạng đúng chứ không bị sai nữa.

Nếu như có chức năng ghi nhớ lại thì mình có 1 mẹo nhỏ đó là tìm 1 file ảnh có nguồn từ qidian.com (trang truyện chính). sau đó kiếm file text của file ảnh này (các truyện sau 1 thời gian sẽ có text chính xác).

khi convert file ảnh ra có thể dùng bản kết quả để so sánh với file text gốc, sửa những từ sai và ghi nhớ lại để lần sau không mắc phải. cứ thế sẽ dần ít từ bị lỗi. khi từ điển lỗi tích cóp được khoảng vài nghìn từ thì hầu như đều đã convert được hết các chương truyện mà ko bị lỗi

Theo mình nhận thấy thì ABBYY không có chức năng này bạn ạ. Có thể nói chức năng này gần như là không thể. Vì ABBYY quét ảnh để nhận dạng chữ nên nhiều chữ gần gần giống nhau thường dễ bị sai.
Đặc điểm của ABBYY là càng những chữ đơn giản lại càng dễ bị sai vì dạng chữ này thường hay giống nhau. Còn những chữ loằng ngoằng nhiều nét thì hầu như trăm chữ mới có 1 chữ sai.
Ví dụ như chữ 几 ( kỷ) và chữ 儿 (nhân) chẳng hạn. Hai chữ này thường xuyên bị ABBYY nhầm lẫn.
ngoài ra chữ 一 (nhất) thường xuyên bị ABBYY bỏ qua.

**ingram** · 29-08-2009, 05:03

Đa tạ bác tử thần công đức vô lượng, cho mình hỏi, chương trình này có support dạng gif ko vì mình down file image xuong toàn dạng gif ko ah.

Chủ đề: Convert Image

Công cụ Chủ đề

Convert Image

Thông tin về chủ đề này

Users Browsing this Thread