Nếu bạn chỉ đơn giản là muốn convert image sang text chỉ để đọc hiểu cơ bản tình tiết truyện thì các bạn nên dùng Readiris Pro 11 Mr.Underground Edition --> hiểu được 85-90% đó.
Còn nếu bạn muốn đọc chính xác thì sẽ phải mất nhiều công sức hơn.
Theo kinh nghiệm bản thân thì mình vẫn thường kết hợp 2 file convert từ 2 phần mềm ABBYY FineReader 9.0 Professional Edition+Readiris Pro 11 Mr.Underground Edition+ chỉnh sửa lại mới được bản text hoàn chỉnh.
Đây là link tui mới up lên. Đảm bảo sạch.
phần mềm ABBYY FineReader 9.0 Professional Edition
Phần mềm Readiris Pro 11 Mr.Underground Edition
add on để Readiris 11 convert được tiếng trung
Đầu tiên là cài đặt.
Bạn cài Readiris11 xong thì phải coppy hết các file nhỏ trong foder Readiris11 add-on vào thì mới có thể đọc được tiếng Trung.
Cài ABBY xong phải chọn tiếng Trung ( cái chinese Simpli..ấy )
Bây giờ là convert:
Bước 1
Bạn mở Readiris11 cho đến khi hiện như bảng sau. Bạn phải chọn 2 cái đánh dấu nó mới chạy được mà không lỗi.
Tiến hành convert được file .rtf dạng như sau. Bạn sẽ thấy các chữ nó chồng lên nhau không thể nhìn được.
Ấn ctrl+A để bôi đen rùi coppy
Paste vào chương trình dịch. ( mình dùng chương trình của bác vvtlove -có trong ttv đó)
Ấn thực hiện . Rùi coppy phần tiếng Trung . ( bây giờ nó không bị trùng nữa rùi)
Coppy phần Tiếng Trung đó ra Word .
Bước 2:
Mở ABBYY ra. tiến hành convert file ảnh. ( nhớ phải chọn phần tiếng Trung rùi nhé.)
Ấn F8 được giao diện. Phần trên là file doc bạn convert được. Phần dưới là file ảnh Gốc. ( bạn có thể chỉnh zoom để nó to lên cho dễ nhìn)
Bây giờ bạn bắt đầu xoát từng chữ một. Mỗi khi đến một chữ nó sẽ ảnh vàng của chữ gốc bên dứoi.
Trong hình vẽ là một chữ convert ra sai. Bạn Click chuột phải.
Số 1 là vị trí của chữ trong file doc
Số 2 là vị trí của chữ trong file image.
Số 3 là chữ chuẩn.
Số 4 là danh sách chữ đồng dạng.
(bạn hãy so sánh trong 4 với 3 xem cái nào trùng thì chọn)
Tuy nhiên không phải lúc nào bạn cũng có được chữ trùng hợp.
Đôi khi click chuột phải lại không ra mà chỉ được như hình vẽ
Lúc này bạn cần đến file doc thu được sau khi convert bằng Read..11 ( file coppy ra Word ở bước 1 )
Bạn hãy dò từng dòng với file ảnh để tìm chữ phù hợp
Bạn hãy chọn chữ đó rùi coppy vào ABBYY đúng với vị trí của chữ cần tìm.
Tuy nhiên không phải lúc nào cũng có chữ trùng trong file doc với ảnh gốc.
VD :
Lúc này bạn mở file ảnh gốc ra ( bằng Paint cũng được)
Bạn Cut riêng cái chữ khó chju ấy ra. Để riêng một chỗ.
Đồng thời đánh dấu vị trí của chữ đó trong ABBYY ( Cái chữ No đó)
Cứ như vậy xoát từng chữ cho hết chương.
Tập hơp nhũng chữ riêng bạn không tìm được ở trên lưu lại trong thành file image sau đó lại sử dụng ABBYY convert cái file image mới có để tìm được những chữ đó.
Vd như trong hình vẽ.
Ô khoanh tròn là những chữ không tìm được trong chương truyện.
Những hàng còn lại là mình coppy ra mấy lần để cho khi convert lại dễ tìm hơn.
Bạn cứ làm như vậy là có thể hoàn thành chương truyện thui.
Khá tốn time đó.
Vấn đề bạn convert ra file ảnh thì thỉnh thoảng vẫn gặp với một số image quá ngắn.
Khuyến khích bạn sử dụng với file ảnh truyện . DCLM chẳng hạn
Note:
Đôi khi có những từ tiếng Trung khá là giống nhau, nhưng nghĩa thì khác hẳn.
Vì vậy sau khi chỉnh image được một đoạn bạn nên dịch sang Vietphrase để xem nghĩa. Thấy nó chuối chuối hoặc hơi khó hiểu thì 90% là đoạn đó vẫn còn sót chữ sai.