Cách chia chương truyện nhanh
Áp dụng với truyện có cụm chia chương cụ thể (có số chương) và khi convert có check vào ô Chèn dòng trắng giữa các đoạn
1. Mở file truyện đã convert lên, copy bắt đầu từ chương đầu tiên (bỏ qua các dòng tên truyện, tác giả linh tinh các kiểu)
2. Mở Notepad++, File -> New, nhìn góc dưới cùng bên phải, đảm bảo tab thứ 3 tính từ phải qua đang hiện Windows (CR LF). Nếu không phải thì click chuột phải vào đấy và chọn loại đó.
Ở menu, vào Encoding -> Convert to UTF-8-BOM
3. Gõ xuống dòng 2 lần
4. Paste vào phần vừa copy
5. Mở hộp thoại Replace (Ctrl-H)
6. Tại Find what, nhập
"
Tại Replace with, nhập
""
Bấm Replace All (Replace một dấu ngoặc kép thành hai dấu ngoặc kép)
7. Vẫn trong hộp thoại Replace, tại Search mode, chọn Regular expression
Tại Find what, nhập
\r\n\r\nA\r\n\r\n
Tại Replace with, nhập
"\r\n"B","
Chú ý: Phải thay A và B bằng các cụm regex tương ứng với cụm từ dùng để chia chương truyện. Xem ví dụ ở phần dưới.
Bấm Replace All
8. Xóa dòng đầu tiên (dòng chỉ có dấu ")
9. Thêm dấu " ở cuối dòng cuối cùng
10. Lưu file lại dưới tên tùy chọn và tự add thêm đuôi là .csv vào ô tên
11. Mở file vừa lưu bằng Excel thì sẽ hiện mỗi dòng gồm 2 cột là tên chương và nội dung chương
12. Chú ý: Khi copy nội dung chương phải click đúp vào cell tương ứng và select all + copy ở trạng thái đang edit cell. Nếu copy thẳng cell thì sẽ bị hiện thành hai dấu ngoặc kép
Note: Cách làm này có giới hạn là:
- truyện không được quá 1,048,576 chương => cái này chắc chẳng truyện nào đến được
- 1 chương không được quá 32,767 ký tự
Khi mở file csv thấy lỗi là biết quá ngay
Ví dụ regex cụm chia chương
Dạng |
Ví dụ |
A |
B |
Thứ + số + chương
Thứ + số + chương + tên chương |
Thứ 1 chương
Thứ 1 chương abcxyz |
Thứ ([0-9]*) chương(.*?) |
Thứ \1 chương\2 |
Chương + số
Chương + số + tên chương |
Chương 01
Chương 01 abcxyz |
Chương ([0-9]*.*?) |
Chương \1 |
Tùy cụm chia chương có dạng nào mà sẽ phải thay đổi regex tương ứng nhé. Nếu thấy khó quá không biết replace thế nào thì paste thử lên đây tớ sẽ chuyển cụm chia chương đó sang regex cho nha.