TTV Translate - Ứng dụng convert truyện trên mobile
Hướng dẫn đăng truyện trên website mới
Đăng ký convert hoặc Thông báo ngừng
Trang 1 của 10 123 ... CuốiCuối
Kết quả 1 đến 5 của 48

Chủ đề: phần mềm lấy text

  1. #1
    Ngày tham gia
    Nov 2008
    Bài viết
    103
    Xu
    0

    Mặc định phần mềm lấy text

    tìm text thấy khó quá nếu copy text thì lâu nên mình viết 1 cái mới áp dụng xpath nên tốc độ khá nhanh

    code mình viết bằng C#

    ở đây mình đính kèm 2 file cho người dùng cuối và nhà lập trình

    hiện chương trình mình chỉ chạy được các site viết bằng utf-8 và không hiện nội dung bằng javascript hay AJAX

    2 site mình add sẵn là zhsxs.com và menghen.org mọi trông tin config site nằm trong file config.xml
    mộ số thông số trong file config.xml
    Mã nguồn PHP:
    <webs>
        <
    web>zhsxs.com</web>// địa chỉ trang web không có www
        
    <web_begin>http://gate.baidu.com</web_begin>// cái này không cần quan tâm
        
    <getchuong_xpath>//tr/td/a</getchuong_xpath>// Xpath xác định link các chương 
        
    <getchuong_start></getchuong_start>// cái này không cần quan tâm
        
    <getchuong_end></getchuong_end>// cái này không cần quan tâm
        
    <begin>0</begin>// cái này không cần quan tâm
        
    <gettitle_xpath>//tr/td/h1</gettitle_xpath>//xpath xác định tiêu đề chương
        
    <gettitle_att></gettitle_att>// cái này không cần quan tâm
        
    <gettitle_value></gettitle_value>// cái này không cần quan tâm
        
    <gettext_xpath>//tr/td/div***91;5***93;</gettext_xpath>//xpath xác định text của chương
        
    <gettext_att></gettext_att>// cái này không cần quan tâm
        
    <gettext_value></gettext_value>// cái này không cần quan tâm
      
    </webs
    các bạn có thể kiểm thử với bộ này
    http://www.zhsxs.com/zhschapter/38667.html

    mục tiêu cần giải quyết hiện thời
    1. Đọc được các site mã hóa bằng GBK
    2. Lấy được Xpath một cách dễ dàng như phần mềm của bán Quỷ Kiếm


    Update sửa lỗi
    1. Đọc được các site mã hóa bằng GBK //đã giải quyết
    2. Lấy được Xpath một cách dễ dàng như phần mềm của bán Quỷ Kiếm

    bác nào biết comment báo em với


    11.08.13 get_text_tq_update2.rar
    thêm chức năng xóa xuống dòng
    File đính kèm File đính kèm
    Lần sửa cuối bởi lehoang0109, ngày 11-08-2013 lúc 20:04.
    ---QC---


  2. Bài viết được 2 thành viên cảm ơn::   [Hiện ra]
  3. #2
    Ngày tham gia
    May 2009
    Bài viết
    5,774
    Xu
    58

    Mặc định

    xpath không khả thi vì có khi phải lấy nội dung của các tag lồng nhau qua việc định nghĩa các thuộc tính.

    Muốn xài xpath phải sử dụng 1 cách khác.
    ◆☆◆ CON VẸT BANG → Lãng tử bất hồi đầu ◆☆◆



    Được ngắm em và được thấy em cười là hạnh phúc lớn nhất mà cuộc đời ban tặng cho anh, xin lỗi em, anh sẽ ko bao giờ buông tay em.

    Vô đề
    Sự thực là anh có nhớ em đâu
    Chỉ cồn cào vì con tim khắc khoải
    Hồn thơ bé nên nỗi đau dài mãi
    Biết bao giờ ôm trọn một niềm thương

    Sự thực là anh đâu có vấn vương
    Kia - tơ tình đang tự giăng đó chứ
    Kẻ kiêu hùng trên bước đường lữ thứ
    Đã vô tình lạc mất cả con tim

    Sự thực là anh đâu có kiếm tìm
    Chỉ chơi vơi giữa đôi bờ hoài niệm
    Chẳng muốn đâu cùng về với hiện thực
    Thắt cõi lòng, anh lại càng nhớ thêm...

    Em ơi em, em còn nhớ hay quên
    Đêm rả rích tiếng ai cười ngặt nghẽo
    Trưa rì rầm lệ người rơi hắt héo
    Tiếng trầm buồn nát dòng nhạc trên khuông.....

    Nơi hồng trần vốn bụi bặm mênh mông
    Được gặp em là một điều hạnh phúc
    Cánh đại bàng giương trời cao phía trước
    Vẹn công danh quyết đón theo em cùng.

    Love you....

    Hidden Content




    Thân ta rời núi ngạo phong sương
    Hùng tâm tráng chí dựng muôn phương
    Kẻ sĩ chiến chinh - giang hồ mộng
    Chỉ mong danh chấn cõi vô thường

    Hidden Content


  4. Bài viết được 1 thành viên cảm ơn::   [Hiện ra]
  5. #3
    Ngày tham gia
    Nov 2008
    Bài viết
    103
    Xu
    0

    Mặc định

    Trích dẫn Gửi bởi Nhiếp Phong Xem bài viết
    xpath không khả thi vì có khi phải lấy nội dung của các tag lồng nhau qua việc định nghĩa các thuộc tính.

    Muốn xài xpath phải sử dụng 1 cách khác.
    mỗi site có 1 kiểu riêng mình có file config để lưu thông tin xpath của từng trang nên không sao còn những site có cấu trúc phức tạp thì mình dùng attbutes và value để xác định innertext nên mình thấy nó vẫn khả thi

  6. #4
    Ngày tham gia
    Sep 2008
    Bài viết
    275
    Xu
    0

    Mặc định

    cho mình hỏi cái này (do thấy 2 bro biết lập trình+hỏi trong hỏi đáp ko thấy ai trả lời):
    - làm cách nào để xóa được các đoạn văn bị break line (do dùng tag <br) và đoạn văn dùng tag <pre. Nếu được, làm thế nào cho nhanh với 1 trang và với n trang truyện.
    Nguyên nhân: một số trang truyện khi copy bị hiện tượng gãy đoạn văn nên khi chép vào QT nó bị xuống hàng vô tội vạ.
    Đa tạ.

  7. #5
    Ngày tham gia
    Oct 2007
    Bài viết
    5,600
    Xu
    0

    Mặc định

    Những trang nào thế?

    ---QC---


Trang 1 của 10 123 ... CuốiCuối

Thông tin về chủ đề này

Users Browsing this Thread

Có 1 người đang xem chủ đề. (0 thành viên và 1 khách)

DMCA.com Protection Status