Plugin installed. Go to Export/Import to backup sources.
Hướng dẫn nhanh cho người mới
1) Cách cấu hình 1 nguồn (cơ bản)
- URL: trang danh mục/list của site nguồn.
- List Selector: selector trỏ tới
<a> chứa link bài trong trang list.
- Content Selector: selector vùng nội dung chính trong trang chi tiết bài.
- Category + Tác giả: nơi đổ bài và tác giả WordPress.
- Active: bật/tắt nguồn (tắt thì cron/chạy tay bỏ qua).
- Strip link: thay link ngoài domain bằng text cấu hình
Outlink text.
- PDF: tải PDF về hosting và thay link bằng link nội bộ (theo giới hạn MB).
2) Tính năng mới: Chèn HTML vào cuối bài viết (Append HTML)
Mỗi nguồn có thể nhập một đoạn HTML, plugin sẽ tự động chèn đoạn này vào cuối nội dung của mỗi bài khi import (chỉ áp dụng cho bài mới).
Ví dụ cơ bản (ghi nguồn + ghi chú):
<hr>
<p><b>Nguồn:</b> canhgiacduoc.org.vn</p>
<p><i>Nội dung được hệ thống tự động tổng hợp.</i></p>
Ví dụ nâng cao (khung cảnh báo + CTA):
<div style="border:1px solid #f0ad4e;background:#fff8e1;padding:10px">
⚠️ <b>Lưu ý:</b> Nội dung mang tính tham khảo, không thay thế tư vấn chuyên môn.
</div>
<hr>
<p><b>Bạn cần tư vấn thêm?</b> Hotline: 1900 xxxx — Website: example.com</p>
Lưu ý: HTML được lọc theo chuẩn an toàn (không chạy <script>). Tránh nhồi nội dung quá dài.
3) Phân trang (Pagination) — chọn đúng để chạy ổn định
- Auto: ưu tiên Next Page Selector, không có thì tự tăng URL phổ biến (
?page=, /page/2/, /trang/2/).
- Selector: chỉ dùng Next Page Selector, không tự tăng URL.
- Query: URL dạng
?page=2 / ?paged=2 → nhập đúng Key (page/paged/p).
- Path: URL dạng
/page/2/ hoặc /trang/2/ → nhập đúng Slug (page/trang).
- Start at page 2: bật nếu trang đầu là
.../category/ và trang 2 mới là .../category/page/2/ (không có /page/1/).
- Page limit: giới hạn số trang để tránh crawl vô hạn.
4) Mẹo chạy “bền production”
- Đặt Max posts per cron và Max posts per source để tránh bùng tải.
- Nếu site nguồn hay chặn (403/429), tăng HTTP retry vừa phải (2–3) và để plugin tự backoff.
- Bật Last-seen để lần sau gặp lại bài đã thấy thì dừng nguồn (giảm scan bài cũ).