VnCrawl: Plugin lấy bài viết tự động và tạo audio, video, upload to Youtube

<h4>Tính năng chính của VnCrawl:</h4> <ul> <li>Tùy chọn độ dài tối thiểu bài viết lấy về (Số lượng từ). Mặc định tối thiểu 500 từ</li> <li>Tùy chọn tạo audio</li> <li>Tùy chọn số lượng ảnh tối thiểu</li> <li>Tự tạo internal link cho bài viết với các mẫu text ngẫu nhiên do bạn tự nhập</li> <li>Tùy chọn lấy h1 làm tiêu đề bài viết. (Lấy theo h1 thì thường tiêu đề sẽ chính xác ko có rác nhưng nhiều web ko chuẩn có chứa nhiều h1 sẽ dẫn đến lấy sai. Còn nếu lấy theo tiêu đề bài viết gốc thì hay bị rác do các web hay gắn thêm brand). Tiêu đề này nếu ngắn dưới 10 từ sẽ tự động nối thêm brand của bạn vào cuối.</li> <li>Tùy chọn tự tạo mục lục (Table of content) cho bài viết. Tính năng này sẽ lấy tất cả các thẻ h2, h3 trong bài viết tạo thành mục lục. Khi bât – tắt tình năng này cũng sẽ bật tắt cho toàn bộ bài viết trên web của bạn.</li> <li>Tùy chọn thay số đt, email</li> <li>Tùy chọn loại bỏ các url có chứa những từ ko mong muốn. Mặc định đã loại bỏ wikipedia, youtube, fb, twitter, wikipedia, medium, pinterest…</li> <li>Tùy chọn thay thế text trong nội dung. Thường dùng khi lấy bài viết nhập từ các url là bạn đã xác định trước nguốn lấy. Sử dụng tính năng này để thay thế brand của web nguồn thành brand của bạn.</li> </ul>
39

VnCrawl là Plugin lấy bài viết viết tự động dành cho website wordpress. Với rất nhiều ưu điểm nổi bật như ngoài việc lấy bài viết tự động thì còn có thể giúp bạn tạo audio, video, upload to Youtube. Hãy cùng SEOTOP tìm hiểu nhé:

Lấy bài viết tự động

– Tùy chọn độ dài tối thiểu bài viết lấy về (Số lượng từ). Mặc định tối thiểu 500 từ

– Tùy chọn tạo audio

– Tùy chọn số lượng ảnh tối thiểu

– Tự tạo internal link cho bài viết với các mẫu text ngẫu nhiên do bạn tự nhập

– Tùy chọn lấy h1 làm tiêu đề bài viết. (Lấy theo h1 thì thường tiêu đề sẽ chính xác ko có rác nhưng nhiều web ko chuẩn có chứa nhiều h1 sẽ dẫn đến lấy sai. Còn nếu lấy theo tiêu đề bài viết gốc thì hay bị rác do các web hay gắn thêm brand). Tiêu đề này nếu ngắn dưới 10 từ sẽ tự động nối thêm brand của bạn vào cuối.

– Tùy chọn tự tạo mục lục (Table of content) cho bài viết. Tính năng này sẽ lấy tất cả các thẻ h2, h3 trong bài viết tạo thành mục lục. Khi bât – tắt tình năng này cũng sẽ bật tắt cho toàn bộ bài viết trên web của bạn.

– Tùy chọn thay số đt, email

– Tùy chọn loại bỏ các url có chứa những từ ko mong muốn. Mặc định đã loại bỏ wikipedia, youtube, fb, twitter, wikipedia, medium, pinterest…

– Tùy chọn thay thế text trong nội dung. Thường dùng khi lấy bài viết nhập từ các url là bạn đã xác định trước nguốn lấy. Sử dụng tính năng này để thay thế brand của web nguồn thành brand của bạn.

Cấu hình plugin VnCrawl

Keywords và urls

– Vncrawl sẽ lấy bài viết theo 2 hình thức: Theo danh sách từ khóa và danh sách url do người dùng nhập vào.

– Các từ khóa hay url nhập vào sẽ tự động loại trừ trùng lặp, các bài viết lấy về cũng sẽ tự loại trừ trùng lặp nên bài viết nào đã lấy sẽ ko bao giờ lấy lại.

– Các keyword và url được chia làm 2 loại chưa lấy và đã lấy để bạn dễ dàng quản lý cũng như thống kê chính xác các bài viết crawl.

Keywords và urls

Tạo audio

– Các bài viết lấy về sẽ được tự động tạo audio từ nội dung bài viết với 3 loại giọng đọc AI của Viettel, FPT, Zalo (Tổng cộng gần 20 giọng đọc nam, nữ, 3 miền)

– Hiện tại tạo audio với giọng đọc của Viettel là free còn fpt và zalo mất phí.

– Tùy chọn độ dài nội dung muốn tạo audio.

– Tự động tạo rss podcast theo thông tin tạo kênh podcast của bạn. Dùng rss podcast này để đăng ký các kênh podcast như Google, Apple, Spotify, Amazon … sẽ thu được số lượng lớn backlink khủng. Rss podcast này mỗi ngày sẽ tự cập nhật 4 lần. Ngoài ra nếu muốn bạn cũng có thể tự cập nhật.

Tạo audio và kênh podcast

Tạo video và upload video lên youtube (Sắp ra mắt)

– Tự động mix các hình ảnh trong bài viết với audio đã tạo ra để tạo thành video. Đồng thời đóng dấu văn bản lên video theo tùy chọn của bạn.

– Tự động upload video tạo ra lên kênh youtube của bạn. (Ngày upload được khoảng 15-50 video lên youtube).

Quản trị bài viết

Quản trị mọi thứ liên quan đến bài viết như: lọc bài viết theo audio, bài viết crawl, danh mục. Có thể tạo audio và video hàng loạt cho bài viết ở đây. Có thể xóa bài viết và các dữ liệu liên quan đến bài viết triệt để (ảnh, audio…)

Quản trị bài viết

Dowload plugin VnCrawl

Tham gia thảo luận và tải về plugin VnCrawl tại gr https://www.facebook.com/groups/1248185935611504

Hướng dẫn chi tiết cách sử dụng Plugin VnCrawl để lấy bài viết tự động

Cài đặt plugin VnCrawl như thông thường sau đó vào Menu -> Setting -> VnCrawl để cấu hình plugin.

Plugin VnCrawl

Cấu hình

User key

– Nhập user key để sử dụng plugin VnCrawl. Mỗi user key dùng cho duy nhất 1 domain.

User key

Cấu hình chung

– Lấy url (1): Kích hoạt lấy url từ danh sách keyword được nhập ở tab Keyword & Url.

– Lấy bài viết (2): Kích hoạt lấy bài viết từ danh sách url lấy về từ keyword (danh sách url có thể tự nhập thêm vào thủ công)

– Lấy H1 làm tiêu đề (3): Tùy chọn này sẽ lấy thẻ H1 của bài viết nguồn làm tiêu đề. Nếu không chọn sẽ lấy tiêu đề bài viết nguồn làm tiêu đề. Sử dụng H1 làm tiêu đề thường sẽ tránh được brand của web nguồn gắn vào so với lấy tiêu đề, nhưng cũng sẽ có một số trường hợp web nguồn không chuẩn, 1 bài viết sử dụng nhiều H1 sẽ dẫn tới khi plugin lấy H1 sẽ không chuẩn.

– Tạo mục lục (4): Quét toàn bộ H2, H3 trong bài viết tự động tạo thành mục lục bài viết (Table Of Content). Tính năng này khi Bật – Tắt sẽ có tác dụng lên tất cả bài viết trên web của bạn.

– Thời gian lấy bài viết (5): Đặt thời gian cào bài về (Tính theo phút). Nhanh nhất là 2 phút/bài. Nếu đồng thời kích hoạt tạo audio cho bài viết thì nên để thời gian lớn 1 chút vì plugin còn mất 1 khoảng thời gian để tạo audio.

– Độ dài tối thiểu (6): Đặt độ dài tối thiểu cho bài viết cào về (Mặc định 500 từ). VnCrawl sẽ chỉ cào những bài có số từ tối thiểu như bạn set ở mục này.

– Số ảnh tối thiểu (7): Mặc định là 1. VnCrawl sẽ chỉ cào những bài viết có số ảnh tối thiểu như bạn nhập ở mục này.

– Thay số phone (8) và thay email (9): Số phone và email trong bài viết cào về sẽ được thay thế thành số phone và email do bạn nhập ở 2 mục này.

– Nhãn internal link (10): Mỗi mẫu text 1 dòng. Dòng đầu tiên là mẫu text của link trỏ về chính bài viết đang xem. (bạn đang xem …). Các dòng tiếp theo sẽ được lấy ngẫu nhiên để tạo mẫu text cho 3 internal link trong bài viết (Xem thêm, đọc thêm, tham khảo ….). Tính năng này sẽ hoạt động khi mỗi danh mục có từ 4 bài viết trở lên.

– Text cần loại trừ trên url (11): Dùng để loại trừ các domain, các url nhạy cảm mà bạn không muốn cào bài. Mỗi mẫu text trên 1 dòng. Mặc định đã loại trừ một số url như: wikipedia, facebook, youtube, twitter,…

– Text cần thay thế trong nội dung (12): Thường dùng với trường hợp cào bài theo url tự nhập. Khi đó bạn đã xác định trước web nguồn lấy biết rõ trong bài viết họ hay chèn brand, các cụm từ là gì. Bạn có thể nhập mỗi mẫu 1 dòng, các mẫu này sẽ được thay thế thành brand của bạn.

*Lưu ý: Mặc định plugin VnCrawl sẽ luôn thay thế bất kỳ domain lạ nào trong bài viết và title thành domain của bạn. Ngoài ra nếu title lấy về quá ngắn (dưới 10 từ) thì plugin cũng sẽ tự động gắn thêm brand của bạn vào title.

Plugin cũng sẽ xóa tất cả các link trần dạng text, ví dụ nhiều bài hay chèn thêm Nguồn: https://abc.com/x/y-z sẽ bị xóa.

Cấu hình chung

Keyword & Url

– Nhập danh sách keyword & url cần cào bài theo danh mục. Mặc định đã loại bỏ danh mục “chưa phân loại”. Mỗi mẫu trên 1 dòng.

– Các keyword và url khi nhập sẽ tự động loại bỏ trùng lặp, loại bỏ nếu nằm trong danh sách đã lấy.

– Nếu muốn cào bài theo keyword thì nhập danh sách keyword vào “keyword chưa lấy url” (1). Url lấy về sẽ được chuyển vào danh sách “Url chưa lấy bài viết” (3) và đồng thời keywor đã lấy url sẽ được chuyển vào danh sách “Keyword đã lấy url” (2)

– Nếu muốn cào bài theo url thì nhập danh sách url cần lấy vào “Url chưa lấy bài viết” (3). Khi mỗi url được chạy cào bài thì nó sẽ được chuyển vào danh sách “Url đã lấy bài viết” (4). Bài viết cào về sẽ được thêm vào danh mục tương ứng.

*Lưu ý: Nếu web chưa có danh mục cần phải tạo danh mục để nhập cho phần này.

Danh sách keywword & Url

Audio

Cấu hình Audio

– Tạo audio (1): kích hoạt tạo audio khi cào bài.

– Chèn audio player (2): Tự động chèn trình chạy audio vào đầu bài viết.

– Độ dài (3): Độ dài (số từ) muốn tạo audio. Nếu để 0 thì sẽ tạo audio toàn bộ bài viết.

– User audio (4): Tài khoản audio để sử dụng tạo audio từ Zalo và FPT. Riêng Viettel miễn phí, không cần tài khoản.

– Loại audio (5): Hiện có 3 loại Zalo, FPT, Viettel (Viettel miễn phí).

– Giọng đọc (6): Plugin chọn lọc tổng cộng gần 20 giọng đọc AI chất lượng cao với đầy đủ nam, nữ, 3 miền.

Cấu hình audio

Podcasts

– Những bài viết đã tạo audio có thể sử dụng tính năng này để tạo rss podcast. Rss podcast này dùng để đăng ký các kênh podcats sẽ thu về được số lượng lớn backlink từ các ông lớn như Google, Apple, Amazon, Spotify…

– Cách cài đặt rss podcast tạo kênh khá đơn giản bạn chỉ cần lưu ý chỗ “Emai author”, mã xác thực khi đăng ký các kênh podcast sẽ được gửi về email này. Lưu ý thứ 2 là cover của kênh podcast yêu cầu hình ảnh jpg hoặc png có tỉ lệ 1:1 và có kích thước tối thiểu 1400×1400.

*Lưu ý: Tạo audio Viettel miễn phí nên nếu ai không muốn dùng tính năng cào bài vẫn có thể sử dụng plugin VnCrawl để tạo audio và các kênh podcast hoàn toàn miễn phí.

Cài đặt rss podcast

Quản trị bài viết

– Quản trị tất cả bài viết trên website

– Bộ lọc: Lọc theo loại bài viết (cào bài và thông thường), lọc theo danh mục, lọc theo bài viết có audio

– Hành động: Xóa bài viết với tùy chọn xóa hoàn toàn các file đính kèm như hình ảnh, audio. Xóa audio. Tạo audio

Quản trị bài viết

Chú ý quan trọng

– Plugin VnCrawl hoạt động dựa trên Cronjob của wordpress nên vì một số lý do nào đó sẽ có nhưng website bị tắt cronjob thì plugin sẽ không hoạt động được. Hãy kiểm tra file wp-config.php của website bạn:

+ Nếu cronjob bị chặn sẽ có dòng này: define(‘DISABLE_WP_CRON’, true);

+ Để kích hoạt cronjob bạn sửa thành: define(‘DISABLE_WP_CRON’, false);

– Cronjob của wordpress chỉ hoạt động khi web được tải tức là khi có người dùng truy cập vào web. Do vậy nếu web bạn là web cũ có lượt truy cập cao, liên tục thì không cần cài đặt cronjob server web. Ngược lại web mới, web yếu lượt truy cập ít thì cần cài đặt cronjob của server web. Thực hiện chạy cronjob sau trên server web:

*/1 * * * * wget -q -O – https://domaincuaban/wp-cron.php?doing_wp_cron >/dev/null 2>&1

Chú thích:

*/1 * * * * là cronjob sẽ chạy mỗi phút 1 lần

wget -q -O – https://domaincuaban/wp-cron.php?doing_wp_cron >/dev/null 2>&1 là lệnh thực thi cronjob

Các bạn có thể xem cách tạo cronjob dưới đây:

+ Tạo cronjob trên Cpanelhttps://wiki.matbao.net/kb/huong-dan-su-dung-cron-jobs-tren-cpanel/

+ Tạo cronjob trên DirectAdminhttps://wiki.tino.org/docs/huong-dan-tao-cron-jobs-tren-directadmin/

+ Tạo cronjob trên Cyberpanelhttps://wiki.tino.org/docs/cronjob-tren-cyberpanel/

Tải về plugin VnCrawl

Liên hệ

Mọi vấn đề về plugin VnCrawl các bạn vui lòng tham gia thao luận tại gr https://www.facebook.com/groups/1248185935611504

Hoặc vui lòng liện trực tiếp với mình:

– Facebook: https://www.facebook.com/thienvt36/

– Email: thienvt@gmail.com

– Mobile/zalo: 033 439 0000