Cài tệp robots.txt chuẩn cho blogspot

Tệp robots.txt là gì? Cài tệp robots.txt chuẩn cho blogspot


Một tập tin robots.txt là một tệp được lưu ở định dạng văn bản cho biết robot công cụ tìm kiếm thu thập dữ liệu web để truy cập blog của bạn.

Cài tệp robots.txt chuẩn cho blogspot



Những robot này được tự động hóa và trước khi truy cập các trang trên blog của bạn, chúng sẽ kiểm tra nội dung của tệp robots.txt cấm họ truy cập vào một số trang nhất định nào đó.

Tệp robots.txt ở đâu cho blog của bạn?


Nó có đường dẫn là

https://www.giaodienblogbanhang.com/robots.txt

Dưới đây là file robot.txt chuẩn cho blogspot


User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /search/label
Allow: /

Sitemap: https://www.giaodien.blog/sitemap.xml



Các bạn thay domain của blog các bạn vô bên trên.

Cách cài đặt tệp robot.stxt như sau: Cài đặt - Tùy chọn tìm kiếm - Robots.txt tùy chỉnh

Các bạn nhấn chỉnh sửa và copy đoạn code trên dán vô đó và lưu lại là xong, các bạn nhớ là phải thay domain của các bạn vô nhé.

Một số blog khác cài đặt sitemap có dạng là:

Sitemap: https://www.tendomaincuablog.com/feeds/posts/default?orderby=UPDATED

Như vậy có đúng và chuẩn không?

Nó cũng là một sitemap với mắt thường thì chúng ta không phân biệt được nó đúng hay sai, và dưới đây là mình check tools kiểm tra so sánh 2 sitemap trên nhé

1. Sitemap.xml : https://www.giaodien.blog/sitemap.xml




2. Sitemap dạng: https://www.giaodien.blog/feeds/posts/default?orderby=UPDATED

Sẽ bị cảnh báo như hình



Như vậy thì cái sitemap nào chuẩn, thì mình dùng thôi đúng không nào.
Mới hơn Cũ hơn
Contact Me on Zalo