Robots.txt là
nhanh dạng tập tin đặc
sẽ biệt không
quá phải là HTML
lại hay một
được loại nào khác.
chớ Mục đích của
luôn việc có file
lại robots.txt là khai
nhất báo cho công cụ
chẳng search biết rằng những content nào trên trang web của bạn được cho phép các bot search và lập chỉ mục.
MỤC không gian sống ĐÍCH CỦA FILE ROBOTS.TXT LÀ GÌ?
Khi
đang có một công
những cụ search thông báo
nhất trang web
mất của bạn,
cả điều đầu tiên
thôi mà nó search đa
thường số là
luôn file
Robots.txt . File này sẽ
có lẽ nói với công cụ search
mới những gì cần và không
cần cần lập chỉ mục.
chậm Nó cũng có
nhanh lẽ chỉ ra
dễ vị trí trang
quá web của bạn trên
được XML Sitemap. Sau
nhất đó các công
nhanh cụ search sẽ gửi “bot”, “robot” hoặc “spider” để thu thập thông báo trang web của bạn theo giống như có các hướng dẫn của file Robots.txt (các công cụ search sẽ không gửi nếu file Robot.txt nói với họ là không thể chỉ mục).
FILE sắc đẹp ROBOTS.TXT NẰM Ở ĐÂU?
File Robots.txt có lẽ nằm ở
rất thư mục gốc
rất của bạn, bạn
mất có lẽ lợi ích
nhanh tạo một file trống
luôn và đặt tên
có lẽ là Robots.txt,
lại điều này giúp bạn
lắm giảm thiểu được các lỗi
được cho trang web
mất cùng lúc cho phép đa số các công cụ search thu thập thông báo về trang web của bạn. Ví dụ trang web bạn là sieutocviet.com thì file robots sẽ là sieutocviet.com/robots.txt
File Robots.txt mặc luôn định của Word rất press:
User-agent: *
Disallow cao : /wp-admin/
Disallow suôn sẻ : /wp-includes/
Hoặc
tự nhiên Bạn có lẽ tham khảo code này
User-agent: * Disallow: lại /wp-admin/ User-agent: chớ * Allow: / thôi Disallow: /*?* Disallow: thôi /*/?* Sitemap: https://web.sieutocviet.com/sitemap.xml
MỘT tiện lợi SỐ VÍ DỤ KHÁC VỀ ROBOTS.TXT
Chặn bot
đích không cho chỉ mục
chớ đa số trang
cả web Bạn có
cần câu lệnh giống
đã như sau: User-agent:* Disallow:
chậm / Lệnh này có
ngay ý nghĩa: “Không cho phép
quá các bot của
đang công cụ search
đang đăng nhập và đánh chỉ mục trên đa số tài nguyên có trên trang web của bạn.” Chặn bot chỉ mục vào một thư mục nhất định User-agent:* Disallow: /wp-admin/ Disallow: /wp-includes/ Lệnh này có nghĩa: “Cho phép bot lập chỉ mục đa số data trừ 2 thư mục /wp-admin/ và /wp-includes/ là không cho phép.” Chặn một trang hay đường dẫn đến bài viết nào đó User-agent:* Disallow: /gioi-thieu.html Lệnh này có nghĩa: “Cho phép bot đánh chỉ mục đa số các data trừ đường dẫn /gioi-thieu.html” Chặn một hình ảnh nào đó User-agent:* Disallow: /images/tenhinhanhcanchan.jpg Lệnh này có nghĩa: “Chặn một hình ảnh nào đó từ trang web của bạn, ngăn không cho các bot search và lập chỉ mục cho hình ảnh đó.” Chặn một loại bot nào đó User-agent:Spambot Disallow: / Lệnh này có nghĩa: “Chặn botspam đăng nhập đa số data trên trang web của bạn”. Trong khi đó các bot khác thì được quyền truy cập” Chặn đa số các data trong một thư mục trừ một file nào đó User-agent:* Disallow: /thumucbichan/ Allow: /thumucbichan/filekhongbichan.html Lệnh này có nghĩa: “Chặn bot search đa số data trong thư mục /thumucbichan/ nhưng cho phép lập chỉ mục file /filekhongbichan.html”
Võ Minh Tốt ()
Với hơn 4 năm kinh nghiệm lập trình (Python, PHP, JS, Wordpress...) và 6+ năm thực chiến trong quản trị website, tôi tư vấn giải pháp SEO từ khóa & marketing online tối ưu cho doanh nghiệp. Hiện là Trưởng phòng Kinh doanh tại Siêu Tốc Việt.