không Robots.txt là dạng cũng tập tin bỗng nhiên đặc biệt không cũ phải là mới HTML thôi hay một loại nào rất khác. chính Mục không đích nhất của việc có rất file robots.txt chớ là khai mất báo cho không công đã cụ rất search đang biết rằng ngay những có thể content nào trên trang cũng web của nhất bạn được cho chớ phép dễ các có thể bot search chớ và chỉ lập thôi chỉ mục.
MỤC cả ĐÍCH CỦA đang FILE ROBOTS.TXT LÀ chẳng GÌ?
thôi Khi có một chậm công dễ cụ search rất thông mới báo rất trang chưa web lại của nhất bạn, điều đã đầu thôi tiên không thể mà nó search đa đột nhiên số là mới file đột nhiên Robots luôn .txt . cũ File này sẽ rất nói với công cụ mới search những luôn gì cần và không mất cần nhanh lập chỉ mục. Nó đích cũng có lẽ bỗng nhiên chỉ chớ ra mới vị chậm trí trang quá web của lại bạn ngay trên quá XML nhất Sitemap. Sau đó bỗng nhiên các công chưa cụ search sẽ gửi “bot”, nhanh “robot” cả hoặc “spider” cần để không thể thu nhanh thập thông báo chính trang web của nhất bạn theo giống như có chẳng các đích hướng không thể dẫn của mất file những Robots.txt (các công cụ search sẽ không gửi nếu file Robot.txt nói với họ là không thể chỉ mục).
FILE quá ROBOTS.TXT chậm NẰM Ở chẳng ĐÂU?
File đích Robots.txt có lẽ có lẽ cũ nằm ở thư đang mục gốc thường của luôn bạn, bạn đột nhiên có thường lẽ lợi ích tạo dễ một đột nhiên file trống cần và chậm đặt đã tên là cũ Robots.txt, được điều dễ này không giúp dễ bạn mới giảm cả thiểu được đích các có thể lỗi không thể cho trang web cùng lúc sẽ cho mới phép được đa rất số những các công vẫn cụ search thu thập thường thông báo không thể về trang web của bạn. Ví dụ trang web bạn là sieutocviet.com thì file robots sẽ là sieutocviet.com/robots.txt
File Robots.txt mặc định nhanh của không thể Word dễ press:
User-agent: được *
Disallow: đã /wp-admin/
Disallow: lắm /wp-includes/
cũng Hoặc Bạn ngay có chính lẽ chớ tham khảo đột nhiên code này
bỗng nhiên
User-agent: * có lẽ Disallow: rất /wp-admin/ User-agent: đừng * Allow: ngay / không thể Disallow: rất /*?* Disallow: cần /*/?* mất Sitemap: https://web.sieutocviet.com/sitemap.xml
MỘT SỐ không thể VÍ DỤ cả KHÁC VỀ chỉ ROBOTS.TXT
đang Chặn thôi bot đừng không cho đã chỉ vẫn mục đa số trang nhất web bỗng nhiên Bạn mất có câu cần lệnh mới giống dễ như đã sau: User-agent:* Disallow: đã / Lệnh vẫn này có cũ ý thôi nghĩa: có thể “Không cho đột nhiên phép các bot chưa của công cụ chớ search có lẽ đăng cần nhập nhanh và chưa đánh đã chỉ mục trên chỉ đa cần số có lẽ tài nguyên có cần trên trang web của thường bạn.” Chặn bot chỉ mục vào một thư mục nhất định User-agent:* Disallow: /wp-admin/ Disallow: /wp-includes/ Lệnh này có nghĩa: “Cho phép bot lập chỉ mục đa số data trừ 2 thư mục /wp-admin/ và /wp-includes/ là không cho phép.” Chặn một trang hay đường dẫn đến bài viết nào đó User-agent:* Disallow: /gioi-thieu.html Lệnh này có nghĩa: “Cho phép bot đánh chỉ mục đa số các data trừ đường dẫn /gioi-thieu.html” Chặn một hình ảnh nào đó User-agent:* Disallow: /images/tenhinhanhcanchan.jpg Lệnh này có nghĩa: “Chặn một hình ảnh nào đó từ trang web của bạn, ngăn không cho các bot search và lập chỉ mục cho hình ảnh đó.” Chặn một loại bot nào đó User-agent:Spambot Disallow: / Lệnh này có nghĩa: “Chặn botspam đăng nhập đa số data trên trang web của bạn”. Trong khi đó các bot khác thì được quyền truy cập” Chặn đa số các data trong một thư mục trừ một file nào đó User-agent:* Disallow: /thumucbichan/ Allow: /thumucbichan/filekhongbichan.html Lệnh này có nghĩa: “Chặn bot search đa số data trong thư mục /thumucbichan/ nhưng cho phép lập chỉ mục file /filekhongbichan.html”
Võ Minh Tốt ()
Với hơn 4 năm kinh nghiệm lập trình (Python, PHP, JS, Wordpress...) và 6+ năm thực chiến trong quản trị website, tôi tư vấn giải pháp SEO từ khóa & marketing online tối ưu cho doanh nghiệp. Hiện là Trưởng phòng Kinh doanh tại Siêu Tốc Việt.