Kiểm soát cách Google lập chỉ mục nội dung của bạn bằng thẻ meta
Có rất nhiều công cụ tìm kiếm ngoài kia, nhưng hầu hết thời gian, chủ sở hữu trang web quan tâm đến việc trang web của họ được lập chỉ mục trên Google toàn năng. Một cách để thực hiện tốt hơn trên công cụ tìm kiếm là sử dụng thẻ meta robot.
Các meta
thẻ robot là thẻ meta đồng thuận giữa các công cụ tìm kiếm như Google, Yahoo và Bing. Việc sử dụng thẻ meta là để cho phép các nhà phát triển web kiểm soát khả năng truy cập cho các trang web, chống lại các trình thu thập công cụ tìm kiếm. Ví dụ, một cái gì đó như noindex
sẽ ngăn tất cả các robot từ các công cụ tìm kiếm đưa trang web của bạn vào chỉ mục của chúng.
Robot riêng của Google được gọi là Googlebot. Trong bài đăng này, chúng tôi sẽ xem cách chúng tôi giải quyết Googlebot độc quyền thông qua thẻ meta.
Địa chỉ Googlebot
Để giải quyết Googlebot, chỉ định meta Tên
như googlebot
Thay vì chỉ robot
. Ví dụ này sẽ ngăn Googlebot đưa trang web của bạn vào chỉ mục của họ nhưng vẫn cho phép các bot từ Bing và Yahoo thu thập dữ liệu trang. Do đó, các trang web của bạn vẫn có thể xuất hiện trong kết quả tìm kiếm của Bing và Yahoo.
Google có một số robot đặc biệt thu thập thông tin qua các loại nội dung khác nhau như Hình ảnh, Tin tức, Video, Quảng cáo và Di động. Google cho phép bạn chặn từng robot này. Ví dụ: nếu bạn không muốn trang web của mình xuất hiện trong kết quả tìm kiếm của Google Mobile, bạn có thể chỉ định thẻ meta robot theo cách này:
Danh sách đầy đủ các loại bot Google có thể được tìm thấy trong trang Trình thu thập trang web của Google.
Ngăn chặn lập chỉ mục hình ảnh
Thật khó chịu khi bạn tìm thấy hình ảnh có bản quyền của mình được người khác sử dụng mà không có sự cho phép trước của bạn. Nếu bạn muốn giảm thiểu điều này xảy ra, bạn có thể ngăn Google đưa hình ảnh của bạn vào chỉ mục của họ.
Chỉ định thẻ meta robot có giá trị là noimageindex
. Điều này sẽ ngăn robot lập chỉ mục tất cả các hình ảnh trong trang và hình ảnh của bạn sẽ không xuất hiện trong kết quả Tìm kiếm hình ảnh của Google, nơi mọi người thường tìm kiếm hình ảnh.
Ngoài ra, bạn có thể đặt tên meta là hình ảnh googlebot
để đặc biệt ngăn robot của Google thu thập dữ liệu trang web của bạn để lấy hình ảnh.
Ngăn dịch
Google Chrome cung cấp bản dịch của một trang web bằng tiếng nước ngoài sang ngôn ngữ địa phương hoặc ngôn ngữ địa phương yêu thích của khách truy cập, với sự trợ giúp của Google Dịch. Mặc dù bản dịch Google Dịch đang trở nên tốt hơn, nhưng nó không hoàn hảo đối với một số ngôn ngữ. Đầu ra dịch đôi khi có thể thực sự kỳ quặc.
Nếu bạn không muốn Google dịch các trang web của mình, hãy đặt meta googlebot với giá trị là không dịch
, như vậy.
Nếu bạn muốn ngăn một phần nhất định của trang được dịch, bạn có thể thêm không dịch
lớp trong phần tử bao bọc nội dung:
Google sẽ bỏ qua điều này Bạn cũng có thể ngăn Google lập chỉ mục các trang web của bạn sau một khoảng thời gian nhất định. Điều này sẽ đặc biệt hữu ích cho các trang web chỉ liên quan trong khung thời gian, chẳng hạn như trang đăng ký sự kiện, chẳng hạn. Trong trường hợp này, có lẽ bạn muốn yêu cầu robot không thu thập dữ liệu và lập chỉ mục trang này sau khi sự kiện kết thúc, do đó ngăn nó hiển thị trong kết quả tìm kiếm của Google. Để làm điều này, chỉ định thẻ meta có giá trị là Đưa ra ví dụ trên, robot Google sẽ không thu thập dữ liệu trang sau ngày 29-ngày 14 tháng 9. Trang cuối cùng sẽ biến mất khỏi chỉ mục, nhưng bạn vẫn có thể giữ lại trang để lưu trữ trong trang web của mình.Ngăn chặn lập chỉ mục sau một thời gian cụ thể
không có sẵn_ sau đó
sau đó theo thông tin thời gian Định dạng thời gian phải tuân theo định dạng RFC-850, ví dụ: Thứ năm, ngày 26 tháng 9 đến 14:00:00 UTC