Lỗi 403 khi gởi sơ đồ trang web năm 2024
Trang này mô tả các ảnh hưởng của mã trạng thái HTTP, lỗi mạng và lỗi DNS đối với Google Tìm kiếm. Chúng tôi sẽ đề cập 20 mã trạng thái phổ biến nhất mà Googlebot gặp trên môi trường web cũng như các lỗi mạng và lỗi DNS tiêu biểu nhất. Các mã trạng thái ít gặp hơn, chẳng hạn như Show Mã trạng thái HTTPMã trạng thái HTTP là do máy chủ lưu trữ trang web tạo ra khi phản hồi yêu cầu của ứng dụng, chẳng hạn như trình duyệt hoặc trình thu thập dữ liệu. Mỗi mã trạng thái HTTP có một ý nghĩa riêng, nhưng thông thường, kết quả của yêu cầu sẽ giống nhau. Ví dụ: có nhiều mã trạng thái để báo hiệu lệnh chuyển hướng, nhưng kết quả mà những mã đó trả về thì giống nhau. Search Console tạo thông báo lỗi cho mã trạng thái trong phạm vi Bảng sau đây trình bày những mã trạng thái HTTP mà Google hay bắt gặp nhất và cách Google xử lý từng mã trạng thái đó. Mã trạng thái HTTP 2xx (success)Google sẽ cân nhắc lập chỉ mục nội dung này. Nếu nội dung có dấu hiệu bị lỗi, chẳng hạn như có trang trống hoặc thông báo lỗi, thì Search Console sẽ cho thấy .
Google sẽ đưa nội dung vào quy trình lập chỉ mục. Có thể hệ thống lập chỉ mục sẽ lập chỉ mục nội dung này (nhưng không đảm bảo). dig +nocmd www.example.com cname +noall +answer 0 dig +nocmd www.example.com cname +noall +answer 1 Googlebot sẽ chờ nhận nội dung trong một khoảng thời gian nhất định, sau đó đưa phần nội dung đã nhận vào quy trình lập chỉ mục. Thời gian chờ tuỳ thuộc vào loại tác nhân người dùng, ví dụ: thời gian chờ của Googlebot Smartphone có thể khác với thời gian chờ của Googlebot Image. dig +nocmd www.example.com cname +noall +answer 2 Googlebot báo hiệu cho quy trình lập chỉ mục là không nhận được nội dung nào. Search Console có thể cho thấy lỗi dig +nocmd www.example.com cname +noall +answer 4 Googlebot đi theo tối đa 10 bước chuyển hướng. Nếu trình thu thập dữ liệu không nhận được nội dung trong vòng 10 bước, thì Search Console sẽ hiện trong báo cáo Lập chỉ mục trang của trang web. Số bước chuyển hướng mà Googlebot đi theo tuỳ thuộc vào loại tác nhân người dùng; ví dụ: Googlebot Smartphone có thể có giá trị số bước khác với Googlebot Image. Đối với tệp robots.txt, Googlebot sẽ đi theo ít nhất 5 bước chuyển hướng như xác định trong RFC 1945, sau đó dừng lại và coi đó là một lỗi dig +nocmd www.example.com cname +noall +answer 5 của tệp robots.txt. Mọi nội dung mà Googlebot nhận được từ URL chuyển hướng đều bị bỏ qua và nội dung của URL đích cuối cùng sẽ được xem xét để lập chỉ mục. dig +nocmd www.example.com cname +noall +answer 6 Googlebot sẽ đi theo lệnh chuyển hướng và quy trình lập chỉ mục sẽ coi lệnh chuyển hướng là một tín hiệu mạnh cho thấy trang đích của lệnh chuyển hướng nên được chọn làm trang chính tắc. dig +nocmd www.example.com cname +noall +answer 7 Googlebot sẽ đi theo lệnh chuyển hướng và quy trình lập chỉ mục sẽ coi lệnh chuyển hướng là một tín hiệu yếu cho thấy trang đích của lệnh chuyển hướng nên được chọn làm trang chính tắc. dig +nocmd www.example.com cname +noall +answer 8 dig +nocmd www.example.com cname +noall +answer 9 Googlebot sẽ báo hiệu cho quy trình lập chỉ mục rằng nội dung này giống với nội dung trong lần thu thập dữ liệu trước đó. Quy trình lập chỉ mục có thể tính toán lại các tín hiệu của URL, nhưng ngoài điểm này ra thì mã trạng thái không ảnh hưởng đến việc lập chỉ mục.
0 Tương đương với
1.
2 Tương đương với
3.
4 Quy trình lập chỉ mục của Google không xem xét việc lập chỉ mục URL trả về mã trạng thái
5. Những URL đã được lập chỉ mục và trả về mã trạng thái
5 sẽ bị xoá khỏi chỉ mục. Mọi nội dung Googlebot nhận được qua những URL trả về mã trạng thái
5 đều bị bỏ qua.
8 Ngoại trừ lỗi
9, mọi lỗi
5 đều được xử lý như nhau: Googlebot báo hiệu cho quy trình lập chỉ mục rằng nội dung không tồn tại. Quy trình lập chỉ mục sẽ xoá URL khỏi chỉ mục nếu URL này đã có trong chỉ mục. Hệ thống sẽ không xử lý những trang dig +nocmd www.example.com cname +noall +answer 5 mới gặp. Tần suất thu thập dữ liệu sẽ giảm dần. `418 (I'm a teapot)`2`418 (I'm a teapot)`3`418 (I'm a teapot)`4`418 (I'm a teapot)`5`418 (I'm a teapot)`6`418 (I'm a teapot)`7 Googlebot coi mã trạng thái
9 là tín hiệu cho thấy máy chủ bị quá tải và coi đó là một lỗi máy chủ. `418 (I'm a teapot)`9Các lỗi máy chủ `4xx–5xx`0 và
9 sẽ thông báo để trình thu thập dữ liệu của Google tạm thời giảm tốc độ thu thập dữ liệu. Những URL đã lập chỉ mục sẽ vẫn còn trong chỉ mục, nhưng cuối cùng sẽ bị xoá. Nếu tệp robots.txt trả về một mã trạng thái lỗi máy chủ trong hơn 30 ngày, thì Google sẽ sử dụng phiên bản gần đây nhất của tệp này lưu trong bộ nhớ đệm. Nếu không có, Google sẽ xem như không có hạn chế nào đối với việc thu thập dữ liệu. Mọi nội dung Googlebot nhận được qua những URL trả về mã trạng thái `4xx–5xx`0 đều bị bỏ qua. `4xx–5xx`3 Googlebot giảm tốc độ thu thập dữ liệu cho trang web. Tốc độ thu thập dữ liệu sẽ giảm tương ứng với số lượng URL riêng lẻ đang trả về lỗi máy chủ. Quy trình lập chỉ mục của Google sẽ xoá khỏi chỉ mục những URL liên tục trả về lỗi máy chủ. `4xx–5xx`4`4xx–5xx`5 Lỗi soft 404 Lỗi Những trang như vậy có thể do máy chủ web, hệ thống quản lý nội dung hoặc trình duyệt của người dùng tạo ra vì nhiều lý do. Ví dụ:
Trường hợp trả về mã trạng thái Khi thuật toán của Google phát hiện rằng trang đó thực sự là một trang lỗi (dựa vào nội dung trên trang), thì bạn sẽ thấy một lỗi Khắc phục lỗi |