Đừng nhìn nhận nó là thuật toán quét backlink, đó là một sai lầm.
Bạn sẽ thấy từ khi thuật toán đó chạy, có một điều rất kỳ lạ trước đây không gặp:
Khi một url vẫn được index nhưng không thể tìm kiếm ra nó bằng bất kỳ từ khoá nào.
Điển hình như BVTTHCM năm ngoái, tìm bằng brand name và url web còn không ra, nhưng tìm bằng cấu trúc site:url thì có.
Trường hợp này, nó đã dính thuật toán link spam. Nó giống với việc bạn bị đưa trở lại kho lưu trữ dữ liệu.
Nôm na quy trình xếp hạng cơ bản gồm: Tìm thu thập - Đưa vào hàng đợi - Index - Xếp hạng. Ở đây các quá trình là độc lập, page của bạn đang ở xếp hạng bị đưa ngược trở lại kho lưu trữ dữ liệu thu thập.
Phỏng đoán lý do Google làm vậy:
Url lúc này vẫn được giữ lại vì Google nhận thấy dữ liệu của url đó vẫn còn giá trị cho Google nạp vào để học.
Tuy nhiên, Google đã ngăn chặn nó tiếp cận với người dùng tìm kiếm, vì nó có yếu tố spam, không mang lại giá trị cho người tìm kiếm.
Hành vi spam đây là spam về backlink hoặc một yếu tố khác không phải content nên content bên trong có thể vẫn ngon lành cho Google xơi.
Cách xử lý quá hay của Google.
Giống như ngoài đời, ông Quyết FLC bị bế đi trại vì thao túng chứng khoán nhưng hãng bay Bamboo của ông ấy vẫn đang phục vụ tốt người dùng, chẳng có lý do gì phạt họ, chỉ cần ngăn chặn ông Quyết và vẫn giữ lại những sản phẩm tốt của ông ấy.
Và tất nhiên rồi, những url như thế này không có động gì tới kết quả tìm kiếm. Backlink trong đó không có giá trị.
Ngược lại, nếu url đó spam về content thì nó sẽ vô nghĩa cho cả Google lẫn người dùng. Trường hợp này thường không index hoặc mất index. Nhất là dạng tạo hàng loạt social có nội dung trùng lặp.
Hãy tưởng tượng, bạn gặp 1 nội dung ở rất nhiều nơi, bạn muốn chia sẻ cho người khác thì bạn chỉ lấy ở 1 duy nhất, bạn đâu có lấy ở mọi nơi nội dung đó xuất hiện để chia sẻ. Google cũng vậy, chẳng việc gì nó phải lấy các nội dung đã tồn tại.
Đây là thuật toán có rất nhiều thứ để khai thác. Vô cùng đa dạng hình thức xử lý của Google:
-
Bỏ qua không thu thập (noindex)
-
Loại bỏ khỏi index (deindex)
-
Ngăn chặn tiếp cận người dùng
Tuỳ vào mức độ spam và phần giá trị còn lại của url mà nó sẽ có cách xử lý khác nhau.
Việc của bạn là check xem bạn đang dính lỗi nào và thay đổi. Có thể tham khảo các yếu tố bị Google coi là spam ở đây.
Author: Nguyễn Cao Khánh - Group Nghiện SEO
(Bài cũ post lại)