Hướng dẫn xuất Full báo cáo các URL đã - chưa lập chỉ mục trong GSC

Em có quan sát trên Group, cũng như nhiều anh chị nhắn hỏi riêng nên em quyết định viết bài này ạ.

Bất kì ai quen thuộc với Google Search Console đều biết rằng giới hạn dữ liệu có thể xuất ra là 1000 hàng, cho dù đó là các báo cáo về cụm từ tìm kiếm, trang, quốc gia, hình thức xuất hiện trong kết quả tìm kiếm,… Hiếu đã có một bài viết trước đó hướng dẫn mọi người cách sử dụng Looker Studio để xuất toàn bộ các dữ liệu này: https://www.facebook.com/groups/nghienseo/posts/1294590721210928/

Tuy nhiên, những báo cáo này chỉ ghi nhận các URL đã xuất hiện trên SERPs, nếu bạn muốn kiểm tra toàn bộ các URL đã được lập chỉ mục, chưa được lập chỉ mục thì cách này không hiệu quả.

Trong bài viết này, Hiếu sẽ hướng dẫn mọi người cách để có thể xuất dữ liệu toàn bộ các trang, bài viết đã được lập chỉ mục, chưa được lập chỉ mục trên website. Dữ liệu này sẽ rất quan trọng nếu bạn đang quản lý một website với hàng chục nghìn bài viết và sản phẩm. Bạn có thể kiểm tra các URL nào chưa được lập chỉ mục, lập chỉ mục rồi nhưng không xuất hiện trên SERPs để từ đó quyết định có nên giữ chúng lại, sửa đổi, ép index, hay xoá bỏ.

Các bước để xuất File full báo cáo URL trogn GSC

Bước 1: Tạo các sitemap với tối đa 1000 URL trên 1 sitemap.

Vì Google Search Console chỉ cho phép xuất dữ liệu dưới 1000 hàng, nên nguyên tắc là chúng ta sẽ tạo ra các sitemap với tối đa 1000 URL để từ đó có thể xuất dữ liệu theo từng sitemap.

Ở đây, Hiếu sẽ hướng dẫn anh chị cách làm trên Wordpress với Plugin Rankmath SEO. Trên các nền tảng khác, anh chị cũng có thể thực hiện tương tự. Thay vì để tất cả bài viết, sản phẩm trong một sitemap duy nhất, chúng ta sẽ chia ra thành các sitemap nhỏ hơn với 1000 URL.

Anh chị tìm đến Cài đặt sơ đồ trang > Chung > Liên kết trên mỗi sơ đồ trang web > Chỉnh giá trị này lên 1000 (ảnh 1)

Bước 2: Truy cập https://domain[.]com/sitemap_index.xml, lấy danh sách các sitemap cần kiểm tra URL (ảnh 2). Bình thường, Hiếu sẽ setup trong cài đặt của Rankmath SEO để chỉ tạo các sitemap với các URL mà Hiếu muốn lập chỉ mục như post, category product, product,… Các sitemap cho từng loại sẽ được chia nhỏ thành nhiều sitemap khác nhau như post-sitemap1.xml, post-sitemap2.xml,… Mỗi sitemap này sẽ có tối đa 1000 URL như chúng ta đã setup trong bước 1.

Bước 3: Thêm các sitemap này vào trong Google Search Console (ảnh 3). Ở bước này, công việc của bạn chỉ đơn giản là thêm các sitemap đã lấy ở bước 2 vào Google Search Console. Bạn có thể sẽ gặp lỗi “Không thể tìm nạp”, đừng lo lắng, đây chỉ là lỗi hiển thị khi GSC chưa cập nhật dữ liệu kịp thời, bạn thêm sitemap mới hoặc reload lại trang là sẽ hết lỗi này.

Bước 4: Bây giờ bạn có thể điều hướng đến mục Trang > Tất cả các trang đã biết > Chọn bộ lọc theo sơ đồ trang web > Chọn đến một sitemap bất kì mà bạn muốn kiểm tra (ảnh 4).

Bước 5: Xuất dữ liệu các trang đã được lập chỉ mục. Sau khi đã vào xem báo cáo cho một sitemap cụ thể lúc này bạn có thể vào “Xem dữ liệu về các trang đã được lập chỉ mục” > Sau đó xuất dữ liệu ra file CSV hoặc Google Sheet. (ảnh 5, 6). Dữ liệu trong file báo cáo bao gồm cả số lượt hiển thị của URL đó trên SERP.

Bước 6: Xuất dữ liệu các trang chưa được lập chỉ mục: Ngoài dữ liệu các trang đã được lập chỉ mục, bạn có thể xuất dữ liệu các trang Đã thu thập dữ liệu - hiện chưa được lập chỉ mục hoặc Đã phát hiện thấy - hiện chưa được lập chỉ mục,…

Chọn vào từng mục để đến báo cáo của chúng, sau đó xuất báo cáo về định dạng file CSV hoặc Google Sheet như ở bước 5. (ảnh 7)

Bước 7: Thực hiện tương tự cho danh sách sitemap còn lại sau đó tổng hợp các file lại theo các tiêu chí như: URL đã được lập chỉ mục, URL đã thu thập dữ liệu - hiện chưa được lập chỉ mục, URL đã phát hiện thấy - hiện chưa được lập chỉ mục,… Bạn có thể sắp xếp các URL đã được lập chỉ mục theo số lần hiển thị.

Dựa vào các báo cáo này, bạn sẽ có phương án audit website toàn diện. Ví dụ như các URL đã phát hiện thấy nhưng chưa được lập chỉ mục nguyên nhân là do đâu, mình sẽ audit, ép index lại hay xoá bỏ. Các trang có lượt hiển thị thấp cần đi thêm backlink hoặc chỉnh sửa nội dung, bổ sung từ khoá,…

Cuối cùng, những cài đặt ở trên mình đã setup khi mới tạo website nên dữ liệu có ngay lập tức lúc mình cần báo cáo. Nếu bạn mới bắt đầu thực hiện theo các bước này, dữ liệu có thể sẽ được cập nhật lại ngay theo từng sitemap, hoặc bạn cần kiên nhẫn đợi vài ngày để Google Search Console cập nhật lại dữ liệu.

Hi vọng rằng những chia sẻ của Hiếu có thể giúp bạn trong quá trình audit toàn diện website.

:eight_spoked_asterisk: Author: Nguyễn Hiếu - Nghiện SEO

3 Lượt thích