Topical Authority: Tầm quan trọng đối với xếp hạng website

Mình mới quay trở lại SEO một thời gian gần đây, có rất nhiều khái niệm mới và các thuật ngữ được tạo ra và nhiều người hay nói về Thẩm quyền chủ đề của website. Thế nên mình cũng đã tìm hiểu nghiên một chút qua khái niệm này đồng thời nhận thấy nhiều bạn mới làm SEO chưa hiểu rõ khái niệm này lắm cho nên bài viết này để giúp các bạn hiểu rõ về Topical Authority hơn.

Thẩm quyền chủ đề là gì? Và nó giúp ích như thế nào đối với việc xếp hạng website của bạn trên SERP?

Khi bạn tìm kiếm một từ khóa hoặc một câu hỏi trên Google thì nó sẽ trả về kết quả các website phù hợp kèm nội dung. Và đó là nơi có thẩm quyền chủ đề và cũng chính là thứ bạn có được kết quả đầy đủ nội dung về một lĩnh vực nào đó.

Có vẻ hơi mồ nhỉ? Vậy thì có thể theo dõi ví dụ dưới đây bạn sẽ hiểu rõ hơn thẩm quyền chủ đề là gì?

Giả sử bạn là một nhân viên SEO đang đi xin việc và có một buổi phỏng vấn trực tiếp với nhà tuyển dụng.

Nhà tuyển dụng sẽ làm gì?

Có thể họ sẽ hỏi bạn hàng loạt các câu hỏi về SEO mà họ đã biết rõ các câu trả lời đó.

Bạn trả lời càng đúng nhiều câu hỏi thì chứng tỏ là bạn hiểu rõ về chủ đề SEO

Thẩm quyền chủ đề đơn giản chỉ có vậy. Chủ yếu là bạn đưa ra cho Google thấy các câu trả lời đúng và Google thấy website của bạn biết câu trả lời.

Tính đến thời điểm hiện nay thì thẩm quyền chủ đề có sự thay đổi một chút khi AI đang ngày càng phát triển mạnh mẽ. (Google vẫn đang cho AI cố học hết tất cả các nội dụng để có thể đưa ra các kết quả tìm kiếm phù hợp)

Google không quan tâm đến câu trả lời của bạn đúng hay sai, đơn thuần chỉ quan tâm và kiểm tra các câu hỏi. Đó là lý do vì sao có một thời gian các trang về PAA (People Also Ask) tăng traffic và xếp hạng cao đột ngột như Quora, Reddit,.v.v… Cùng lúc đó, cũng nhiều ae SEOer chèn cả đống các câu hỏi FAQ vào các bài viết với mong muốn Google hiển thị FAQ của mình trên SERP. Nhưng một thời gian sau thì các kết quả FAQ bị bỏ dần trên bảng xếp hạng.

Với dữ liệu khổng lồ hiện tại thì có thể chắc chắn rằng Google đã có mọi câu trả lời phù hợp cho tất cả các chủ đề (bao gồm chủ đề chính và phụ) trong một lĩnh vực nào đó. Chính xác thì Google cũng đã xây dựng các bản đồ chủ đề ở mọi lĩnh vực dựa trên các website có thẩm quyền hiện nay.

Tạo ra hoàng loạt các bài viết với tiêu đề dạng câu hỏi hoặc chủ đề phụ là cách mà bạn cho Google thấy bạn am hiểu về lĩnh vực đó như thế nào. Bạn không cần trả lời chính xác để chứng minh với Google rằng là mình biết câu trả lời đó. Nhưng đối với các trang web nội dung về Luật pháp thì tốt nhất nên có sự chính xác và trích dẫn văn bản cụ thể (nếu có). Đây là cách mà bạn cho Google thấy là bạn bao phủ tất cả các chủ đề trong một lĩnh vực nào đó mà Google biết. Như ví dụ trên thì Google được coi như là nhà tuyển dụng.

Ở đây mình giải thích thêm cho bạn biết thêm về Google sử dụng AI để xác định thẩm quyền chủ đề đối với một lĩnh vực cụ thể như thế nào.

Google sử dụng Véctơ và Nhúng (Vector and Embeddings)

Véctơ: Là một dãy số, mỗi số biểu diễn một đặc điểm khác nhau của một từ hoặc một đoạn văn. Ví dụ, véctơ của từ “mèo” có thể chứa thông tin về kích thước, màu sắc, hành vi của mèo.

Nhúng: Là quá trình chuyển đổi từ hoặc văn bản thành véctơ. Quá trình này được thực hiện bởi các mô hình máy học phức tạp, được huấn luyện trên lượng lớn dữ liệu.

Có thể hiểu: Nhúng là không gian vectơ có chiều cao có thể biểu diễn các thực thể rất phức tạp. Sau đó, bạn có thể giảm vectơ có chiều cao đó xuống vectơ có chiều thấp để so sánh nó cực kỳ nhanh (hoặc bằng mắt người). Đối với các dạng chữ thì thay vì chỉ nhìn vào các từ riêng lẻ, máy tính sẽ chuyển đổi chúng thành những con số đặc biệt gọi là véctơ. Những con số này chứa đựng thông tin về ý nghĩa và mối quan hệ giữa các từ.

Tại vì ngay từ thuở sơ khai thì các ký tự chúng ta gõ trên bàn phím thực chất là những con số ở dạng mã ASCII. Nếu bạn viết một đoạn văn bản thì nó cũng chuyển về dạng mã ASCII.

Và đó là lý do vì sao mình đề câp ở trên là Google không thể nào biết được kết quả câu trả lời của bạn có chính xác hay không. Đơn thuần là họ chỉ kiểm tra câu trả lời của bạn có phù hợp với các dữ liệu mà họ đang có hay không.

Google có một cơ sở dữ liệu lớn lớn véctơ về các chủ đề và nó càng ngày được nạp nhiều dữ liệu từ AI

Tại đây mình giả sử rằng:

Bạn đang muốn xếp hạng với từ khóa “Làm thế nào để trở thành lập trình viên Front End?”. Với cụm từ khóa này Google đã biến nó thành một véctơ trong cơ sở dữ liệu của mình. Cho nên nếu website của bạn có các bài viết như “Front End là gì?”, “Các kỹ năng cần có để trở thành lập trình Front End”,… thì Google có thể đo được khoảng cách giữa các từ khóa này. Cách đo này sẽ được áp dụng đối với tất cả các bài viết có trên website của bạn.

Về toán học thì đây gọi là thẩm quyền chủ đề

Về việc làm On-page cũng tương tự, Google đo khoảng cách trong không gian véctơ để tìm ra chủ đề gần với ý định của người dùng (User Intent). Bên cạnh đó thì trong vụ rò rỉ API của Google gần đây cũng có để cập đến phần Nhúng và Vector bạn có thể xem hình bên dưới.

pageEmbedding là biểu diễn vector của trang(các trang), và siteEmbedding là biểu diễn của Compressed site (toàn bộ Site embedding) Thuộc tính siteFocusScore

Định lượng mức độ tập trung hoặc chú trọng của một trang web vào một chủ đề cụ thể. Điểm cao hơn sẽ gợi ý rằng nội dung trên trang web tập trung cao độ vào một chủ đề, trong khi điểm thấp hơn sẽ chỉ ra rằng nội dung của trang web đa dạng hơn và bao gồm nhiều chủ đề hơn. Thuộc tính siteRadius đo lường tính biến đổi hoặc độ phân tán của các trang nhúng trong một trang web so với toàn bộ nhúng trang web

Nói cách khác, thuộc tính này định lượng mức độ nội dung của từng trang trên một trang web lệch khỏi chủ đề hoặc trọng tâm trung tâm được biểu thị bằng nhúng toàn bộ của trang web. Tóm lại, siteFocusScore cao kết hợp với siteRadius thấp có thể thể hiện thẩm quyền chủ đề mạnh mẽ và tính nhất quán về một chủ đề cụ thể.

Ngoài ra bạn có thể tham khảo thêm tài liệu về 2 bằng sáng chế của Google nói về điều này. Hi vọng thì kiến thức này đủ để bạn biết về thẩm quyền chủ đề là như thế nào.



Bằng sáng chế của Google:

[1] US9740680B1 - Computing numeric representations of words in a high-dimensional space - Google Patents

[2] WO2021252076A1 - Generating a graph data structure that identifies relationships among topics expressed in web documents - Google Patents

:asterisk: Author: Vũ Tuấn Kiệt - Nghiện SEO

1 Lượt thích