Mặc dù có sự tương đồng lớn về nguyên tắc giữa tối ưu hóa cho AI và tìm kiếm truyền thống, vẫn có những khác biệt rõ rệt do sự thay đổi trong phong cách truy xuất (đối sánh truy vấn đơn với các trang so với việc phân nhánh truy vấn và tổng hợp content), mục tiêu tối ưu hóa (content và siêu dữ liệu trang so với các đoạn content và các mẩu thông tin thực tế), trình bày kết quả (danh sách xếp hạng các liên kết có thể nhấp so với câu trả lời tổng hợp, trích dẫn, tóm tắt), và các chỉ số thành công (thứ hạng, CTR, traffic so với sự xuất hiện/khả năng hiển thị trong phản hồi, trích dẫn/đề cập), cùng với các lĩnh vực khác, mà tôi nhấn mạnh ở đây nếu bạn quan tâm đến sự thay đổi.
Để dễ dàng hành động, tôi đã tạo một Checklist Tối ưu hóa Content cho AI Search gồm 10 bước, đi qua các khía cạnh quan trọng nhất cần tính đến để tối ưu hóa content của bạn cho các câu trả lời tìm kiếm của AI - từ tối ưu hóa đoạn, mức độ đáng tin cậy để trích dẫn, chiều rộng và chiều sâu chủ đề, cá nhân hóa, v.v. -, cùng với tầm quan trọng của chúng và cách thực hiện, với các ví dụ về cách tiến lên và những gì cần tránh.
Hãy cùng xem qua và truy cập phiên bản Google Sheets tại đây.
1. Nghiên cứu và đánh giá hành vi của đối tượng trên nền tảng AI Search
Hiểu cách đối tượng của bạn tìm kiếm cụ thể trên các nền tảng AI là điều cơ bản do hành vi tìm kiếm trên AI khác với tìm kiếm truyền thống: cả về mục đích, ý định, độ dài của truy vấn, cũng như sự tương tác/tương tác, với các truy vấn dài, dựa trên hội thoại, nhiều lượt với ý định hướng đến nhiệm vụ cao thay vì các truy vấn ngắn, dựa trên keyword, một lần với ý định điều hướng cao.
Kết quả sẽ cho phép bạn xác định các loại câu hỏi và chủ đề mà content của bạn cần giải quyết để xuất hiện trong các câu trả lời do AI tạo ra, và cách ưu tiên dựa trên hiệu suất hiện tại của nó so với các đối thủ cạnh tranh.
Cần làm:
- Xác định các Nền tảng AI Search mà Đối tượng của bạn Sử dụng, những nền tảng đã giới thiệu traffic hàng đầu đến trang web của bạn, cũng như những nền tảng giới thiệu traffic AI đến đối thủ cạnh tranh của bạn
- Xác định các Truy vấn/Lời nhắc phổ biến và phù hợp nhất được đối tượng của bạn sử dụng để tìm kiếm sản phẩm/dịch vụ và thương hiệu của bạn trong suốt hành trình của khách hàng
- Xác định Hiệu suất Content Hiện tại của bạn (lượt đề cập, links, tình cảm) so với Đối thủ cạnh tranh cho các Truy vấn/Lời nhắc có liên quan trên các Nền tảng AI có liên quan
- Thiết lập các truy vấn/lời nhắc và chủ đề có liên quan của bạn để nhắm mục tiêu và ưu tiên tối ưu hóa với chiến lược content của bạn dựa trên hiệu suất trang web và thương hiệu hiện tại của bạn so với các đối thủ cạnh tranh
Ví dụ:
Tốt:
- Sử dụng nền tảng phân tích của bạn (ví dụ: GA4) để xác định các nền tảng AI search phổ biến nhất được khách truy cập hiện tại của bạn sử dụng (ChatGPT, Gemini, Perplexity, v.v.)
- Sử dụng các công cụ của bên thứ ba (ví dụ: Similarweb) để xác định các nền tảng AI search phổ biến nhất giới thiệu traffic đến đối thủ cạnh tranh
- Xác định các lời nhắc phổ biến nhất giới thiệu traffic trang web của bạn từ các nền tảng AI bằng các công cụ của bên thứ ba (ví dụ: Similarweb)
- Nghiên cứu các lời nhắc phổ biến nhất liên quan đến thương hiệu và các chủ đề sản phẩm/dịch vụ của bạn trên các nền tảng AI (ví dụ: Profound, Sistrix) bằng cách sử dụng những lời nhắc hoạt động tốt nhất hiện tại của bạn và của các đối thủ cạnh tranh hàng đầu của bạn làm nguồn
- Đánh giá sự bao gồm và khả năng hiển thị của trang web và thương hiệu của bạn (đề cập, links, tình cảm) trong câu trả lời cho các truy vấn/lời nhắc có liên quan trong số những truy vấn/lời nhắc phổ biến nhất (ví dụ: Profound, Peec AI, v.v.)
- Xác định và đánh giá khoảng cách về sự bao gồm và khả năng hiển thị của thương hiệu của chính bạn so với các đối thủ cạnh tranh hàng đầu của bạn đối với các truy vấn/lời nhắc có liên quan và phổ biến (ví dụ: Profound, Peec AI, v.v.)
- Phát hiện các truy vấn/lời nhắc và chủ đề hàng đầu để nhắm mục tiêu với content của bạn và để tối ưu hóa - và theo dõi -, dựa trên sự bao gồm và khả năng hiển thị hiện tại so với các đối thủ cạnh tranh trên các nền tảng AI được sử dụng nhiều nhất
Không tốt:
- Bỏ qua dữ liệu giới thiệu từ các nguồn AI, không theo dõi traffic đến từ các nền tảng AI như Perplexity hoặc ChatGPT dẫn đến bỏ lỡ những hiểu biết sâu sắc về hành vi người dùng và hiệu suất content, mà bạn có thể sử dụng để hiểu sở thích của đối tượng và ưu tiên các nỗ lực của mình.
- Cho rằng người dùng vẫn tìm kiếm theo cách tương tự như trên tìm kiếm Google truyền thống mà không xem xét cách người dùng hỏi các lời nhắc dài hơn, dựa trên nhiệm vụ, mang tính hội thoại trên các nền tảng AI.
- Không phân tích khả năng hiển thị AI của đối thủ cạnh tranh. Bỏ qua cách đối thủ cạnh tranh của bạn được trích dẫn, liên kết hoặc tóm tắt bởi các nền tảng AI có nghĩa là bạn bỏ lỡ việc đo lường hiệu suất, để xác định các cơ hội.
- Chỉ xem xét các lời nhắc có thương hiệu; chỉ tập trung vào các lời nhắc đề cập đến thương hiệu của bạn (ví dụ: “[Thương hiệu] có tốt không?”) trong khi bỏ qua các truy vấn chủ đề sản phẩm/dịch vụ không có thương hiệu (ví dụ: “Loại [sản phẩm] tốt nhất cho nhu cầu X”) sẽ giới hạn phạm vi content và tiềm năng hiển thị của bạn.
- Xác định các đề cập liên quan đến thương hiệu và sản phẩm/dịch vụ của bạn cho các lời nhắc phổ biến, mà không đánh giá thêm về tình cảm và sự bao gồm của links trong đó.
- Đối xử với tất cả các nền tảng AI như nhau, không phân tích hành vi cụ thể và cơ chế hiển thị của các công cụ tìm kiếm AI khác nhau (ví dụ: Google AI Mode so với ChatGPT) có thể dẫn đến các nỗ lực tối ưu hóa không phù hợp.
2. Tối ưu hóa khả năng thu thập và lập chỉ mục của content AI
Content có liên quan phải có thể truy cập, có thể lập chỉ mục và có thể tái sử dụng bởi cả các trình thu thập thông tin của công cụ tìm kiếm truyền thống và các AI agent cụ thể truy xuất content cho các mô hình ngôn ngữ lớn và các câu trả lời do AI tạo ra.
Cần làm:
- Cho phép các trình thu thập thông tin của công cụ tìm kiếm từ các hệ thống AI thông qua các chỉ thị robots.txt của bạn trong các khu vực có content có liên quan để hiển thị: GPTBot, Googlebot and Google-Extended token, bingbot, Claude (ClaudeBot/Claude-User/Claude-SearchBot), CCBot, PerplexityBot/Perplexity‑User.
- Tránh chặn các bot AI bằng tường lửa hoặc bộ lọc bot, bằng cách đưa các dải IP của chúng vào danh sách trắng.
- Kết xuất tất cả content cần thiết phía máy chủ hoặc sử dụng kết xuất trước. Tránh phụ thuộc vào JavaScript phía máy khách cho content chính để tránh các thách thức về khả năng lập chỉ mục vì không phải tất cả các hệ thống AI đều kết xuất nó.
- Tránh noindexing thông qua meta robots đối với content có giá trị sẽ được hiển thị trong các câu trả lời của AI.
- Tránh sử dụng quy tắc “nosnippet” thông qua meta robots trong content có giá trị sẽ được hiển thị trong các câu trả lời của AI, điều này sẽ ngăn content được sử dụng làm đầu vào trực tiếp cho AI Overviews và AI Mode.
- Sử dụng thẻ canonical để chỉ định content sẽ được truy xuất và sử dụng trong quá trình tổng hợp từ các phiên bản URL của trang phù hợp.
- Tối ưu hóa liên kết nội bộ để tạo điều kiện thuận lợi cho việc thu thập thông tin các trang nội bộ, đồng thời sử dụng các văn bản neo mô tả.
Ví dụ:
Tốt:
1. Content bạn sẽ tạo:
- Tiêu đề: “Hướng dẫn đầy đủ về Technical SEO”
- Định dạng: Trang trụ cột dựa trên HTML được lưu trữ tại /technical-seo/, được cấu trúc với các tiêu đề phụ và được liên kết đến các trang cụm hỗ trợ.
2. Các tối ưu hóa chính về khả năng thu thập và lập chỉ mục:
- Cho phép các trình thu thập thông tin chính trong robots.txt: GPTBot, Googlebot, Google-Extended, bingbot, ClaudeBot, CCBot, PerplexityBot.
- Các bot AI được đưa vào danh sách trắng trong các quy tắc tường lửa/CDN: Traffic của bot (ví dụ: từ GPTBot, PerplexityBot) được cho phép và không bị giới hạn tốc độ hoặc bị chặn.
- Kết xuất phía máy chủ (SSR): Content được kết xuất trên máy chủ để đảm bảo tất cả các bot (bao gồm cả LLMs) có thể truy cập và index đầy đủ. Tránh các framework nặng về JavaScript trừ khi được kết xuất trước.
- Không chặn trong thẻ meta: <meta name=”robots” content=”index, follow”>. Không sử dụng noindex hoặc nosnippet trên các trang thông tin có giá trị cao.
- Thẻ canonical tự tham chiếu: . Tránh các tín hiệu content trùng lặp; cho biết phiên bản nào sẽ được sử dụng để tổng hợp.
- Liên kết nội bộ có thể thu thập thông tin và mô tả: <a href=”/technical-seo/crawlability/” title=”Tìm hiểu cách khả năng thu thập thông tin ảnh hưởng đến SEO”>Khả năng thu thập thông tin. Văn bản neo rõ ràng giúp các trình thu thập thông tin hiểu ngữ cảnh trang và cải thiện các kết nối ngữ nghĩa.
Không tốt:
1. Content bạn sẽ tạo:
- Tiêu đề: “Mẹo Technical SEO”
- Định dạng: Ứng dụng một trang nặng về JavaScript tại /technical-seo.html chỉ kết xuất content phía máy khách
2. Các vấn đề nghiêm trọng về khả năng thu thập và lập chỉ mục:
- Không cho phép các trình thu thập thông tin AI trong robots.txt: Disallow: / hoặc User-agent: GPTBot Disallow: / ngăn các hệ thống AI chính truy cập content.
- Các bot AI bị chặn bởi tường lửa: Các quy tắc tường lửa chặn các dải IP từ Perplexity, Claude, v.v., ngăn chặn việc truy xuất content.
- Chỉ kết xuất phía máy khách (CSR): Trang hoàn toàn dựa vào JavaScript để kết xuất, vì vậy các bot không thực thi JS sẽ thấy một trang trống.
- Chặn thẻ meta:
<meta name=”robots” content=”noindex, nofollow”>
hoặc<meta name=”googlebot” content=”nosnippet”>
ngăn trang không được index hoặc sử dụng trong các đoạn trích. - Không có thẻ Canonical hoặc Canonical không chính xác: Thiếu thẻ canonical trên các trang trùng lặp làm các trình thu thập thông tin bị nhầm lẫn, hoặc canonical hóa đến một trang không liên quan ngăn trang chính xác không được index.
- Liên kết nội bộ không thể thu thập thông tin:
<span onclick=”goTo(‘/technical-seo/crawlability/’)”>
Khả năng thu thập thông tin</span>
. Các liên kết được triển khai thông qua các sự kiện JavaScript, không phải là các thẻ<a>
href có thể thu thập thông tin, che giấu chúng khỏi các bot.
3. Tối ưu hóa cho chiều rộng và chiều sâu của chủ đề
Các hệ thống AI search tổng hợp thông tin từ nhiều nguồn để cung cấp các câu trả lời toàn diện. Content của bạn nên bao quát một chủ đề một cách sâu sắc, giải quyết các chủ đề phụ, các thực thể và các câu hỏi phổ biến có liên quan để thiết lập thẩm quyền về chủ đề và tăng cơ hội được đưa vào một câu trả lời tổng hợp.
Cần làm:
- Bao quát chủ đề chính một cách toàn diện, giải quyết các câu hỏi ai, cái gì, tại sao và như thế nào.
- Giải quyết các chủ đề phụ, các thực thể và các câu hỏi có liên quan mà người dùng có khả năng hỏi trong các truy vấn tiếp theo.
- Cấu trúc content một cách hợp lý với các tiêu đề, tiêu đề phụ và danh sách rõ ràng để cải thiện khả năng đọc và giúp các hệ thống AI phân tích thông tin.
- Sử dụng mô hình trang trụ cột và cụm chủ đề để tổ chức content và thể hiện chuyên môn.
- Kết hợp dữ liệu có cấu trúc (ví dụ: Schema.org) để xác định rõ ràng các thực thể, chủ đề và mối quan hệ.
Ví dụ:
Tốt:
1. Content bạn sẽ tạo:
- Tiêu đề trang trụ cột: “Hướng dẫn cuối cùng về Link Building cho SEO”
- URL: /link-building/
- Content cụm hỗ trợ: /link-building-strategies/, /outreach-for-links/, /measuring-link-building-roi/, /guest-blogging-guide/, v.v.
2. Các đặc điểm chính về chiều rộng và chiều sâu của chủ đề:
- Bao quát toàn diện: Trang trụ cột định nghĩa link building, giải thích tầm quan trọng của nó và bao quát các khái niệm cơ bản.
- Giải quyết các chủ đề phụ: Nó liên kết đến các trang cụm bao gồm các chiến lược cụ thể (ví dụ: xây dựng liên kết bị hỏng, đề cập thương hiệu không có liên kết), các chiến thuật tiếp cận và đo lường.
- Trả lời các câu hỏi phổ biến: Bao gồm một phần Hỏi & Đáp trả lời “Mất bao lâu để xây dựng links?” và “Link building có còn phù hợp không?”
- Cấu trúc hợp lý: Sử dụng H2 cho các phần chính (“Link Building là gì?”), H3 cho các phần phụ (“Các chỉ số Link Building chính”) và các dấu đầu dòng cho danh sách.
- Dữ liệu có cấu trúc: Triển khai lược đồ Article, FAQPage và BreadcrumbList để cung cấp ngữ cảnh cho các công cụ tìm kiếm.
Không tốt:
1. Content bạn sẽ tạo:
- Tiêu đề trang: “Link Building dễ dàng”
- URL: /easy-links.html
2. Tại sao nó thiếu chiều rộng và chiều sâu của chủ đề:
- Bao quát nông cạn: Bài viết chỉ liệt kê ba mẹo link building cơ bản mà không giải thích các nguyên tắc cơ bản hoặc bối cảnh chiến lược.
- Bỏ qua các chủ đề phụ: Không bao gồm các loại link building khác nhau, cách thực hiện các chiến dịch hoặc cách đo lường thành công.
- Không trả lời câu hỏi của người dùng: Giả định một ý định duy nhất, đơn giản và không giải quyết các câu hỏi hoặc mối quan tâm tiếp theo phổ biến.
- Cấu trúc kém: Content là một khối văn bản duy nhất không có tiêu đề rõ ràng, gây khó khăn cho người dùng và AI trong việc phân tích.
- Không có dữ liệu có cấu trúc: Bỏ lỡ cơ hội sử dụng đánh dấu lược đồ để làm rõ mục đích và cấu trúc của content.
4. Tối ưu hóa cho việc truy xuất ở cấp độ đoạn
Các hệ thống AI search thường truy xuất và tổng hợp các “đoạn” content nhỏ, khép kín thay vì toàn bộ trang. Mỗi đoạn phải dễ hiểu theo đúng nghĩa của nó và cung cấp một câu trả lời rõ ràng, ngắn gọn cho một câu hỏi hoặc chủ đề phụ cụ thể.
Cần làm:
- Chia nhỏ content dài thành các phần hoặc đoạn hợp lý, khép kín, mỗi phần giải quyết một chủ đề phụ cụ thể.
- Sử dụng các tiêu đề rõ ràng và mô tả (H1, H2, H3) để xác định chủ đề của mỗi đoạn.
- Đảm bảo mỗi đoạn ngắn gọn, được viết tốt và cung cấp một câu trả lời hoặc giải thích trực tiếp.
- Sử dụng định dạng như danh sách, bảng và trích dẫn khối để cấu trúc thông tin để dễ dàng trích xuất.
- Viết bằng một giọng văn tự nhiên, mang tính hội thoại phù hợp với cách các hệ thống AI tạo ra câu trả lời.
Ví dụ:
Tốt:
Cấu trúc Content (HTML):
Kiểm toán Content là gì?
Kiểm toán content là một quy trình có hệ thống để xem xét tất cả content trên trang web của bạn để đánh giá hiệu suất, sự liên quan và chất lượng của nó. Nó giúp xác định điểm mạnh và điểm yếu trong chiến lược content của bạn.
Tại sao Kiểm toán Content lại quan trọng?
Kiểm toán content rất quan trọng đối với:
- Cải thiện hiệu suất SEO: Bằng cách xác định và loại bỏ hoặc cải thiện content hoạt động kém.
- Nâng cao trải nghiệm người dùng: Bằng cách đảm bảo content chính xác, cập nhật và đáp ứng nhu cầu của người dùng.
- Phù hợp với mục tiêu kinh doanh: Bằng cách xác minh rằng content của bạn hỗ trợ các mục tiêu tiếp thị và bán hàng của bạn.
Tại sao điều này hoạt động:
- Các đoạn khép kín: Các phần “Kiểm toán Content là gì?” và “Tại sao Kiểm toán Content lại quan trọng?” có thể đứng một mình và vẫn có ý nghĩa.
- Các tiêu đề mô tả: H2 và H3 báo hiệu rõ ràng chủ đề của mỗi đoạn.
- Ngắn gọn và trực tiếp: Mỗi đoạn cung cấp một lời giải thích rõ ràng, tập trung.
- Định dạng có cấu trúc: Việc sử dụng
<ul>
và<li>
giúp AI dễ dàng phân tích và trình bày thông tin dưới dạng danh sách.
Không tốt:
Cấu trúc Content (HTML):
Kiểm toán Content
Kiểm toán content là khi bạn xem xét content của mình. Nó quan trọng đối với SEO. Bạn nên kiểm tra những thứ như links bị hỏng, thông tin cũ và traffic thấp. Nó cũng giúp ích cho trải nghiệm người dùng và mục tiêu kinh doanh. Ví dụ, bạn có thể tìm thấy content để xóa hoặc cải thiện. Toàn bộ quá trình này có thể mất nhiều thời gian, nhưng cuối cùng nó rất xứng đáng vì trang web của bạn sẽ tốt hơn.
Tại sao điều này thất bại:
- Khối nguyên khối: Toàn bộ chủ đề được nhồi nhét vào một đoạn văn duy nhất, gây khó khăn cho việc trích xuất một câu trả lời cụ thể.
- Tiêu đề mơ hồ: H2 “Kiểm toán Content” không mô tả bằng một tiêu đề dựa trên câu hỏi.
- Thiếu cấu trúc: Không có danh sách hoặc định dạng để chia nhỏ thông tin, buộc AI phải phân tích một khối văn bản dày đặc.
- Các chủ đề hỗn hợp: Nó pha trộn giữa “cái gì”, “tại sao” và “như thế nào” mà không có sự tách biệt rõ ràng, khiến nó trở thành một nguồn yếu cho một câu trả lời ngắn gọn.
5. Tối ưu hóa cho việc tổng hợp câu trả lời
Các công cụ AI search tổng hợp thông tin từ nhiều nguồn để tạo ra một câu trả lời duy nhất, mạch lạc. Để được đưa vào, content của bạn phải dễ phân tích, chính xác về mặt thực tế và được viết theo cách có thể được tích hợp liền mạch với thông tin từ các nguồn khác.
Cần làm:
- Viết bằng một giọng văn rõ ràng, khách quan và thực tế. Tránh ngôn ngữ quá quảng cáo hoặc chủ quan.
- Sử dụng các cấu trúc câu và từ vựng đơn giản.
- Đảm bảo content của bạn được cấu trúc tốt với các tiêu đề, danh sách và bảng.
- Cung cấp câu trả lời trực tiếp cho các câu hỏi (ví dụ: bắt đầu một phần bằng một câu tóm tắt).
- Sử dụng dữ liệu có cấu trúc (ví dụ:
FAQPage
,HowTo
) để làm cho content của bạn dễ phân tích hơn nữa.
Ví dụ:
Tốt:
Cấu trúc Content (HTML):
Kiểm toán SEO là gì?
Tóm tắt: Kiểm toán SEO là một phân tích toàn diện về một trang web để xác định các vấn đề có thể ảnh hưởng đến việc tối ưu hóa và khả năng hiển thị không phải trả tiền của nó trong các công cụ tìm kiếm.
Nó thường bao gồm việc xem xét khả năng thu thập thông tin, khả năng lập chỉ mục, tốc độ, việc sử dụng dữ liệu có cấu trúc, sự liên quan và chất lượng của content, và sự phổ biến của liên kết so với các đối thủ cạnh tranh. Mục tiêu là khám phá các vấn đề và cơ hội liên quan đến kỹ thuật, content và sự phổ biến của liên kết để cải thiện hiệu suất của nó trong tìm kiếm không phải trả tiền.
Tại sao điều này hoạt động:
- Bắt đầu bằng một bản tóm tắt trực tiếp, ngắn gọn
- Mở rộng với chi tiết có cấu trúc
- Sử dụng định dạng Hỏi & Đáp và tiêu đề rõ ràng
- Giọng văn đơn giản, thực tế
Không tốt:
<h2>Audit SEO và các tài nguyên thiết yếu khác mà chúng tôi cung cấp</h2>
<p>Tại LearningSEO.io, chúng tôi hướng dẫn bạn thông qua các cuộc Audit, danh sách kiểm tra và bộ công cụ được thiết kế riêng để cải thiện khả năng hiển thị trực tuyến của bạn. Lộ trình SEO hoàn chỉnh của chúng tôi trao quyền cho các marketers trở thành chuyên gia. Khám phá cách technical SEO, content và backlinks có thể đưa traffic của bạn lên một tầm cao mới.</p>
Tại sao điều này thất bại:
- Ngôn ngữ quảng cáo và mơ hồ
- Không có định nghĩa hoặc tóm tắt rõ ràng
- Không có dữ liệu có cấu trúc
- Thiếu cấu trúc Hỏi & Đáp và định dạng có thể trích xuất
- Hợp nhất nhiều chủ đề, khó tổng hợp thành một câu trả lời AI
6. Tối ưu hóa cho mức độ đáng tin cậy để trích dẫn
Các công cụ AI search sẽ trích dẫn content khi nó được coi là chính xác về mặt thực tế, cập nhật, có cấu trúc tốt và có thẩm quyền. Không phải mọi đoạn được bao gồm đều được trích dẫn - để được ghi công, content của bạn phải đáp ứng các tiêu chí tin cậy và rõ ràng cao hơn.
Cần làm:
- Sử dụng các tuyên bố cụ thể, cập nhật, có thể kiểm chứng, dựa trên thực tế, không phải là những lời khái quát mơ hồ.
- Bao gồm các trích dẫn nguồn (liên kết đến các study, số liệu thống kê hoặc chuyên gia).
- Hiển thị quyền tác giả và thông tin xác thực cho các tín hiệu EEAT.
- Sử dụng dữ liệu có cấu trúc của tác giả, tổ chức cho sự nổi bật của thương hiệu và thực thể nhằm củng cố siêu dữ liệu trích dẫn.
- Làm mới content chính thường xuyên và báo hiệu content được cập nhật bằng cách thêm dấu thời gian.
Ví dụ:
Tốt:
<h2>robots.txt là gì và nó ảnh hưởng đến SEO như thế nào?</h2>
<p>Tệp <code>robots.txt</code> được sử dụng để kiểm soát cách các trình thu thập thông tin của công cụ tìm kiếm truy cập trang web của bạn. Theo Google Search Central, việc không cho phép một trang trong <code>robots.txt</code> sẽ ngăn nó không bị thu thập thông tin nhưng <strong>không</strong> ngăn nó không bị index nếu các tín hiệu khác (như links) trỏ đến nó. <a href="https://developers.google.com/search/docs/crawling-indexing/robots/intro">[Google Search Central, 2025]</a> [link giữ nguyên]</p>
<p><strong>Cập nhật:</strong> Tháng 3 năm 2025</p>
<p><strong>Author:</strong> Aleyda Solis, SEO Consultant and Author, LearningSEO.io</p>
Tại sao điều này hoạt động:
- Sử dụng một tuyên bố chính xác, có thể kiểm chứng được liên kết trực tiếp đến tài liệu chính thức
- Làm rõ một quan niệm sai lầm phổ biến về SEO với độ chính xác thực tế
- Hiển thị quyền tác giả và vai trò cho EEAT
- Ngày cập nhật mới
Không tốt:
Giải thích về robots.txt
robots.txt rất quan trọng đối với SEO. Bạn có thể sử dụng nó để ngăn Google index các trang của bạn. Nó là một công cụ mạnh mẽ và nên được sử dụng cẩn thận.
Tại sao điều này thất bại:
- Không chính xác và gây hiểu lầm: robots.txt chặn việc thu thập thông tin, không nhất thiết là index
- Không có nguồn hoặc tài liệu tham khảo bên ngoài
- Ngôn ngữ mơ hồ, khái quát
- Không có quyền tác giả, dấu thời gian hoặc dữ liệu có cấu trúc cho sự liên quan của trích dẫn
7. Tối ưu hóa cho các tín hiệu về thẩm quyền của Content
Thẩm quyền làm tăng khả năng content của bạn sẽ được đưa vào và trích dẫn trong các câu trả lời do AI tạo ra, đặc biệt là khi các hệ thống này dựa vào việc nhận dạng thực thể và danh tiếng để xác định nguồn nào đáng tin cậy. Nếu không có các tín hiệu thẩm quyền rõ ràng - chẳng hạn như dòng tác giả chuyên gia, dữ liệu có cấu trúc, các trích dẫn bên ngoài và các đề cập trên các trang web có uy tín - content của bạn ít có khả năng được hiển thị, ngay cả khi nó chính xác.
Cần làm:
- Tối ưu hóa sự hiện diện thương hiệu của bạn trên các nền tảng web, bao gồm cả các kênh xã hội, một cách nhất quán, liên kết trở lại trang web chính của bạn, tương tác với cộng đồng của bạn, trả lời các bài đánh giá, v.v.
- Xuất bản các nghiên cứu, report hoặc study dữ liệu gốc, tiến hành các cuộc khảo sát, biên soạn các bộ dữ liệu độc đáo hoặc thực hiện các study trong ngành. Quảng bá chúng đến các nhà báo và blogger tạo ra các bài tổng hợp content.
- Đảm bảo được đưa tin trên các ấn phẩm của ngành và chuyên gia, đóng góp các trích dẫn hoặc content khách mời cho các bản tin và blog có uy tín trong ngành của bạn.
- Quảng bá content của bạn trên các kênh của bên thứ ba có liên quan: Tương tác với những người có ảnh hưởng, chuyên gia, các nhóm Slack, subreddit và cộng đồng. Yêu cầu phản hồi và đề cập.
Ví dụ:
Tốt:
1. Content bạn sẽ tạo:
- Tiêu đề: “Tình hình các công cụ SEO năm 2025: Xu hướng sử dụng theo vai trò, khu vực và kinh nghiệm”
- Loại: Study nghiên cứu gốc với bộ dữ liệu có thể tải xuống + hình ảnh hóa
- Định dạng: Report dạng dài + CSV + biểu đồ có thể nhúng
- Mục tiêu cụm chủ đề: Các công cụ SEO - phù hợp với thẩm quyền chủ đề rộng hơn của các nguyên tắc cơ bản về SEO
Đặc điểm chính:
- Dựa trên một cuộc khảo sát hơn 1.000 chuyên gia SEO từ nhiều khu vực và cấp độ kinh nghiệm
- Bao gồm các phân tích chi tiết theo danh mục công cụ (trình thu thập thông tin, nghiên cứu keyword, trình theo dõi thứ hạng, công cụ AI SEO, v.v.)
- Bao gồm các biểu đồ, đồ thị và hình ảnh hóa dữ liệu gốc (được phân phát dưới dạng HTML, không chỉ là hình ảnh)
- Được viết bởi một chuyên gia SEO đã biết (với dòng tác giả, hồ sơ và links xã hội)
- Dữ liệu có cấu trúc bao gồm tác giả, tổ chức, ngày xuất bản, sameAs cho thương hiệu và cá nhân
- Được đóng dấu thời gian và làm mới hàng năm, thể hiện cam kết về độ chính xác và kịp thời
- Links đến các tài liệu tham khảo bên ngoài (ví dụ: so sánh với các report năm 2024 từ Semrush, Ahrefs hoặc Google)
2. Cách bạn đảm bảo được đưa tin và quảng bá:
- Tiếp cận trực tiếp các ấn phẩm như SEJ, SEL, SER cung cấp bản xem trước độc quyền hoặc các góc trích dẫn với các điểm dữ liệu theo khu vực/danh mục công cụ để được đưa tin
- Giới thiệu cho các bản tin trong ngành như SEOFOMO, Core Updates, SEO for Lunch hoặc Growth Memo, bao gồm các xu hướng mới nhất, để đưa nghiên cứu vào ấn bản tiếp theo, cung cấp một đoạn giới thiệu ngắn
- Gửi nghiên cứu đến các công cụ tổng hợp tin tức SEO như SEOFOMO News
- Chia sẻ nghiên cứu với khán giả của bạn trên các nền tảng xã hội (LinkedIn, X, Bluesky) bằng cách giới thiệu các số liệu thống kê nổi bật
- Xuất bản lại một bản tóm tắt nghiên cứu và những hiểu biết hàng đầu trong một bài đăng trên LinkedIn liên kết đến nghiên cứu chính để tìm hiểu thêm
- Đăng trong các cộng đồng SEO trên Slack và các chủ đề subreddit với giá trị rõ ràng + biểu đồ
- Yêu cầu các chuyên gia SEO đóng góp bình luận, bao gồm 3-4 trích dẫn ngắn từ các chuyên gia SEO có uy tín trong report. Điều này khuyến khích đồng quảng bá và nâng cao thẩm quyền được cảm nhận.
Tại sao điều này hoạt động:
- Đó là Content gốc, nguồn chính
- Nó có tín hiệu EEAT (Chuyên môn, Kinh nghiệm, Thẩm quyền, Tin cậy) rõ ràng
- Nó được quảng bá và trích dẫn bên ngoài
- Nó được cấu trúc để trích xuất và tổng hợp
- Nó được làm mới và đóng dấu thời gian
Không tốt:
1. Content bạn sẽ tạo:
- Tiêu đề: “Các công cụ SEO hàng đầu cho năm 2025”
- Loại: Bài đăng trên blog có links liên kết
- Định dạng: Kiểu danh sách với các mô tả nông cạn
Tại sao nó thiếu thẩm quyền:
- Không có dữ liệu, trích dẫn hoặc thông tin chi tiết gốc - thông tin được đóng gói lại từ những người khác
- Được viết dưới một dòng tác giả “Nhóm” chung chung không có hồ sơ tác giả hoặc siêu dữ liệu có cấu trúc
- Bao gồm các CTA quảng cáo, links liên kết và những ưu/nhược điểm mơ hồ
- Không có trích dẫn đến các nguồn bên ngoài đáng tin cậy hoặc so sánh theo thời gian
- Không có links từ hoặc đề cập trên các ấn phẩm SEO hoặc tiếp thị đáng tin cậy
- Không có sự tương tác trên mạng xã hội, email hoặc các cộng đồng đáng tin cậy
- Không được cập nhật hoặc đóng dấu thời gian; không có tín hiệu liên quan cho các hệ thống AI
8. Tối ưu hóa cho hỗ trợ đa phương thức
Các hệ thống AI search ngày càng truy xuất và tổng hợp content đa phương thức, - bao gồm hình ảnh, biểu đồ, bảng, video -, để trả lời các truy vấn của người dùng tốt hơn, tạo cơ hội cung cấp các câu trả lời hữu ích, dễ quét và hấp dẫn hơn cho người dùng.
Cần làm:
- Đảm bảo khả năng thu thập thông tin của hình ảnh và video cho các bot tìm kiếm và AI.
- Phân phát hình ảnh qua HTML sạch và tránh tải chậm chỉ bằng JS, vì các trình quét dựa trên LLM có thể không kết xuất các phần tử nặng về JS.
- Hình ảnh nên sử dụng văn bản thay thế mô tả bao gồm ngữ cảnh chủ đề.
- Thêm chú thích vào hình ảnh và video với lời giải thích ngay bên dưới hoặc bên cạnh hình ảnh.
- Sử dụng
<figure>
,<table>
, v.v. với đánh dấu đúng ngữ cảnh để giúp phân tích các bảng, hình, danh sách. - Tránh hình ảnh của các bảng, sử dụng các bảng HTML thay thế cho một định dạng có thể đọc được bằng máy hỗ trợ việc mã hóa và tóm tắt.
Ví dụ:
Tốt:
<h2>Tổng quan về quy trình kiểm toán SEO</h2>
<p>Một cuộc kiểm toán SEO đánh giá các lĩnh vực cấu hình trang web chính như khả năng thu thập thông tin, khả năng lập chỉ mục, chất lượng content, tốc độ trang web và backlinks.</p>
<figure>
<img src="/images/seo-audit-process.png" alt="Sơ đồ quy trình kiểm toán SEO: khả năng thu thập thông tin, khả năng lập chỉ mục, content, tốc độ, backlinks" />
<figcaption>Hình 1: Luồng kiểm toán SEO cho thấy năm lĩnh vực trọng tâm cốt lõi được xem xét trong một cuộc kiểm toán technical SEO.</figcaption>
</figure>
<h3>Các lĩnh vực trọng tâm của kiểm toán SEO</h3>
<table>
<thead>
<tr>
<th>Lĩnh vực</th>
<th>Nó bao gồm những gì</th>
</tr>
</thead>
<tbody>
<tr>
<td>Khả năng thu thập thông tin</td>
<td>robots.txt, sitemap, liên kết nội bộ</td>
</tr>
<tr>
<td>Khả năng lập chỉ mục</td>
<td>Thẻ Canonical, noindex, mã trạng thái HTTP</td>
</tr>
</tbody>
</table>
Tại sao điều này hoạt động:
- Sử dụng
<figure>
và<figcaption>
cho ngữ cảnh hình ảnh có thể đọc được bằng máy - Văn bản thay thế mô tả và phù hợp với chủ đề
- Sử dụng một bảng HTML thực - không phải là một hình ảnh - cho phép các mô hình AI mã hóa và tóm tắt content
- Content trực quan trực tuyến và có thể thu thập thông tin, không phụ thuộc vào JavaScript
- Nâng cao khả năng quét và truy xuất đa phương thức để tổng hợp AI search
Không tốt:
<h2>Tổng quan về kiểm toán SEO</h2>
<p>Kiểm toán SEO được hiển thị bên dưới:</p>
<p><img src="/images/audit-summary.jpg" /></p>
<p>Đây là bảng:</p>
<p><img src="/images/audit-checklist.jpg" /></p>
Tại sao điều này thất bại:
- Hình ảnh không có chú thích, không cung cấp ngữ cảnh xung quanh
- Văn bản thay thế bị thiếu hoặc không rõ ràng (giả sử
<img>
không có alt phù hợp) - Bảng được hiển thị dưới dạng hình ảnh - không thể đọc được bằng máy, không có cấu trúc ngữ nghĩa
- Không sử dụng các yếu tố ngữ nghĩa như
<figure>
hoặc<table>
- Có thể dựa vào tải chậm JavaScript, chặn các trình thu thập thông tin dựa trên LLM truy xuất content
9. Tối ưu hóa cho Content có khả năng phục hồi cá nhân hóa
Các công cụ AI search có thể cá nhân hóa các câu trả lời bằng cách sử dụng kết hợp các tín hiệu theo ngữ cảnh, kỹ thuật truy xuất và dữ liệu lấy người dùng làm trung tâm: Vị trí của người dùng, ý định của người dùng, lịch sử tìm kiếm hoặc bối cảnh phiên, sự quen thuộc của thực thể hoặc thiên vị thương hiệu thông qua các mẫu người dùng, phản hồi và sự tương tác của người dùng.
Cần làm:
- Bao quát nhiều ý định cho cùng một chủ đề, để content của bạn phù hợp với nhiều truy vấn phụ được cá nhân hóa, tăng diện tích bề mặt.
- Tối ưu hóa cho ý định được bản địa hóa bằng cách bao gồm content khu vực, tiền tệ, địa chỉ hoặc đánh dấu lược đồ cục bộ (Place, LocalBusiness).
- Thêm các tín hiệu theo ngữ cảnh phù hợp với content với cá nhân hóa dựa trên hồ sơ, phân đoạn content cho các nhân vật hoặc trường hợp sử dụng cụ thể.
- Nhận links và đề cập trên các domain có uy tín và các nền tảng phổ biến nơi khán giả của bạn tương tác thông qua PR kỹ thuật số, các bài đăng của người đóng góp, các trích dẫn trên Wikipedia, các đề cập trong nghiên cứu, sự hiện diện và tương tác mạnh mẽ của cộng đồng và phương tiện truyền thông xã hội, vì AI search có thể được cá nhân hóa theo hướng các thương hiệu hoặc trang web mà người dùng đã tương tác trước đây hoặc có khả năng nhận dạng thực thể cao cho một chủ đề nhất định.
- Giữ sự chú ý và tương tác với content nhanh, hữu ích mang lại trải nghiệm người dùng thỏa mãn vì các hệ thống AI search tinh chỉnh kết quả dựa trên hành vi của người dùng, lượt thích/không thích, v.v. Vòng phản hồi này lặp lại vào các quyết định xếp hạng và tổng hợp cho các câu trả lời trong tương lai.
Ví dụ:
Tốt:
1. Content bạn sẽ tạo:
- Tiêu đề: “Lộ trình học SEO cho các vai trò khác nhau: Người làm nghề tự do, đội ngũ nội bộ và người mới bắt đầu”
- Định dạng: Trang trung tâm tương tác với điều hướng dựa trên vai trò + chi tiết theo khu vực cụ thể
2. Đặc điểm chính:
- Bao quát đa ý định
- Các phần cho: Cách học SEO, các khóa học SEO tốt nhất cho người làm nghề tự do, đào tạo SEO nội bộ, các tùy chọn miễn phí so với trả phí
- Mỗi phần có tiêu đề riêng, content có cấu trúc và links nội bộ
- Các yếu tố được bản địa hóa
- Các ví dụ đào tạo theo quốc gia cụ thể
- Được đánh dấu bằng LocalBusiness, Place và lược đồ theo vị trí địa lý cụ thể
- Phân đoạn dựa trên nhân vật
- Phần “Người làm nghề tự do” nêu bật các tùy chọn linh hoạt, chi phí thấp
- Phần “Nội bộ” tập trung vào các quy trình cộng tác và tài liệu
- Phần “Người thay đổi nghề nghiệp” bao gồm các lộ trình khóa học cấp đầu vào và luyện thi chứng chỉ
- Sự quen thuộc và phân phối của thực thể
- Được viết bởi một chuyên gia đã biết có dòng tác giả có cấu trúc (lược đồ tác giả)
- Được trích dẫn trong các bản tin như SEOFOMO, Core Updates và SEOForLunch
- Được chia sẻ trong các chủ đề Reddit về SEO, các nhóm Slack và các bài đăng trên LinkedIn về tiếp thị kỹ thuật số
- Tín hiệu UX & Tương tác
- Thiết kế nhanh, đáp ứng
- Bao gồm một bài kiểm tra: “Lộ trình SEO nào phù hợp với bạn?” - tăng thời gian phiên
- Các nút chia sẻ xã hội và các tiện ích phản hồi (“Điều này có hữu ích không?”)
Tại sao điều này hoạt động:
Nó phù hợp với nhiều ý định, thích ứng với các nhân vật và địa điểm khác nhau, xây dựng thẩm quyền thực thể và tạo ra các tín hiệu tương tác tích cực của người dùng - làm cho nó có khả năng phục hồi cao trong các môi trường tìm kiếm do AI điều khiển được cá nhân hóa.
Không tốt:
Content bạn sẽ tạo:
- Tiêu đề: “Khóa học SEO của chúng tôi: Học trong 30 ngày”
- Định dạng: Một trang đích chung chung quảng cáo một sản phẩm duy nhất
Tại sao điều này thất bại:
- Nhắm mục tiêu một ý định duy nhất: Chỉ tập trung vào “mua khóa học SEO” - bỏ qua các ý định thông tin, so sánh hoặc theo nhân vật.
- Không bản địa hóa: Không có chi tiết hoặc đánh dấu theo khu vực cụ thể. Không phục vụ các truy vấn được bản địa hóa hoặc nhu cầu tìm kiếm quốc tế.
- Không phân biệt giữa các đối tượng: người mới bắt đầu, chuyên gia, người làm nghề tự do hoặc các đại lý. Không sử dụng các nhân vật, phân đoạn hoặc các tín hiệu theo ngữ cảnh
- Thẩm quyền và tương tác yếu: Không có tác giả chuyên gia, không có trích dẫn, không có xác nhận của cộng đồng. Không được đề cập hoặc chia sẻ bên ngoài các kênh sở hữu. Tải chậm và thiếu các yếu tố tương tác.
10. Theo dõi hiệu suất AI Search của content bạn
Việc theo dõi khả năng hiển thị, tình cảm, các lượt giới thiệu từ các câu trả lời AI có liên quan của thương hiệu bạn cho phép bạn xác định các cơ hội để cải thiện sự bao gồm trong các câu trả lời do AI tạo ra và củng cố sự hiện diện của bạn trong các phản hồi AI search so với các đối thủ cạnh tranh.
Cần làm:
- Theo dõi các lời nhắc phổ biến nhất được khán giả của bạn sử dụng để tìm kiếm sản phẩm, dịch vụ và thương hiệu của bạn trên các nền tảng AI.
- Theo dõi và đánh giá các đề cập thương hiệu của bạn từ các câu trả lời AI search cho các lời nhắc liên quan đến sản phẩm/dịch vụ, cũng như các lời nhắc tập trung vào thương hiệu trên các nền tảng AI search.
- Theo dõi và đánh giá tình cảm của các đề cập thương hiệu của bạn trong các câu trả lời AI search cho các lời nhắc liên quan đến sản phẩm/dịch vụ, cũng như các lời nhắc tập trung vào thương hiệu trên các nền tảng AI search.
- Theo dõi sự bao gồm của links đến Trang web của bạn từ các đề cập thương hiệu có liên quan trong các câu trả lời AI search trên các nền tảng.
- Đo lường hiệu suất các đề cập thương hiệu, tình cảm và links của bạn trong các câu trả lời có liên quan so với các đối thủ cạnh tranh chính trên các nền tảng AI search.
- Đo lường hiệu suất các đề cập thương hiệu, tình cảm và sự bao gồm của links trong các nguồn content của câu trả lời AI so với các đối thủ cạnh tranh chính trên các nền tảng AI search.
- Theo dõi traffic giới thiệu AI thông qua nền tảng phân tích của bạn bằng cách tạo một kênh mới cho các nguồn nền tảng AI [link giữ nguyên] để hiểu sự tăng trưởng của nó theo thời gian, các điểm đến của trang, sự tương tác và chuyển đổi.
- Theo dõi hành vi thu thập thông tin của các nền tảng AI trên trang web của bạn: Tần suất thu thập thông tin, các URL và độ sâu được thu thập thông tin, mã trạng thái HTTP được trả về, các mẫu truy cập robots.txt, loại content được yêu cầu, các thay đổi trong hành vi thu thập thông tin theo thời gian, v.v.
Ví dụ:
Tốt:
- Theo dõi các lời nhắc phổ biến liên quan đến thương hiệu và các chủ đề sản phẩm/dịch vụ chính của bạn trong các công cụ AI cung cấp chúng (ví dụ: Profound, Similarweb, Sistrix, v.v.) để hiểu hành vi AI search của khán giả và sử dụng dữ liệu này để thông báo cho chiến lược tối ưu hóa content của bạn.
- Theo dõi các đề cập thương hiệu, tình cảm và links của bạn trong các câu trả lời AI một cách riêng biệt cho từng nền tảng AI search chính (ví dụ: ChatGPT, Gemini, AI Overviews/AI Mode, Perplexity, v.v.).
- Kiểm tra các nguồn được trích dẫn trong các câu trả lời AI có liên quan, đặc biệt là những nơi thương hiệu của bạn không được đề cập, để xác định các cơ hội trích dẫn mới.
- Đánh giá tình cảm của các đề cập thương hiệu của bạn trong các câu trả lời AI so với các đối thủ cạnh tranh, để khám phá các nhu cầu quản lý danh tiếng và các khoảng trống về định vị.
- Theo dõi hành vi traffic do AI điều khiển (ví dụ: các trang đã truy cập, sự tương tác và chuyển đổi) so với traffic tìm kiếm truyền thống để hiểu sự khác biệt về hành vi và xác định các cơ hội tối ưu hóa.
- Theo dõi hành vi thu thập thông tin của các bot AI: tần suất thu thập thông tin, các URL và độ sâu được thu thập thông tin, mã trạng thái HTTP được trả về, các mẫu truy cập robots.txt, các loại content được yêu cầu và các thay đổi trong hành vi thu thập thông tin theo thời gian, để đảm bảo content chính của bạn được truy cập và index một cách hiệu quả.
Không tốt:
- Cho rằng hành vi và các truy vấn của người dùng của bạn trên các nền tảng AI search giống như trong các công cụ tìm kiếm truyền thống, mà không phân tích dữ liệu lời nhắc cụ thể của AI.
- Theo dõi các đề cập thương hiệu, tình cảm và links của bạn chỉ trên một nền tảng AI (ví dụ: ChatGPT) và cho rằng kết quả là như nhau trên tất cả các nền tảng khác.
- Bỏ qua các nguồn content trong các câu trả lời AI và chỉ tập trung vào các chỉ số câu trả lời ở cấp độ bề mặt.
- Theo dõi các đề cập thương hiệu trong các câu trả lời AI nhưng bỏ qua việc phân tích tình cảm hoặc ngữ cảnh.
- Không phân đoạn hoặc phân tích traffic do AI điều khiển và cho rằng nó hoạt động giống như traffic tìm kiếm truyền thống.
- Không theo dõi hành vi thu thập thông tin của các bot AI và cho rằng nó giống hệt với hành vi của các trình thu thập thông tin của công cụ tìm kiếm truyền thống.
Source: aleydasolis
© Cre: NGHIỆN SEO (Team biên tập).