Lâu rồi mới viết bài trên group Nghiện SEO, nay mình gửi gắm chút nội dung mình viết riêng cho group.
Trong bài viết, mình sẽ giới thiệu 2 khái niệm cho content website bạn mà khả năng cao bạn không biết, đó là Nhận Diện Thực Thể Tên Riêng (Name Entity Recognition - NER) và Giải Ám Chỉ Thực Thể Tên Riêng (Named Entity disambiguation - NED).
Trong bài viết, mình sẽ giải thích:
-
Định nghĩa
-
Tại sao bạn nên quan tâm? Làm sao NER & NED giúp cải thiện ranking bạn tốt hơn?
-
Tại sao content bạn bị mất index/không index/không ranking cao như trước?
-
Cũng như cách ứng dụng và một prompt AI mình giúp bạn trích xuất Entity tốt hơn.
NER VÀ NED – ĐỊNH NGHĨA
- Nhận Diện Thực Thể Tên Riêng (NER): NER là một công nghệ trong NLP, có khả năng quét văn bản của bạn để xác định và phân loại các “thực thể” quan trọng – cụ thể là tên người, địa danh, tổ chức, sản phẩm, v.v.
Ví dụ, khi viết bài về “Bún bò Huế”, NER hỗ trợ Google phân biệt món ăn nổi tiếng chứ không đơn thuần hiểu đây là một cụm từ chung chung.
- Giải Ám Chỉ Thực Thể Tên Riêng (NED): NED cũng là một công nghệ trong NLP, đóng vai trò như chuyên gia đối chiếu, xử lý những trường hợp một từ hay cụm từ mang nhiều ngữ nghĩa.
Chẳng hạn, “Apple” có thể là tên một trái cây, một thương hiệu, hay thậm chí là một người nào đó. NED sẽ kết nối các manh mối, đảm bảo rằng công cụ tìm kiếm thấu hiểu nội dung bạn truyền tải đó là công ty Apple? Hay là một trái cây?
GOOGLE DÙNG NER & NED ĐỂ LÀM GÌ?
-
Hiểu về CHỦ ĐỀ bạn muốn nói. Lúc này google sẽ đọc, hiểu ngữ cảnh và hiểu chủ đề bạn. Khi hiểu chủ đề thì nó dễ Matching với intent hơn.
-
Lọc bớt mấy content spam: Nếu bạn viết một bài viết “quán nướng ngon quận 1” chẳng hạn, mà bạn lại không để tên các quán, địa chỉ, các món nướng cụ thể nổi tiếng của quán, giá tiền (NER và NED), mà toàn chèn mấy keywords “quán nướng ngon quận 1”
⇒ Google sẽ loại bài bạn luôn, đỡ mắc công đọc.
- Câu trả lời có cấu trúc: Công cụ tìm kiếm thích cung cấp câu trả lời nhanh chóng, chính xác cho các câu hỏi của người dùng.
NER và NED giúp chúng xác định các sự kiện và chi tiết chính xác trong nội dung của bạn. Khả năng này trực tiếp cung cấp thông tin cho các đoạn trích nổi bật và thẻ kiến thức mà bạn thấy trong kết quả tìm kiếm. (rank top feature Snippet tốt hơn khi áp dụng NER & NED)
NER & NED QUAN TRỌNG RA SAO VỚI DÂN SEO?
Cũng như các ý đã đề cập trên, mình tóm tắt lại cũng như bổ sung để bạn rõ:
-
Cải thiện khả năng phân tích ngữ nghĩa: Nội dung được bổ sung chiều sâu, cho phép công cụ tìm kiếm nắm bắt trọn vẹn bối cảnh ẩn sau ngôn từ.
-
Tăng cơ hội xuất hiện trong kết quả đa dạng (Rich Results): Tối ưu hóa các thực thể tên riêng giúp nội dung đủ điều kiện để hiển thị dưới dạng nổi bật như bảng kiến thức, hình ảnh dạng carousel…, từ đó cải thiện đáng kể độ hiển thị.
-
Thích ứng với tìm kiếm bằng giọng nói: NER/NED giúp chuẩn bị nội dung cho xu thế tương lai, đảm bảo độ chính xác khi người dùng tìm kiếm thông qua câu hỏi ngôn ngữ tự nhiên.
Ví dụ minh họa NER & NED
-
Blog về ẩm thực: NER nhận diện “bánh phở”, “chả lụa”, “rau thơm” là các nguyên liệu, đồng thời NED phân biệt giữa “nước mắm” với “nước chấm".
-
Tin tức thể thao: NER gắn thẻ “Nguyễn Công Phượng” với danh mục cầu thủ, “Hoàng Anh Gia Lai” là câu lạc bộ. NED phân biệt chính xác “Hoàng Anh Gia Lai” là đội bóng thay vì địa danh.
TIPS TỐI ƯU HÓA NỘI DUNG VỚI NER & NED:
- Xác định các thực thể mục tiêu: Trước khi bắt tay vào viết, hãy dành thời gian xác định những nhóm thực thể (entities) liên quan nhất đến chủ đề.
Nhắm đến mảng đánh giá sản phẩm? Tập trung vào thương hiệu, tên sản phẩm, tính năng.
Nhắm đến bài viết về du lịch Sa Pa? Suy nghĩ về các địa danh, điểm tham quan, văn hóa đặc trưng…
- Chèn Entities tự nhiên: Tránh nhồi nhét từ khóa một cách thiếu khéo léo.
Thay vào đó, hãy lồng ghép thực thể xuyên suốt bài viết, vừa cung cấp thông tin cho người đọc, vừa hỗ trợ công cụ tìm kiếm.
-
Hỗ trợ từ các công cụ NER: Các dịch vụ như Google Natural Language API (https://cloud.google.com/natural-language) có thể giúp phân tích nội dung và đề xuất các thực thể liên quan.
-
Luôn lưu tâm đến các trường hợp đa nghĩa: Đọc và hiệu đính nội dung kỹ lưỡng, tránh để sót các từ/cụm từ có thể gây hiểu nhầm. Hãy làm rõ ngữ cảnh hoặc sử dụng từ đồng nghĩa nhằm hạn chế tối đa các nhầm lẫn tiềm ẩn.
PROMPT AI
Bên dưới là mẫu prompt AI bạn có thể bỏ vào Gemini hay GPT đều được
Read this article: [đưa link] about [tên topic bằng tiếng Anh]
Give me 10 to 20 entities that are semantically relevant the the main topic based on the content of the URL The list output must be translated to Vietnamese, prioritized based on the frequency that appears first, then the semantically second.
Nếu bài viết hữu ích hoặc có thắc mắc hãy comment bên dưới nhé.
Cheer bro/sis.
Author: Đỗ Anh Việt - Group Nghiện SEO