Một bằng sáng chế do Google nộp gần đây mô tả cách một trợ lý AI (AI assistants) có thể sử dụng ít nhất 5 tín hiệu ngữ cảnh trong thế giới thực, bao gồm cả việc xác định các ý định liên quan, để ảnh hưởng đến câu trả lời và tạo ra cuộc đối thoại tự nhiên. Đây là một ví dụ về cách tìm kiếm có sự hỗ trợ của AI sửa đổi các phản hồi để thu hút người dùng bằng các câu hỏi và đối thoại phù hợp theo ngữ cảnh, mở rộng ra ngoài các hệ thống dựa trên từ khóa.
Bằng sáng chế mô tả một hệ thống tạo ra đối thoại và câu trả lời phù hợp bằng cách sử dụng các tín hiệu như ngữ cảnh môi trường, ý định đối thoại, dữ liệu người dùng và lịch sử hội thoại. Những yếu tố này vượt ra ngoài việc sử dụng dữ liệu ngữ nghĩa trong truy vấn của người dùng và cho thấy cách tìm kiếm có sự hỗ trợ của AI đang hướng tới các tương tác tự nhiên, giống con người hơn.
Nói chung, mục đích của việc nộp bằng sáng chế là để có được sự bảo hộ pháp lý và độc quyền cho một phát minh và hành động nộp đơn không cho thấy rằng Google đang thực sự sử dụng nó.
“Đáng chú ý, trong một phiên đối thoại nhất định, người dùng có thể tương tác với trợ lý tự động bằng nhiều phương thức nhập khác nhau, bao gồm nhưng không giới hạn ở đầu vào nói, đầu vào gõ và/hoặc đầu vào chạm.”
Tên của bằng sáng chế là: Sử dụng (các) Mô hình Ngôn ngữ Lớn (LLM) trong việc Tạo (các) phản hồi của Trợ lý tự động. Bằng sáng chế áp dụng cho một loạt các trợ lý AI nhận đầu vào thông qua ngữ cảnh gõ, chạm và giọng nói.
Có 5 yếu tố ảnh hưởng đến các phản hồi được sửa đổi bởi LLM:
- Thời gian, Địa điểm và Ngữ cảnh Môi trường
- Ngữ cảnh Cụ thể của Người dùng
- Ý định Đối thoại & Tương tác Trước đó
- Đầu vào (văn bản, chạm và giọng nói)
- Ngữ cảnh Hệ thống & Thiết bị
4 yếu tố đầu tiên ảnh hưởng đến các câu trả lời mà trợ lý tự động cung cấp và yếu tố thứ năm xác định xem có nên tắt phần được hỗ trợ bởi LLM và quay lại các câu trả lời AI tiêu chuẩn hay không.
Thời gian, địa điểm và môi trường
Có 3 yếu tố ngữ cảnh: thời gian, địa điểm và môi trường cung cấp các ngữ cảnh không tồn tại trong từ khóa và ảnh hưởng đến cách trợ lý AI phản hồi. Mặc dù các yếu tố ngữ cảnh này, như được mô tả trong bằng sáng chế, không liên quan chặt chẽ đến AI Overviews hoặc Chế độ AI, chúng cho thấy cách các tương tác được hỗ trợ bởi AI với dữ liệu có thể thay đổi.
Bằng sáng chế sử dụng ví dụ về một người nói với trợ lý của họ rằng họ sẽ đi lướt sóng. Một phản hồi AI tiêu chuẩn sẽ là một nhận xét soạn sẵn để chúc vui vẻ hoặc tận hưởng ngày mới. Phản hồi được hỗ trợ bởi LLM được mô tả trong bằng sáng chế sẽ tạo ra một phản hồi dựa trên vị trí địa lý và thời gian để tạo ra một nhận xét về thời tiết như khả năng có mưa. Đây được gọi là các đầu ra trợ lý được sửa đổi.
Nội dung Bằng sáng chế mô tả nó như thế này:
“…các đầu ra trợ lý có trong tập hợp các đầu ra trợ lý được sửa đổi bao gồm các đầu ra trợ lý thúc đẩy phiên đối thoại theo cách thu hút người dùng của thiết bị khách hàng hơn nữa trong phiên đối thoại bằng cách đặt các câu hỏi phù hợp theo ngữ cảnh (ví dụ: “bạn đã lướt sóng bao lâu rồi?”), cung cấp thông tin phù hợp theo ngữ cảnh (ví dụ: “nhưng nếu bạn lại đến Bãi biển Example, hãy chuẩn bị cho những cơn mưa rào nhẹ”), và/hoặc nếu không thì gây được tiếng vang với người dùng của thiết bị khách hàng trong ngữ cảnh của phiên đối thoại.”
Ngữ cảnh cụ thể của người dùng
Bằng sáng chế mô tả nhiều ngữ cảnh cụ thể của người dùng mà LLM có thể sử dụng để tạo ra một đầu ra được sửa đổi:
- Dữ liệu hồ sơ người dùng, chẳng hạn như sở thích (như đồ ăn hoặc loại hoạt động).
- Dữ liệu ứng dụng phần mềm (chẳng hạn như các ứng dụng hiện đang hoặc gần đây được sử dụng).
- Lịch sử đối thoại của các phiên trợ lý đang diễn ra và/hoặc trước đó.
Đây là một đoạn trích nói về các tín hiệu ngữ cảnh khác nhau liên quan đến hồ sơ người dùng:
“Hơn nữa, ngữ cảnh của phiên đối thoại có thể được xác định dựa trên một hoặc nhiều tín hiệu ngữ cảnh bao gồm, ví dụ, tiếng ồn xung quanh được phát hiện trong môi trường của thiết bị khách hàng, dữ liệu hồ sơ người dùng, dữ liệu ứng dụng phần mềm, ….lịch sử đối thoại của phiên đối thoại giữa người dùng và trợ lý tự động, và/hoặc các tín hiệu ngữ cảnh khác.”
Ý định liên quan
Một phần thú vị của bằng sáng chế mô tả cách sở thích ăn uống của người dùng có thể được sử dụng để xác định một ý định liên quan đến một truy vấn.
“Ví dụ, …một hoặc nhiều LLM có thể xác định một ý định liên quan đến truy vấn trợ lý đã cho… Hơn nữa, một hoặc nhiều LLM có thể xác định, dựa trên ý định liên quan đến truy vấn trợ lý đã cho, ít nhất một ý định liên quan có liên quan đến ý định liên quan đến truy vấn trợ lý đã cho… Hơn nữa, một hoặc nhiều LLM có thể tạo ra truy vấn trợ lý bổ sung dựa trên ít nhất một ý định liên quan. “
Bằng sáng chế minh họa điều này bằng ví dụ về một người dùng nói rằng họ đói. LLM sau đó sẽ xác định các ngữ cảnh liên quan như loại ẩm thực mà người dùng thích và ý định ăn tại một nhà hàng.
Bằng sáng chế giải thích:
“Trong ví dụ này, truy vấn trợ lý bổ sung có thể tương ứng với, ví dụ, “người dùng đã cho biết họ thích loại ẩm thực nào?” (ví dụ: phản ánh ý định loại ẩm thực liên quan liên quan đến ý định của người dùng cho biết họ muốn ăn), “những nhà hàng nào gần đây đang mở cửa?” (ví dụ: phản ánh ý định tra cứu nhà hàng liên quan liên quan đến ý định của người dùng cho biết họ muốn ăn)… Trong các triển khai này, đầu ra trợ lý bổ sung có thể được xác định dựa trên việc xử lý truy vấn trợ lý bổ sung.”
Ngữ cảnh hệ thống & thiết bị
Phần ngữ cảnh hệ thống và thiết bị của bằng sáng chế rất thú vị vì nó cho phép AI phát hiện xem ngữ cảnh của thiết bị có phải là sắp hết pin hay không, và nếu vậy, nó sẽ tắt các phản hồi được sửa đổi bởi LLM. Có những yếu tố khác như liệu người dùng có đang đi ra khỏi thiết bị hay không, chi phí tính toán, v.v.
Tóm lại điểm chính cần quan tâm
- Phản hồi truy vấn AI sử dụng tín hiệu ngữ cảnh
Bằng sáng chế của Google mô tả cách các trợ lý tự động có thể sử dụng ngữ cảnh thế giới thực để tạo ra các câu trả lời và đối thoại phù hợp và giống con người hơn. - Các yếu tố ngữ cảnh ảnh hưởng đến phản hồi
Chúng bao gồm thời gian/địa điểm/môi trường, dữ liệu cụ thể của người dùng, lịch sử và ý định đối thoại, điều kiện hệ thống/thiết bị và loại đầu vào (văn bản, giọng nói hoặc chạm). - Phản hồi được sửa đổi bởi LLM tăng cường tương tác
Các mô hình ngôn ngữ lớn (LLM) sử dụng các ngữ cảnh này để tạo ra các phản hồi hoặc câu hỏi tiếp theo được cá nhân hóa, như tham chiếu đến thời tiết hoặc các tương tác trong quá khứ. - Ví dụ tác động thực tế
Các kịch bản như đề xuất đồ ăn dựa trên sở thích của người dùng hoặc nhận xét về thời tiết địa phương trong các kế hoạch ngoài trời cho thấy cách các ngữ cảnh trong thế giới thực có thể ảnh hưởng đến cách AI phản hồi các truy vấn của người dùng.
Bằng sáng chế này rất quan trọng vì hàng triệu người đang ngày càng tương tác với các trợ lý AI (AI assistants), do đó nó có liên quan đến các nhà xuất bản, cửa hàng thương mại điện tử, doanh nghiệp địa phương và dân làm SEO.
Nó phác thảo cách các hệ thống được hỗ trợ bởi AI của Google có thể tạo ra các phản hồi được cá nhân hóa, nhận biết ngữ cảnh bằng cách sử dụng các tín hiệu trong thế giới thực. Điều này cho phép các trợ lý vượt ra ngoài các câu trả lời dựa trên từ khóa và phản hồi bằng thông tin liên quan hoặc các câu hỏi tiếp theo, chẳng hạn như đề xuất các nhà hàng mà người dùng có thể thích hoặc nhận xét về điều kiện thời tiết trước một hoạt động đã lên kế hoạch.
Tài liệu bằng sáng chế tại đây: [1]
Author: #NghienSEO (Team biên tập)