Phần lớn thông tin trên internet được phát triển từ những thông tin ngoài xã hội thực. Xã hội thực càng phát triển thì có càng nhiều thông tin được đưa lên internet là điều hiển nhiên. Những thông tin đó giúp Google liên tục thu thập, phân tích và phân phối tới người dùng qua các mục đích, công cụ khác nhau.
Auto content thì có vẻ không như vậy, dù nó có được thiết kế tư duy suy luận xác suất, thì machine learning cũng chỉ lấy thông tin đại diện cho mối quan hệ giữa các mục trong tập dữ liệu nó có và tạo ra các mô hình để dự đoán kết quả trong tương lai.
Nó không thể thay thế những nhà nghiên cứu ngoài xã hội, những phóng viên cập nhật tin mới do con người nghiên cứu từ thực tiễn. Hay đơn giản là chú xe ôm chụp hình đường phố thực và than thở về kẹt xe trên fb, thay vì vẽ ra con đường bằng AI tổng hợp, không có tính xác thực.
Phần lớn, người dùng tìm kiếm cũng chỉ tra cứu những vấn đề mà họ đang gặp phải ngoài đời thực, họ cần câu trả lời để tiếp tục giải quyết vấn đề đó ở ngoài kia. Vậy nếu Google cứ nạp dữ liệu do một thằng không có thực đưa ra và phân phối lại cho người dùng, nó sẽ lệch hướng hoàn toàn và tới một ngày sự chính xác của kết quả tìm kiếm giảm sút thì nó ắt sẽ ko còn tín nhiệm từ người dùng.
Google search sẽ không bao giờ ra mắt một công cụ tương tự ChatGPT, bởi sứ mệnh của nó là “hệ thống hóa thông tin của thế giới, giúp những thông tin đó trở nên hữu ích và dễ dàng tiếp cận trên toàn cầu”, nó muốn các câu trả lời cho truy vấn là của người thực có tính tin cậy cao chứ không phải suy luận tổng hợp theo cách chủ quan từ một cỗ máy, điều này có thể sẽ sai lệch và lạc hậu so với xã hội thực.
Nó thừa sức làm ra công cụ tương tự ChatGPT và sẽ chứng minh bằng cách ra mắt 1 công cụ tương tự nhưng sẽ ko tích hợp vào search hoặc ko làm mất đi tính trung lập nội dung.
Mặt khác, với lòng tự tôn của gã khổng lồ về dữ liệu và công nghệ AI như Google, nó sẽ không bao giờ chấp nhận đi thu thập lại dữ liệu từ những thằng AI sinh sau đẻ muộn, có tệp dữ liệu nhỏ bé hơn nó.
Phần 2: Quan điểm Google có chém content AI hay không?
Còn kiểu content cào tự động gây trùng lặp thêm rác cho internet thì không bàn tới rồi, mình cho rằng Google cũng sẽ chém hết. Đôi khi bạn sẽ thấy Google cực đoan khi xếp hạng các trang cào, mình hiểu đơn giản rằng, content cào cũng là content mang giá trị cho người dùng, thằng đi cào nó thấy ngon nó mới cào về (maybe), giữa những bài trùng lặp thì Google sẽ giữ lại bài tốt nhất, hoặc là bài trên site tốt nhất, có điều thường thì cái ông viết ra content site yếu quá, còn ông cào lại là site khỏe, thế mới đau chứ.
Cơ bản, cái chính Google sẽ kiểm soát là nguồn xuất bản thông tin chứ không hẳn là content có sự than thiệp của AI hay không. Bản chất nếu chỉ tập trung phát hiện content AI thì chỉ là phần ngọn, cái gốc là quản lý chủ thể tạo ra nội dung, nếu content đó có sự tham gia của AI nhưng vẫn được chủ thể chịu trách nhiệm kiểm duyệt về tính tin cậy của chuyên môn, trải nghiệm, thẩm quyền theo EEAT thì nó vẫn là content giá trị, hay gọi là “content gốc”.
Vậy việc cần vẫn là xây dựng một nền móng thật chắc cho tính tin cậy cho website, chúng ta nên bắt đầu từ xây dựng một tổ chức chịu trách nhiệm cho nội dung.
Quan điểm của mình về xây thế nào thì bài sau về phần 2 mình nói tiếp nhé. Tạm dừng tại đây.
Disclaimer: Tất cả là quan điểm cá nhân mình, theo sự hiểu biết hạn hẹp của mình, anh em không nên dựa vào làm tài liệu học.
Author: Nguyễn Cao Khánh - Group Nghiện SEO