Google đẩy mạnh AI Overviews trên tìm kiếm, nhưng độ chính xác và độ tin cậy của câu trả lời vẫn gây tranh cãi.
Google đẩy mạnh AI Overviews trên tìm kiếm, nhưng độ chính xác và độ tin cậy của câu trả lời vẫn gây tranh cãi.
Trong những năm gần đây, Google đã thay đổi cách vận hành công cụ tìm kiếm khi ưu tiên hiển thị các câu trả lời do trí tuệ nhân tạo tạo ra ở vị trí đầu trang.
Tính năng AI Overviews cho thấy Google đang chuyển từ việc dẫn người dùng tới nguồn tin sang trực tiếp tạo và cung cấp nội dung.
Sự thay đổi này giúp người dùng tiếp cận thông tin nhanh hơn, nhưng cũng làm dấy lên nhiều tranh luận về độ chính xác, tính minh bạch và mức độ đáng tin cậy của các câu trả lời do AI tạo ra.
Một phân tích gần đây của Công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo - Oumi (Mỹ), cho thấy các câu trả lời từ AI Overviews chính xác khoảng 85% khi sử dụng công nghệ Gemini 2 và tăng lên 91% với phiên bản nâng cấp Gemini 3.
Dù vậy, với hơn 5.000 tỉ lượt tìm kiếm mỗi năm, tỉ lệ sai sót nhỏ này vẫn có thể tương đương hàng chục triệu câu trả lời sai mỗi giờ.
Đáng chú ý, hơn một nửa các câu trả lời đúng lại bị đánh giá là “không có căn cứ rõ ràng”, tức là các liên kết nguồn không hoàn toàn hỗ trợ thông tin được đưa ra. Điều này khiến người dùng gặp khó khăn trong việc kiểm chứng.
Phân tích của Oumi dựa trên bài kiểm tra chuẩn SimpleQA, là một công cụ phổ biến để đánh giá độ chính xác của các hệ thống AI.
Tuy nhiên, Google đã phản bác kết quả này, cho rằng phương pháp đánh giá có “lỗ hổng nghiêm trọng”, do chính bộ câu hỏi kiểm tra cũng có thể chứa thông tin sai lệch.
Bên cạnh vấn đề độ chính xác, nguồn dữ liệu cũng là yếu tố gây tranh cãi.
Trong hơn 5.000 nguồn được trích dẫn, các nền tảng như Facebook và Reddit xuất hiện với tần suất cao.
Đáng nói, khi AI đưa ra câu trả lời sai, tỉ lệ trích dẫn từ Facebook còn cao hơn so với khi câu trả lời đúng, đặt ra câu hỏi về chất lượng nguồn tham chiếu.
Một vấn đề khác nằm ở chính cách đánh giá AI. Các công ty như Oumi thường sử dụng hệ thống AI khác để kiểm chứng câu trả lời.
Tuy nhiên, phương pháp này tiềm ẩn rủi ro khi “AI kiểm tra AI” cũng có thể mắc lỗi, khiến kết quả đánh giá không hoàn toàn tuyệt đối.
Dù còn nhiều tranh cãi, không thể phủ nhận AI Overviews đang ngày càng được cải thiện và trở thành một phần quan trọng trong trải nghiệm tìm kiếm.
Tuy nhiên, các chuyên gia cảnh báo rằng người dùng không nên hoàn toàn phụ thuộc vào các câu trả lời này, mà cần duy trì thói quen kiểm chứng thông tin từ nhiều nguồn khác nhau.
Đọc bài gốc tại đây.