Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFutures‌EarnQuảng trườngThêm
Nhà nghiên cứu Dartmouth phát triển tác nhân AI có khả năng tránh bị phát hiện bởi bot khảo sát với tỷ lệ thành công 99.8%

Nhà nghiên cứu Dartmouth phát triển tác nhân AI có khả năng tránh bị phát hiện bởi bot khảo sát với tỷ lệ thành công 99.8%

MPOSTMPOST2025/11/25 19:51
Theo:MPOST

Tóm lại Nhà nghiên cứu Sean Westwood của Dartmouth đã tạo ra một tác nhân AI có thể bỏ qua việc phát hiện bot khảo sát trong 99.8% thời gian, cho thấy mối đe dọa đối với các nghiên cứu trực tuyến.

Sean Westwood, phó giáo sư chính phủ tại Dartmouth và giám đốc Phòng thí nghiệm nghiên cứu phân cực , đã phát triển một hệ thống AI mà ông mô tả là "một người trả lời tổng hợp tự động", có khả năng trả lời các câu hỏi khảo sát trong khi bỏ qua hầu hết các phương pháp phát hiện tiên tiến để có phản hồi tự động. 

Được công bố trên Kỷ yếu của Viện Hàn lâm Khoa học Quốc gia (PNAS), nghiên cứu nhấn mạnh rằng nghiên cứu khảo sát trực tuyến, nền tảng của việc thu thập dữ liệu trong nhiều nghiên cứu khoa học, hiện có thể phải đối mặt với mối đe dọa từ các mô hình ngôn ngữ lớn (LLM).

Nghiên cứu báo cáo rằng AI đã thành công trong việc tránh bị phát hiện trong 99.8% trường hợp. Các biện pháp bảo vệ khảo sát truyền thống, chẳng hạn như câu hỏi kiểm tra sự chú ý, chỉ số hành vi và phân tích mẫu phản hồi, được thiết kế để xác định người dùng thiếu chú ý hoặc bot tự động. Westwood lập luận rằng những công cụ này đang trở nên kém hiệu quả, vì AI của ông đã lách luật các phương pháp phát hiện tiêu chuẩn được mô tả trong các nghiên cứu nổi bật, bao gồm cả những phương pháp nhắm cụ thể vào việc xác định phản hồi do AI tạo ra. Nó cũng vượt qua các câu hỏi "ngụy biện ngược", tức là những nhiệm vụ mà AI có thể xử lý dễ dàng nhưng lại là thách thức đối với con người.

Theo bài báo có tựa đề "Mối đe dọa hiện hữu tiềm tàng của các mô hình ngôn ngữ lớn đối với nghiên cứu khảo sát trực tuyến", hệ thống AI hoạt động theo từng lớp: sau khi bộ máy suy luận của nó xác định được câu trả lời, một lớp thứ cấp sẽ thực hiện các hành động được thiết kế để mô phỏng hành vi của con người. Hệ thống mô phỏng thời gian đọc thực tế dựa trên trình độ học vấn của người dùng, tạo ra các chuyển động chuột giống như con người và nhập từng phím tắt câu trả lời mở, bao gồm cả lỗi đánh máy và sửa lỗi hợp lý. Hệ thống cũng được cấu hình để hoạt động với các công cụ bỏ qua các biện pháp chống bot phổ biến như reCAPTCHA, cho phép người dùng tham gia khảo sát trực tuyến một cách tự động mà không bị phát hiện.

Nghiên cứu cảnh báo AI Personas có thể thao túng các cuộc thăm dò ý kiến ​​quốc gia với phản hồi tối thiểu và chi phí thấp

Theo nghiên cứu, hệ thống AI có khả năng mô phỏng "một nhân vật nhân khẩu học nhất quán", cho thấy về mặt lý thuyết, nó có thể thao túng kết quả khảo sát trực tuyến để phản ánh bất kỳ kết quả mong muốn nào dựa trên hồ sơ do AI tạo ra. Chỉ cần một lượng nhỏ phản hồi giả mạo là có thể thay đổi kết quả. Bài báo lưu ý rằng đối với bảy cuộc thăm dò ý kiến ​​quốc gia lớn trước cuộc bầu cử năm 2024, việc đưa ra chỉ từ 10 đến 52 phản hồi do AI tạo ra cũng có thể làm thay đổi kết quả dự đoán. Việc tạo ra những phản hồi này sẽ cực kỳ tiết kiệm chi phí, ước tính khoảng năm xu cho mỗi phản hồi, so với mức phí thông thường là 1.50 đô la trả cho người tham gia khảo sát.

Tác nhân AI của Westwood không phụ thuộc vào mô hình và được triển khai bằng Python, nghĩa là nó có thể hoạt động thông qua API từ các nhà cung cấp AI lớn như OpenAI, Anthropic hoặc Google hoặc được lưu trữ cục bộ bằng cách sử dụng các mô hình trọng lượng mở như LLamaTrong nghiên cứu, thử nghiệm chủ yếu được sử dụng OpenAI'o4-mini, nhưng các mô hình khác bao gồm DeepSeek R1, Mistral Large, Claude 3.7 Sonnet, Grok3 và Gemini 2.5 Preview cũng được sử dụng để chứng minh khả năng tương thích của phương pháp này trên nhiều LLM. Đặc vụ hoạt động dựa trên một lời nhắc duy nhất khoảng 500 từ, hướng dẫn nó về loại nhân vật cần mô phỏng và cách phản hồi theo cách giống con người.

Bài báo cũng nêu bật các chiến lược tiềm năng để giảm thiểu rủi ro thao túng khảo sát do AI tạo ra, mặc dù mỗi phương pháp đều có những đánh đổi. Việc tăng cường xác minh danh tính người tham gia có thể giảm thiểu mối đe dọa nhưng lại làm dấy lên lo ngại về quyền riêng tư. Các nhà nghiên cứu cũng được khuyến khích tăng cường tính minh bạch trong việc thu thập dữ liệu khảo sát và xem xét các phương pháp tuyển dụng người tham gia được kiểm soát chặt chẽ hơn, chẳng hạn như lấy mẫu theo địa chỉ hoặc sử dụng hồ sơ đăng ký cử tri, để duy trì tính toàn vẹn của dữ liệu.

0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!

Bạn cũng có thể thích

Nghiên cứu nhân chủng học tiết lộ Claude AI phát triển hành vi lừa dối mà không được đào tạo rõ ràng

Tóm lại Anthropic đã công bố nghiên cứu mới về sự không phù hợp của AI, phát hiện ra rằng Claude bắt đầu nói dối và phá hoại các bài kiểm tra an toàn sau khi học cách gian lận trong các bài tập lập trình.

MPOST2025/11/25 19:51
Nghiên cứu nhân chủng học tiết lộ Claude AI phát triển hành vi lừa dối mà không được đào tạo rõ ràng

Myriad đạt khối lượng giao dịch 100 triệu đô la, thúc đẩy tăng trưởng gấp mười lần trên thị trường dự đoán trong vòng ba tháng

Tóm lại Myriad đã vượt mốc 100 triệu đô la khối lượng giao dịch USDC với mức tăng trưởng gấp 10 lần trong ba tháng, thu hút hơn 400,000 nhà giao dịch đồng thời mở rộng sang BNB Chain, hợp tác với Walrus và nhiều đối tác khác.

MPOST2025/11/25 19:51
Myriad đạt khối lượng giao dịch 100 triệu đô la, thúc đẩy tăng trưởng gấp mười lần trên thị trường dự đoán trong vòng ba tháng

Circle tích hợp Permit2 của Uniswap vào mạng lưới thanh toán, đơn giản hóa việc ủy quyền và thanh toán Stablecoin

Tóm lại Circle đã tích hợp Permit2 của Uniswap vào Mạng thanh toán của mình, ra mắt Onchain Transaction V2 để hợp lý hóa việc ủy quyền và thanh toán stablecoin.

MPOST2025/11/25 19:51
Circle tích hợp Permit2 của Uniswap vào mạng lưới thanh toán, đơn giản hóa việc ủy quyền và thanh toán Stablecoin