Google DeepMind ra mắt SIMA 2: Trợ lý AI có khả năng chơi, suy luận và học trong thế giới ảo 3D
Tóm lại Google DeepMind đã giới thiệu tác nhân AI SIMA 2 có thể hiểu được hướng dẫn, lý luận và tự học các kỹ năng mới trong môi trường ảo, gần đạt đến khả năng hoàn thành nhiệm vụ ở cấp độ con người.
Bộ phận AI của công ty công nghệ Google, Google DeepMind đã giới thiệu SIMA 2, phiên bản mới nhất của Scalable Instructable Multiworld Agent, đánh dấu bước chuyển hướng tới các tác nhân AI có năng lực và mục đích chung hơn.
Được xây dựng dựa trên khả năng suy luận tiên tiến của các mô hình Gemini, hệ thống mở rộng hơn nữa khả năng thực hiện theo hướng dẫn cơ bản trong môi trường ảo và hiện hoạt động như một người bạn đồng hành tương tác có thể diễn giải các mục tiêu, trò chuyện với người dùng và cải thiện hiệu suất theo thời gian.
Mô hình SIMA đầu tiên đã học được hàng trăm hành động dựa trên ngôn ngữ trong các trò chơi điện tử thương mại bằng cách quan sát dữ liệu đầu vào trên màn hình và vận hành bằng các nút điều khiển ảo thay vì cơ chế trò chơi tích hợp.
SIMA 2 phát triển phương pháp này bằng cách nhúng Gemini làm cốt lõi, cho phép tác nhân thực hiện suy luận hướng đến mục tiêu, giải thích các hành động dự định và thực hiện các nhiệm vụ phức tạp hơn trong trò chơi. Được đào tạo kết hợp giữa các bài trình diễn của con người và các chú thích do Gemini tạo ra, tác nhân này đã được thử nghiệm trên một tập hợp trò chơi rộng hơn thông qua quan hệ đối tác với nhiều nhà phát triển. Bản cập nhật này đánh dấu một bước tiến quan trọng đối với AI hiện thân, kết hợp nhận thức, suy luận và hành động trong môi trường 3D động.
Việc tích hợp Gemini đã tăng cường khả năng khái quát hóa và vận hành đáng tin cậy của SIMA 2 trong các bối cảnh không quen thuộc. Giờ đây, tác nhân này có thể diễn giải các lệnh chi tiết và sắc thái hơn, đồng thời thực hiện chúng thành công ngay cả trong các trò chơi mà nó chưa từng gặp trước đây, chẳng hạn như tựa game ASKA mang chủ đề Viking hay MineDojo, một phiên bản nghiên cứu của Minecraft.
Khả năng áp dụng các khái niệm đã học vào nhiều môi trường khác nhau—ví dụ, mở rộng ý tưởng "khai thác" từ trò chơi này sang "thu hoạch" trong trò chơi khác—tạo thành một thành phần quan trọng của khái quát hóa rộng rãi và đưa hiệu suất của nó gần hơn với hiệu suất của người chơi.
Để đánh giá những khả năng này, SIMA 2 cũng đã được thử nghiệm trong các thế giới 3D được tạo theo thủ tục bởi Genie 3, tạo ra các môi trường mới từ các gợi ý văn bản hoặc hình ảnh. Trong những bối cảnh xa lạ này, tác nhân vẫn có thể điều hướng hiệu quả, diễn giải các hướng dẫn và làm việc theo hướng người dùng.defimục tiêu đã đề ra, cho thấy mức độ thích ứng chưa từng thấy ở các hệ thống tương tự trước đây.
SIMA 2 thúc đẩy AI tự cải thiện với khả năng mới trong tổng quát hóa và học tự động
Theo tiêu chuẩn công ty Một trong những phát triển đáng chú ý nhất của SIMA 2 là khả năng tự cải thiện hiệu suất. Trong quá trình huấn luyện, SIMA 2 đã chứng minh được khả năng thực hiện các nhiệm vụ ngày càng phức tạp thông qua phương pháp thử và sai lặp đi lặp lại kết hợp với phản hồi từ Gemini. Sau khi học hỏi ban đầu từ các buổi trình diễn của con người, SIMA 2 có thể tiếp tục phát triển trong các trò chơi mới thông qua việc chơi tự động, trau dồi kỹ năng trong môi trường xa lạ mà không cần thêm dữ liệu của con người. Kinh nghiệm này sau đó có thể được sử dụng để huấn luyện các phiên bản tiếp theo, có khả năng hơn của SIMA 2. Tác nhân AI và quá trình tự cải thiện tương tự đã được áp dụng thành công trong các môi trường do Genie tạo ra, đánh dấu một bước tiến có ý nghĩa trong việc đào tạo các đặc vụ chung trên nhiều thế giới tổng hợp đa dạng. Chu kỳ tinh chỉnh liên tục này hỗ trợ mục tiêu dài hạn là cho phép các đặc vụ học hỏi với sự hướng dẫn tối thiểu của con người.
Khả năng hoạt động của SIMA 2 trên nhiều môi trường trò chơi khác nhau cung cấp một nền tảng thử nghiệm quan trọng cho trí thông minh tổng quát, cho phép nó tiếp thu các kỹ năng, thực hành lập luận và học hỏi liên tục thông qua hành động tự định hướng. Mặc dù hệ thống này là một bước tiến đáng kể hướng tới trí thông minh tổng quát, tương tác và hiện thân, nhưng nó vẫn còn những hạn chế rõ ràng ở giai đoạn nghiên cứu. Tác nhân vẫn gặp khó khăn với các tác vụ phức tạp, dài hạn đòi hỏi lập luận mở rộng hoặc xác minh mục tiêu nhiều lần, và trí nhớ của nó vẫn còn hạn chế do nhu cầu tương tác độ trễ thấp trong một cửa sổ ngữ cảnh hạn chế. Độ chính xác trong các hành động chi tiết và khả năng hiểu trực quan các cảnh 3D phức tạp cũng vẫn là một thách thức lớn hơn trên toàn lĩnh vực.
Dự án chứng minh tiềm năng của phương pháp AI hướng hành động, trong đó năng lực tổng quát được hỗ trợ bởi dữ liệu đào tạo đa dạng và khả năng lập luận mạnh mẽ. SIMA 2 cho thấy những yếu tố này có thể được hợp nhất trong một tác nhân tổng quát duy nhất thay vì bị cô lập trong các hệ thống chuyên biệt riêng biệt, và nó mở ra một hướng đi đầy hứa hẹn cho các ứng dụng robot trong tương lai, vì nhiều kỹ năng học được trong môi trường ảo—chẳng hạn như điều hướng, sử dụng công cụ và xử lý tác vụ cộng tác—sẽ được chuyển thành các thành phần cơ bản cho AI hiện thân.
SIMA 2 được thiết kế như một tác nhân nghiên cứu tương tác, lấy con người làm trung tâm, và quá trình phát triển của nó tập trung rõ ràng vào các hoạt động có trách nhiệm, đặc biệt là liên quan đến các cơ chế tự cải thiện. Nhóm đã hợp tác với các chuyên gia đổi mới sáng tạo có trách nhiệm trong suốt dự án và đang phát hành SIMA 2 dưới dạng bản xem trước nghiên cứu giới hạn, cung cấp quyền truy cập sớm cho các học giả và nhà phát triển trò chơi được lựa chọn. Phương pháp tiếp cận theo từng giai đoạn này cho phép tiếp tục giám sát, phản hồi và đánh giá liên ngành khi công nghệ và các tác động tiềm năng của nó được khám phá sâu hơn.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
Ethereum (ETH) vượt mốc 3.200 USD, tăng 0,47% trong ngày
Bitcoin rớt xuống dưới 96.000 USD, giảm 0,32% trong ngày
Circle ra mắt StableFX và hợp tác với các đồng tiền ổn định để thúc đẩy việc phát hành ngoại hối và đồng tiền ổn định cho các tổ chức
Tóm lại Circle đã ra mắt StableFX và Circle Partner Stablecoin trên Arc, cho phép giao dịch stablecoin theo tổ chức, thanh toán theo thời gian thực và tăng cường tính thanh khoản cho một số stablecoin khu vực được chọn.

Xác suất Cục Dự trữ Liên bang cắt giảm lãi suất 25 điểm cơ bản vào tháng 12 đã giảm xuống còn 44,4%.
