What's new

Welcome to VOZ

Join us now to get access to all our features. Once registered and logged in, you will be able to create topics, post replies to existing threads, give reputation to your fellow members, get your own private messenger, and so, so much more. It's also quick and totally free, so what are you waiting for?

Claude Mythos - 'siêu Hacker' Khiến Anthropic Chưa Dám Thương Mại Hóa

Joined
Apr 20, 2026
Messages
1.065
Reaction score
6
Points
1
n0enud29udnjcfcl7gnmzhdk2fa2l0-1281-7120-1776962741.png

Một buổi tối cuối tháng 2 tại Bali (Indonesia), nhà nghiên cứu AI Nicholas Carlini rời một đám cưới, trở về nhà, mở laptop và bắt đầu khám phá. Phòng thí nghiệm Anthropic PBC của Anthropic vừa gửi cho ông bản demo nội bộ về mô hình AI mới có tên Claude Mythos.

Anthropic trả tiền cho những người như Carlini với mục đích kiểm tra độ an toàn của Mythos, xem liệu tin tặc có thể lợi dụng chúng cho mục đích gián điệp, trộm cắp hoặc phá hoại hay không. Và chỉ trong vài giờ, ông đã đi từ bất ngờ này đến bất ngờ khác. Nhà nghiên cứu kỳ cựu phát hiện Mythos có khả năng tự động tạo ra các công cụ đột nhập mạnh mẽ, gồm cả Linux - mã nguồn mở nền tảng của hầu hết hệ thống máy tính hiện đại. Mythos thậm chí dàn dựng một vụ cướp ngân hàng kỹ thuật số: vượt qua các giao thức bảo mật và xâm nhập vào mạng lưới, đột nhập và tiếp cận các kho tiền trực tuyến.

"AI từng bẻ khóa hệ thống thành công, nhưng giờ nó còn có thể thực hiện cả một vụ cướp", Carlini nói với Bloomberg. Mỗi ngày, ông và đồng nghiệp tiếp tục nhận phản hồi từ Mythos về những lỗi nghiêm trọng và nguy hiểm, gồm loại lỗi thường chỉ được phát hiện bởi những hacker giỏi nhất thế giới.

Minh họa về "hacker Mythos". Ảnh: HackerNoon

Song song với các thử nghiệm của Carlini, đội ngũ "Tiên phong đỏ" (Frontier Red Team - chuyên đánh giá các mô hình của Anthropic, đảm bảo chúng không gây hại cho nhân loại) cũng kiểm tra mô phỏng sau khi nhận Mythos từ phòng thí nghiệm.

"Chỉ sau vài giờ, chúng tôi đã biết nó khác biệt", Logan Graham, người điều hành nhóm Frontier Red Team của Anthropic, cho biết. "Nó có thể tự tìm và khai thác lỗ hổng".


Nguồn: VnExpress Số hóa
Bài viết được tổng hợp tự động bởi voz.com.vn
 

Thread statistics

Created
voznews,
Replies
0
Views
1

Forum statistics

Threads
1.109
Messages
1.112
Members
6
Latest member
vieclam
Back
Top