Welcome to VOZ

voznews · Sunday at 2:00 PM

n0enud29udnjcfcl7gnmzhdk2fa2l0-1281-7120-1776962741.png

Một buổi tối cuối tháng 2 tại Bali (Indonesia), nhà nghiên cứu AI Nicholas Carlini rời một đám cưới, trở về nhà, mở laptop và bắt đầu khám phá. Phòng thí nghiệm Anthropic PBC của Anthropic vừa gửi cho ông bản demo nội bộ về mô hình AI mới có tên Claude Mythos.

Anthropic trả tiền cho những người như Carlini với mục đích kiểm tra độ an toàn của Mythos, xem liệu tin tặc có thể lợi dụng chúng cho mục đích gián điệp, trộm cắp hoặc phá hoại hay không. Và chỉ trong vài giờ, ông đã đi từ bất ngờ này đến bất ngờ khác. Nhà nghiên cứu kỳ cựu phát hiện Mythos có khả năng tự động tạo ra các công cụ đột nhập mạnh mẽ, gồm cả Linux - mã nguồn mở nền tảng của hầu hết hệ thống máy tính hiện đại. Mythos thậm chí dàn dựng một vụ cướp ngân hàng kỹ thuật số: vượt qua các giao thức bảo mật và xâm nhập vào mạng lưới, đột nhập và tiếp cận các kho tiền trực tuyến.

"AI từng bẻ khóa hệ thống thành công, nhưng giờ nó còn có thể thực hiện cả một vụ cướp", Carlini nói với Bloomberg. Mỗi ngày, ông và đồng nghiệp tiếp tục nhận phản hồi từ Mythos về những lỗi nghiêm trọng và nguy hiểm, gồm loại lỗi thường chỉ được phát hiện bởi những hacker giỏi nhất thế giới.

Minh họa về "hacker Mythos". Ảnh: HackerNoon

Song song với các thử nghiệm của Carlini, đội ngũ "Tiên phong đỏ" (Frontier Red Team - chuyên đánh giá các mô hình của Anthropic, đảm bảo chúng không gây hại cho nhân loại) cũng kiểm tra mô phỏng sau khi nhận Mythos từ phòng thí nghiệm.

"Chỉ sau vài giờ, chúng tôi đã biết nó khác biệt", Logan Graham, người điều hành nhóm Frontier Red Team của Anthropic, cho biết. "Nó có thể tự tìm và khai thác lỗ hổng".

Nguồn: VnExpress Số hóa
Bài viết được tổng hợp tự động bởi voz.com.vn

Color picker

Search

Welcome to VOZ

Claude Mythos - 'siêu Hacker' Khiến Anthropic Chưa Dám Thương Mại Hóa

voznews

Thread statistics

Forum statistics

Chia sẻ trang

Giới thiệu

Quy định & Chính sách

Liên hệ

Welcome to VOZ

Claude Mythos - 'siêu Hacker' Khiến Anthropic Chưa Dám Thương Mại Hóa

voznews Send direct message

Thread statistics

Forum statistics

Chia sẻ trang

Giới thiệu

Quy định & Chính sách

Liên hệ

voznews