Bài viết mới
VOZ Forums

Tham gia VOZ Forums để thảo luận, chia sẻ kiến thức và kết nối cộng đồng. Đăng ký tài khoản miễn phí để đăng bài, bình luận và nhắn tin với thành viên khác.

hot Apple: Siri được 'đập đi xây lại'

voznews

Điều hành viên
12 Level 12
47.7%
Bài viết
2.570
Được Like
11
dscf7552-1781042235-8377-1781042314.jpg

Apple: Siri được 'đập đi xây lại'

Sau phát biểu chính tại WWDC 2026 ngày 8/6, Apple có buổi thảo luận chi tiết về công nghệ với giới hạn khách mời truyền thông, với sự tham gia của Craig Federighi, Phó chủ tịch cấp cao về phần mềm của Apple; Amar Subramanya, Phó chủ tịch về trí tuệ nhân tạo; Mike Rockwell, đứng đầu bộ phận Siri; và Sebastien Marineau-Mes, Phó chủ tịch phần mềm.

DSCF7557-1781041773-3091-1781042314.jpg

"Chúng tôi không dùng Google Gemini", Craig Federighi nói, thêm rằng Apple cũng không sử dụng mô hình Gemini nào đang được triển khai cho khách hàng Google, cơ sở hạ tầng tìm kiếm Google Search hay bất kỳ điều gì tương tự làm "xương sống" cho tri thức máy học của hãng. Thay vào đó, công ty hợp tác với Google để phát triển mô hình riêng là Apple Foundation Model (AFM) thế hệ ba.

Theo Subramanya, Foundation Model mới bao gồm hai mô hình hoạt động trực tiếp trên thiết bị và ba mô hình trên máy chủ. Nhóm hoạt động trên thiết bị gồm AFM Core sử dụng kiến trúc dày đặc (dense architecture) và AFM Core Advanced sử dụng kiến trúc thưa (sparse architecture), đa phương thức nguyên bản (multimodal native). Ông cho biết AFM Core Advanced "khác biệt hoàn toàn so với bất kỳ mô hình nào trên thiết bị mà công ty từng triển khai", cho phép bổ sung tính năng mới, bao gồm yêu cầu tương tác và giọng nói biểu cảm mà không cần gửi lệnh lên máy chủ.

DSCF7568-1781042023-3894-1781042314.jpg

Hai mô hình trên đám mây được nhắc đến trước tiên là AFM Cloud tối ưu cho độ trễ và chi phí thấp, AFM Cloud Image hỗ trợ tạo và chỉnh sửa hình ảnh, như tính năng thay đổi góc chụp Định lại khung mới của Apple Intelligence.

Theo mô tả của Subramanya, bốn mô hình trên đánh dấu sự hợp tác quan trọng với Google. "Tất cả đều làm riêng cho chip Apple Silicon, được huấn luyện bằng dữ liệu độc quyền với phương pháp học tăng cường và tinh chỉnh bằng cách sử dụng kết quả đầu ra từ các mô hình tiên phong của Gemini", ông nói. Các đóng góp của Google dựa trên sự chắt lọc của Apple thay vì áp dụng toàn bộ Gemini như các tin đồn.

Mô hình thứ năm và mạnh mẽ nhất của Apple là AFM Cloud Pro, được thiết kế cho tác nhân AI và tác vụ suy luận phức tạp, với chất lượng được Subramanya khẳng định "tương tự các mẫu Gemini tiên tiến nhất". Mô hình cũng đánh dấu một bước ngoặt với dịch vụ điện toán đám mây riêng tư Private Cloud Compute của Apple.

Quyền riêng tư người dùng và Điện toán đám mây riêng tư (PCC)

Private Cloud Compute (PCC) vốn được Apple sử dụng cho xử lý AI riêng tư, giữ an toàn cho các yêu cầu từ Apple Intelligence trong khi vẫn xử lý dữ liệu trên đám mây. PCC trước đây chỉ giới hạn với máy chủ Apple Silicon trong các trung tâm dữ liệu của Apple nhưng từ năm nay, công ty làm việc với Google và Nvidia để mở rộng cơ sở hạ tầng PCC của mình sang các hệ thống Google Cloud chạy GPU Nvidia mà không ảnh hưởng đến quyền riêng tư và bảo mật. Marineau-Mes cho biết Apple muốn sử dụng các chip mới nhất của Nvidia nhưng yêu cầu chúng phải được cấu hình sao cho không thể đọc được nội dung trên các máy chủ của Apple.

DSCF7552-1781041923-1517-1781042314.jpg

Theo Sebastien Marineau-Mes, dữ liệu của người dùng chỉ được gửi lên máy chủ với một thao tác cụ thể và Apple không có quyền truy cập vào chúng. Hệ thống này có thể được kiểm chứng bởi các nhà nghiên cứu độc lập để minh chứng cho cam kết của Apple. Đại diện Apple cũng nhấn mạnh bất kỳ dữ liệu nào được gửi lên PCC sẽ bị xóa sạch hoàn toàn sau khi hoàn thành yêu cầu. Hệ thống bảo mật tới mức chính các kỹ sư cũng không thể truy cập để gỡ lỗi khi nó đang chạy.

Điểm quan trọng nhất giúp hệ thống của Apple bảo mật được dữ liệu riêng tư của người dùng là công ty hoàn toàn kiểm soát phần mềm được triển khai và các thiết bị Apple chỉ giao tiếp với mã nguồn đã được Apple xác thực.

Siri mới, hoạt động với ngữ cảnh cá nhân hóa

Mike Rockwell, đứng đầu bộ phận Siri, chia sẻ Apple "phá bỏ hoàn toàn" phiên bản Siri cũ để xây dựng từ đầu dựa trên mô hình AI mới. Trước đó, công ty đã cố cải tiến Siri dần dần trên nền tảng cũ nhưng đội ngũ của ông cảm thấy không thể truyền tải đúng tầm nhìn và trải nghiệm mà họ mong muốn.

Siri AI được xây trên mô hình AFM, có khả năng đa phương thức nguyên bản (natively multimodal), được huấn luyện từ đầu để hiểu, xử lý và kết hợp đồng thời nhiều loại dữ liệu khác nhau như văn bản, hình ảnh, âm thanh, video. Siri mới vẫn đảm bảo tính bảo mật và nhất quán tren toàn bộ dải thiết bị của hãng gồm iPhone, iPad, Mac, và Vision Pro.

Việc xây dựng lại Siri giúp trợ lý này có thể sử dụng các ngữ cảnh cá nhân hóa người dùng để thực hiện tác vụ phức tạp nhưng vẫn đảm bảo quyền riêng tư thông qua sự kết hợp giữa xử lý trên thiết bị và Điện toán đám mây riêng (PCC).

DSCF7565-1781042160-8952-1781042314.jpg

Trong màn trình diễn trên sân khấu, Mike Rockwell hỏi Siri những món đồ mà mọi người sẽ mang đến bữa tiệc BBQ. Trợ lý ảo tìm thông tin liên quan từ tin nhắn trong máy, như người mang dưa hấu, người mang mỳ ống. Sau đó, Siri tiếp tục gợi ý các loại đồ uống phù hợp dựa trên kiến thức trên Internet, cho thấy sự kết hợp giữa tìm kiếm dữ liệu riêng tư trong thiết bị, phối hợp với nghiên cứu dữ liệu công cộng nhằm đưa ra kết quả cuối cùng.

Trong một ví dụ khác, Sebastien Marineau-Mes cho thấy khả năng Siri có thể đọc, hiểu nội dung đang có trên màn hình. Ví dụ, khi xem một bức ảnh mây, người dùng có thể hỏi: "Tại sao đám mây lại trông như này?", Siri khi đó sẽ phân tích hình ảnh để đưa ra câu trả lời. Nó cũng cho phép người dùng hỏi những câu như "Tôi có rảnh vào ngày đó không?" khi đang xem một tin nhắn người bạn mời đi xem ca nhạc vào thời gian cụ thể.

Craig Federighi cho biết Siri mới không phải một chatbot rời rạc đơn thuần mà là một công cụ hội thoại được tích hợp sâu, với khả năng kết hợp dữ liệu từ thiết bị người dùng. Việc có một ứng dụng riêng biệt thay vì không như trước đây sẽ giúp người dùng dễ dàng quản lý và quay lại các cuộc hội thoại trước đó.



Nguồn: VnExpress Số hóa
Chuyên mục: HOT
 
Back