Apple: Siri được 'đập đi xây lại'

3 小时前 4

Apple cho biết Siri AI được xây lại từ đầu dựa trên mô hình Foundation Model thế hệ ba, đồng thời chia sẻ về việc hợp tác với Google Gemini.

Sau phát biểu chính tại WWDC 2026 ngày 8/6, Apple có buổi thảo luận chi tiết về công nghệ với giới hạn khách mời truyền thông, với sự tham gia của Craig Federighi, Phó chủ tịch cấp cao về phần mềm của Apple; Amar Subramanya, Phó chủ tịch về trí tuệ nhân tạo; Mike Rockwell, đứng đầu bộ phận Siri; và Sebastien Marineau-Mes, Phó chủ tịch phần mềm.

 Tuấn Hưng

Từ trái qua: Amar Subramanya, Phó chủ tịch về trí tuệ nhân tạo của Apple; Mike Rockwell, người đứng đầu bộ phận Siri; Sebastien Marineau-Mes, Phó chủ tịch phần mềm và Craig Federighi, Phó chủ tịch cấp cao về phần mềm. Ảnh: Tuấn Hưng

Hợp tác với Google

"Chúng tôi không dùng Google Gemini", Craig Federighi nói, thêm rằng Apple cũng không sử dụng mô hình Gemini nào đang được triển khai cho khách hàng Google, cơ sở hạ tầng tìm kiếm Google Search hay bất kỳ điều gì tương tự làm "xương sống" cho tri thức máy học của hãng. Thay vào đó, công ty hợp tác với Google để phát triển mô hình riêng là Apple Foundation Model (AFM) thế hệ ba.

Theo Subramanya, Foundation Model mới bao gồm hai mô hình hoạt động trực tiếp trên thiết bị và ba mô hình trên máy chủ. Nhóm hoạt động trên thiết bị gồm AFM Core sử dụng kiến trúc dày đặc (dense architecture) và AFM Core Advanced sử dụng kiến trúc thưa (sparse architecture), đa phương thức nguyên bản (multimodal native). Ông cho biết AFM Core Advanced "khác biệt hoàn toàn so với bất kỳ mô hình nào trên thiết bị mà công ty từng triển khai", cho phép bổ sung tính năng mới, bao gồm yêu cầu tương tác và giọng nói biểu cảm mà không cần gửi lệnh lên máy chủ.

 Tuấn Hưng

Ông Mike Rockwell giới thiệu về các mô hình Apple Foundation Model thế hệ ba. Ảnh: Tuấn Hưng

Hai mô hình trên đám mây được nhắc đến trước tiên là AFM Cloud tối ưu cho độ trễ và chi phí thấp, AFM Cloud Image hỗ trợ tạo và chỉnh sửa hình ảnh, như tính năng thay đổi góc chụp Định lại khung mới của Apple Intelligence.

Theo mô tả của Subramanya, bốn mô hình trên đánh dấu sự hợp tác quan trọng với Google. "Tất cả đều làm riêng cho chip Apple Silicon, được huấn luyện bằng dữ liệu độc quyền với phương pháp học tăng cường và tinh chỉnh bằng cách sử dụng kết quả đầu ra từ các mô hình tiên phong của Gemini", ông nói. Các đóng góp của Google dựa trên sự chắt lọc của Apple thay vì áp dụng toàn bộ Gemini như các tin đồn.

Mô hình thứ năm và mạnh mẽ nhất của Apple là AFM Cloud Pro, được thiết kế cho tác nhân AI và tác vụ suy luận phức tạp, với chất lượng được Subramanya khẳng định "tương tự các mẫu Gemini tiên tiến nhất". Mô hình cũng đánh dấu một bước ngoặt với dịch vụ điện toán đám mây riêng tư Private Cloud Compute của Apple.

Quyền riêng tư người dùng và Điện toán đám mây riêng tư (PCC)

Private Cloud Compute (PCC) vốn được Apple sử dụng cho xử lý AI riêng tư, giữ an toàn cho các yêu cầu từ Apple Intelligence trong khi vẫn xử lý dữ liệu trên đám mây. PCC trước đây chỉ giới hạn với máy chủ Apple Silicon trong các trung tâm dữ liệu của Apple nhưng từ năm nay, công ty làm việc với Google và Nvidia để mở rộng cơ sở hạ tầng PCC của mình sang các hệ thống Google Cloud chạy GPU Nvidia mà không ảnh hưởng đến quyền riêng tư và bảo mật. Marineau-Mes cho biết Apple muốn sử dụng các chip mới nhất của Nvidia nhưng yêu cầu chúng phải được cấu hình sao cho không thể đọc được nội dung trên các máy chủ của Apple.

 Tuấn Hưng

Craig Federighi giới thiệu về Apple Intelligence mới. Ảnh: Tuấn Hưng

Theo Sebastien Marineau-Mes, dữ liệu của người dùng chỉ được gửi lên máy chủ với một thao tác cụ thể và Apple không có quyền truy cập vào chúng. Hệ thống này có thể được kiểm chứng bởi các nhà nghiên cứu độc lập để minh chứng cho cam kết của Apple. Đại diện Apple cũng nhấn mạnh bất kỳ dữ liệu nào được gửi lên PCC sẽ bị xóa sạch hoàn toàn sau khi hoàn thành yêu cầu. Hệ thống bảo mật tới mức chính các kỹ sư cũng không thể truy cập để gỡ lỗi khi nó đang chạy.

Điểm quan trọng nhất giúp hệ thống của Apple bảo mật được dữ liệu riêng tư của người dùng là công ty hoàn toàn kiểm soát phần mềm được triển khai và các thiết bị Apple chỉ giao tiếp với mã nguồn đã được Apple xác thực.

Siri mới, hoạt động với ngữ cảnh cá nhân hóa

Mike Rockwell, đứng đầu bộ phận Siri, chia sẻ Apple "phá bỏ hoàn toàn" phiên bản Siri cũ để xây dựng từ đầu dựa trên mô hình AI mới. Trước đó, công ty đã cố cải tiến Siri dần dần trên nền tảng cũ nhưng đội ngũ của ông cảm thấy không thể truyền tải đúng tầm nhìn và trải nghiệm mà họ mong muốn.

Siri AI được xây trên mô hình AFM, có khả năng đa phương thức nguyên bản (natively multimodal), được huấn luyện từ đầu để hiểu, xử lý và kết hợp đồng thời nhiều loại dữ liệu khác nhau như văn bản, hình ảnh, âm thanh, video. Siri mới vẫn đảm bảo tính bảo mật và nhất quán tren toàn bộ dải thiết bị của hãng gồm iPhone, iPad, Mac, và Vision Pro.

Việc xây dựng lại Siri giúp trợ lý này có thể sử dụng các ngữ cảnh cá nhân hóa người dùng để thực hiện tác vụ phức tạp nhưng vẫn đảm bảo quyền riêng tư thông qua sự kết hợp giữa xử lý trên thiết bị và Điện toán đám mây riêng (PCC).

 Tuấn Hưng

Ông Mike Rockwell demo trực tiếp khả năng Siri xử lý yêu cầu của người dùng dựa trên các tin nhắn trong máy. Ảnh: Tuấn Hưng

Trong màn trình diễn trên sân khấu, Mike Rockwell hỏi Siri những món đồ mà mọi người sẽ mang đến bữa tiệc BBQ. Trợ lý ảo tìm thông tin liên quan từ tin nhắn trong máy, như người mang dưa hấu, người mang mỳ ống. Sau đó, Siri tiếp tục gợi ý các loại đồ uống phù hợp dựa trên kiến thức trên Internet, cho thấy sự kết hợp giữa tìm kiếm dữ liệu riêng tư trong thiết bị, phối hợp với nghiên cứu dữ liệu công cộng nhằm đưa ra kết quả cuối cùng.

Trong một ví dụ khác, Sebastien Marineau-Mes cho thấy khả năng Siri có thể đọc, hiểu nội dung đang có trên màn hình. Ví dụ, khi xem một bức ảnh mây, người dùng có thể hỏi: "Tại sao đám mây lại trông như này?", Siri khi đó sẽ phân tích hình ảnh để đưa ra câu trả lời. Nó cũng cho phép người dùng hỏi những câu như "Tôi có rảnh vào ngày đó không?" khi đang xem một tin nhắn người bạn mời đi xem ca nhạc vào thời gian cụ thể.

Craig Federighi cho biết Siri mới không phải một chatbot rời rạc đơn thuần mà là một công cụ hội thoại được tích hợp sâu, với khả năng kết hợp dữ liệu từ thiết bị người dùng. Việc có một ứng dụng riêng biệt thay vì không như trước đây sẽ giúp người dùng dễ dàng quản lý và quay lại các cuộc hội thoại trước đó.

Tuấn Hưng

阅读全文