Anthropic: Cần cơ chế dừng phát triển AI toàn cầu

11 giờ trước 23

Thứ bảy, 6/6/2026, 06:51 (GMT+7)

Startup Anthropic cho rằng thế giới cần chuẩn bị phương án giảm tốc hoặc dừng phát triển AI nếu các mô hình có khả năng tự nâng cấp quá nhanh.

Trong bài đăng trên blog hôm 4/6, Anthropic kêu gọi các nhà phát triển AI hàng đầu cân nhắc thiết lập một cơ chế phối hợp để làm chậm hoặc tạm dừng quá trình phát triển nếu AI bắt đầu tự cải tiến với tốc độ vượt sức quản lý rủi ro của xã hội. Startup này nhận định, AI với khả năng tự cải tiến sẽ là bước phát triển lớn trong lịch sử công nghệ, nhưng cũng làm tăng nguy cơ con người mất quyền kiểm soát trí tuệ nhân tạo.

"Nếu các hệ thống có thể tự xây dựng phiên bản kế nhiệm thì cách con người bảo mật, giám sát và định hình hành vi của chúng sẽ trở nên quan trọng hơn rất nhiều", Anthropic viết, đồng thời chia sẻ, tính đến tháng trước, hơn 80% mã nguồn được tích hợp vào cơ sở mã của công ty là do AI Claude viết.

Anthropic cho rằng các hệ thống AI hiện chưa thể tự nâng cấp mà không cần con người, nhưng điều này có thể xảy ra sớm hơn dự đoán của đa số chính phủ và tổ chức. "Bằng chứng cho thấy vai trò của con người đang giảm dần ở mỗi giai đoạn trong quá trình phát triển AI", công ty viết. Do đó, sẽ rất tốt cho thế giới nếu "tồn tại lựa chọn làm chậm hoặc tạm dừng việc phát triển AI tiên tiến, tạo điều kiện để các cấu trúc xã hội và nghiên cứu điều chỉnh theo kịp sự tiến bộ của công nghệ".

Tuy nhiên, bài đăng cảnh báo, việc làm chậm tiến độ một cách đơn phương hoặc thiếu phối hợp có thể phản tác dụng nếu các bên thiếu thận trọng tiếp tục thúc đẩy AI, dẫn đến nguy cơ giảm an toàn chung. Việc một công ty đơn phương tạm dừng sẽ dễ thực hiện hơn nhưng chỉ mang lại tác động hạn chế, chủ yếu chỉ làm thay đổi vai trò lãnh đạo.

Vì vậy, một cơ chế tạm dừng hiệu quả sẽ đòi hỏi nhiều nhà phát triển AI hàng đầu cùng đồng thuận, cũng như quy định rõ những điều kiện nào sẽ kích hoạt hoặc chấm dứt cơ chế và ai là người giám sát. Bộ phận nghiên cứu của Anthropic sẽ nghiên cứu và hỗ trợ xây dựng các hệ thống cần thiết để triển khai cơ chế này.

Theo Reuters, trong những tháng tới, Anthropic dự định tổ chức các cuộc thảo luận với nhà hoạch định chính sách, nhà nghiên cứu, tổ chức xã hội dân sự và công ty AI khác nhằm xem xét một số vấn đề then chốt như cách quản lý rủi ro liên quan đến AI và tăng cường các cơ chế phối hợp.

WSJ cho biết, các lãnh đạo của Anthropic, bao gồm CEO Dario Amodei, từng nhiều lần cảnh báo về rủi ro tiềm ẩn từ AI và kêu gọi sự hợp tác rộng rãi của xã hội để giải quyết. Ông lo ngại AI có thể làm trầm trọng thêm tình trạng bất bình đẳng và loại bỏ tới một nửa số việc làm văn phòng cấp thấp.

Amodei cảnh báo, những hệ thống AI mạnh mẽ mà ông dự đoán sẽ xuất hiện trong tương lai gần hoàn toàn có thể phát triển khuynh hướng phá hoại theo cách khó lường. Hồi tháng 1, Amodei nhận định việc huấn luyện các mô hình bằng câu chuyện khoa học viễn tưởng về AI nổi loạn có thể dẫn đến việc chúng thực sự nổi loạn.

Jack Clark, đồng sáng lập Anthropic, cũng thường xuyên lên tiếng về mối nguy hiểm tiềm ẩn của AI và hậu quả khi các hệ thống AI đạt đến ngưỡng tự cải tiến, cho rằng điều này sẽ làm thay đổi thế giới. "Loại công nghệ đó chưa từng tồn tại trước đây, nhưng tôi tin nó có thể xuất hiện trong vòng hai năm tới, thậm chí sớm hơn", Clark nói trong một buổi diễn thuyết ở London tháng trước.

Anthropic thành lập năm 2021 bởi một nhóm lãnh đạo và nhà nghiên cứu từng làm việc ở OpenAI. Các sản phẩm của công ty, đặc biệt là trợ lý Claude Code, trở nên phổ biến trong vòng hơn một năm qua. Doanh thu hàng năm của startup này được ước tính vượt mốc 30 tỷ USD.

Thu Thảo tổng hợp

Đọc toàn bộ bài viết