"Chúng tôi phát hiện chiến dịch ở quy mô công nghiệp của ba phòng thí nghiệm AI gồm DeepSeek, Moonshot và MiniMax, trong đó khai thác trái phép khả năng của Claude để cải thiện mô hình AI của riêng họ", Anthropic cho biết trên blog ngày 23/2. "Nhóm này thực hiện hơn 16 triệu giao dịch với Claude thông qua khoảng 24.000 tài khoản gian lận, vi phạm điều khoản dịch vụ và các hạn chế truy cập theo khu vực của chúng tôi".

Trong bài đăng, công ty AI Mỹ nói "luôn ủng hộ biện pháp kiểm soát xuất khẩu nhằm duy trì vị thế dẫn đầu của Mỹ trong lĩnh vực trí tuệ nhân tạo", trong khi tấn công "chưng cất" (distillation) làm suy yếu việc kiểm soát. Chiến dịch ba công ty Trung Quốc thực hiện "ngày càng gia tăng về cường độ và sự tinh vi", với thời gian hành động rất ngắn, còn mối đe dọa "vượt ngoài phạm vi của bất kỳ công ty hay khu vực nào".

"Giải quyết vấn đề này đòi hỏi hành động nhanh chóng và phối hợp giữa các bên trong ngành, nhà hoạch định chính sách, cộng đồng AI toàn cầu", Anthropic kêu gọi, đồng thời khẳng định cuộc tấn công sao chép từ DeepSeek, Moonshot và MiniMax vi phạm điều khoản dịch vụ của công ty. Tuy vậy, chưa rõ điều này có vi phạm luật quốc tế hay không.

DeepSeek, Moonshot và MiniMax chưa đưa ra bình luận.

DSC00620-JPG-7324-1771902859.jpg?w=680&h=0&q=100&dpr=1&fit=crop&s=LQQUS0INlQVHc9A6vmDPSQ

Giao diện đăng nhập DeepSeek trên smartphone. Ảnh: Bảo Lâm

Trong thế giới AI, khái niệm "chưng cất" (distillation) đề cập việc "chuyển giao kiến thức" từ mô hình này sang mô hình khác giống kiểu giáo viên - học sinh. "Chưng cất là kỹ thuật được thiết kế để chuyển kiến thức của một mô hình lớn được đào tạo trước (giáo viên) thành một mô hình nhỏ hơn (học sinh), cho phép mô hình học sinh đạt được hiệu suất tương đương mô hình giáo viên", hai nhà khoa học Vishal Yadav và Nikhil Pandey nói với Forbes. "Kỹ thuật này giúp người dùng tận dụng chất lượng của các mô hình ngôn ngữ lớn (LLM), đồng thời giảm chi phí suy luận".

Các mô hình AI hàng đầu từ OpenAI, Google, Meta hay Anthropic về cơ bản tự học từ đầu với lượng dữ liệu thô khổng lồ - quá trình thường mất nhiều tháng và tiêu tốn hàng chục triệu USD trở lên. Tuy nhiên, khi một công ty khác ra đời sau và tận dụng kết quả đã có từ các AI đi đầu này, quá trình "chưng cất" có thể giúp tạo ra một mô hình tốt trong vài tuần, thậm chí vài ngày, với chi phí ít hơn đáng kể.

Đầu năm ngoái, nói với FT, OpenAI cho biết đã phát hiện dấu hiệu "chưng cất" từ DeepSeek. Tuy nhiên, theo Mashable, nhiều người khi đó không thông cảm mà quay sang chế giễu vì OpenAI và các công ty AI lớn khác cho rằng họ "có quyền tuyệt đối" trong việc huấn luyện mô hình của mình trên các tác phẩm có bản quyền mà không cần xin phép hoặc trả phí.

Đầu tháng này, nhóm Tình báo và Mối đe dọa của Google (GTIG) cũng "phát hiện sự gia tăng các nỗ lực trích xuất mô hình hoặc các cuộc tấn công chưng cất" diện rộng. Tuy nhiên, công ty không nêu tên cụ thể.

DeepSeek nổi tiếng từ đầu năm ngoái khi ra mắt mô hình AI hiệu suất cao với chi phí hạn chế. Công ty tuyên bố họ chỉ sử dụng 2.048 card đồ họa Nvidia H800 và 5,6 triệu USD để đào tạo mô hình V3 với 671 tỷ tham số, bằng một phần nhỏ so với số tiền OpenAI và Google phải bỏ ra để huấn luyện mô hình có quy mô tương đương.

Moonshot AI là kỳ lân mới của Trung Quốc, nổi tiếng với Kimi K2. Mô hình mã nguồn mở này cho phép nhà phát triển bỏ qua khâu đào tạo từ đầu và tự do sử dụng, tinh chỉnh, mở rộng theo ý muốn. Với lượng tham số lớn, Kimi K2 tỏ ra vượt trội đối thủ ChatGPT 4.1 trong bài kiểm tra khả năng viết mã và Claude 4 Opus trong bài kiểm tra kiến thức khoa học. Kimi K2 đứng thứ 9 trên bảng xếp hạng mô hình mã nguồn mở của Hugging Face tính đến tháng 8 năm ngoái.

MiniMax cũng là startup AI nổi bật của Trung Quốc, thuộc nhóm "AI Tigers" (những con hổ dẫn đầu làn sóng LLM). Theo Reuters, trong hệ sinh thái sản phẩm của mình, MiniMax xây dựng nhiều nền tảng AI đa phương thức có thể xử lý văn bản, giọng nói, hình ảnh và video, phục vụ hàng trăm triệu người dùng trong nước.

Bảo Lâm tổng hợp

  • Tin tặc dùng 100.000 câu lệnh hòng sao chép Google Gemini
  • Sếp Anthropic 'dùng 100% AI' để viết mã
  • Anthropic: Nhiều mô hình AI biết 'tống tiền'
  • DeepSeek sau một năm gây sốt toàn cầu

Nguoi-noi-tieng.com (r) © 2008 - 2022