DeepSeek ra mô hình V4

DeepSeek thông báo trên X ngày 24/4 rằng bản V4 sẽ có mặt dưới dạng bản xem trước (Preview), "có ngữ cảnh cực dài một triệu token, dẫn đầu trong cả lĩnh vực AI nguồn đóng và nguồn mở về khả năng tác nhân, kiến thức thế giới và hiệu suất suy luận".

V4 có hai phiên bản gồm V4 Pro và V4 Flash. Theo DeepSeek, V4 Pro cho phép xử lý trực tiếp kho mã nguồn khổng lồ hoặc tài liệu lưu trữ, không cần xây dựng thêm lớp truy xuất tăng cường (RAG) trong thời gian nhiều năm, giảm lỗi truy xuất và đơn giản hóa quy trình kỹ thuật. Phiên bản này sử dụng hệ thống định tuyến chuyên gia 16x16, giúp nâng điểm chuẩn MMLU - bộ đánh giá, kiểm tra kiến thức ở 57 lĩnh vực - lên 88,5%, cao hơn mức 85,5% của V3. DeepSeek áp giá 2,8 USD/triệu token đầu vào và 8,8 USD/triệu token đầu ra, thấp hơn so với các mô hình phương Tây.

"Trong các bảng xếp hạng sức mạnh toàn cầu, DeepSeek-V4-Pro vượt trội so với các mô hình mã nguồn mở khác và chỉ bị mô hình mã nguồn đóng hàng đầu là Gemini-Pro-3.1 của Google vượt qua một chút, nhưng chi phí lại rẻ hơn hẳn", DeepSeek cho biết.

DSC09973-JPG-7723-1777006748.jpg?w=680&h=0&q=100&dpr=1&fit=crop&s=HdYZvg2x9zg1U-NquxK7eA

Logo DeepSeek V4 trên một chiếc smartphone. Ảnh: Bảo Lâm

Trong khi đó, bản Flash có tổng tham số 284 tỷ với 13 tỷ tham số hoạt động, là "lựa chọn nhanh chóng, hiệu quả và tiết kiệm", cạnh tranh với các mô hình như GPT-4o-mini của OpenAI hay Claude Haiku của Anthropic. DeepSeek áp mức giá 0,4 USD cho mỗi triệu token đầu vào và 1,2 USD cho mỗi triệu token đầu ra.

Theo EuroNews, sự xuất hiện của V4 hiệu năng cao và giá rẻ có thể khiến các công ty cung cấp AI tương tự phải xem lại bảng giá. Trong đó, cửa sổ ngữ cảnh một triệu token được xem là lời thách thức trực tiếp đối với vị thế dẫn đầu về ngữ cảnh dài của một số sản phẩm như Claude. Trang này cho rằng, rất có thể Anthropic hay OpenAI sẽ phải điều chỉnh tính năng hoặc giá bán để tăng sức hút trước AI từ Trung Quốc.

Đầu năm 2025, công ty khởi nghiệp Trung Quốc DeepSeek ra mắt mô hình R1 "mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự", đồng thời miễn phí mô hình V3. Động thái này lập tức gây bão toàn cầu, khiến vốn hóa của Nvidia khi đó sụt gần 600 tỷ USD, còn Meta phải lập "phòng chiến tranh" để giải mã mô hình đang thay đổi cuộc chơi của Trung Quốc.

Dù chưa có nhiều đột phá sau cơn sốt đầu 2025, giới chuyên gia vẫn đánh giá rất cao DeepSeek, đặc biệt ở chi phí đầu vào thấp, phù hợp cho các công ty vừa và nhỏ vốn có nguồn lực cho AI hạn chế.

Theo TechCrunch, DeepSeek ra mắt V4 chỉ diễn ra vài giờ sau khi OpenAI tung ra GPT-5.5, được công ty gọi là "mô hình thông minh nhất và dễ sử dụng nhất". Nhà đồng sáng lập kiêm Chủ tịch OpenAI Greg Brockman tuyên bố GPT-5.5 đang đưa công ty tiến gần hơn một bước đến việc tạo ra "siêu ứng dụng" của OpenAI.

"Mô hình mới là bước tiến thực sự hướng tới loại hình điện toán đang được kỳ vọng", Brockman nói. "Nó có khả năng tư duy nhanh hơn, sắc bén hơn với ít token hơn so với một hệ thống như GPT-5.4. Nghĩa là, sẽ có nhiều công nghệ AI tiên tiến hơn dành cho doanh nghiệp và người tiêu dùng".

Mark Chen, Giám đốc nghiên cứu tại OpenAI, cho biết GPT-5.5 hoạt động tốt hơn các phiên bản trước đó trong việc xử lý công việc trên máy tính, cũng như "cho thấy tiến bộ đáng kể trong quy trình nghiên cứu khoa học và kỹ thuật". Ông nhấn mạnh mô hình mới có thể "thực sự giúp các nhà khoa học chuyên gia đạt được tiến bộ", nhất là ở lĩnh vực tìm thấy thuốc mới.

Bảo Lâm tổng hợp