Theo OpenAI, GPT-5.4 là nỗ lực của công ty nhằm hạn chế "ảo giác và sai sót về mặt thực tế". Mô hình mới ít mắc lỗi trong các phản hồi riêng lẻ hơn 33% và tổng thể hơn 18% so với GPT 5.3 Instant - mô hình mà họ mới ra mắt ngày 3/3.
OpenAI cũng bổ sung bài kiểm tra an toàn mới giúp đánh giá "chuỗi suy nghĩ" của mô hình - thông tin thường hiển thị cho người dùng trước khi đưa ra kết quả cuối. ChatGPT đã có tính năng này trước đây, nhưng bài kiểm tra mới giúp nắm thông tin chi tiết hơn. Thông qua quá trình, người dùng có thể theo dõi, giám sát công cụ an toàn và hiệu quả.
GPT-5.4 cũng "mang lại hiệu suất hàng đầu, hoạt động nhanh hơn với chi phí thấp hơn so với đối thủ cạnh tranh", theo giới thiệu của OpenAI. Mô hình đạt hiệu năng cao với điểm số 75% trong bài kiểm tra hiệu năng máy tính OSWorld-Verified và WebArena Verified, cũng như đạt điểm cao nhất cho đến nay với 83% trong GDPval - bài kiểm tra của OpenAI dành cho các nhiệm vụ công việc đòi hỏi kiến thức chuyên môn sâu. Ngoài ra, mô hình cũng đạt 81,2% về MMMU-Pro, cao hơn so với Gemini 3.1 Pro với 80,5%.

Minh họa về mô hình OpenAI GPT-5.4 Thinking. Ảnh: Decoder
Trong bài kiểm tra độc lập của Mercor, mô hình của OpenAI cũng đứng đầu trong thang điểm APEX-Agents - được thiết kế để đánh giá các kỹ năng chuyên môn trong lĩnh vực luật và tài chính. "GPT-5.4 vượt trội trong việc tạo sản phẩm có thời gian hoàn thành dài như bản trình chiếu, mô hình tài chính và phân tích pháp lý", Brendan Foody, CEO Mercor, cho biết.
Về khả năng lập trình, thông qua OpenAI Codex, AI mới cho phép tạo token nhanh hơn 1,5 lần mà không làm giảm chất lượng. Theo công ty, mô hình mới với "khả năng sử dụng máy tính tiên tiến, tích hợp sẵn, cho phép tác nhân AI vận hành máy tính và thực hiện quy trình công việc phức tạp trên nhiều ứng dụng".
GPT-5.4 được cung cấp thông qua mô hình suy luận GPT-5.4 Thinking và hiệu suất cao GPT-5.4 Pro. API của mô hình hiện có sẵn với cửa sổ ngữ cảnh một triệu token, lớn nhất của OpenAI. Công ty cũng nhấn mạnh việc cải thiện hiệu quả sử dụng token khi cho biết AI mới có thể giải quyết cùng một vấn đề với số lượng token ít hơn đáng kể so với phiên bản tiền nhiệm.
Cùng với API, OpenAI giới thiệu công cụ quản lý hệ thống cho nhà phát triển có tên Tool Search. Trước đây, hệ thống sẽ hiển thị định nghĩa cho tất cả công cụ có sẵn khi gọi mô hình - quá trình tiêu tốn nhiều token khi tăng số lượng công cụ. Hệ thống mới cho phép AI tra cứu định nghĩa công cụ khi cần thiết, giúp thực hiện yêu cầu nhanh và tiết kiệm hơn nếu hệ thống đã có sẵn công cụ.
GPT-5.4 Thinking hiện được triển khai cho người dùng ChatGPT Plus, Team và Pro thay cho GPT-5.2 Thinking nhưng mới có mặt tại một số thị trường. Trong khi đó, mô hình GPT-5.4 Pro hiện được cung cấp qua gói ChatGPT Pro và Enterprise.
Bảo Lâm (theo TechCrunch, OpenAI)
- Sam Altman thừa nhận vội vã khi 'khoe' hợp đồng quân sự
- OpenAI tìm kiếm người không chuyên nhưng 'có gu'
- ChatGPT chạm mốc 900 triệu người dùng
- OpenAI đạt thỏa thuận dùng AI trong hệ thống mật của quân đội Mỹ
- Ông chủ ChatGPT: Nhiều công ty viện cớ triển khai AI để sa thải



































