Hội nghị thường niên lần thứ 40 của Hiệp hội Trí tuệ Nhân tạo (AAAI-26) vừa diễn ra tại Singapore. Đây được coi là một trong số sự kiện học thuật danh giá thế giới về AI, nơi quy tụ những nhóm nghiên cứu xuất sắc nhất từ các tập đoàn công nghệ và viện hàn lâm lớn. Đại diện Việt Nam có kỹ sư Nguyễn Thị Ngân và Tiến sĩ Trần Văn Khánh đều đang công tác tại Trung tâm GenAI, FPT Smart Cloud, Tập đoàn FPT.
Các thử nghiệm nghiên cứu được tăng tốc trên FPT AI Factory - nền tảng hạ tầng GPU Cloud để chạy và đánh giá nhiều cấu hình mô hình. Việc chủ động hạ tầng giúp nhóm rút ngắn thời gian chạy thử nghiệm, tăng tính ổn định khi huấn luyện và mở rộng quy mô đánh giá theo yêu cầu thuận lợi hơn.

Toàn cảnh Hội nghị thường niên lần thứ 40 của Hiệp hội Trí tuệ Nhân tạo (AAAI-26). Ảnh: FPT
Nguyễn Thị Ngân, 26 tuổi, kỹ sư AI tại Trung tâm GenAI (FPT Smart Cloud), mang đến hội nghị báo cáo nghiên cứu về phương pháp "CTPD: Cross Tokenizer Preference Distillation". Nghiên cứu này tập trung vào một phân khúc tiềm năng nhưng cũng đầy thách thức: làm thế nào để tạo ra những mô hình AI "vừa nhỏ vừa tốt" để đưa vào vận hành thực tế tiết kiệm.
Xuất phát từ thực trạng doanh nghiệp thường đối mặt với chi phí vận hành khổng lồ khi sử dụng các mô hình ngôn ngữ quy mô lớn, Ngân và nhóm cộng sự tìm cách chuyển đổi các mô hình mạnh sang gọn nhẹ. Từ đó, các mô hình nhỏ này vẫn giữ được khả năng trả lời "hợp ý người dùng" nhưng lại chạy nhanh và ít tốn tài nguyên hơn. Tuy nhiên, một "nút thắt" kỹ thuật nảy sinh là mỗi mô hình lại có một bộ tách từ (tokenizer) khác nhau, khiến việc truyền đạt tín hiệu huấn luyện giữa chúng sai lệch.

Nguyễn Thị Ngân, kỹ sư đại diện nhóm CTPD tham gia trình bày tại AAAI-26. Ảnh: FPT
Giải thích về điểm mới của nghiên cứu, Ngân cho biết thay vì cố ép các mô hình phải có chung cách "cắt chữ", nhóm sử dụng vị trí ký tự trong câu gốc làm mốc chung để căn chỉnh. Điều này cho phép mô hình nhỏ học được phong cách trả lời từ mô hình lớn chính xác nhất. "Chúng tôi muốn giúp cộng đồng tái sử dụng các mô hình mạnh sẵn có để tạo ra những mô hình thực dụng cho nhiều bài toán khác nhau như chăm sóc khách hàng, luật hay ngân hàng", Ngân chia sẻ.
Trước khi đến AAAI-26, nhóm nghiên cứu của Ngân và cộng sự trải qua ba tháng làm việc cường độ cao. Có thời điểm chỉ còn một tuần trước hạn nộp bài, kết quả thử nghiệm vẫn chưa đạt kỳ vọng khiến cả đội chịu áp lực lớn. Ba ngày trước sự kiện, những số liệu mới thực sự bứt phá. Với Ngân, việc bài nghiên cứu không chỉ được chấp thuận, thuộc top 3% bài báo xuất sắc là điều bất ngờ. Theo ban tổ chức đánh giá, nghiên cứu của Ngân mang tư duy thực tế. AI không nhất thiết phải luôn khổng lồ, còn phải đủ gọn và đủ thông minh để phục vụ cộng đồng.
Trong khi Nguyễn Thị Ngân tập trung vào "phần lõi" của mô hình, Tiến sĩ Trần Văn Khánh lại hướng tới việc thay đổi cách con người tương tác với AI trong giáo dục. Công trình "SAGE" được anh đại diện trình bày tại hội nghị là một khung làm việc đa tác nhân (Multi-Agent), giúp giải quyết vấn đề cốt lõi của giáo dục trực tuyến: sự thiếu hụt tương tác nhóm có cấu trúc sư phạm.

Tiến sĩ Trần Văn Khánh, đại diện nhóm SAGE tham gia trình bày tại Hội nghị AAAI-26. Ảnh: FPT
SAGE là một hệ thống mô phỏng buổi học nhóm với các "bạn học AI" đóng vai trò khác nhau. Tiến sĩ Khánh giải thích hệ thống bao gồm một AI điều phối tiến độ, một AI đóng vai chuyên gia hỗ trợ kiến thức và một AI đóng vai động viên. Điểm khác biệt lớn nhất của SAGE so với các hệ thống cũ là khả năng "biết nói đúng lúc và im lặng đúng lúc". Các AI Agent trong SAGE có cơ chế tự chủ, chúng không trả lời thay học sinh quá sớm mà chỉ đưa ra gợi ý khi cần thiết, tuân theo phương pháp "giàn giáo" trong sư phạm - hỗ trợ nhiều lúc đầu và giảm dần để học sinh tự làm chủ kiến thức.
Tiến sĩ Khánh chia sẻ, nghiên cứu này ra đời từ sự kết hợp giữa khối nghiên cứu hàn lâm và thực tế công nghiệp, cùng chung trăn trở về việc AI hiện nay dù giỏi trả lời nhưng vẫn thiếu tính "người" và sư phạm. Kết quả thử nghiệm trên các bài toán lớp 12 cho thấy SAGE đạt tỷ lệ hiệu quả sư phạm vượt trội (hơn 72%) so với các phương pháp thông thường. "Khi AI biết lùi lại đúng lúc, người học sẽ chủ động hơn thay vì chỉ trông chờ vào đáp án", anh nhận định.
Thách thức Tiến sĩ Khánh và nhóm nghiên cứu đối mặt là chi phí và độ trễ khi vận hành cùng lúc nhiều tác nhân AI. Tuy nhiên, tầm nhìn của anh vẫn hướng về việc xây dựng các lớp học ảo thông minh, nơi AI không chỉ là công cụ mà là người đồng hành giúp rút ngắn khoảng cách tri thức. Với anh, việc xuất hiện tại AAAI-26 là cơ hội để khẳng định những trăn trở về giáo dục tại Việt Nam hoàn toàn có thể được giải quyết bằng công nghệ đạt tiêu chuẩn toàn cầu.
Hai công trình nghiên cứu khoa học được đánh giá là nền tảng để đội ngũ chuyên gia tiếp tục phát triển chuyên sâu, chuyển hóa công nghệ thành giá trị thực tiễn, theo đúng định hướng làm chủ công nghệ của Tập đoàn FPT.
Thanh Thư




































