Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo (CSAIL) thuộc Viện Công nghệ Massachusetts (MIT) ngày 21/4 ra mắt MathNet. Đây là bộ dữ liệu gồm các đề ôn luyện toán quốc tế lớn nhất thế giới hiện nay, gấp 5 lần các kho lưu trữ cùng loại.
MathNet bao quát 143 kỳ thi từ 47 quốc gia và vùng lãnh thổ, sử dụng 17 ngôn ngữ, trải dài khoảng 40 năm. Trong đó, kho dữ liệu này lưu trữ 259 đề thi từ Việt Nam.
Shaden Alshammari, nghiên cứu sinh tiến sĩ tại MIT và là tác giả chính, cho biết: "Mỗi quốc gia đều có những tuyển tập bài toán sáng tạo và độc đáo. Tuy nhiên, trước đây chưa từng có ai nỗ lực thu thập, làm sạch và số hóa chúng để chia sẻ rộng rãi".

Giao diện website MathNet. Ảnh: Khánh Linh
Để xây dựng MathNet, nhóm nghiên cứu đã phải truy tìm gần 1.600 tệp PDF với tổng cộng hơn 25.000 trang tài liệu, bao gồm cả những bản quét cũ từ nhiều thập kỷ trước.
Một phần đáng kể đến từ Navid Safaei, một nhân vật kỳ cựu trong cộng đồng Olympic Toán quốc tế (IMO). Từ năm 2006, Safaei đã cần mẫn thu thập và quét các tập tài liệu thi đấu, tạo nên "xương sống" cho bộ dữ liệu đồ sộ này.
Khác với các diễn đàn toán học trực tuyến thường có lời giải ngắn gọn hoặc không chính thức, bài toán trong MathNet được trích xuất từ các tài liệu thi quốc gia chính thống. Mỗi lời giải đều được các chuyên gia viết, thẩm định kỹ lưỡng, dài nhiều trang và trình bày nhiều cách tiếp cận.
MathNet còn là "thước đo" cho năng lực của AI. Dù các mô hình ngôn ngữ lớn hiện nay được quảng bá là có khả năng giải toán cấp độ huy chương vàng IMO, kết quả thử nghiệm trên MathNet cho thấy thực tế phức tạp hơn.
Ngay cả GPT-5 (mô hình mạnh nhất được thử nghiệm) cũng chỉ đạt tỷ lệ giải đúng trung bình 69,3% trên 6.400 bài. Như vậy, AI vẫn "bó tay" trước gần 1/3 số bài toán Olympic. Đặc biệt, năng lực của AI sụt giảm nghiêm trọng ở các bài có hình vẽ hoặc sử dụng ngôn ngữ ít phổ biến như tiếng Mông Cổ.
Sultan Albarakati, đồng tác giả kiêm thành viên hội đồng IMO, cho biết nhóm nghiên cứu đã huy động hơn 30 chuyên gia từ nhiều quốc gia, trong đó có Nga, Ba Lan, Việt Nam,... để kiểm chứng và xác thực hàng nghìn lời giải.
"Chúng tôi hy vọng đây sẽ là điểm tựa, giúp mọi học sinh tiếp cận với những bài toán và lời giải chất lượng nhất thế giới", Alshammari chia sẻ.
Khánh Linh



































