Song-Chun Zhu sinh năm 1968 tại vùng nông thôn ở Ngạc Châu, tỉnh Hồ Bắc. Lớn lên trong cửa hàng tạp hóa của cha, ông được nghe vô số câu chuyện về cảnh nghèo đói và khổ cực xung quanh. "Thật sự rất khó khăn", Zhu chia sẻ với Guardian. "Mọi người đều rất nghèo".
Một ngày, khi tình cờ tìm thấy sổ gia phả của gia đình, Zhu hỏi tại sao chỉ ghi ngày sinh và ngày mất của tổ tiên mà không ghi gì về cuộc đời họ. Người giữ sổ bình thản nói họ là nông dân và không có gì đáng ghi chép. Câu trả lời khiến Zhu hoảng sợ và quyết tâm rằng số phận của mình sẽ khác.
Zhu là học sinh top đầu tại trường trung học địa phương và đậu một trong những đại học tốt nhất cả nước, Đại học Khoa học và Công nghệ Trung Quốc (USTC) ở thành phố Hợp Phì, chuyên ngành khoa học máy tính. Năm 1986, quan hệ Mỹ - Trung đã bình thường hóa. Một số giáo sư của trường được nhà nước tài trợ sang Mỹ và mang về nhiều sách để dịch. "Thời đó, chúng tôi coi Mỹ như một ngọn hải đăng, một thánh đường khoa học", ông nói.

Song-Chun Zhu, Giám đốc sáng lập Viện Trí tuệ nhân tạo Tổng quát Bắc Kinh (BigAI). Ảnh: zhusongchun
Trong số sách mang về có cuốn Vision của David Marr, nhà khoa học thần kinh người Anh, nổi tiếng với việc phân tích thị giác, một quá trình sinh học, thành hệ thống toán học. Công trình của Marr cho thấy trong tương lai máy móc có thể "nhìn" thế giới giống con người. Điều này cuốn hút Zhu, khiến ông mơ ước lập bản đồ trí tuệ - cách suy nghĩ, lập luận và đưa ra phán đoán đạo đức - với độ chính xác toán học như một nhà vật lý vẽ bản đồ vũ trụ.
Năm 1991, khi tốt nghiệp USTC, Zhu nghèo đến mức không đủ khả năng trả lệ phí nộp đơn mà đại học Mỹ yêu cầu. Ông nộp đơn mà không trả phí, nhắm đến những trường không thuộc nhóm ưu tú nhất, nhưng đều bị từ chối. Năm sau, một giáo sư gợi ý Zhu nộp vào trường Ivy League, vốn nhiều tiền và không quá quan tâm đến lệ phí nộp đơn. Vài tháng sau, ông kinh ngạc nhận được một phong thư dày từ Đại học Harvard, cung cấp học bổng toàn phần cho chương trình tiến sĩ về khoa học máy tính.
"Điều đó đã thay đổi cuộc đời tôi", Zhu nói.
Sự nghiệp rực rỡ tại "thánh đường khoa học"
Sau khi hoàn thành chương trình tiến sĩ tại Đại học Harvard và trải qua thời gian nghiên cứu ngắn ở Đại học Brown, Zhu giảng dạy tại Đại học Stanford. Khi đó, Thung lũng Silicon đang trải qua cơn sốt dot-com. Yahoo vừa lên sàn chứng khoán và các nhà đầu tư mạo hiểm liên tục xuất hiện trong khuôn viên trường. Hai nghiên cứu sinh tiến sĩ trong khoa của Zhu là Larry Page và Sergey Brin tạo ra công cụ tìm kiếm Google. Sinh viên đổ xô đến các khóa học phát triển web, trong khi những lớp mang tính lý thuyết hơn về nhận dạng mẫu của Zhu phải vật lộn để thu hút sự quan tâm.
Sau một năm làm việc tại Đại học Stanford, Zhu chuyển đến Đại học bang Ohio. Năm 2002, ông đến Đại học California Los Angeles (UCLA) và trở thành giảng viên chính thức. Một năm sau, ông nhận giải thưởng Marr - danh hiệu cao quý hàng đầu trong lĩnh vực thị giác máy tính. Đồng nghiệp ví ông với Steve Jobs bởi cường độ làm việc dữ dội và không khoan nhượng với sự tầm thường.
Trong 18 năm gắn bó với UCLA, lĩnh vực của ông trải qua những thay đổi gần như không tưởng. Nửa đầu quãng thời gian này, ông là gương mặt hàng đầu trong hướng đi chủ đạo của AI. Nhưng ở nửa sau, ông ngày càng mất niềm tin vào hướng phát triển của trí tuệ nhân tạo.
Cuối những năm 1990, đầu những năm 2000, tiếng nói của Zhu cùng các đồng nghiệp có ảnh hưởng bậc nhất trong lĩnh vực thị giác máy tính. Các mô hình thống kê của họ thuyết phục nhiều nhà nghiên cứu rằng thiếu dữ liệu là trở ngại lớn ngăn AI tiến bộ.
Để giải quyết vấn đề, năm 2004, Zhu cùng một giám đốc tại Microsoft thành lập Viện Lotus Hill tại quê hương ông - Ngạc Châu, Trung Quốc. Các nhà nghiên cứu đã chú thích hình ảnh vật dụng hàng ngày như bàn ghế, cốc chén, trong bối cảnh vật lý của chúng rồi đưa vào một tập dữ liệu lớn có thể dùng để đào tạo mô hình thống kê mạnh. Lotus Hill là một trong những nỗ lực đầu tiên để xây dựng các tập dữ liệu quy mô lớn nhằm cải tiến và thử nghiệm AI.

Song-Chun Zhu trong khu vườn bên ngoài văn phòng của mình tại Đại học Bắc Kinh, ngày 10/7/2025. Ảnh: Sean Gallagher/The Guardian
Tầm nhìn AI khác biệt
Đến 2009, Zhu bắt đầu mất niềm tin vào phương pháp tiếp cận dựa trên dữ liệu. Lotus Hill đã chú thích hơn nửa triệu hình ảnh, nhưng ông lại băn khoăn một vấn đề: việc chú thích hình ảnh phụ thuộc vào nhiệm vụ mà người ta muốn máy móc thực hiện. Nếu nhiệm vụ là xác định chiếc cốc để robot cầm lên, vị trí tay cầm rất quan trọng. Nhưng nếu nhiệm vụ là ước tính giá trị thị trường, các chi tiết như thương hiệu và chất liệu cốc lại quan trọng hơn. Zhu tin trí tuệ tổng quát phải có khả năng "nghĩ" vượt ra ngoài dữ liệu.
Năm 2010, ông đóng cửa Lotus Hill, bắt đầu xây dựng các tác nhân với "kiến trúc nhận thức" có khả năng suy luận, lập kế hoạch và tiến hóa trong bối cảnh vật lý và xã hội chỉ với một lượng dữ liệu nhỏ.
Nhưng lúc này, cơ sở dữ liệu ImageNet, gồm hàng triệu hình ảnh kèm theo chú thích, xuất hiện và thu hút sự chú ý lớn. Mùa thu 2012, nhà khoa học Geoffrey Hinton cùng đồng nghiệp phát triển một mạng thần kinh nhân tạo tiên tiến, khởi động làn sóng ứng dụng AI toàn cầu đang tiếp diễn đến ngày nay.
"Ngay khi tôi quay lưng với dữ liệu lớn, nó lại bùng nổ", Zhu chia sẻ. Ông cho rằng dấu hiệu của trí thông minh thực sự là khả năng lý luận hướng tới mục tiêu với lượng đầu vào tối thiểu - phương pháp "dữ liệu nhỏ, nhiệm vụ lớn", khác với phương pháp "dữ liệu lớn, nhiệm vụ nhỏ" mà các mô hình ngôn ngữ lớn ngày nay như ChatGPT sử dụng.
Quyết định hồi hương
Hướng tiếp cận của Zhu bị gạt ra ngoài lề. Ông cảm thấy bị lãng quên. Cùng lúc, môi trường chung cho các nhà khoa học Trung Quốc tại Mỹ ngày càng trở nên kém thân thiện khi căng thẳng giữa hai nước gia tăng.
Theo nghiên cứu của tổ chức MarcoPolo thuộc Viện Paulson (Mỹ) năm 2020, chuyên gia AI Trung Quốc chiếm tỷ lệ lớn nhất trong số những nhà nghiên cứu quốc tế làm tại các công ty và tổ chức ở Mỹ. Nhưng khi cuộc chiến công nghệ nổ ra, Washington tăng cường giám sát chuyên gia Trung Quốc, thắt chặt kiểm soát thị thực, tác động đến dòng chảy nhân tài AI toàn cầu vào Mỹ.
Zhu cũng vướng rắc rối vì từng nhận tài trợ từ Huawei, công ty Trung Quốc bị Mỹ coi là mối đe dọa an ninh quốc gia. Dù ông phủ nhận dính dáng tới các hoạt động nhạy cảm, việc xin quỹ nghiên cứu ở Mỹ trở nên khó khăn. Điều này thôi thúc Zhu trở về Trung Quốc. Một yếu tố cá nhân khác ảnh hưởng đến quyết định là con gái ông, Zhu Yi, được tuyển chọn để thi đấu cho Trung Quốc tại Thế vận hội Mùa đông Bắc Kinh 2022.
Tháng 8/2020, sau 28 năm sống và làm việc trên đất Mỹ, Zhu đặt vé một chiều hồi hương. Mark Nitzberg, bạn cùng lớp ở Đại học Harvard, rất ngạc nhiên trước quyết định đột ngột của Zhu. "Họ cung cấp cho tôi những tài nguyên tôi không bao giờ nhận được ở Mỹ. Nếu muốn tạo ra hệ thống mà tôi hình dung, đây là cơ hội có một không hai", Zhu giải thích.
Mùa thu 2020, ông nhận được lời mời làm giáo sư tại Đại học Bắc Kinh và Đại học Thanh Hoa. Thành phố Bắc Kinh cũng đồng ý tài trợ cho Viện Trí tuệ nhân tạo Tổng quát Bắc Kinh (BigAI) mà ông điều hành. Truyền thông Trung Quốc ca ngợi ông là người yêu nước, hỗ trợ quê hương trong cuộc đua AI.
Năm 2023, ông trở thành thành viên của cơ quan cố vấn chính trị hàng đầu Trung Quốc và đề xuất Trung Quốc phát triển AI với mức độ cấp bách chiến lược tương tự một chương trình vũ khí hạt nhân. Sau 5 năm về Bắc Kinh, ông đã được tài trợ hàng trăm triệu USD để nghiên cứu, theo hai nguồn tin thân cận.
Khi ông rời Mỹ, những người cộng tác với ông lo ngại việc nghiên cứu ở Trung Quốc sẽ mất đi tính độc lập. Tuy nhiên, Zhu cho biết ông thoải mái tập trung hơn vào nghiên cứu lúc đến Bắc Kinh. Khi được hỏi Mỹ hay Trung Quốc chiến thắng cuộc đua AI có quan trọng không, Zhu trả lời chỉ muốn "phiên bản AI đạo đức nhất chiến thắng".
Thu Thảo tổng hợp