DeepSeek ra mắt mô hình AI mở có trình độ tương đương huy chương vàng Olympic Toán học quốc tế

Thiên Kim

(Thị trường tài chính) - Mô hình này được công bố miễn phí trên Hugging Face và GitHub, mở ra cơ hội tiếp cận AI toán học cao cấp cho các nhà nghiên cứu toàn cầu.

Công ty AI Trung Quốc DeepSeek ngày 28/11 thông báo họ đã phát hành mô hình AI mở đầu tiên trên thế giới có khả năng đạt huy cương vàng tại Olympic Toán quốc tế (IMO).

Thep SCMP, mô hình Math-V2 của DeepSeek được công bố rộng rãi trên các nền tảng dành cho nhà phát triển như Hugging Face và GitHub, dưới giấy phép cho phép người dùng tùy ý tái sử dụng và điều chỉnh mô hình.

IMO, được tổ chức hàng năm từ 1959, được coi là cuộc thi toán học danh giá nhất thế giới (cả với con người lẫn các hệ thống AI) bởi các câu hỏi đòi hỏi “tư duy sâu, sáng tạo và nghiêm ngặt”, theo nhận định của nhà nghiên cứu AI Harvard Huang Yichen và giáo sư khoa học máy tính Yang Lincủa Đại học California tại Los Angeles.

DeepSeek ra mắt mô hình AI mở có trình độ tương đương huy chương vàng Olympic Toán học quốc tế - ảnh 1Mô hình AI Math-V2 của DeepSeek không chỉ giải được các bài toán khó mà còn tự kiểm chứng đáp án, đạt huy chương vàng tại cả IMO 2025 và Olympic Toán Trung Quốc 2024. Ảnh: SCMP 

 

Để đạt điểm cao, các hệ thống AI không chỉ đưa ra kết quả mà còn phải chứng minh được lý luận đằng sau đáp án. Trung bình chỉ khoảng 8% thí sinh đạt huy chương vàng tại IMO.

Thành tựu của DeepSeek được kỳ vọng sẽ hạ rào cản và cho phép các nhà phát triển toàn cầu tiếp cận một mô hình AI toán học mạnh mẽ, chỉ vài tháng sau khi các “ông lớn” AI Mỹ như Google DeepMind và OpenAI cũng đạt được thành tích tương tự với mô hình độc quyền của họ.

DeepSeek khẳng định mô hình của họ đạt được điểm số ở mức giành huy chương vàng trong cả IMO năm nay và Olympic Toán học Trung Quốc 2024.

Clement Delangue, đồng sáng lập kiêm CEO Hugging Face, viết trên mạng xã hội X: “Hãy tưởng tượng việc sở hữu bộ não của một trong những nhà toán học xuất sắc nhất thế giới - hoàn toàn miễn phí - để nghiên cứu, tinh chỉnh, tối ưu và chạy trên phần cứng của riêng bạn”.

Trong một bài đăng trên blog Hugging Face, các nhà nghiên cứu DeepSeek cho biết khả năng toán học của AI có thể tác động lớn đến nghiên cứu khoa học nếu được phát triển thêm. Tuy nhiên, nhiều hệ thống AI hiện nay chủ yếu được tối ưu để đạt điểm cao trên các bài kiểm tra toán mà không cải thiện đáng kể năng lực lý luận cơ bản.

Ngược lại, DeepSeek tập trung nâng cao tính nghiêm ngặt trong lý luận toán học của mô hình bằng cách cho phép nó tự kiểm chứng đáp án, ngay cả với những câu hỏi chưa có lời giải chuẩn.

Điều này đã giải quyết nút thắt của nhiều hệ thống AI hiện tại, vốn chỉ cải thiện dễ dàng trên các nhiệm vụ có lời giải dễ xác minh.

“Dù còn nhiều việc phải làm, kết quả này cho thấy lập luận toán học tự kiểm chứng là hướng nghiên cứu khả thi, có thể giúp phát triển các hệ thống AI toán học mạnh mẽ hơn”, nhóm nghiên cứu nhận định.

Được biết mô hình độc quyền đạt huy chương vàng của Google DeepMind đã được cung cấp cho khách hàng đăng ký gói cao cấp Ultra. Trong khi đó, CEO OpenAI Sam Altman lưu ý mô hình “thí nghiệm” đạt huy chương vàng của công ty sẽ không được công bố cho công chúng trong nhiều tháng tới.

Theo SCMP 

 

Tin tức

Tin đọc nhiều