OpenAI ra mắt phiên bản ChatGPT mới có khả năng lập luận toán học và khoa học
(Thị trường tài chính) - Vào thứ Năm, OpenAI đã ra mắt một phiên bản mới của ChatGPT có thể khắc phục những sai sót. Công ty cho biết, chatbot này dựa trên công nghệ trí tuệ nhân tạo mới gọi là OpenAI o1, có thể “lập luận” qua các nhiệm vụ liên quan đến toán học, lập trình và khoa học.
Các chatbot trực tuyến như ChatGPT của OpenAI và Gemini của Google đôi khi gặp khó khăn với các bài toán đơn giản. Mã máy tính mà chúng tạo ra thường bị lỗi và không đầy đủ. Thỉnh thoảng, chúng thậm chí còn bịa ra thông tin.
“Với các mô hình trước đây như ChatGPT, bạn hỏi chúng một câu hỏi và chúng ngay lập tức bắt đầu trả lời,” Jakub Pachocki, nhà khoa học trưởng của OpenAI cho biết. “Mô hình này có thể dành thời gian để suy nghĩ về vấn đề — bằng tiếng Anh — và cố gắng phân tích và tìm kiếm các góc độ nhằm cung cấp câu trả lời tốt nhất.”
Trong một buổi trình diễn cho The New York Times, Tiến sĩ Pachocki và Szymon Sidor, một chuyên gia kỹ thuật của OpenAI, đã cho thấy chatbot giải một câu đố chữ cái (acrostic), một loại câu đố từ phức tạp hơn đáng kể so với câu đố ô chữ thông thường. Chatbot này cũng trả lời một câu hỏi hóa học trình độ tiến sĩ và chẩn đoán một căn bệnh dựa trên một báo cáo chi tiết về các triệu chứng và lịch sử của bệnh nhân.
Công nghệ mới này là một phần trong nỗ lực rộng lớn hơn để xây dựng AI có thể lập luận qua các nhiệm vụ phức tạp. Các công ty như Google và Meta cũng đang xây dựng các công nghệ tương tự, trong khi Microsoft và công ty con GitHub của họ đang làm việc để tích hợp hệ thống mới của OpenAI vào các sản phẩm của họ.
Mục tiêu là xây dựng các hệ thống có thể giải quyết một vấn đề một cách cẩn thận và logic thông qua một loạt các bước rời rạc, mỗi bước xây dựng dựa trên bước trước đó, tương tự như cách con người lập luận. Những công nghệ này có thể đặc biệt hữu ích cho các lập trình viên máy tính sử dụng hệ thống AI để viết mã. Chúng cũng có thể cải thiện các gia sư tự động cho toán học và các môn học khác.
OpenAI cho biết công nghệ mới của họ cũng có thể giúp các nhà vật lý tạo ra các công thức toán học phức tạp và hỗ trợ các nhà nghiên cứu y tế trong các thí nghiệm của họ.
Với sự ra mắt của ChatGPT vào cuối năm 2022, OpenAI đã chứng minh rằng máy móc có thể xử lý các yêu cầu giống như con người, trả lời các câu hỏi, viết các bài luận và thậm chí tạo ra mã máy tính. Nhưng đôi khi các phản hồi lại có sai sót.
ChatGPT học các kỹ năng của mình bằng cách phân tích một lượng lớn văn bản từ khắp nơi trên internet, bao gồm các bài viết trên Wikipedia, sách và nhật ký trò chuyện. Bằng cách tìm ra các mẫu trong tất cả các văn bản đó, nó đã học cách tạo ra văn bản của riêng mình.
Vì internet chứa đầy thông tin sai lệch, công nghệ này đã học cách lặp lại những điều không đúng sự thật. Đôi khi, nó thậm chí còn bịa ra mọi thứ.
Tiến sĩ Pachocki, ông Sidor và các đồng nghiệp đã cố gắng giảm thiểu những sai sót đó. Họ đã xây dựng hệ thống mới của OpenAI bằng cách sử dụng cái gọi là học tăng cường. Thông qua quá trình này — có thể kéo dài trong nhiều tuần hoặc nhiều tháng — một hệ thống có thể học hành vi thông qua thử và sai rất nhiều lần.
Bằng cách giải quyết các vấn đề toán học khác nhau, chẳng hạn, nó có thể học được phương pháp nào dẫn đến câu trả lời đúng và phương pháp nào không. Nếu nó lặp lại quá trình này với một số lượng lớn các vấn đề, nó có thể xác định các mẫu. Nhưng hệ thống không nhất thiết phải lập luận giống như con người. Và nó vẫn có thể mắc lỗi và bị ảo giác.
“Nó sẽ không hoàn hảo,” ông Sidor nói. “Nhưng bạn có thể tin tưởng rằng nó sẽ nỗ lực hơn và có nhiều khả năng đưa ra câu trả lời đúng hơn.”
Người tiêu dùng và doanh nghiệp đăng ký các dịch vụ ChatGPT Plus và ChatGPT Teams của công ty sẽ có quyền truy cập vào công nghệ mới bắt đầu từ hôm nay. Công ty cũng đang bán công nghệ này cho các nhà phát triển phần mềm và doanh nghiệp xây dựng các ứng dụng AI của riêng họ.
OpenAI cho biết, công nghệ mới này hoạt động tốt hơn so với các công nghệ trước đó trong một số bài kiểm tra tiêu chuẩn nhất định. Trong kỳ thi tuyển chọn Olympic Toán học Quốc tế, hay I.M.O. — cuộc thi toán học hàng đầu dành cho học sinh trung học — công nghệ trước đây của họ đạt 13%. OpenAI o1, theo công ty, đạt 83%.
Tuy nhiên, các bài kiểm tra tiêu chuẩn không phải lúc nào cũng là thước đo tốt về cách các công nghệ sẽ hoạt động trong các tình huống thực tế và mặc dù hệ thống có thể giỏi ở câu hỏi kiểm tra toán, nó vẫn có thể gặp khó khăn trong việc dạy toán.
“Có sự khác biệt giữa giải quyết vấn đề và hỗ trợ,” Angela Fan, nhà khoa học nghiên cứu tại Meta cho biết. “Các mô hình mới có thể giải quyết vấn đề. Nhưng đó rất khác với việc giúp ai đó làm bài tập về nhà của họ.”