Chàng trai Hưng Yên từng được tuyển thẳng vào đại học, 37 tuổi là Phó Giáo sư ngành Khoa học máy tính ở Mỹ

Linh Chi

(Thị trường tài chính) -Trong quá trình học tập và làm việc, anh đã nhận được nhiều danh hiệu, giải thưởng cao quý.

Nguyễn Hữu Thiện là một trong những gương mặt trẻ nhận được nhiều chú ý bởi thành tích học tập xuất sắc. Anh từng theo học lớp chuyên Toán tại Trường THPT Chuyên Hưng Yên và giành giải Nhì trong kỳ thi học sinh giỏi Quốc gia khi còn học lớp 12.

Với thành tích này, anh được tuyển thẳng vào chương trình Cử nhân tài năng của Đại học Bách khoa Hà Nội năm 2006. Nguyễn Hữu Thiện chọn chuyên ngành Khoa học Máy tính với mong muốn áp dụng kiến thức vào thực tiễn.

Theo thông tin từ trang web của Đại học Oregon, Mỹ, Nguyễn Hữu Thiện (37 tuổi) hiện là Phó Giáo sư tại Khoa Khoa học Máy tính của trường. Anh công tác tại trường từ năm 2018.

Anh nhận bằng Tiến sĩ và Thạc sĩ ngành Khoa học Máy tính từ Đại học New York, dưới sự hướng dẫn của Giáo sư Ralph Grishman và Giáo sư Kyunghyun Cho.

Chàng trai Hưng Yên từng được tuyển thẳng vào đại học, 37 tuổi là Phó Giáo sư ngành Khoa học máy tính ở Mỹ - ảnh 1
Nguyễn Hữu Thiện. Ảnh: uoregon.edu.

Trước đó, anh tốt nghiệp Cử nhân ngành Khoa học Máy tính tại Đại học Khoa học và Công nghệ Hà Nội. Nguyễn Hữu Thiện cũng từng là nghiên cứu sinh sau tiến sĩ tại Đại học Montreál, nơi anh làm việc cùng Giáo sư Yoshua Bengio và các cộng sự tại Viện Thuật toán Học tập Montreál.

Các nghiên cứu của anh tập trung vào việc phát triển các cơ chế giúp máy tính hiểu và xử lý ngôn ngữ con người, nhằm thực hiện các nhiệm vụ nhận thức liên quan đến ngôn ngữ thay cho con người. Phó Giáo sư 37 tuổi đặc biệt quan tâm đến việc trích xuất thông tin có cấu trúc và khai thác kiến thức hữu ích từ lượng lớn văn bản do con người viết, thuộc nhiều ngôn ngữ và lĩnh vực khác nhau.

Để thực hiện mục tiêu này, anh cùng các cộng sự thiết kế và sử dụng các thuật toán học máy hiệu quả nhằm trích xuất thông tin và khai thác dữ liệu trong xử lý ngôn ngữ tự nhiên. Hiện tại, trọng tâm của anh là các thuật toán học sâu, với vai trò tiên phong trong việc phát triển và chứng minh hiệu quả của các mô hình này trong trích xuất thông tin.

Ngoài ra, anh còn nghiên cứu cũng mở rộng sang các ứng dụng học sâu khác trong ngôn ngữ, bao gồm đọc hiểu, dịch máy, tạo ngôn ngữ tự nhiên, chatbot và định vị ngôn ngữ.

Trong quá trình học tập và làm việc, Phó Giáo sư Nguyễn Hữu Thiện nhận được nhiều danh hiệu, giải thưởng. Nổi bật là năm 2012 với Giải Nhì Hội nghị Nghiên cứu Khoa học Sinh viên, do Bộ Giáo dục và Đào tạo Việt Nam tổ chức.

Anh cũng nhận được học bổng Henry MacCracken, Đại học New York từ năm 2012 - 2017.

Năm 2016, Nguyễn Hữu Thiện đặt được nhiều thành tích xuất sắc như Giải thưởng Harold Grad, Viện Khoa học Toán học Courant, Đại học New York; Học bổng luận án xuất sắc của Trưởng khoa, Trường Cao học Nghệ thuật và Khoa học, Đại học New York và nhận học bổng Tiến sĩ IBM.

Năm 2021, anh giành Giải thưởng Bài báo trình diễn xuất sắc; Giải thưởng Bài báo cáo thử nghiệm xuất sắc nhất.

Năm 2022, Nguyễn Hữu Thiện được trao Giải thưởng Danh dự AI 2000 dành cho các Học giả có Ảnh hưởng nhất trong lĩnh vực Xử lý Ngôn ngữ Tự nhiên do AMiner trao tặng.

Và năm 2023, anh đạt Giải thưởng NSF CAREER.

Một trong những công trình nghiên cứu mà Nguyễn Hữu Thiện tự hào nhất là bộ dữ liệu đa ngôn ngữ CulturaX, bao gồm 167 ngôn ngữ.

Cách đây 3 năm trước, các mô hình ngôn ngữ như ChatGPT phổ biến, loạt tập đoàn công nghệ lớn công bố các mô hình mã nguồn mở nhưng không tiết lộ cơ sở dữ liệu dùng để huấn luyện. Trước tình hình này, Nguyễn Hữu Thiện cùng các sinh viên quyết định xây dựng một bộ dữ liệu công khai, có thể sử dụng cho mọi nghiên cứu và ứng dụng. Nhóm nghiên cứu đã công bố bài báo cáo đánh giá toàn diện ChatGPT trên 7 tác vụ khác nhau và 37 ngôn ngữ.

Bộ dữ liệu này chứa khoảng 6,3 nghìn tỷ từ vựng, được làm sạch và loại bỏ trùng lặp một cách nghiêm ngặt, sẵn sàng cho việc phát triển các mô hình ngôn ngữ quy mô lớn (LLM). CulturaX hiện đã được phát hành công khai trên HuggingFace.

Ngoài ra, bộ dữ liệu CulturaX đã được Stability AI sử dụng để huấn luyện thành công mô hình đa ngôn ngữ tiên tiến Stable LM 2 1.6B. Khung đánh giá Okapi do nhóm của nam PGS phát triển, dùng để kiểm tra các LLM đa ngôn ngữ trên 26 ngôn ngữ, cũng đã được tích hợp vào bộ công cụ đánh giá mô hình ngôn ngữ nổi tiếng của EleutherAI.

Nguồn: uoregon.edu

Tin tức

Tin đọc nhiều