Dự án giúp AI ‘thông thạo’ tiếng Việt, trở thành công cụ cho người Việt

Mạnh Lân

(Thị trường tài chính) - Tại Việt Nam, dù AI đã được ứng dụng rộng rãi, nhưng việc tích hợp ngôn ngữ tiếng Việt vào AI vẫn còn nhiều hạn chế, chưa thực sự tự nhiên và chuẩn xác.

Trong bối cảnh công nghệ thông tin phát triển không ngừng, việc áp dụng Trí tuệ nhân tạo (AI) hiệu quả là yếu tố then chốt cho sự tiến bộ của bất kỳ quốc gia nào. Tại Việt Nam, dù AI đã được ứng dụng rộng rãi, nhưng việc tích hợp ngôn ngữ tiếng Việt vào AI vẫn còn nhiều hạn chế, chưa thực sự tự nhiên và chuẩn xác. Đây là nhận định của ông Trần Việt Hùng, Nhà sáng lập & CEO của tổ chức AI for Vietnam, trong buổi khởi động Chương trình Thách thức Đổi mới sáng tạo 2025 được tổ chức bởi Trung tâm Đổi mới sáng tạo quốc gia Việt Nam (NIC - Bộ Tài chính) phối hợp cùng Tập đoàn Meta vào ngày 14/3.

Dự án giúp AI ‘thông thạo’ tiếng Việt, trở thành công cụ cho người Việt - ảnh 1

Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia Võ Xuân Hoài giới thiệu về dự án ViGen. Ảnh: Báo Người Lao Động

Chương trình năm nay tập trung vào dự án ViGen, một sáng kiến quan trọng nhằm phát triển bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao. Mục tiêu của dự án là cải thiện và nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), qua đó giúp AI có khả năng hiểu sâu hơn về văn hóa, bối cảnh và cách diễn đạt phong phú của tiếng Việt. Dự án này không chỉ khắc phục các bất cập của tiếng Việt trong AI mà còn hướng tới việc tạo ra một công cụ mạnh mẽ cho mọi người Việt.

Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia, ông Võ Xuân Hoài, chia sẻ niềm tin rằng dự án ViGen sẽ đưa tiếng Việt trở thành ngôn ngữ nền tảng trong quá trình phát triển AI tại Việt Nam, đồng thời góp phần thúc đẩy nền kinh tế số của đất nước phát triển bền vững và vượt bậc. Ông nhấn mạnh: "AI đang chuyển đổi thế giới và việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách".

Dự án giúp AI ‘thông thạo’ tiếng Việt, trở thành công cụ cho người Việt - ảnh 2

Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức (Hình minh họa)

Theo ông Võ Xuân Hoài, dự án ViGen bắt nguồn từ hợp tác ba bên giữa Tập đoàn Meta, NIC và tổ chức "AI for Vietnam". Dự án này không chỉ làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi mà còn mở khóa tiềm năng các ứng dụng AI tại Việt Nam. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức.

PGS. TS Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin (Viện Hàn Lâm Khoa học và Công nghệ Việt Nam), cung cấp cái nhìn sâu sắc hơn về mục tiêu của dự án, cho biết chúng ta sẽ 'dạy' ngôn ngữ tiếng Việt cho AI. Nếu AI xây dựng trên nền tảng mã nguồn mở, chúng ta có thể dạy, huấn luyện AI và nó hấp thụ thông tin rất nhanh.

"Với việc được tạo ra từ mã nguồn mở giúp, chúng ta có thể tiếp cận và huấn luyện để biến Ai trở nên thuần Việt hơn, chuẩn hóa tiếng Việt", PGS. TS Nguyễn Trường Thắng cho hay.

Ông Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta, cũng đánh giá cao dự án ViGen và thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.