Zalo và hành trình làm chủ LLM Tiếng Việt

Khi cả thế giới đang dõi theo những bước tiến thần tốc trong lĩnh vực AI của các cường quốc công nghệ như Mỹ, Trung Quốc hay châu Âu, thì tại Việt Nam, nhóm kỹ sư công nghệ Zalo đã bắt đầu hành trình mang theo khát vọng: Làm chủ trí tuệ nhân tạo bằng chính tiếng mẹ đẻ.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 1.

Sự bùng nổ của trí tuệ nhân tạo tạo sinh (Generative AI) đã làm thay đổi hoàn toàn bức tranh công nghệ toàn cầu. Từ khi OpenAI ra mắt ChatGPT vào cuối năm 2022, hàng loạt mô hình LLM tương tự liên tục xuất hiện, ứng dụng trong nhiều lĩnh vực như y tế, giáo dục, tài chính, pháp lý… Cuộc đua trở nên gay gắt, không chỉ ở quy mô doanh nghiệp mà còn ở quy mô quốc gia về năng lực huấn luyện, hạ tầng tính toán và dữ liệu. 

Các công ty lớn như OpenAI, Google, Meta hay Microsoft với tiềm lực tài chính và điều kiện thuận lợi đều đã “nhanh chân” đầu tư hàng tỷ USD để sở hữu hàng nghìn GPU cao cấp như Nvidia H100 – nhân tố cốt lõi cho việc huấn luyện các mô hình LLM. Giá cổ phiếu Nvidia tăng chóng mặt trong giai đoạn đó, phản ánh cơn khát hạ tầng của toàn thế giới.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 2.

Trong khi đó, doanh nghiệp công nghệ ở các nước đang phát triển ngoài vấn đề chi phí, còn phải đối mặt với giới hạn về xuất nhập khẩu thiết bị chip AI từ Mỹ. Điều này dẫn đến thiếu thiết bị huấn luyện và “chậm chân” hơn so với các gã khổng lồ công nghệ. Với khát vọng nội địa, Zalo cũng không nằm ngoài vòng xoáy đó.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 3.

Về dữ liệu, những bài toán học máy trước đây đã đòi hỏi lượng dữ liệu huấn luyện lớn nhưng với các mô hình ngôn ngữ lớn, đây là lượng dữ liệu khổng lồ. Để có một mô hình đủ tốt, hệ thống LLM đòi hỏi hàng chục, thậm chí hàng trăm tỷ token văn bản đầu vào. Trong khi đó, về mức độ phổ biến, tiếng Việt không “có cửa” với tiếng Anh và tiếng Trung. Điều này đã làm khó khăn tăng lên gấp bội với các nhà phát triển LLM của Việt Nam.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 4.

Năm 2023, các mô hình ngôn ngữ lớn (LLM) như GPT-3.5, GPT-4 đã làm khuynh đảo thế giới công nghệ, và nhiều doanh nghiệp Việt Nam cũng lựa chọn fine-tuned model (kỹ thuật tinh chỉnh mô hình) sẵn có của nước ngoài để đi tắt, đón đầu quá trình huấn luyện LLM. 

Zalo lại chọn một con đường khác – gian nan hơn, nhưng tự chủ hơn: Tự huấn luyện mô hình từ đầu (from-scratch model). Một hướng đi đòi hỏi mọi thứ đều phải tạo dựng từ con số 0 – từ dữ liệu, kiến trúc mô hình đến toàn bộ quá trình huấn luyện. Quyết định đó không phải để chạy đua với người khổng lồ mà để hiện thực hóa khát vọng của chính người Việt: làm chủ mô hình LLM bằng tiếng mẹ đẻ.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 5.

“Chúng tôi đã lường trước những khó khăn và vẫn quyết định gia nhập cuộc chơi từ sớm. Chúng tôi không cạnh tranh trực tiếp với các “ông lớn” mà chọn thị trường ngách, nơi chúng tôi có thể làm tốt hơn. Khát vọng của chúng tôi là xây dựng một mô hình mà người Việt làm chủ hoàn toàn – từ dữ liệu đến thuật toán” - Tiến sĩ Nguyễn Trường Sơn, Giám đốc khoa học tại Zalo AI chia sẻ.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 6.

Dù gặp nhiều trở ngại ở ba yếu tố chính gồm hạ tầng thiết bị, dữ liệu và trình độ huấn luyện, các kỹ sư Việt Nam đã chủ động tìm giải pháp vượt khó. Điều này minh chứng cho tinh thần và sức mạnh ý chí của người Việt trong các hoàn cảnh gian nan mà cụ thể ở đây là chinh phục thách thức trong quá trình phát triển LLM cho người Việt. 

Muốn huấn luyện LLM, các kỹ sư cần phải có hạ tầng phù hợp. Nhưng tại thời điểm đó, những GPU như H100 của Nvidia gần như là “hàng hiếm toàn cầu”. Trong khi đó, các hãng lớn đã đặt trước cả năm và trả hàng triệu USD để sở hữu. Tại Việt Nam, Zalo cũng đã cố gắng mua 8 máy chủ DGX H100 nhưng không dễ dàng, phải chờ từng đợt bàn giao của nhà sản xuất. 

Trong hoàn cảnh chưa có GPU của Nvidia, các kỹ sư Việt Nam đã phải linh hoạt dùng tạm GPU dân dụng để thực nghiệm trên từng dòng mã, chạy từng mô hình nhỏ. Thay vì chờ đợi, các kỹ sư chủ động chuẩn bị để khi sở hữu thiết bị hiện đại, mọi thứ đã sẵn sàng.

Về mặt dữ liệu, thay vì trông chờ vào nguồn tài nguyên sẵn có, Zalo đầu tư xây dựng kho dữ liệu chất lượng cao riêng cho tiếng Việt, nhằm bù đắp sự thiếu hụt nghiêm trọng so với tiếng Anh và tiếng Trung.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 7.

Nhờ chiến lược phát triển linh hoạt, Zalo đã rút ngắn thời gian phát triển thành công mô hình ngôn ngữ lớn của mình từ 18 tháng dự kiến xuống còn 6 tháng. Cuối năm 2023, mô hình ngôn ngữ lớn tiếng Việt của Zalo đã chính thức được ra mắt tại sự kiện quy tụ giới công nghệ và AI hàng đầu của Việt Nam - Zalo AI Summit. Tại đây, mô hình LLM của Zalo đã có màn chào sân thông qua thử thách Kahoot do Tinhte.vn đặt ra và bất ngờ vượt lên GPT 3.5, chỉ xếp sau GPT4 – mô hình LLM được đánh giá là mạnh nhất thế giới ở thời điểm đó.

Trên nền tảng đánh giá VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), mô hình của Zalo đạt năng lực gấp 1.5 lần GPT-3.5 của OpenAI. Tới cuối năm 2024, mô hình này còn vượt qua những tên tuổi lớn như GPT-4 (OpenAI), Gemma-2-9B (Google) hay Phi-3-small (Microsoft), chỉ đứng sau LLaMA-3-70B của Meta về năng lực xử lý tiếng Việt trên bảng xếp hạng của VMLU.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 8.

Không chỉ dừng lại ở nghiên cứu, Zalo đang từng bước đưa công nghệ từ phòng thí nghiệm ra cuộc sống bằng việc thương mại hóa và phổ cập hóa các sản phẩm ứng dụng từ LLM.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 9.

Đầu năm 2025, trợ lý hỏi đáp tổng hợp Kiki Info – được vận hành như một tài khoản chính thức (Official Account) trên nền tảng Zalo – đã thu hút hơn 1 triệu lượt người dùng chỉ trong chưa đầy 2 tháng. Một ứng dụng khác là Thiệp AI cũng đạt con số ấn tượng 15 triệu thiệp được tạo và gửi đi chỉ trong 2 tháng.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 10.

Hành trình của Zalo không chỉ là chuyện một công ty muốn phát triển công nghệ. Đó là mảnh ghép trong bức tranh lớn hơn – nơi Việt Nam đang quyết liệt đẩy mạnh đổi mới sáng tạo, với những chủ trương từ Nghị quyết 57-NQ/TW về phát triển khoa học, công nghệ và chuyển đổi số quốc gia. Trong đó, đặc biệt nhấn mạnh đến lĩnh vực trí tuệ nhân tạo.

Sự xuất hiện và phát triển nhanh chóng của LLM tiếng Việt từ Zalo không chỉ là bước tiến công nghệ của một doanh nghiệp, mà còn là minh chứng cho năng lực nội tại và tinh thần bền bỉ của đội ngũ công nghệ Việt Nam.

Với kỹ thuật “from-scratch” – huấn luyện mô hình từ con số 0, Zalo lựa chọn con đường dài, nhưng giúp Việt Nam thực sự làm chủ AI. Không chỉ về kết quả, mà còn về toàn bộ quy trình từ kiến trúc mô hình, dữ liệu, thuật toán, đến sản phẩm ứng dụng. Thành công của Zalo cũng đã giúp Việt Nam trở thành một trong số ít quốc gia Đông Nam Á sở hữu mô hình LLM nội địa – một cột mốc mang tính chiến lược trong bối cảnh cạnh tranh công nghệ toàn cầu ngày càng gay gắt.

Trên hành trình dài phía trước, Zalo không chỉ dừng lại ở một mô hình hay một số sản phẩm mà còn tiếp tục hoàn thiện mô hình để vừa phục vụ người dùng vừa tạo ra một nền tảng AI Việt Nam có chất lượng cạnh tranh: “Hành trình phát triển AI của Zalo vẫn còn dài. Chúng tôi sẽ tiếp tục tối ưu mô hình theo cả chiều rộng và chiều sâu, đồng thời đẩy mạnh tính ứng dụng thực tiễn. Mục tiêu cuối cùng là tạo ra những sản phẩm AI chất lượng phục vụ thiết thực cho người Việt.” - Ông Sơn cho biết thêm.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 11.

Việc Zalo phát triển thành công LLM tiếng Việt không chỉ là bước đi đột phá của một doanh nghiệp, mà còn mở ra tương lai tiềm năng cho trí tuệ nhân tạo Việt Nam. Sự bền bỉ và khát vọng của người Việt đã dẫn dắt hành trình chạm đến những kết quả xứng đáng. Tương lai AI Việt Nam sẽ không chỉ có một “Zalo”, mà còn có cả một thế hệ kỹ sư dũng cảm tiếp bước, kế thừa và chinh phục thế giới công nghệ.

Zalo và hành trình làm chủ LLM Tiếng Việt - Ảnh 12.

Bình luận hay

Chia sẻ
Chủ đề: Zalo
Bình luận (0)
Tối đa: 1500 ký tự

Tin cùng chuyên mục

Lỗ hổng bảo mật trong Microsoft Copilot: Cảnh báo mới về nguy cơ rò rỉ dữ liệu từ AI

Một lỗ hổng bảo mật nghiêm trọng trong Microsoft Copilot khiến dữ liệu người dùng có thể bị đánh cắp mà không cần thao tác nào. Sự cố này đặt ra câu hỏi lớn: Trí tuệ nhân tạo đang giúp ta, hay đẩy ta vào thế rủi ro?

Lỗ hổng bảo mật trong Microsoft Copilot: Cảnh báo mới về nguy cơ rò rỉ dữ liệu từ AI

Mã độc ngày càng phức tạp nhưng nhiều lãnh đạo các đơn vị vẫn còn xem nhẹ

Trong 6 tháng đầu năm 2025, mã độc tống tiền (ransomware) và các cuộc tấn công có chủ đích (APT) ngày càng gia tăng, nhắm tới các doanh nghiệp cũng như các tổ chức nhà nước.

Mã độc ngày càng phức tạp nhưng nhiều lãnh đạo các đơn vị vẫn còn xem nhẹ

Công nghệ đang âm thầm 'thuê' bạn mỗi ngày mà không trả đồng nào

Mỗi ngày bạn đăng nhập, xác thực, dọn thông báo, cập nhật phần mềm, phản hồi hệ thống..., những việc tưởng như phục vụ chính bạn hóa ra lại đang nuôi sống các nền tảng số.

Công nghệ đang âm thầm 'thuê' bạn mỗi ngày mà không trả đồng nào

Bước chân vào thế giới gaming với màn hình LG UltraGear OLED 2025

Tấm nền OLED sắc nét, tốc độ quét đến 480Hz và thời gian phản hồi nhanh… là những công nghệ giúp bộ ba sản phẩm màn hình gaming LG UltraGear OLED biến giấc mơ của game thủ thành hiện thực.

Bước chân vào thế giới gaming với màn hình LG UltraGear OLED 2025

Chụp ảnh quá nhiều sẽ bị giảm trí nhớ?

Chụp ảnh là một trong những cách phổ biến nhất để lưu giữ kỷ niệm, nhưng khoa học lo ngại chụp ảnh quá nhiều có thể làm giảm trí nhớ của chúng ta.

Chụp ảnh quá nhiều sẽ bị giảm trí nhớ?

Camera trăm 'chấm' nhưng ảnh nhẹ tênh và 'bí mật' phía sau

Dù sở hữu camera 108MP, nhiều mẫu điện thoại lại cho ra những bức ảnh có dung lượng nhẹ đến bất ngờ, đôi khi chưa bằng một tấm ảnh từ máy ảnh cũ. Phía sau sự chênh lệch này là những kỹ thuật xử lý ảnh tinh vi mà không phải ai cũng biết.

Camera trăm 'chấm' nhưng ảnh nhẹ tênh và 'bí mật' phía sau
Tất cả bình luận (0)
Ý kiến của bạn sẽ được biên tập trước khi đăng, xin vui lòng viết bằng tiếng Việt có dấu.
Được quan tâm nhất
Mới nhất
Hiện chưa có bình luận nào, hãy là người đâu tiên bình luận về bài viết.
Tối đa: 1500 ký tự
Avatar
Đăng ký bằng email
Khi bấm "Đăng ký" đồng thời bạn đã đồng ý với điều khoản của toà soạn Đăng ký
Đăng nhập
Thông tin bạn đọc Thông tin của bạn đọc sẽ được bảo mật an toàn và chỉ sử dụng trong trường hợp toà soạn cần thiết để liên lạc với bạn.
Gửi bình luận
Đóng
Hoàn thành
Đóng