05/12/2023 18:37 GMT+7

Thế giới có ChatGPT, Việt Nam có PhởGPT

PhởGPT có thể được xem như phiên bản ChatGPT của người Việt, được tạo ra và chuyên dụng cho tiếng Việt.

Trải nghiệm ứng dụng trí tuệ nhân tạo tại AI Day 2023 - Ảnh: ĐỨC THIỆN

Trải nghiệm ứng dụng trí tuệ nhân tạo tại AI Day 2023 - Ảnh: ĐỨC THIỆN

Tại Ngày hội trí tuệ nhân tạo - AI Day 2023 đang diễn ra ở TP.HCM, Công ty VinAI lần đầu tiên công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt có tên là PhởGPT.

Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hóa người Việt. PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước.

Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Kết quả so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá.

Đội ngũ phát triển PhởGPT cho biết đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.

Chia sẻ với Tuổi Trẻ Online, đại diện VinAI cho biết ý tưởng phát triển PhởGPT xuất phát từ những hạn chế của các mô hình tiếng Việt trước đó. Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây ra những khó khăn trong việc ứng dụng chúng cho các mục đích thực tế và tiềm năng phát triển ứng dụng đa dạng dành cho ngôn ngữ tiếng Việt.

“Chúng tôi thấy rằng sự thiếu sót này không chỉ đặt ra thách thức đối với việc tạo ra các ứng dụng tiếng Việt chất lượng cao mà còn ảnh hưởng đến sự phát triển của cộng đồng ngôn ngữ tự nhiên trong nước. Việc này thúc đẩy chúng tôi đặt ra mục tiêu xây dựng một mô hình mới, mạnh mẽ hơn và có khả năng xử lý ngôn ngữ Việt với độ chính xác và hiệu suất cao”, đại diện VinAI cho biết.

Đánh giá về ứng dụng mới, Thứ trưởng Bộ Kế hoạch và Đầu tư Trần Duy Đông cho rằng đây là ứng dụng AI với mã nguồn mở để sẵn sàng cung cấp cho người dùng Việt Nam, đặt nền móng cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao.

“Từ đó phát triển các ứng dụng thực tế, phù hợp với nhu cầu sử dụng của người Việt và định hướng phát triển công nghệ của Chính phủ”, ông Đông cho biết.

PhởGPT khác gì so với ChatGPT?

PhởGPT là một dự án mã nguồn mở (open-source) thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI. Điều này nghĩa là mã nguồn của PhởGPT là công khai và có sẵn cho cộng đồng người phát triển.

Do đó, bằng cách sử dụng mô hình mã nguồn mở PhởGPT, người dùng có thể phát triển các ứng dụng tùy chỉnh, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phải phụ thuộc vào API từ các phần mềm sở hữu riêng.

Cha đẻ ChatGPT sẽ tham gia trực tuyến Ngày hội trí tuệ nhân tạo 2023

Ngày hội trí tuệ nhân tạo AI Day 2023 với chủ đề “AI tái thiết thực tại” vừa được công bố sẽ diễn ra trong hai ngày 5 và 6-12 tại The Global City (TP.HCM).

Bình luận hay

Chia sẻ

Tuổi Trẻ Online Newsletters

Đăng ký ngay để nhận gói tin tức mới

Tuổi Trẻ Online sẽ gởi đến bạn những tin tức nổi bật nhất

Bình luận (0)
Tối đa: 1500 ký tự

Tin cùng chuyên mục

Vỡ mộng 'kỳ lân', Yeah1 đón cổ đông mới tái cấu trúc, bán vốn Giga1

Từng được kỳ vọng trở thành kỳ lân công nghệ Việt khi bắt tay với Tân Hiệp Phát phát triển nền tảng Giga1, Yeah1 đã trải qua giai đoạn biến động mạnh, từ khủng hoảng với YouTube đến làn sóng thoái vốn của cổ đông lớn.

Vỡ mộng 'kỳ lân', Yeah1 đón cổ đông mới tái cấu trúc, bán vốn Giga1

Bí quyết giúp Việt Nam sản xuất thành công giống cá cam lần đầu tiên trên thế giới

Ngay trong lần đầu tiên nghiên cứu, cho sinh sản nhân tạo cá cam, Viện nghiên cứu Nuôi trồng thủy sản I đã sản xuất thành công giống cá này. Trong khi các nước như Nhật Bản, Trung Quốc đã và đang nghiên cứu song chưa thành công.

Bí quyết giúp Việt Nam sản xuất thành công giống cá cam lần đầu tiên trên thế giới

Nhạc số: Mỗi lượt nghe trực tuyến mang về bao nhiêu tiền cho nghệ sĩ Việt?

Thị trường âm nhạc số Việt Nam tiếp tục tăng trưởng. Tuy nhiên, các thách thức về bản quyền, nhân sự và công nghệ mới đang cản bước nghệ sĩ, ngay cả khi ca khúc của họ đạt hàng triệu lượt nghe.

Nhạc số: Mỗi lượt nghe trực tuyến mang về bao nhiêu tiền cho nghệ sĩ Việt?

Công ty chứng khoán giảm mạnh nhân sự, tăng đầu tư công nghệ

Big data, AI… tạo ra sức ép cạnh tranh khốc liệt hơn trong ngành chứng khoán. Cục diện thị phần mới đang được sắp xếp lại dưới tác động của yếu tố công nghệ.

Công ty chứng khoán giảm mạnh nhân sự, tăng đầu tư công nghệ

Vải thiều Bắc Giang được mùa, bộ trưởng đề nghị tổ chức tiêu thụ linh hoạt

Với sản lượng hơn 165.000 tấn vải thiều cho thu hoạch trong vòng 2 tháng, Bộ trưởng Đỗ Đức Duy đề nghị tỉnh Bắc Giang tổ chức tiêu thụ linh hoạt, sát thực tế và thường xuyên cập nhật kịch bản tiêu thụ.

Vải thiều Bắc Giang được mùa, bộ trưởng đề nghị tổ chức tiêu thụ linh hoạt

Đề xuất làm tuyến đường sắt 900 tỉ đồng nối Dung Quất với đường sắt Bắc - Nam

Ban quản lý Khu kinh tế Dung Quất và các khu công nghiệp Quảng Ngãi đề xuất đầu tư tuyến nhánh đường sắt nối Dung Quất với đường sắt Bắc - Nam.

Đề xuất làm tuyến đường sắt 900 tỉ đồng nối Dung Quất với đường sắt Bắc - Nam
Tất cả bình luận (0)
Ý kiến của bạn sẽ được biên tập trước khi đăng, xin vui lòng viết bằng tiếng Việt có dấu.
Được quan tâm nhất
Mới nhất
Hiện chưa có bình luận nào, hãy là người đâu tiên bình luận về bài viết.
Tối đa: 1500 ký tự
Avatar
Đăng ký bằng email
Khi bấm "Đăng ký" đồng thời bạn đã đồng ý với điều khoản của toà soạn Đăng ký
Đăng nhập
Thông tin bạn đọc Thông tin của bạn đọc sẽ được bảo mật an toàn và chỉ sử dụng trong trường hợp toà soạn cần thiết để liên lạc với bạn.
Gửi bình luận
Đóng
Hoàn thành
Đóng

Bình luận (0)
Tối đa: 1500 ký tự
Tất cả bình luận (0)
Ý kiến của bạn sẽ được biên tập trước khi đăng, xin vui lòng viết bằng tiếng Việt có dấu.
Được quan tâm nhất
Mới nhất
Hiện chưa có bình luận nào, hãy là người đâu tiên bình luận về bài viết.
Tối đa: 1500 ký tự
Avatar