Theo Reuters, bộ phận nghiên cứu trí tuệ nhân tạo của Huawei đã bác bỏ cáo buộc rằng một phiên bản của mô hình ngôn ngữ lớn Pangu Pro đã sao chép yếu tố từ mô hình của Alibaba, nói rằng mô hình này được phát triển và huấn luyện hoàn toàn độc lập.
Bộ phận này, có tên Noah Ark Lab, đưa ra tuyên bố vào thứ Bảy, một ngày sau khi một tổ chức có tên HonestAGI công bố một báo cáo bằng tiếng Anh trên nền tảng chia sẻ mã Github. Báo cáo này cho rằng mô hình Pangu Pro Moe (Mixture of Experts) của Huawei có "mối tương quan bất thường" với mô hình Qwen 2.5 14B của Alibaba.

Báo cáo cho rằng điều này cho thấy mô hình của Huawei được tạo ra bằng cách “tái chế nâng cấp” từ mô hình có sẵn chứ không được huấn luyện từ đầu. Nhận định này đã làm dấy lên cuộc thảo luận sôi nổi trong cộng đồng AI trực tuyến cũng như trên các phương tiện truyền thông công nghệ tại Trung Quốc.
Báo cáo còn chỉ ra rằng phát hiện của họ có thể liên quan đến hành vi vi phạm bản quyền, làm sai lệch thông tin trong báo cáo kỹ thuật và đưa ra tuyên bố không đúng về khoản đầu tư của Huawei vào quá trình huấn luyện mô hình.
Noah Ark Lab trong tuyên bố khẳng định mô hình của họ “không dựa trên việc huấn luyện gia tăng từ mô hình của các nhà sản xuất khác” và rằng họ đã “thực hiện các đổi mới quan trọng trong thiết kế kiến trúc và tính năng kỹ thuật”. Đây cũng là mô hình quy mô lớn đầu tiên được xây dựng hoàn toàn dựa trên chip Ascend do Huawei sản xuất.
Phòng thí nghiệm này cũng cho biết nhóm phát triển đã tuân thủ nghiêm ngặt các yêu cầu về giấy phép mã nguồn mở đối với bất kỳ đoạn mã bên thứ ba nào được sử dụng, tuy nhiên không nói rõ đã tham khảo từ mô hình mã nguồn mở nào.
Việc DeepSeek – một startup của Trung Quốc – ra mắt mô hình mã nguồn mở R1 vào tháng 1 năm nay đã gây chấn động giới công nghệ tại Silicon Valley nhờ chi phí thấp, đồng thời thổi bùng cuộc cạnh tranh giữa các “ông lớn” công nghệ Trung Quốc trong việc tung ra các sản phẩm AI cạnh tranh.
Qwen 2.5-14B được phát hành vào tháng 5/2024 là một trong những mô hình cỡ nhỏ thuộc dòng Qwen 2.5 của Alibaba, có thể triển khai trên máy tính cá nhân và điện thoại thông minh.
Huawei đã tham gia vào lĩnh vực mô hình ngôn ngữ lớn từ khá sớm với phiên bản Pangu ban đầu ra mắt vào năm 2021, nhưng kể từ đó được cho là đang tụt lại so với các đối thủ. Vào cuối tháng 6 vừa qua, Huawei đã công bố mã nguồn mở của các mô hình Pangu Pro Moe trên nền tảng GitCode – một trang dành cho nhà phát triển Trung Quốc – nhằm thúc đẩy việc ứng dụng công nghệ AI của hãng thông qua việc cung cấp truy cập miễn phí cho cộng đồng lập trình viên.
Trong khi Qwen hướng tới người dùng cá nhân và cung cấp dịch vụ chatbot tương tự ChatGPT, các mô hình Pangu của Huawei chủ yếu được sử dụng trong các lĩnh vực như chính phủ, tài chính và sản xuất.
Thái An