Portal berita Gold Finance melaporkan bahwa tim Qwen dari Alibaba secara resmi merilis hasil penelitian terbaru mereka - model bahasa besar QwQ-32B, yang mencapai lonjakan kinerja dengan menggunakan penguatan pembelajaran hanya dengan sekitar 1/21 parameter DeepSeek-R1.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka