Alibaba Hadirkan Model LLM Open-source Qwen3, Apa Keunggulannya?

3 hours ago 2
ARTICLE AD BOX

Jakarta, Gizmologi – Alibaba, memperkenalkan model large language model (LLM) open-source terbaru yaitu Qwen3. Seri LLM terbaru ini menetapkan standar baru dalam inovasi kecerdasan buatan atau AI.

Seri Qwen3 terdiri atas enam dense model dan dua model Mixture-of-Experts (MoE), yang memberikan fleksibilitas bagi para developer mengaplikasikan generasi berikutnya di berbagai perangkat. Seperti ponsel, kacamata pintar, kendaraan otonom, hingga robotika serta perangkat lainnya.

Qwen3 menandai debut Alibaba dalam model hybrid reasoning, yang menggabungkan kemampuan tradisional LLM dengan penalaran dinamis tingkat lanjut. Alibaba menjelaskan, model ini dapat dengan mulus beralih dari mode berpikir untuk tugas-tugas yang kompleks.

Baca Juga: PolarDB dari Alibaba Cloud Pecahkan Rekor Dunia dengan Arsitektur Inovatif

Keunggulan Model LLM Qwen3 Milik Alibaba dan Cara Mendapatkannya

Keunggulan Alibaba Qwen3

Seluruh model Qwen3, termasuk dense model  (dengan parameter 0.6B, 1.7B, 4B, 8B, 14B, dan 32B) serta model MoE (30B dengan 3B aktif, dan 235B dengan 22B aktif), kini telah dirilis secara open-source dan tersedia secara global. Keunggulan atau kemampuan utama dari model ini ialah dukungan 119 bahasa dan dialek.

Model ini dihadirkan dengan penerjemahan dan mengikuti intruksi multibahasa. Lalu terdapat dukungan secara native Model Context Protocol (MCP) dan pemanggilan fungsi yang andal, menjadikan Qwen 3 pemimpin di antara model open-source untuk tugas berbasis agen AI yang kompleks.

Qwen3 hadir melampaui model Qwen sebelumnya (QwQ dalam mode berpikir dan Qwen2.5 dalam mode non-berpikir) dalam tolok ukur matematika, pengkodean, dan penalaran logis. Selain itu, model ini juga bisa menghasilkan pengalaman menulis kreatif, bermain peran, dan dialog bergilir yang terasa lebih alami dan menarik.

Data Center Alibaba Cloud

Bagi para developer yang mengakses Qwen3 melalui API, model ini menawarkan kontrol yang terperinci terhadap durasi berpikir hingga 38.000 token. Durasi ini memungkinkan keseimbangan optimal antara kinerja cerdas dan efisiensi komputasi.

Selain itu, model MoE Qwen3-235B-A22B mampu mengurangi biaya penerapan secara signifikan dibandingkan dengan model mutakhir lainnya. Model ini dilatih dengan dataset masif berisi 36 triliun token, dua kali lipat dari pendahulunya Qwen2.5.

Alibaba Qwen

Model terbaru Alibaba ini telah meraih hasil unggulan di berbagai tolok ukur industri seperti AIME25 (penalaran matematika), LiveCodeBench (kemampuan pengkodean), BFCL (kemampuan penggunaan alat dan pemrosesan fungsi), dan Arena-Hard (tolok ukur untuk LLM yang dilatih mengikuti instruksi). Selain itu, untuk mengembangkan model hybrid reasoning ini, Alibaba menerapkan proses pelatihan empat tahap yang mencakup long chain-of-thought (CoT) cold start, reinforcement learning (RL) berbasis penalaran, thinking mode fusion, dan reinforcement learning secara umum.

Model Qwen3 kini tersedia secara gratis untuk diunduh melalui Hugging Face,GitHub, dan ModelScope, serta dapat diakses langsung melalui chat.qwen.ai. Akses API akan segera tersedia melalui platform pengembangan model AI Alibaba, Model Studio. Qwen3 juga menjadi teknologi inti di balik Quark, aplikasi asisten super AI unggulan Alibaba.

Artikel berjudul Alibaba Hadirkan Model LLM Open-source Qwen3, Apa Keunggulannya? yang ditulis oleh Zihan Fajrin pertama kali tampil di Gizmologi.id

Read Entire Article