הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

 עליבאבא (Alibaba Group) חשפה את Qwen-3-Max-Preview, מודל שפה גדול חדש עם יותר מטריליון פרמטרים – המודל המתקדם ביותר שלה עד כה. בכך היא מצטרפת לחברות המובילות בתחום הבינה המלאכותית, לצד OpenAI ו-Google DeepMind.

המודל הושק בפלטפורמת הענן של עליבאבא ובמרקטפלייס OpenRouter, ומהווה המשך לסדרת Qwen3 שהוצגה לראשונה במאי 2025 וכללה מודלים בטווח של 600 מיליון עד 235 מיליארד פרמטרים.

מה המשמעות של טריליון פרמטרים?

פרמטרים הם המשתנים שנלמדים בתהליך האימון ומגדירים את “האינטליגנציה” של המודל. ככל שמספרם גדול יותר, כך גדלה עוצמתו ויכולותיו. עם זאת, אימון והפעלה של מודלים בקנה מידה כזה דורשים משאבי מחשוב עצומים.

לשם השוואה, ההערכות הן שמודל GPT-4.5 של OpenAI כולל בין 5 ל-7 טריליון פרמטרים.

ביצועים ותחרות

עליבאבא טוענת כי Qwen-3-Max-Preview מציג ביצועים עדיפים בהשוואה לגרסה הקודמת שלה (Qwen3-235B), ששוחררה ביולי. בנוסף, לפי נתוני מבחנים פנימיים, המודל עקף מתחרים כמו:

  • MoonShot AI’s Kimi K2

  • גרסה מצומצמת של Claude Opus 4 של Anthropic

  • DeepSeek V3.1

היכולות החדשות כוללות:

  • שיפור בהבנת טקסטים בסינית ובאנגלית

  • ביצוע הוראות מורכבות

  • יכולת טיפול במשימות פתוחות וסובייקטיביות

  • שדרוג ברב-לשוניות

  • שימוש יעיל בכלי עזר (Tool Invocation)

זמינות וקוד פתוח

למרות הצלחת סדרת Qwen בקהילת הקוד הפתוח – עם יותר מ-20 מיליון הורדות ו-100 אלף מודלים נגזרים ב-Hugging Face – המודל החדש אינו משוחרר בקוד פתוח. הגישה אליו זמינה רק דרך ערוצי הענן הרשמיים של עליבאבא, בדומה למודל הקודם בסדרה Qwen2.5-Max.

מה הלאה?

עליבאבא מציינת כי מדובר בגרסת Preview בלבד, וכי ההשקה הרשמית תכלול חידושים נוספים. בכך היא ממשיכה לחזק את מעמדה כאחת השחקניות המרכזיות במירוץ הגלובלי לפיתוח מודלי בינה מלאכותית בהיקפים חסרי תקדים.