רואה, שומעת, חושבת ועושה: כל מה שצריך וחשוב לדעת על Gemma 4

עולם הבינה המלאכותית עבר טלטלה נוספת עם השקתה של משפחת המודלים Gemma 4 מבית גוגל. אם בעבר מודלים בפורמט משקולות פתוחות (Open Weights) נחשבו ל- "אחים הקטנים" והפחות מוכשרים של המודלים הקנייניים הסגורים, כמו ChatGPT או ג'מיני פרו, Gemma 4 מוחקת את הפער הזה כמעט לחלוטין.

משפחת המודלים החדשה מציע ארכיטקטורה חדשנית, תמיכה מובנית במולטי מודאליות ויכולות הסקה שטרם נראו במודלים בגדלים כאלה. גוגל מציבה רף חדש למה שניתן להריץ באופן מקומי על מחשב אישי או אפילו על סמארטפון.

 

ממודלי קצה ועד לתחנות עבודה

ענקית הטכנולוגיה בחרה להשיק את Gemma 4 בארבעה גדלים אסטרטגיים, המעניקים מענה לכל סוגי המפתחים – החל מאלו המפתחים אפליקציות למובייל ועד לחוקרים העובדים על שרתים עתירי ביצועים. המשפחה מחולקת לשתי קטגוריות עיקריות:

  1. קטגוריית הקצה (מודלים מסוג E2B ו- E4B): מודלים קטנים במיוחד שעברו אופטימיזציה לצריכת זיכרון (RAM) מינימלית ושימור חיי סוללה. מודל ה- E2B (Effective 2 Billion) וה- E4B תוכננו מראש לעבוד על מעבדי NPU של סמארטפונים ומכשירי IoT, והם הראשונים מסוגם שמציעים תמיכה מובנית באודיו ללא צורך בחיבור לענן.
  2. קטגוריית תחנות עבודה (מודלים מסוג 26B ו- 31B): כאן נמצאת העוצמה האמיתית. מודל ה- 26B A4B הוא מודל MoE (Mixture of Experts) המפעיל 3.8 מיליארד פרמטרים בכל רגע נתון, מה שמאפשר מהירות תגובה יוצאת דופן. לצידו נמצא ה- 31B Dense, מודל "צפוף" שנועד למקסם את איכות הפלט וההבנה העמוקה, הנחשב כיום למודל המוביל בעולם בקטגוריית המשקל שלו.

פריצת דרך ארכיטקטונית

אחד החידושים המרתקים ביותר ב- Gemma 4 הוא היישום המתקדם של ארכיטקטורת Mixture of Experts (MoE) במודל ה- 26B. המודל כולל לא פחות מ- 128 מומחים זעירים, כאשר בכל פעולת עיבוד המערכת בוחרת באופן דינמי רק את המומחים הרלוונטיים ביותר למשימה. גישה זו מאפשרת למודל להחזיק "ידע" של מודל ענק, אך לצרוך משאבי חישוב של מודל קטן בהרבה.

בנוסף, גוגל הטמיעה ב- Gemma 4 את ה- Thinking Mode, מצב עבודה שבו המודל מבצע תהליך של "שרשרת מחשבה" (Chain of Thought) פנימי לפני שהוא מספק תשובה סופית. היכולת הזו קריטית לפתרון בעיות מתמטיות מורכבות, כתיבת קוד וקבלת החלטות לוגיות. בניגוד למודלים קודמים שבהם המשתמש היה צריך לבקש מהמודל "לחשוב צעד אחר צעד", ב- Gemma 4 היכולת הזו מוטמעת ברמת הארכיטקטורה וניתנת להגדרה לפי המשימה שהתקבלה.

Gemma 4 E2B שולט על סימולטור בדפדפן
המודל Gemma 4 E2B שולט על סימולטור בתוך הדפדפן. קרדיט: Google

יכולות Agentic ופונקציות מתקדמות

משפחת Gemma 4 לא מיועדת רק לשיחות, אלא תוכננה לשמש כליבה מרכזית לסוכני AI אוטונומיים (AI Agents). גוגל הוסיפה תמיכה מובנית ב- "קריאה לפונקציות" (Function Calling), המאפשרת למודל להתממשק עם כלים חיצוניים, כדי לבצע שאילתות ולעבוד עם בסיסי נתונים, להפעיל תוכנות צד-שלישי ולבצע פעולות מורכבות ברשת.

היא מציעה חלון הקשר של עד 256,000 טוקנים במודלים הגדולים, כך שניתן להזין למודל ספריות קוד שלמות, מסמכים משפטיים ארוכים או ספרים מלאים, ולנתח אותם באופן מעמיק.

מודלי הקצה – E2B ו- E4B, תומכים בחלון הקשר של 128K, מה שנחשב ליוצא דופן עבור מודלים המיועדים להרצה על סמארטפונים.

התכונות העיקריות של Gemma 4:

  • ארבעה גדלים ייעודיים: החל מ- 2B למובייל ועד 31B לתחנות עבודה חזקות.
  • ארכיטקטורת MoE מתקדמת: מודל ה- 26B משתמש ב- 128 מומחים ליעילות מקסימלית.
  • מולטי-מודאליות טבעית: תמיכה בטקסט, תמונה, וידאו (עד 60 שניות) ואודיו (במודלי הקצה).
  • מצב חשיבה: יכולת הסקה מובנית לפתרון בעיות לוגיות ומתמטיות מורכבות.
  • חלון הקשר ענק: תמיכה של עד 256K טוקנים המאפשרת ניתוח של מסמכים גדולים וארוכים.
  • חופש מסחרי: המודלים משוחררים תחת רישיון המאפשר שימוש מסחרי רחב (Apache 2.0/Google Open Model License).

סוכני AI מתקדמים אצלכם במחשב ובסמארטפון

עד היום, כדי להשתמש בבינה מלאכותית חזקה ומתקדמת באמת, היינו צריכים לשלוח את המידע לשרתים מרוחקים, לחכות לתגובה ולקוות שיש לנו קליטה טובה. Gemma 4 משנה את התמונה בכך שהיא פשוט "מתיישבת" ישירות על המעבד של המחשב או הסמארטפון.

היתרונות

קודם כל, המהירות: התגובות הן מיידיות, בלי דיליי הטעינה המוכר. שנית, ולא פחות חשובה – הפרטיות. המידע, הנתונים והקבצים שלכם, בין אם אלו תמונות משפחתיות או מסמכי עבודה רגישים, לא יוצאים מהמכשיר. הכל מעובד מקומית, מה שאומר שאפשר להשתמש בבינה המלאכותית גם במצב טיסה או במקומות שאין בהם WiFi או גישה לאינטרנט.

עוזר אישי חכם ומוכשר בכיס

דמיינו עוזר אישי בטלפון שיכול לסכם לכם הקלטות של פגישות בזמן אמת, לערוך תמונות באופן מקצועי תוך שניות, או לעזור לכם לכתוב קוד ולפתור בעיות טכניות במחשב בלי לחשוש שמידע פנימי ידלוף החוצה.

בנוסף, היכולת המולטי מודאלית מאפשרת לכם פשוט להראות לסוכן מוצר שבור או תקלה במחשב, דרך המצלמה של המחשב או הסמארטפון, והוא יסביר לכם שלב אחר שלב איך לתקן את זה, כשהוא "רואה" ומנתח את הווידאו בזמן אמת.

כמה זה עולה ?

במודלים של Gemma 4 ניתן להשתמש בחינם. אין דמי מנוי חודשיים, אין חבילות "פרימיום" ואין מגבלת הודעות יומית. ה- "מחיר" היחיד שאתם משלמים הוא המשאבים של המכשיר שלכם – זיכרון RAM ואחסון, סוללה, בלאי של רכיבים שנגרם בעקבות התחממות, וגם תצטרכו להשאיר את המכשירים מחוברים לחשמל כל הזמן, כדי שהעבודה לא תיפסק באמצע.

גוגל שחררה את המודלים תחת רישיון פתוח, מה שאומר שכל אחד יכול להתקין אותם על המחשב האישי שלו או בסמארטפון, או להשתמש באפליקציות שמבוססות עליהם, וליהנות מכוח של מעבדת AI מתקדמת בתוך הכיס, בלי להוציא שקל מהארנק.

אולי יעניין אותך גם

 
דילוג לתוכן