תמונות מציאותיות יותר וטקסט קריא: מיקרוסופט הציגה את MAI Image-2

מיקרוסופט (Microsoft) הכריזה על המודל MAI Image-2, הדור השני והמתקדם של מחולל התמונות שלה, שמבטיח להפוך את הדמיון שלנו למציאות ויזואלית במהירות ובצורה מדויקת מאי פעם.

במיקרוסופט מדווחים כי המודל החדש מציג שיפור דרמטי ביכולת הבנת הקשרים בתוך פרומפטים מורכבים. לפי החברה, בגרסה הזו, הבעיה המוכרת שבה המודל "שוכח" פרטים מסוימים שביקשנו בהנחייה כמעט נעלמה. בנוסף, המודל מצטיין ביצירת טקסט קריא בתוך תמונות – אחת מנקודות התורפה של מודלים כמו DALL-E ומידג'רני, ומעבר לכך – יוצר טקסטורות מורכבות, כמו עור אנושי, תאורה טבעית והשתקפויות מציאותיים.

אלה החידושים העיקריים במודל MAI Image-2:

  • הבנת הקשרים עמוקה: המודל מסוגל לעבד הנחיות ארוכות ומורכבות בלי "לאבד" פרטים מסוימים שנכתבו בהנחייה, מה שמעניק תוצאה סופית מדויקת מאוד.
  • יצירת טקסט מעוצב וקריא בתוך תמונה: שיפור דרמטי בהטמעת מילים ומשפטים קריאים ומעוצבים כחלק אינטגרלי מהגרפיקה.
  • תמונות יותר מציאותיות: יוצר טוב יותר טקסטורות מורכבות כמו עור אנושי, השתקפויות אור ותאורה טבעית, המעניקים לתמונות מראה יותר מקצועי ופחות "סינתטי".
  • מהירות וזמינות: אופטימיזציה של זמני העיבוד המאפשרת יצירת תמונות באיכות גבוהה בשניות בודדות, לצד אינטגרציה מלאה בתוך סביבת העבודה של Windows וקופיילוט (Copilot).

ההישגים הטכניים של המודל החדש אינם נשארים רק על הנייר, אלא באים לידי ביטוי גם בשטח: MAI-Image-2 התברג היישר אל המקום השלישי בטבלת הדירוג היוקרתית של Arena.ai, המבוססת על מבחני השוואה עיוורים של משתמשים מרחבי העולם. מדובר בהישג מרשים שמוכיח כי מיקרוסופט מסוגלת לתת פייט אמיתי למודלים הוותיקים בתחום, כמו Reve ו- xAI, ולספק תוצאות ויזואליות שקולעות לטעם האנושי.

המודל החדש של מיקרוסופט MA-Image-2 נמצא במקום ה- 3 ב- Arena.ai

מיקרוסופט כבר החלה בהפצה הדרגתית של המודל החדש לקופיילוט (Copilot) ו- Bing Image Creator. מי שרוצה להתנסות בגרסאות הפיתוח העדכניות ביותר לפני כולם, יכול לבקש גישה מהחברה דרך ה- MAI Playground, שכרגע לא זמין לגולשים מישראל. דרך הממשק ניתן גם לשלוח משוב ישירות למפתחים, מה שיכול לעזור להם לשפר ולתקן את המודל והיכולות שלו לפני הפריסה המלאה לכלל המשתמשים.

אולי יעניין אותך גם

 
דילוג לתוכן