גוגל מציגה את ג'מה 3, דגם ה- IA החזק ביותר הפועל על GPU יחיד

Google Deepmind הודיעה על ג'מה 3, הגרסה החדשה של המודל הלשוני של הקוד הפתוח שלה. ג'מה 3 מציגה שיפורים חשובים בהשוואה לגרסאות קודמות, כולל היכולת לעבד תמונות וסרטונים קצרים, ניהול רב יותר של ההקשר והתמיכה ביותר מ -140 שפות.

GEMMA 3 זמין בארבעה ממדים, עם מספר פרמטרים המשתנים בין מיליארד ל 27 מיליארד, וניתן להשתמש בהם בשתי גרסאות עיקריות: מודלים של חניכה מראש ומודלים משכילים למשימות ספציפיות. גרסת הפרמטרים של מיליארד היא הראשונה ממשפחת ג'מה שהיא כל כך קלה, מה שהופך אותה מתאימה למכשירים עם יכולת חישוב מופחתת.

החדשות של גוגל ג'מה 3

אחת החדשות החשובות ביותר היאשילוב של רב -מודליות, המאפשרת לג'מה 3 לפרט לא רק טקסט, אלא גם תמונות וסרטונים קצרים. תכונה זו מתאפשרת על ידי המקודד Siglip, המתרגם את התוכן הוויזואלי לייצוגים פנימיים שניתן להבין על ידי המודל. בזכות Melutodality, ג'מה 3 יכולה לנתח תמונות, לזהות אובייקטים, לענות על שאלות המבוססות על תוכן חזותי ואפילו לקרוא ולפרש את הטקסט בתמונות.

ג'מה 3 מסוגלת לנהל הקשרים רחבים יותר מאשר גרסאות קודמות, עד 128,000 אסימון במפגש יחיד. המשמעות היא שהמודל יכול לשמור על עקביות בטקסטים ארוכים יותר, ולשפר את יכולתו לנתח ולהבין בשיחות נרחבות או במסמכים מורכבים. התמיכה הלשונית הורחבה מאוד, ועברה מ -80 השפות הנתמכות על ידי ג'מה 2 ליותר מ -140 שפות באבני חן 3. התרחבות זו מלווה באימוץ של אסימון חדש שמקורו בזה של תאומים 2.0, המאפשר למודל לנהל את המבנים הלשוניים הלא -אנגלים בצורה מדויקת יותר ולשפר את האיכות של התרגום.

ג'מה 3 מציגה גם אופטימיזציות ספציפיות לפיתרון וקידוד בעיות, אך זה לא מודל "הנמקה", כלומר עם שרשרת חשיבה. שיפורים הם תוצאה של אסטרטגיית הכשרה מתקדמת המבוססת על למידת חיזוק. המודל שופר גם בטכניקות זיקוק ולמידה עם משוב אנושי ולא -אנושי.

גוגל גם הפכה גרסאות כמותיות זמינות של ג'מה 3, המפחיתות את צריכת הזיכרון מבלי לפגוע באיכות התגובות. תכונה זו מאפשרת לבצע את הדגם גם על חומרה פחות חזקה, כמו GPU יחידה או TPU, מה שהופך אותו לנגיש לקהל רחב יותר.

בנוסף להתקדמות הטכנית, ג'מה 3 מציגה גם כלים לבטיחות ואמינות גדולים יותר. יחד עם הדגם הראשי, גוגל השיקה את ShieldGengemma 2 Parally, מערכת בקרה המבוססת על ג'מה 3 מתוך 4 מיליארד פרמטרים. כלי זה נועד לתוכן חזותי בינונית, לזהות ולסנן תמונות שעלולות להיות מסוכנות, אלימות או לא מתאימות.

דגמי Gemma 3 החדשים תואמים למסגרת מסגרת מקורית פתוחה כמו חיבוק פנים, אולמה וג'קס, ומאפשרים למפתחים לשלב אותם בקלות בפרויקטים שלהם. "משתמשים רגילים" הסקרנים ביותר יכולים במקום זאת לנסות את ג'מה 3 27B דרך גוגל ללמוד.

מה אתה חושב על החדשות? ספר לנו את ההערות שלך. בינתייםעדכון ההודעות של גוגל פותר סוף סוף את הבעיות בתמונות וסרטונים RCSו