Claude 3.5 Sonnet: IA של אנתרופיה לומד להשתמש במחשב, לבד

Claude 3.5 Sonnet, המודל האחרון של בינה מלאכותית שלאנתרופי, כעת מסוגל לשלוט במחשב. הפונקציונליות החדשה, הנקראת "שימוש במחשבים", מאפשרת לקלוד לראות את המסך, להזיז את הסמן, ללחוץ על הכפתורים והקלד טקסט, ממש כמו שמשתמש אנושי יעשה.

יכולת זו, הזמינה באמצעות API, פותחת אפשרויות חדשות למפתחים, שיוכלו להשתמש בקלוד כדי לאוטומציה של משימות ולתקשר עם יישומים באופן טבעי יותר. האנתרופית מדגישה כי הפונקציונליות עדיין בשלב הניסוי ויכולה להיות נתונה לשגיאות, אך צפויה להיות שיפור מהיר עם הזמן. בואו נראה יותר בפירוט איך זה עובד.

"שימוש במחשב"זה שונה מפתרונות דומים אחרים, כמו Copilot Vision of Microsoft ואפליקציית OpenII Desktop עבור ChatGpt, ליכולתה לקיים אינטראקציה פעילה עם המחשב, במקום פשוט" לראות "את המסך. גוגל מציעה תכונות דומות באפליקציה Gemini עבור אנדרואיד, אך טרם פרסם סוג זה בקנה מידה גדול.

אנתרופי יישם גם אמצעי אבטחה כדי למנוע מקלוד לבצע פעילויות שעלולות להזיק, כמו אינטראקציה עם מדיה חברתית, פעילויות הקשורות לבחירות, רישום תחומי אינטרנט ואינטראקציה עם אתרי ממשלה.

בנוסף ל"שימוש במחשבים ", Claude 3.5 Sonnet מציגה שיפורים משמעותיים במדד שונה, בפרט בקידוד ובשימוש בכלים. הביצועים ב- SWE-Bench מאומתים עלו מ- 33.4% ל- 49.0%, ועולים על כל הדגמים הזמינים לציבור, כולל OpenAI O1-Preview ומערכות מתמחות לקידוד. הביצועים בספסל טאו, מבחן שימוש בכלים, השתפרו גם הם במידה ניכרת.