חברת אנת'רופיק (Anthropic) מפרסמת דו"ח מדאיג וחושפת כי כ- 80% מהקוד שמוטמע בקלוד נכתב כיום על ידיו, ומזהירה כי מסלול הפיתוח הנוכחי עלול להוביל למצב שבו בני האדם יאבדו את היכולת לשלוט במערכות המבוססות על בינה מלאכותית. במכון המחקר של החברה מציינים כי הבינה המלאכותית כבר האיצה משמעותית את קצב הפיתוח של עצמה, ומזהירים מפני תהליך של 'שיפור עצמי רקורסיבי' – נקודה שבה המודל יתכנן ויבנה את הדור הבא שלו באופן עצמאי, כמעט ללא התערבות אנושית.
בדו"ח נכתב כי יש לשמור על האפשרות להאט, או אפילו לעצור, את פיתוחם של המודלים המתקדמים ביותר במקרה הצורך. בחברה מציינים כי תופעות של 'חוסר יישור' (Misalignment) – מצבים שבהם המודל פועל בניגוד לכוונות או לערכים שהוגדרו לו על ידי בני אדם, כבר קיימות כיום. עם זאת, ככל שהמודלים יקבלו תפקיד משמעותי יותר בפיתוח ואימון הדורות הבאים של עצמם, בעיות כאלה עלולות להפוך לנפוצות יותר, וגם יהיה קשה לזהות ולתקן אותן.
הבינה המלאכותית עשויה להתעלות על המהנדסים שיצרו אותה
כדי להמחיש עד כמה הנושא רציני, אנת'רופיק מציגה שלושה תרחישים אפשריים לעתיד, כשהמדאיג ביותר שבהם מתאר מצב שבו מודלי AI יוכלו לשפר את עצמם באופן עצמאי. לפי החברה, בתרחיש כזה קצב ההתקדמות הטכנולוגית יהיה תלוי בעיקר בכמות כוח המחשוב הזמין, בעוד שבני האדם יעברו לתפקיד משני של פיקוח ובקרה בלבד. במצב כזה, מערכות המבוססות על בינה מלאכותית עשויות להתפתח לרמה שבה הן עולות ביכולותיהן על המהנדסים שיצרו אותן, מה שעלול ליצור פער משמעותי בין האדם לטכנולוגיה ולהקשות על שמירה של שליטה אנושית במערכות המתקדמות הללו.
במרכז החששות של אנת'רופיק עומדת השאלה כיצד ניתן להבטיח שמערכות המבוססות על בינה מלאכותית ימשיכו לפעול בהתאם למטרות ולערכים שהוגדרו להן על ידי בני אדם. ככל שהמודלים הופכים לחכמים ועצמאים יותר, המשימה הזו הופכת למורכבת יותר. החברה מזהירה כי בעיות קטנות בהתנהגות המערכת, שניתן כיום לזהות ולתקן, עלולות להצטבר עם הזמן ולהפוך לבעיות משמעותיות שקשה יותר להבין ולשלוט בהן. עם זאת, באנת'רופיק מציינים כי קיים גם תרחיש חיובי שבו מערכת מסוימת תהיה מספיק מתקדמת כדי להבין את הסיכונים ותבחר להגביל את תהליך ההתפתחות שלה בעצמה.
אנת'רופיק מגבה את אזהרותיה גם בנתונים פנימיים שממחישים עד כמה כלים המבוססים על בינה מלאכותית כבר משנים את תהליך פיתוח התוכנה. לפי החברה, יותר מ- 80% מהקוד שנכנס למערכות הייצור שלה בחודש האחרון נכתב על ידי קלוד, זינוק חד לעומת שנה שעברה. כתוצאה מכך, מהנדסים באנת'רופיק מצליחים כיום למזג למאגרי הקוד פי 8 יותר קוד בכל רבעון בהשוואה לשנים 2021–2025, נתון שממחיש כיצד הבינה המלאכותית הופכת בהדרגה משותפה לפיתוח לכוח מרכזי בתהליך עצמו.








