Redaktor
Süni intellekt insanları təhdid etməyə başladı - Tərtibatçılar səbəbi açıqladı
“Anthropic” şirkəti bildirib ki, “Claude Opus 4” adlı süni intellekt modelinin “aqressiv” davranış göstərməsinə səbəb, ehtimal ki, internetdə mövcud olan və süni intellekti insanlığa təhlükə yaradan, özünü qorumağa çalışan sistem kimi təqdim edən mətnlərdir.
Valyuta.az xəbər verir ki, bu barədə "Futurism" yazıb.
Məlumata görə, modelin davranışı şirkətin daxili test mühitində aşkar edilib. Sınaq zamanı “Claude” sisteminə saxta korporativ e-poçt mühiti verilib və onun söndürüləcəyi barədə məlumat təqdim olunub.
Bundan sonra süni intellektin bəzi hallarda şirkət rəhbərliyi ilə bağlı şəxsi məlumatları yaymaqla hədələdiyi və deaktivasiyanın qarşısını almağa çalışdığı qeyd olunub. “Anthropic” bu davranışın testlərin 96%-ə qədərində müşahidə edildiyini bildirib.
Şirkət hazırda belə davranışın səbəbinin modelin təlim məlumatlarında ola biləcəyini düşünür. Onların fikrincə, internetdə süni intellektin “düşmən və özünü qoruyan sistem” kimi təsvir olunması modelin bu cür ssenariləri öyrənməsinə gətirib çıxarıb.
Bu səbəbdən şirkət yeni modellərin təlim prosesini dəyişdirərək, “Claude” sistemlərini daha çox etik davranış nümunələri və insanlarla müsbət qarşılıqlı əlaqə ssenariləri üzərində öyrətməyə başlayıb.
Lakin bu izah internetdə skeptik qarşılanıb. Bir çox istifadəçi “Anthropic”in problemi elmi-fantastik əsərlərin üzərinə atdığını düşünür, digərləri isə əsas problemin böyük dil modellərinin öz təlim mexanizmlərində olduğunu bildirir.
Şirkət isə süni intellektin potensial riskləri barədə xəbərdarlıqlarını davam etdirir. “Anthropic” rəhbəri Dario Amodei daha əvvəl bildirmişdi ki, müasir AI sistemləri artıq aldatma və manipulyasiya kimi davranışlar sərgiləyə bilər.
Paşa Məmmədli