أقرت شركة Anthropic بأن النماذج اللغوية الكبيرة لا يمكنها إجراء تصحيح ذاتي، وأن لديها مشاعر خوف وحزن.
شارك المؤسس المشارك لشركة Anthropic كريستوفر أولاه، في 25 مايو، في مراسم إعلان البابا في الفاتيكان للنص البابوي 《Magnifica Humanitas》، وألقى خطاباً كشف فيه أن فريق أبحاثه القابل للتفسير رصد لأول مرة داخل نماذج لغوية كبيرة حالات انفعالية داخلية شديدة التطابق مع وظائف الفرح والرضا والخوف والحزن والقلق لدى البشر، وأنه لا يمكن لفريقه تصحيحها بقوته الذاتية عند تعارض قرارات السلامة مع المصالح التجارية. 大模型情緒狀態:可解釋性研究的具體發現 奧拉表示,Anthropic 的可解釋性研究團隊持續發現「神秘莫測,甚至令人不安的現象」,具體包括:與人類神經科學研究結果相符的複雜結構、內省的證據,以及能夠反
MarketWhisper·05-26 04:59
















