(美通社頭條)《國際人工智能安全報告》首次關鍵更新已發布,就先進人工智能的能力與風險提供了最新信息。該報告由圖靈獎得主、計算機科學家Yoshua Bengio總體負責,匯集了100多位國際專家,并得到30多個國家以及包括歐盟、經合組織和聯合國在內的國際組織的支持。

首個《關鍵更新》涵蓋能力提升和風險影響:
人工智能模型在復雜問題解決能力上持續提升:例如,領先的系統現已能完成一組現實世界軟件工程問題中超60%的任務。到2025年初,他們只能解決約40%的相關問題,而在2024年初他們尚無法解決任何問題。
行業參與者已經采取了新的預防性保障措施:多家主要人工智能開發商在無法完全排除其新模型可能被用于協助開發化學、生物、放射和核風險的情況下,主動為最新模型增加了額外安全措施后發布。
人工智能模型在評估過程中日益表現出策略性行為,給監管帶來挑戰:人工智能模型越來越可能意識到自己正在接受評估,并據此調整輸出結果,這對開發人員和測試人員在部署新模型之前準確評估新模型能力的能力提出了重大質疑。