首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

较新品最高优惠 15%:苹果美国上架官翻版 M4 MacBook Air 笔记本 REDMI K Pad官宣:性能最强小平板 挑战iPad mini 三星Galaxy S24+ 5G手机1810元秘矿紫 三星在 NVIDIA的12-Hi HBM3E验证中再次失误,重新测试定于9月进行 华硕ROG PG27UCDM电竞显示器限时特惠 每年500万 9大领域协同 “一带一路”共建国家16所高校共商共议 618购物别盲目,这些键盘值得入手! 云游戏是否取代PlayStation主机?索尼强调本地游戏体验仍是主流 当公务员和给你2000亿,你选哪个? 【社招】航天科工集团科技保障中心有限公司部分岗位公开招聘启事 日订单破2500万,京东新王牌稳了 150万在武汉买房,新房or二手房?这波分析超上头! 广州"限\"时代终结!全面取消限购,楼市迎来新春天 根据进化论,你的智能手机其实是一种“寄生虫” 云游戏想取代主机?索尼:玩家还是爱本地畅玩! 真我GT7马丁联名版开售,500元差价值不值?用户吐槽“巨丑无比” 华为手机:智能时代的首选 苹果 iOS/iPadOS 26 引入EnergyKit框架,智能家居环保节能新利器 苹果推迟Siri AI升级至2024 春季,承诺提升软件质量与用户体验 骆克·骑士钢化膜促销,vivo手机适用 vivo X Fold5新品发布会定档6月25日,现已开启预约 荣耀杜雨泽:超高频 PWM 调光在 OLED 频闪改善的阶段性任务已完成,再卷更高数值没有意义 《王者荣耀》杨戬玩法升级:新增“法天象地” 身躯变大 618叠加国补后,公认可以“闭眼入”的5款手机推荐,机身耐用价格“暴跌” “考后经济”升温,电商平台笔记本电脑销量增长200% 相机增长190% 红米K80至尊版和K Pad官宣 定位“豪华性能双旗舰” 洗衣又快又安静!小米洗衣机新科技获评国际领先 外媒称iOS 26从小米借鉴了7点特性:玻璃质感UI在列 黑马突围的“豹式逻辑”,方程豹反超小米、小鹏,钛3登顶周冠! 告别设备孤岛!华为鸿蒙折叠电脑如何改写全球 PC 产业规则?