分享好友 最新动态首页 最新动态分类 切换频道
2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用
2024-12-27 00:37

点击蓝字

2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用


圆桌讨论



尼塔山·拉库马尔(Nitarshan RAJKUMAR)提到,模型级别的安全性与应用级别的安全性之间存在区别。就像人们将充电器插入插座时,不会关心供电问题或者其他极端风险,而只关心这个充电器到底能不能正常工作。


阿葡丽尔·钱(April CHIN)将基础模型类比为“微型核反应堆”,把实际应用比作通过“微型核反应堆”来为电灯泡供电。对于基础模型,需要确保其按预期运行,防范各种潜在风险,规避灾难性后果。而对于实际应用,则需要确保其不会在多种文化背景下产生偏见、歧视和不良后果。


罗宾·韦斯顿(Robin WESTON)倾向于认为两者之间的关联度不高,因为基础模型的安全验证对人工智能应用安全的检测是否具有帮助,不得而知。并且在实际应用阶段,如果加入太多检查和防护措施,反而会打破产品开发的连贯性和减缓开发速度,在客观上降低产品质量。



尼塔山·拉库马尔(Nitarshan RAJKUMAR)赞同到,对于下游应用者而言,他们更关注的是市场需求和产品销售。对于他们而言,安全问题理论上是国家和社会层面的范畴,应由政府部门和相应机构对此负责,由他们进行评估,保这些技术不会带来巨大风险。当然,应用者也会认为即便自己对此有责任,也不具备相应的能力,无法像监管者那样可以确保这些技术不会被恶意使用。


阿葡丽尔·钱(April CHIN)提到,应用者希望通过安全测试帮助他们和客户建立起对人工智能技术的信任基础。应用者可以借此更好地弥合学术基准和业务基准的差距,同时也能更好地向治理部门和客户证明这个系统足够安全,从而使产品顺利投入使用。


罗宾·韦斯顿(Robin WESTON)以自己工作为例,提到其更专注于为客户提供数字化的解决方案比如构建技术系统,因此大部分精力会花在如何确保系统的正常运行,只有20%的精力会放在基础模型安全性的问题上



尼塔山·拉库马尔(Nitarshan RAJKUMAR)认为,值得肯定的是现在对于安全问题的关注越来越大,很多像自己这样的技术专家正在逐渐将关注点转移到政策和治理领域。目前来看,提高安全性的关键还在于是否能提高模型的透明度,因为政府和社会能借此更好掌握技术实际发展水平和提前发现大规模风险出现的迹象。但同时,一些看似可行的方法实际上还存在挑战性,比如测试阶段的重点测试对象就很难明确,正如尼塔山·拉库马尔曾一度认为错误信息和虚假信息将是公众最关心的问题和风险,然而结果却并非如此。


阿葡丽尔·钱(April CHIN)提出,关键在于让所有相关方(模型提供者、使用者、监管机构等)在技术生命周期中具有清晰的责任和协议,确保每个环节都能做到风险最小化。不仅是对基础模型本身进行安全性测试,还包括对基础模型在实际应用中的表现进行持续监控和改进,从而确保其在不同情境下都是安全、可靠,且符合法律和伦理要求。


罗宾·韦斯顿(Robin WESTON)表示,人们需要找到一种测试方式,既能保持技术发展速度,又能明确重点风险领域,同时还要考虑到系统延迟的实际情况。此外,确保模型安全不仅在于保证模型本身的安全,还要考虑到边界条件、护栏等与模型进行互动的部分。




新浪微博:@清华大学人工智能国际治理研究院

微信视频号:THU-AIIG

Bilibili:清华大学AIIG


最新文章
阿里云盘的几个资源搜索平台(应有尽有)
Kafka是一个分布式流处理平台,它具有高吞吐量、可扩展性和容错性的特点。下面是Kafka代码分析的一般步骤:1. 了解Kafka的基本概念和架构:在进行代码分析之前,首先需要了解Kafka的基本概念,例如topic、partition、producer、consumer等
漫蛙漫画app下载
漫蛙漫画app是一款热门的手机漫画资源app。软件上的漫画资源都是免费的,各种类型的题材应有尽有,感兴趣的小伙伴快来下载漫蛙漫画app体验吧!一款提供超多优质彩漫的追漫平台,这里的动漫资源非常的丰富,每天都会更新大量的高清动漫,各
计算器软件大全 热门计算器软件排行
探索科技助手:深入解析计算器软件大全 热门计算器软件排行,为你揭示当前最热门的计算工具,无论是日常生活中的简单加减,还是专业复杂的运算需求,一文带你领略高效便捷的数字生活。从排行榜单中挑选最适合你的那款神器,提升工作学习效
许昌企业网络营销新突破,专业推广公司助力飞跃
许昌一家优化推广公司,专注于帮助企业实现网络营销新突破。通过精准策略与高效执行,助力企业提升品牌影响力,扩大市场份额,实现业绩增长。随着互联网的普及,越来越多的企业开始重视网络营销,希望通过网络平台拓展市场、提升品牌知名度
被星爷邀约,张全蛋的10年演员梦,拼尽全力终究入不了影视圈主流
“初代网红”“6亿票房傍身”“富士康质检小王子”。张全蛋身上的任何一个标签,都注定他会在娱乐圈风生水起。可事实却不是这样。爆火10年之后,演艺圈的“潜规则”在张全蛋身上再一次应验了。01卖惨还是炒作?12月中旬,企鹅出品的纪录片
白杨SEO:工具推荐第一期——关键词挖掘工具使用实例
  引言:常言道,工欲善其事,必先利其器。我们在做SEO的时候,会用到很多工具。而如何找到及用好这些工具,让我们工作事半功倍,白杨SEO会慢慢分享大家。本篇即第一期——关键词挖掘工具(注,本文讲中文工具)   多说两句,如果是之
让AI激发创作!首届豆包MarsCode AI编程挑战赛报名开启
在科技变革浪潮中,编程领域持续演进,AI为其注入无限活力。我们的目标是期望为广大编程爱好者与专业开发者打造一个开放、多元且相当挑战性的平台,促进技术交流与创新思维的碰撞,加速AI技术在编程领域的深度融合与应用落地。在这里你的创
考研区域经济学专业容易上岸的大学怎么选择
对于准备考研的同学来说,选择一个合适的学校和专业至关重要。在众多专业中,考研区域经济学大学排名引起了越来越多同学的关注。区域经济学不仅涉及经济学的基本理论,还结合了地理、社会等多方面的知识,非常适合对社会发展有兴趣的同学。
管家婆2024精准资料大全|讲解词语解释释义
管家婆2024精准资料大全——词语解释释义详解本文将详细介绍管家婆2024精准资料大全中的相关词语,并对其中的关键词进行解释和释义,通过本文,读者可以了解管家婆资料的准确性和可靠性,掌握相关术语的含义,从而更好地利用这些资料。管家
相关文章
推荐文章
发表评论
0评