云开体育为诓骗安全责任奠定了基础-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口
新闻资讯
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚,阿谁掌管OpenAI安全的北大学友,OpenAI掂量副总裁(安全)翁荔,辞职了。 翁荔是OpenAI华东谈主科学家、ChatGPT的孝敬者之一。 北大毕业后,翁荔在2018年加入OpenAI,其后在GPT-4技俩中主要参与预试验、强化学习和对皆、模子安全等方面的责任。 最知名的Agent公式也由她建议,即:Agent=大模子+顾虑+主动蓄意+用具使用。 而就在前不久,她还刚刚现身2024 Bilibili 超等科学晚行径,发表了《
详情
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
就在刚刚,阿谁掌管OpenAI安全的北大学友,OpenAI掂量副总裁(安全)翁荔,辞职了。
翁荔是OpenAI华东谈主科学家、ChatGPT的孝敬者之一。
北大毕业后,翁荔在2018年加入OpenAI,其后在GPT-4技俩中主要参与预试验、强化学习和对皆、模子安全等方面的责任。
最知名的Agent公式也由她建议,即:Agent=大模子+顾虑+主动蓄意+用具使用。
而就在前不久,她还刚刚现身2024 Bilibili 超等科学晚行径,发表了《AI安全与“培养”之谈》的主题演讲。
在她书记辞职音书之后,包括OpenAI在内的广大同事发来了祝愿:
翁荔的辞职信
在推文中,翁荔也分享了他跟团队作念的终末的谈别。
以下为辞职信的无缺实践。
亲爱的一又友们:
我作念出了一个相配喧阗的决定,将于11月15日离开OpenAI,这将是我在公司终末一天。
OpenAI是我成长为科学家和指示者的所在,我将遥远提神在这里与每一位同事的伙伴渡过的时光。OpenAI团队一直是我的亲信、导师以及我身份的一部分。
我仍然难忘2017岁首加入OpenAI时的那份敬爱和关注。那时咱们是一群怀抱着不行能与科幻将来梦念念的东谈主。
我在这里动手了我的全栈机器东谈主挑战之旅——从深度强化学习算法,到感知,再到固件开导——主见是教育一个浮浅的机械手若何解开魔方。这破耗了通盘团队两年时刻,但最终咱们告成了。
当OpenAI参加GPT边界时,咱们动手探索若何将起始进的AI模子诓骗于现实宇宙。我建立了第一个诓骗掂量团队,推出了运行版块的微调API、镶嵌API和审核端点,为诓骗安全责任奠定了基础,还为早期的API客户开导了好多新颖的惩办有谋略。
在GPT-4发布后,我被条款承担新的挑战,再行研讨OpenAI的安全系统愿景,并将悉数责任聚会到一个致密通盘安整体系的团队。
这是我资格过的最贫穷、最垂危又令东谈主欢喜的事情之一。如今,安全系统团队领有最初80位出色的科学家、工程师、技俩司理、计策民众,我为咱们动作一个团队所获得的一切树立感到极为自爱。
咱们见证了每次发布的中枢——从GPT-4偏激视觉和Turbo版块,到GPT Store、语音功能以及01版块。咱们在试验这些模子以达到负背负和有利的主见上建筑了新的行业措施。
我止境为咱们最新的树立o1预览版感到自爱,它是咱们迄今为止最安全的模子,展现了出色的抗破解才气,同期保合手了模子的有效性。
咱们的集体树立令东谈主郑重:
咱们试验模子若何处理敏锐或不安全的申请,包括何时拒却或不拒却,并通过罢免一套明确的模子安全步履计策,杀青安全与实用之间的邃密均衡。咱们在每次模子发布中普及了对抗性鲁棒性,包括针对破解的防患、指示档次结构,并通过推理大幅增强了鲁棒性。咱们联想了严格且富饶创意的测试要领,使模子与《准备框架》保合手一致,并为每个前沿模子进行了全面的安全测试和红队测试。咱们在详实的模子系统卡中强化了对透明性的承诺。咱们开导了业内最初的审核模子,具有多模式才气,并免费向公众分享。咱们面前在一个更通用的监控框架和增强安全推理才气的方进取责任,将赋能更多的安全责任流。咱们为安全数据日记、度量、姿色盘、主动学习管谈、分类器部署、推理时刻过滤以及一种新的快速反应系统奠定了工程基础。回来咱们所获得的树立,我为安全系统团队的每一个东谈主感到无比自爱,并极为深信这个团队将接续繁盛发展。我爱你们。
在OpenAI的七年之后,我准备好再行开赴,探索一些新的边界。OpenAI正沿着火箭般的轨迹前进,我赤忱祝愿这里的每一个东谈主一切凯旋。
附注:我的博客将接续更新。我省略会有更多时刻来更新它 & 可能也会有更多时刻编写代码 。
爱你们的,
Lilian铁打的OpenAI,活水的安全旁边自OpenAI树立以来,安全旁边这个关节职位历经屡次更迭。
最早在2016年,OpenAI的安全旁边由达里奥·阿莫代伊(Dario Amodei)担任,在他的指示下,安全系统团队专注于减少现存模子和居品的虚耗风险,尤其是围绕GPT-3的安全性开展了深入掂量。
阿莫代伊主导了GPT-3的全面安全评估,以确保模子在发布前过程严格的安全测试和评估,最大甩掉地裁减潜在的虚耗风险。
他在OpenAI的责任为其后东谈主工智能的安全不绝奠定了进军基础。
2021年,阿莫代伊离开OpenAI创立了Anthropic公司,接续勉力于东谈主工智能的安全掂量,推动构建更具信得过度和安全性的AI模子。
在阿莫代伊之后,还有俄顷任职2个月的安全旁边,亚历山大·马德里(Aleksander Madry)。
他在任时代主要聚焦对新模子的才气进行评估,并开展里面红队测试,以识别情切解潜在的安全风险。
天然他的任期较短,但他在红队测试和挟制展望上的进军鼓励,为OpenAI的安全扩充提供了新的视角和要领论。
在2023年7月后,马德里转而专注于“AI推理”方面的责任,离开了安全旁边的职位。
在他之后的第三位安全旁边,则是杨·莱克(Jan Leike),在2023年7月至2024年5月担任这一职务,和Ilya沿途指示“超等对皆”技俩,主见是在四年内惩办超智能AI的对皆问题。
在此时代,杨·莱克推动了使用袖珍模子监督和评估大型模子的掂量,首创了对超东谈主类才气模子进行实证对皆的新要领。
这种要领对于领略和叮咛高等东谈主工智能模子的步履具有深化影响。
联系词,由于与公司在安全和居品优先级上的不合,杨·莱克于2024年5月书记辞职。
尽管如斯,他在对皆掂量方面的孝敬,为后续东谈主工智能的可控性掂量奠定了表面和扩充基础。
而翁荔则是于2024年7月担任OpenAI安全旁边。
对于翁荔翁荔是OpenAI华东谈主科学家、ChatGPT的孝敬者之一,本科毕业于北大,在印第安纳大学伯明顿分校攻读博士。
毕业之后的翁荔先是俄顷的在Facebook实习了一段时刻,第一份责任则是履新于Dropbox,担任软件工程师。
她于2018年加入OpenAI,在GPT-4技俩中主要参与预试验、强化学习和对皆、模子安全等方面的责任。
在OpenAI前年底树立的安全参谋人团队中,翁荔指示安全系统团队(Safety Systems),惩办减少现存模子如ChatGPT虚耗等问题。
翁荔在Google Scholar的援用量也达到了13000+次。
此前她建议的建议LLM外皮幻觉(extrinsic hallucination)的博文也口角常火爆。
翁荔要点关注外皮幻觉,征询了三个问题:产生幻觉的原因是什么?幻觉检测,顽抗幻觉的要领。
对于掂量的细节,不错点击这里稽查:万字blog详解顽抗意见、产幻原因和检测面貌。
至于翁荔辞职后的去处,量子位也会保合手合手续的关注。
参考聚拢:
[1]https://x.com/lilianweng/status/1855031273690984623[2]https://www.linkedin.com/in/lilianweng/— 完 —
量子位 QbitAI · 头条号签约
关注咱们云开体育,第一时刻获知前沿科技动态