“ChatGPT之父”:OpenAI早已不使用客户数据来训练模型
财联社5月6日讯(编辑 赵昊)当地时间周五(5月5日),美国人工智能公司OpenAI首席执行官山姆·阿尔特曼(Sam Altman)表示,公司已经“有一段时间”没有使用付费客户的数据来训练人工智能(AI)大语言模型了。
OpenAI是近期爆火的AI聊天机器人ChatGPT的开发商,而阿尔特曼提到的“大语言模型”就是ChatGPT背后的关键技术。据了解,开发商在训练大语言模型时需要摄取网络上的海量数据,才能提高模型生成自然语言的能力。
阿尔特曼在专访中说道,“用户们显然希望我们不要使用他们的数据进行训练,所以我们已经改变了我们的计划,未来我们也不会这样做了。”
网络记录也显示,今年3月1日,OpenAI悄然更新了其服务条款:“不会使用通过其API提交的任何数据来‘服务改进’,包括AI模型训练,除非客户或组织选择加入。”
此外,该公司同时添加了30天的数据保留政策,API用户可以选择“根据用户需求”进行更严格的保留,并简化其条款和数据所有权,以明确用户拥有模型的输入和输出。
鉴于新的隐私规则仅适用于API用户,这也意味着,普通用户和ChatGPT之间的对话内容,只要用户切换“关闭聊天记录”按钮,仍会进入到模型的训练资料库。
长期以来,开发人员一直对OpenAI先前的数据处理政策颇有异议,声称这会带来隐私风险并允许公司从他们的数据中获利。目前,亚马逊等公司已经颁布了禁止员工分享敏感数据的措施,以防范ChatGPT这样的大语言模型窃取公司机密。
另有消息称,三星电子本周也推出了一项新政策,要求员工不得在工作场所使用ChatGPT等生成式人工智能。此前,该公司的半导体业务部门曝出了三起机密资料外泄案件,其中两起与半导体设备有关的文件可能已经录入到ChatGPT的学习资料库中。
本周早些时候,美国作家协会(WGA)与电影公司之间为期六周的合同谈判破裂,好莱坞面临15年来首次编剧罢工。而究其原因,是美国作家协会要求限制人工智能编写电影和电视剧剧本。
美国作家协会谈判委员会成员John August表示,编剧对人工智能主要有两个不满:他们不想让自己的作品成为“喂饱”AI的材料,也不想以后只能修改AI草率的初稿。
内容来源:财联社