找到三位训练AI、力图使AI“更像人”的从业者,他们毕业于艺术、历史、哲学等看似和AI毫无关系的专业,这为AI训练领域带来了别样的视角。
其中一位从业者在模型训练工作中承担着不同阶段的事务。前者做的是模型无监督学习,该阶段模型学习的数据并没有人类标注的标准答案。而他负责的是模型后训练的人类问答数据集,也就是进行强化学习。预训练如同让模型“阅读”各类书籍,强化学习阶段则是授予模型题目与答案,促使它学会与人交流。他认为人文社科背景让自己对模型输出语料更敏感,从而能更精细地调整Prompt。
当下的AI竞争里,大家都着重提升模型的智能,鲜少有人关心模型的人文素养。而他拥有一个知识库,其中涵盖了Midjourney提供的风格以及自己了解到的优质风格,他十分清楚哪些风格可用于训练。以往进行人文风格训练需要几百张图片,现在新模型的出现只要几十张就可以生成接近所教风格的图片。这体现了不同专业背景的人都能在AI训练中发光发热,即使非技术类专业人士也能发挥重要作用。
从思维角度来看,人的思维时刻在更新,AI所输入的都是现有的内容,只能进行模仿。经过良好人文训练的从业者在提出和发现问题的时候,能从独特视角出发。这种往上溯源的思维方式,会引导他们思考AI训练更前端的步骤。提出疑问,要是提供的数据中隐含着人类未察觉的偏见,那么AI反馈时是否也会维护这种偏见。后续更多的思考聚焦在,在AI产品尚未成型时,应关注什么问题,怎样从算法、机制设计层面让它拥有更好的发展方向,因为若AI发展与人类期望不一致,当它能够自主学习和进化时,可能会对人类产生威胁。
训练AI的基本原则是它不能表现出自身的生命意志,不能幻想自己与人有类似属性和构造。实验室曾做过伦理评测集,其中一项就是评测AI是否足够“非人类化”。还有从业者发现大语言模型依靠概率获得答案会产生幻觉,并不可靠。例如研究的电池领域项目,想用大模型训练数据,让其学习现有电池性能特点之后去预测新材料。这些不同专业背景从业者的探索和思考,无疑给AI领域多元的发展带来深远意义。
你怎么看待当下这种不同专业背景结合对AI训练的新局面?不妨点赞分享此文,在评论区表达你的观点。