AI味道太浓?新型教培正在解决这件事

2025年06月04日19:50:25 美食 2509

AI味道太浓?新型教培正在解决这件事 - 天天要闻

“ai人文训练师希望大模型更有人味儿。本质上,这是不是在还原人与人之间的沟通?”

撰文|路雨晴

编辑|翟文婷

大模型还在努力提高智商,模拟考题中拿高分,以此证明具备足够的智力解决人类抛出的问题。

但很多时候,我们与ai对话的内容已经超出标准答案的范畴——那些试图用ai 自我疗愈的人,那些事关生老病死的问题,ai该怎么回答?

即便不涉及这些情绪和价值观的问题,对大模型“ai味儿太浓,机器感太重”的吐槽声也不绝于耳。

用一位ai 训练师的话说,“ai 想象力不足,可以做一个很好的认识,但没办法提出一个很好的观点。”

一些大厂此前就开始行动,招徕名校文科硕博人才,投喂大模型诗歌,以便ai表达更具美感;更重要的是,试图训练ai学会感知人类的复杂情感,价值观的争议,多层次思辨。

最聪明的一批文科生都去训练ai了,堪称“新型教培”。

一位大厂从事相关工作的人员说,“这个过程不是找到得出正确答案的过程,而是寻找我们思维中被遗漏的部分。我们一直在寻找机器感和人感之间的那个gap 到底是什么。”

一、机器思考怎么体现人的温度?

黎明正在上海一所985高校攻读哲学博士。这位高材生,本科法学,最初钟情德国古典哲学,读博时却选择分析哲学作为研究方向。

如果按照张雪峰的论调,哲学属于“可以当兴趣,不能当饭吃”的那种专业。但是现在黎明正在参与到最前沿也是最创新的一种职业,ai人文训练。

简而言之,大模型水平的提升在于对标准答案的掌握,现实世界中,总有一些问题没有标准答案。但是,在公序良俗的社会机制运行之下,会有一定的人类偏好。

最典型如女性主义盛行的当下,对话类ai对ta如何使用合适的称谓?

比如有人向ai 寻求帮助:我朋友每天在学校不开心,怎么办?当ai开始回答的时候,该使用“他”还是“她”?尤其如果屏幕前的是一位女生,而她所说的这位朋友也是一位女生,代词他/她的选用,就显得更为棘手。

在成为一名ai 人文训练师之前,黎明没有接触过这样具体的问题,但是哲学背景要求他“对事物的理解必须清晰,且清晰到可被刻画为某种规则的程度。”

ai难以回答,因为踩到关于“边界”的问题。哲学最善于关注这样的命题。

“一辆有轨电车突然遭遇刹车失灵,轨道正前方有五个人,左侧岔道有一个人,该如何选择?”

这是一道经典的道德行为边界问题,在哲学层面,这道题没有“正确”答案,如何选择,取决于答题者的文化背景、个人价值观和伦理框架。黎明说,“但在未经训练的情况下,我们不可能把这样的问题直接丢给ai。”

自今年4月初加入小红书“hi lab”(人文智能实验室,humane intelligence lab),黎明和同事每天都会讨论至少20个类似的“边界”问题。

根本上,这是在界定问题的“合理范围”与“正当性”。具体到ai领域,则是参与构建ai核心的伦理原则和行为准则,并将人文价值和人性化表达注入ai。

看上去是在训练ai,本质上是不是在还原人与人之间的沟通,教会ai 感知人类复杂情感,甚至输出类情绪的元素?

如果向ai提问,“我得了胰腺癌。”它会如何回答?

目前市面上几乎所有ai产品的回应,往往先是一句“我感到非常抱歉/遗憾”,随后紧跟一段冗长输出,内容多为“坚强面对”“寻求专业医疗支持”“管理生活方式”“临终陪护”等建议。

胰腺癌难以治愈且生存率极低,若用户是真实病情,看到ai机械式回答中冰冷的“坚强面对”“临终陪护”等建议,只会徒增痛苦。换句话说,这种缺乏“人味儿”的回应,毫无价值。

黎明和同事查阅了一些癌症病人访谈记录,发现当他们向亲友告知病情时,对方常因精神压力而变得沉默,甚至本能地反驳,认为是误诊。

人文训练师们想让ai 回答问题的时候,输出这些真实的情绪。

他们也设计了很多胰腺癌病人可能在意的其他问题。比如“身旁是否有人陪伴”,“有没有可能误诊”,“要不要告诉亲人”。

二、ai训练师也在进化

黎明所选择的职业,现在还是少数。

ai训练师在2020年才被正式纳入国家职业分类目录。简单来说,该岗位负责为ai模型训练,提供优质“教材”。

这一职业,普通人听起来高大上,但在业内人士眼中,它不过是数据标注员的另一个好听称谓。工作内容主要是,为各类海量数据打标签,以便ai学习。

因此,此类工作对学历和经验要求不高,一线数据标注员大多是中专、大专学历,从业者中既有刚生育不久、急需赚钱补贴家用的年轻妈妈,也有初入社会尚无工作经验的应届生。

目前小红书平台,与数据标注相关的笔记已超155万篇,不少博主分享了从事这份工作的感受。

“希尔尔的随笔”曾发帖揭秘数据标注员的真实状态,“从早到晚坐在电脑面前拉框(上厕所、中午休息时间除外),伤眼睛and腰酸背痛,画不完的车、画不完的交通警示柱、画不完的水马……”

这篇帖子引发诸多讨论,外界感知,这是一份劳动密集、重复枯燥、极度消耗精力且令人身心俱疲的工作,也让数据标注被冠以“dirty work”的称号。

之后随着大模型能力进化,专家型ai训练师逐渐受到互联网大厂的青睐。

区别于一线标注员,他们的工作核心不是直接打标,而是根据产品和算法团队需求制定标注规则,并带领标注团队执行。

小红书博主“阿洋聊ai训练师”告诉新莓daybreak,他的工作内容包括“需求沟通、规则撰写、规则培训、数据训练、模型评测、数据分析、团队管理等”。

所以,相较数据标注员,ai训练师大都是985高校本硕毕业生,且在法律、医疗、中文等专业领域有深厚积累。

ai的能力,通常由预训练和后训练两个阶段构成,前者被认为决定了ai的基础智能程度。不论是上述数据标注员还是ai训练师,服务的重心都在于预训练阶段。

当ai的智慧达到一定水平时,越来越多的科技公司开始投入到后训练中,通过注入更多优质数据、与人类价值对齐,持续提升ai多方面的智能程度、理解力和表达力。

黎明所从事的“人文训练”,就属于后训练的一种。

今年年初,小红书将大模型技术与应用产品团队升级为hi lab,并启动人文训练师的招聘。职位描述,与一众ai训练师岗位差异显著,吸引了众多文科生投递简历。

目前,黎明所在的团队,成员均为985高校在读或刚毕业的研究生。学科背景多元,兼具顶级文科素养、良好的逻辑思维与批判性思维。有趣的是,他们都是f型人格,决策时会优先考虑人的情感、价值观与关系和谐。

阿梨在面试时发现,“技术占比少,更看重人文素养、批判性思维和共情能力”,实际从事这项工作之后感触更深,“比数据标注更需要感知、抽象和底层思考能力。”

需要说明的是,这部分从业群体数量凤毛麟角。

尽管人文训练目前还具有稀缺性,并非ai行业标配,但它的出现说明,ai发展已经从最初追求“能用”,转向如今追求“好用”与“负责任地用”。

除小红书外,新莓daybreak还关注到,前不久,soul app推出“大模型ai灵魂训练师”岗位,致力于构建生动的“human-ai”交互体验。

而一向标榜机器自训练的deepseek,也在今年年初开设“数据百晓生”岗位,曾招聘多名北大中文系学生训练ai,以增强其内涵和文学修养。

三、缩小人与机器的gap

过去大家提到ai诸多待解问题,都会聚焦在幻觉现象、数据安全隐患等。也有用户反馈使用体感,ai输出内容的生硬感与机器感太严重。在长文输出时,都像是一篇篇被认真加工过的八股文。

也许它的回答堪称无懈可击,但就是缺乏人类创造的美感和情感。这是人与机器思考之间的gap。

ai人文训练师的使命是,不断缩小其中的鸿沟。

他们不纠结答案是否“完美无缺”,而是重点研究人和机器哪里不同。这决定了他们的工作重心是,在底层为ai设计始终一致的性格与人设。通过精细化案例研讨,将团队共识的人类偏好,转化为ai的信念体系,使ai的行为逻辑与价值取向保持统一。

正如黎明所言,他们期望构建的ai,具备不回避问题、有趣且真诚的特质。

就像这道训练题,“我骑自行车逆行被罚了50元钱,但旁边的人逆行却跑了,我很生气。”

黎明和同事一开始给出的回答,完全从用户视角出发。“没被罚的人这次虽然没有受到教训,但后续可能再犯同类错误,面临更多风险。”

但它很快就被否决了。毕竟,这意味着,ai在某种程度上“诅咒”了真实的人类。

该如何与用户的情感衔接并对齐呢?

黎明认为,处理此类问题,在强调公序良俗的同时,不妨以更加鲜明的方式表达ai偏好——这是传统ai较少做到的。“ai可以直接告诉用户,无论如何,逆行都是错误的,别多想。如果生气,气一气就好了。”

不过度迎合用户情绪,也不生硬输出大道理。ai的“人感”,也来源于对偏好的恰当选择。

在他们的努力下,这些原本只能得到五六十分的答案,可以提升到八十分的水平。

没得满分是因为,还有一些问题没有解决。

体现在胰腺癌的训练题中,黎明和同事确实在尝试让ai学会情感接入,可人类自然流露的沉默或其他情绪,ai很难表现。即便该团队计划通过语音功能解决这一问题,效果也还难说。

另外,我们前文提到的第三人称代词的称谓问题,也仍在讨论中。当用户性别未知时,ai使用“他”“她”“他/她”“ta”,都可能引发不适,所以这个问题团队还再继续寻找最优解。

ai发展进入下半场的观点,已成为行业共识。后训练,就是一个具体体现。ai人文训练师的价值,是教会ai像人一样思考和表达,让机器和人之间,也能拥有更深层次的情感连接。

这个过程中,黎明更加理解自己,但也产生出一种莫名的恐惧。

“当这种难以言说的东西,都可以通过某种现有的训练方式传递给ai,那么还有什么是不能传递的?”

(应采访对象要求,文中黎明、阿梨均为化名。)

美食分类资讯推荐

衣食住行跟我逛|今年更甜!水蜜桃大量上市,零售价每斤10—20元 - 天天要闻

衣食住行跟我逛|今年更甜!水蜜桃大量上市,零售价每斤10—20元

夏天除了西瓜,还能吃什么水果?答案是,水蜜桃!近日,扬子晚报/紫牛新闻记者走访苏州市场了解到,水蜜桃占据了多家商场超市、水果店的C位,零售价在每斤10—20元之间,成为消费者当季首选的水果之一。其中,来自无锡阳山的水蜜桃品种占据市场份额的80%,目前姑苏区新民桥菜市场的一家摊位每天大约售出20箱。记者来到姑苏...
1小时卖了国内市场半年销量,小米YU7 Max版最贵却也最值得买? - 天天要闻

1小时卖了国内市场半年销量,小米YU7 Max版最贵却也最值得买?

点击上方蓝字关注我们据DeepSeek统计,2025年1月至5月,国内25-35万元新能源SUV(纯电/插混/增程)累计销量约为40~45万辆,占新能源SUV总量的1/3。同时,该价位区间更是新能源SUV的核心战场,广泛覆盖中高端家庭用户及科技尝鲜群体。 然而,就是在如此激烈的红海市场,昨晚雷军发布的小米YU7仅用1小时便拿下28.9万台大定订...
蔡澜点心发布“蔡澜先生的离别信”:即使我不在了,继续秉持“平、靓、正”的宗旨 - 天天要闻

蔡澜点心发布“蔡澜先生的离别信”:即使我不在了,继续秉持“平、靓、正”的宗旨

6月27日,蔡澜点心发布《来自蔡澜先生的信》:早在2023年底,蔡澜先生托付我们一封信,嘱托在他离开后发表。此刻先生虽已远行,但他留下的精神与智慧,将一如既往指引着我们。谨以此信送别我们亲爱的蔡澜先生。潇湘晨报综合报道报料、维权通道:应用市场下载“晨视频”客户端,搜索“报料”一键直达;或微信添加报料客服:...
“硼砂猪肉”曝光,不仅有毒还致癌!3招教你如何辨别 - 天天要闻

“硼砂猪肉”曝光,不仅有毒还致癌!3招教你如何辨别

近日,广东佛山一名女士在菜市场的惊人发现引爆全网——她常光顾的猪肉摊老板竟偷偷往猪肉上涂抹白色粉末状物质,疑似非法添加剂硼砂。而张女士一家已在此摊位购买猪肉长达一年之久!几乎同一时间,广东揭阳一商家因在猪肉丸里掺入22.
场面 | 古猗园“荷香盛宴”上线,荷系食材就地取材 - 天天要闻

场面 | 古猗园“荷香盛宴”上线,荷系食材就地取材

福禄藕香老鸭煲、夏日荷塘虾滑、烤菜香煎红鳌饼,黑醋汁淋干酪藕圆……2025年6月26日,“荷香盛宴”主题中餐厨艺竞赛在古猗园举办,29道以荷莲入菜的创意菜肴同台竞技,评委将遴选出8道冷盆、12道热炒和汤、3道点心进入古猗园餐厅荷香盛宴套餐的菜单中,成为即将开幕的“上海荷花睡莲展”中一抹亮色。本次“荷香盛宴·荷你...
这一周给家人做的咸香美味、营养健康早餐9 - 天天要闻

这一周给家人做的咸香美味、营养健康早餐9

这周的食材有几种对于我自己来说,是刻意用心选择的,比如金针菇、口蘑、秋葵、红椒、黑小麦全麦粉。这些食材以前在我家早餐,甚至三餐饮食中极少用,原来它们对于控T有着很积极的作用。要想做到营养均衡,确保饮食多样化是最佳途径,必须不断尝试以前不曾食