世界各种大模型都是什么性格,科学家进行了评估

2025年05月04日00:12:06 科技 1497



世界各种大模型都是什么性格,科学家进行了评估 - 天天要闻

大型语言模型 (LLM) 处于人工智能AI) 的前沿,并已广泛用于对话互动。然而,评估特定 LLM 的个性仍然是一项重大挑战。香港理工大学PolyU) 的一个研究团队开发了一种人工智能驱动的评估系统,即语言模型语言人格评估 (LML),能够通过语言分析定量测量 LLM 的性格特征。

这种人工智能和计算语言学的创新跨学科研究导致了强大的、数据驱动的人工智能工具的开发,用于评估细微的法学硕士人格特征和行为。

LML 系统代表了在理解 LLM 并使其更符合人类价值观和需求方面向前迈出的关键一步。

由理大工业及系统工程学系助理教授李立恒教授领导,研究成果已发表在《计算语言学》上

LML 旨在通过检查其输出中的语言模式、风格和其他与语言相关的特征来评估和描述法学硕士的个性。

该系统包括两个主要部分:适应性五大库存 (Adapted BFI) 和 AI 评估器。

LML 首先对 LLM 进行 Adapted-BFI,该 BFI 源自以前基于语言的性格评估理论。

然后,AI 评分者评估响应,将文本答案转换为代表人格特征的可量化数值。

这项创新技术不仅通过为改进 AI 性格评估提供强大的框架来推进以人为本的 AI 和计算语言学,而且还应用于各个领域,包括教育和制造,以及商业领域,例如帮助公司满足合规要求以及环境、社会和治理报告。

它还支持可持续发展目标和加强法律服务。

李教授说:“为了解决 LLM 在捕捉人类人格的认知和情感维度方面的局限性,我们的团队成功开发了新颖的评估工具,以语言术语评估 LLM 人格,与他们的功能能力和作范式保持一致。

这项研究为理解 AI 和与 AI 交互开辟了新的可能性。通过量化 LLM 个性,可以针对特定应用定制他们的沟通方式,为人机之间更加个性化的交互铺平道路。

李教授将其研究的技术基础转化为人工智能驱动的商业合规平台。利用自然语言处理,该平台可以分析和解释大量文本数据和报告,包括由 LLM 生成的数据和报告。AI 技术用于执行自动化数据收集、分析和洞察生成,从而显着简化业务合规性和报告流程。LML 的整合突出了人工智能在评估基于语言的人格特征方面的细微差别能力,为定性商业和人类数据分析提供了潜在应用。


期刊参考

  1. Jingyao Zheng, Xian Wang, Simo Hosio, Xiao Xu, Lik-Hang Lee.LML PA:语言模型语言人格评估计算语言学, 2025;1 DOI: 10.1162/coli_a_00550

科技分类资讯推荐

7款新品!华为这次的瓜,真的太大了! - 天天要闻

7款新品!华为这次的瓜,真的太大了!

时间已经来到了5月份,距离华为新品发布会的召开已经正式进入倒计时。华为官方之前就已经宣布,在5月份会发布新品。比如华为鸿蒙PC,还有尊界S800。那么,5月份的华为新品发布会,到底会发布哪几款新品呢?在这里,毒哥和大家盘点一下。第一款新品,
华为Mate80Pro如果长成这样,肯定再次卖爆! - 天天要闻

华为Mate80Pro如果长成这样,肯定再次卖爆!

作为华为年度压轴大戏,华为Mate80的消息也越来越多了。有网友投稿了一组华为Mate80Pro的渲染设计图,想让毒哥和大家分享一下。毒哥看了之后,觉得这个创意设计确实非常哦漂亮。那么,在这里毒哥结合渲染设计图,和大家汇总一下目前华为Mat
769元!华为这款1TB新品,是来捣乱的吗? - 天天要闻

769元!华为这款1TB新品,是来捣乱的吗?

前几天,毒哥给大家介绍了华为新上架的一款固态硬盘嘛。这款固态硬盘,全称叫做华为坤灵eKitStor Xtreme 200 SSD,售价为599元。华为这款固态硬盘的优势也很明显,M.2 2280的外形设计,兼容性很好。支持NVMe 2.0协
5月又一款新机官宣:5月8日,正式发布 - 天天要闻

5月又一款新机官宣:5月8日,正式发布

随着新机市场不断更新,今年所发布的新机大部分围绕着影像和游戏方面,并且涌现出不少核心技术,主要是提升定向性能。影像核心有影像系统、影像芯片、AI影像功能等,而游戏同样推出游戏芯片、性能引擎、独显芯片等,向着专业级别发展,提升新机竞争力。
守护袁昆:企业互联网营销推广有什么绝招? - 天天要闻

守护袁昆:企业互联网营销推广有什么绝招?

(文/守护袁昆)经常有朋友问到互联网营销推广有什么绝招,现在做互联网营销有什么新技巧和新渠道。每次遇到这样的问题,解释的太多最后得到一个反馈结果:有绝招不愿意公开。互联网营销推广有技巧和方法吗?这是肯定的。互联网营销推广有绝招吗?什么才算绝
假期 我选择在家当“赛博熊猫饲养员” - 天天要闻

假期 我选择在家当“赛博熊猫饲养员”

五一朋友圈摄影大赛已经开赛,本“前参赛选手”选择提前退赛。与其去景区表演“人类迁徙”,不如宅家干点别的。玩手机、打游戏、看电影?格局打开,我选择在家当“赛博熊猫饲养员”。宅家往沙发上一躺,身边还有只圆滚滚的电子熊猫24小时待命,治愈值直接拉
这个五一,用长虹熊猫AI TV rua熊猫可太香了! - 天天要闻

这个五一,用长虹熊猫AI TV rua熊猫可太香了!

五一正确的打开方式:在家沉浸式吸熊猫,这可太香了!长虹电视不久前发布了新品长虹熊猫AI TV,本熊猫爱好者正好想买新电视,美美下单。没想到,五一派上了大用场。不得不说,长虹真可以,我愿称它为“沉浸式熊猫周边”。
小米又一款顶配Ultra终于来了,有点刺激啊 - 天天要闻

小米又一款顶配Ultra终于来了,有点刺激啊

最近机哥经常聊到,下半年会出很多旗舰小平板。 9 英寸不到可以一手掌握的大小,对于游戏党来说,确实比常规大屏舒服太多。 但有的机友觉得,小平板看视频不得劲,问机哥有没有更大更猛的....