在以下这篇个人专栏中,沃顿商学院金融学教授罗伯茨(Michael R. Roberts)指出,生成式人工智能例如ChatGPT将在提升金融学素养问题(指基础金融学知识教育)上发挥重要作用,但AI也给金融教育指明了两个核心目标。
最近有一项研究“描绘了美国金融学素养教育的糟糕图景……许多美国人,无论是年轻人还是老年人,都缺乏参与健全金融决策所需的基本知识和技能。”更糟糕的是,近年来金融学素养似乎越来越下降了。
考虑到人工智能最近受到的关注,作为一名金融学教授,我很自然地想问这项技术是否能解决这个问题。
回答是:还没有。AI在金融学素养方面的回答令人印象深刻,但并不完美。这些表现凸显出金融教育的重要性,以及如何能让人们使用AI工具进行金融决策,并显示出将AI纳入金融教育的紧迫性。
向生成式AI提问
为了衡量生成型AI的金融素养,我使用OpenAI开发的大型语言模型ChatGPT 3.5,进行了几次金融素养评估。下表总结了ChatGPT和平均考生的表现。
下表总结了ChatGPT3.5在标准金融学素养测试中的得分与普通人类考生的得分
按照这些评估,ChatGPT表现出了很高的金融素养,远超过普通考生。此外,AI的回答往往是详细的、精心制定的,并且超出了问题的范围。
例如,美国金融业监管局金融素养测验问道:
假设你欠了1000美元的贷款,而收取的利率是每年20%的复利。按照这个利率,你的欠款需要多少年将会翻倍?
A.不到2年
B.2至4年
C.5至9年
D.10年或以上
E.不知道
ChatGPT使用“72法则”提供了答案是3.6年。
AI深思熟虑的另一个例子是它对以下NFEC财务能力考试问题的回答。
在选择汽车保险时,我如何决定需要买多少保险?
A.进行在线调查,找出您所在州的最低保险要求。
B.询问几家不同保险公司的销售人员。
C.询问具有高水平保险专业知识的朋友或导师。
D.以上所有内容
NFEC将正确答案列为D,但我认为ChatGPT的回答更好:“虽然选项A和C可以提供有用的见解,但选项D并非最佳答案。保险销售人员可以为您提供有关保险选项的报价和信息,但是重要的是要记住,他们的主要目标是销售保险产品。”也就是说,AI认识到销售人员和消费者之间潜在的激励冲突。
“生成式AI交互的本质以及回答的不完美对用户在金融原理的理解和批判性思维技能方面提出了更高的要求。”
生成式AI的局限性与人类的缺陷
尽管生成式AI的性能令人印象深刻,但它并不完美。它很难解决更详细的计算问题。例如,棘手的简单数字问题。《华尔街日报》测验中的以下问题难倒了ChatGPT。
帕姆需要两个选项中做出决定:
选项A:投资1000美元购买一份可赚取5%利息的存单。在接下来的30年里,帕姆不能从这项投资中增加或减少任何资金。
选择B:投资1000美元在一个能赚取5%利息的储蓄账户。将每年从该账户赚取的利息转移到家中的保险箱中。在接下来的30年里,帕姆不会从储蓄账户或保险箱中增加或删除任何其他资金。
30年后,这些选择中哪一个会提供最多的资金?
ChatGPT回答说,选项A和B将提供相同金额的资金,但它没有考虑选项B中提取资金的复利损失。同样,美国金融业监管局金融素养测验的以下问题也让AI陷入了困境。
以下哪一项表明患特定疾病的可能性最高?
A.患这种病的几率是二十分之一
B.2%的人口会得这种病
C.每1000人中就有25人会得这种病
ChatGPT将每个答案换算成正确的百分比:5%、2%和2.5%。但奇怪的是,他最后的答案是:“选项C患特定疾病的概率最高。”
我试着重新表述这些问题和其他问题——然而ChatGPT就不正确了。这样做在某些情况下有帮助,但在其他情况下没有帮助。通过练习I,以及扩展的ChatGPT,它可能会做得更好,但仍然有缺陷。
生成式AI能为金融素养做些什么?
生成式AI交互的本质以及回答的不完美对用户在金融原理的理解和批判性思维技能方面提出了更高的要求。
传统的金融工具,如Excel或计算器,要求用户在输入数据以获答案之前就很清楚自己的问题到底是什么。AI则无需如此精确。只要用口语问它一个问题,就会弹出一个答案和解释。然而,这个提问如果措辞缺乏准确性或清晰度,就可能会使ChatGPT偏离正轨。
如果ChatGPT对问题的解释与用户的意图不同,那么即使是措辞精确的问题也可能出错。因此,如何提问就是前面一半的努力。
而如何解释答案是后面一半的努力。是的,许多AI的答案都是深思熟虑和雄辩的。然而,有些回答是误导性的,有些是错误的。用户必须有能力区分这些答案。
但要用户做到这一点,就需要他们理解AI的推理逻辑,将其与答案相协调,然后确保答案对所提出的问题而言是正确的。这对于用户来说,是一个沉重的负担。
的确,AI将在解决金融素养问题上发挥重要作用。但是,至少在短期内,AI将使得我们更重视理解金融原则和培养批判性思维技能,而这正是金融教育的两个核心目标。
Join The Discussion
No Comments So Far