2025-10-30
让 AI 像金融分析师相似搜索和分析数据,到底有多难?现时的大模子诚然能回应基础金融常识,在 CFA 考试中取得高分,但靠近真确的金融场景,它们的进展究竟奈何? 为了回应这个问题,字节进步 Seed 团队辘集哥伦比亚大学商学院推出了 FinSearchComp,这是首个统统开源的金融搜索与推理基准测试。该基准包含 635 个金融人人悉心联想的问题,掩饰人人和大中华两个市集,并在多个主流模子产物上进行了全面评测。 评测效果令东说念主深念念: 在大派别据集上,进展最佳的 Grok 4 ( web...