通过强化学习驱动的金融推理大模型
通过高质量的可验证金融问题微调训练,采用SFT(监督微调)和RL(强化学习)两阶段训练,显著提升模型金融推理能力。
采用轻量化的7B参数量级架构,在显著降低部署成本的同时,实现卓越的性能表现,超越同规模模型。
在多个金融领域基准测试上的表现达到参评模型的SOTA水平,特别在FinQA和ConvFinQA两大关键任务测试中取得领先优势。
实现各种金融模型、算法和分析任务的计算机编程代码,支持从简单的财务计算到复杂的金融衍生品定价。
建立数学模型并运用数值方法解决实际金融问题,为金融决策提供科学依据。
聚焦于防范金融犯罪与遵守监管要求,帮助企业建立健全的合规管理体系。
利用AI与大数据技术识别和管理金融风险,能够发现潜在的风险模式和异常交易行为。
评估企业在环境、社会、治理的表现,衡量可持续发展能力,确保投资活动促进社会责任。
强调在跨语言环境下使用英语进行金融模型的构建和计算,提供国际化的金融分析能力。
在覆盖多项金融业务场景的基准测试上,我们的模型以仅7B的轻量化参数规模展现出显著的性能优势,全面超越参评的同规模模型。
模型 | 参数量 | FinQA | ConvFinQA | Ant_Finance | TFNS | Finance-Instruct-500k | 平均分 |
---|---|---|---|---|---|---|---|
DeepSeek-R1 | 671B | 71.0 | 82.0 | 90.0 | 78.0 | 70.0 | 78.2 |
Fin-R1 | 7B | 76.0 | 85.0 | 81.0 | 71.0 | 62.9 | 75.2 |
Qwen-2.5-32B-Instruct | 32B | 72.0 | 78.0 | 84.0 | 77.0 | 58.0 | 73.8 |
DeepSeek-R1-Distill-Qwen-32B | 32B | 70.0 | 72.0 | 87.0 | 79.0 | 54.0 | 72.4 |
Fin-R1-SFT | 7B | 73.0 | 81.0 | 76.0 | 68.0 | 61.0 | 71.9 |
博智税通信息科技股份有限公司成立于2015年9月,总部位于北京,由业界资深财税专家与互联网精英共同发起设立,并得到中财龙马公益基金会鼎力支持,致力于打造基于互联网技术与财税服务深度融合创新的O2O开放式财税生态服务平台。
公司口号:博智税通,让财税变轻松
产品理念:以用户为中心,追求极致的用户体验
经营理念:共建、共享、共赢
企业愿景:整合财税行业资源,为企业和个人解决财税问题,致力于打造"互联网+财税"服务领导品牌,引领财税行业实现转型升级
推出线上线下互联互通的财税产品服务形态,广泛地将财税研究机构、专家、学者、财税工作者、财税服务机构、中小微企业、个人连接在一起,构建财税服务生态圈,分享前沿、权威、实战、贴心的全品类的财税服务与培训,为用户提供全方位、一站式的财税增值服务。
机构服务商和个人工作室:为财税服务机构和财税师开设网上事务所、个人工作室等模块,帮助专业人士利用碎片化时间获得收益。
中小企业和个人用户:以"用户获得财税知识和促成财税交易"为落脚点,通过能力雷达系统精准匹配供应商,为中小企业提供一站式采购。