欧亿

您数字货币与 Web3的直通车

数字货币交易和 Web3 - 为您轻松实现

欧亿
当前位置:主页 > 新闻 >

国内量化私募首次向国际顶会投递大模型研究论

  

国内量化私募首次向国际顶会投递大模型研究论文提出全新大模型后训练方法

  近日,量化私募念空科技向AI领域的国际顶会NIPS(Neural Information Processing Systems,神经信息处理系统大会)投递了与上海交大计算机学院合作的大模型研究论文,并于5月20日发表。这是中国量化私募首次在AI基础研究领域挑战全球顶级学术舞台。

  念空科技提交的论文提出了一种全新的大模型后训练方法。此前,DeepSeek将整个训练过程被分成监督微调(sft)-强化学习(rl)-监督微调(sft)-强化学习(rl)四个过程,像是集中一段时间学习刷题(sft)、集中一段时间参加考试对考试结果进行思考总结(rl)。

  念空科技所递交的论文的突破性成果在于,从人类的学习方法的经验得到启发,如果高频的在少量刷题和小测试经验总结之间切换,可能更有利于学习成绩(推理能力)的提高,最终实验发现,在三个不同的公开数据集上,念空科技提出的新的训练框架明显优于单独的sft、单独的rl以及简单混合sft和rl,通俗的说,该研究成果可以帮助大模型在同等训练量下变得更聪明。

  据悉,念空科技创始人王啸在2025年成立了AllMind,全称为“上海全频思维人工智能科技有限公司”,是又一家量化私募孵化的大模型企业,专注于研究通用大语言模型(LLM)相关底层算法和工程技术。(澎湃新闻记者 孙铭蔚)

相关报道

跌幅近20% 比特币近期经历 03-10

跌幅近20% 比特币近期经历

以比特币为首的主要加密货币这几天可以说是经历了过山车式的行情,...

okx
国内商品期货夜盘原油主 05-15

国内商品期货夜盘原油主

每经AI快讯,5月15日,国内商品期货夜盘,原油主力合约收跌0.59%报484...

okx
上证50期权合约的基本条款 04-28

上证50期权合约的基本条款

上证50期权合约是一种金融衍生工具,为投资者提供了对上证50指数ETF(...

okx
部分期货夜盘收盘主力合 05-21

部分期货夜盘收盘主力合

每经AI快讯,5月20日,部分期货夜盘收盘,主力合约涨跌互现,棉花、菜...

okx
ICE:4月22日当周投机者所 04-28

ICE:4月22日当周投机者所

每经AI快讯,洲际交易所(ICE):4月22日当周,投机者所持ICE布伦特原油...

okx
景顺长城量化小盘股票 04-28

景顺长城量化小盘股票

卖基金极速回活期宝:基金赎回时,支持T+1日极速到账活期宝,赚钱不...

okx

立即创建 账号,开始交易!

创建账号