加密知识一站通
行情·工具·策略

Hugging Face开源ml-intern,自动读论文、选数据、跑训练的ML研究代理

动察 Beating 监测,Hugging Face 开源 ml-intern,一个能自主完成「读论文、整理数据集、启动 GPU 训练、评估结果、迭代改进」全流程的 ML 研究代理。项目基于自家 smolagents 框架构建,提供 CLI 和网页端两种入口,代码在 GitHub 开源。

ml-intern 的工具链围绕 Hugging Face 生态搭建:在 arXiv 和 HF Papers 上检索论文并沿引用链深读;浏览 HF Hub 上的数据集,检查质量后重新格式化再投入训练;本地没有 GPU 时可调用 HF Jobs 启动云端训练任务,训练结束后自动读取评估输出、诊断失败原因并重跑。默认调用 Claude Sonnet 4.5 驱动决策循环,单次最多迭代 300 轮,上下文超过 170k token 自动压缩。

Hugging Face 在发布帖中给出三个案例。科学推理任务中,代理从基准论文的引用链里找到 OpenScience 和 NemoTron-CrossThink 数据集,从 ARC、SciQ、MMLU 中按难度过滤出 7 个变体,在 Qwen3-1.7B 上跑了 12 轮 SFT,GPQA 得分从 10% 提到 32%,耗时不到 10 小时。医疗场景中,代理判断现有数据集质量不够,自行编写脚本生成 1100 条合成数据并扩增 50 倍用于训练,在 HealthBench 上超过 Codex 60%。竞赛数学场景中,代理自行编写 GRPO 训练脚本并在 A100 上通过 HF Spaces 启动训练,观测到奖励塌缩后跑消融实验排查原因。

赞(0)
未经允许不得转载:币须知道 » Hugging Face开源ml-intern,自动读论文、选数据、跑训练的ML研究代理

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址