前几天多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了 8000 多张卡,带来的损失可能超过千万美元。”
据知情人士透露,该头部大厂为字节跳动。此事发生在今年 6 月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
传闻显示,该实习生利用了 HF的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且 AML 团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。
字节跳动于今日10 月 19 日发布《关于“实习生破坏大模型训练”的事实澄清》:近期有媒体称“字节跳动大模型训练被实习生攻击”,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退。
特说明如下:
- 涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。
- 网传“涉及 8000 多卡、损失上千万美元”严重夸大。
- 经核实,涉事人一直在商业化技术团队实习,并没有 AI Lab 实习经历。其社交媒体个人简介及部分媒体报道有误。
从公告获悉,该实习生已在 8 月被字节跳动辞退。字节跳动称将其行为同步给行业联盟和所在学校,交由校方处理。