“以魔法对抗魔法”:AI作弊工具颠覆技术面试,一位创始人因此成为百万富翁
硅谷招聘团队正悄然经历一场恐慌,并已达到崩溃的边缘。技术面试,这个曾经是筛选顶尖工程人才的黄金标准,正因看不见的AI帮凶而土崩瓦解。这场巨变的中心是一位21岁的大学辍学生和他的一款售价低于一顿晚餐的软件。
Roy Lee,前哥伦比亚大学二年级学生,自诩为企业家,几周前在一场争议风暴中被停学。他发明了一款AI工具,用于作弊以获得来自亚马逊、Meta和TikTok的offer。
这款名为Interview Coder的工具,现在每月收入高达228,500美元。凭借224,000美元的利润和99%的利润率,它将一个纪律处分案例变成了一场病毒式创业的胜利。对Lee来说,这不仅仅是一场胜利,更是一次证明。
但对招聘人员来说,这并非一场革命,而是一场内爆。
“面试流程完全崩溃”:招聘人员公开反抗
在顶尖科技公司的招聘部门里,绝望已经取代了数据。
“我们明确告诉候选人:这一轮不要使用AI,”一位参与招聘的创业公司联合创始人说。“他们点点头,然后还是作弊。”
面试官们讲述了令人不安的新现象:候选人目光游离于屏幕之外,直接插入完整的代码块而不进行输入,或者完全避免屏幕共享。还有一些人能完美地回答复杂的算法问题,但当被要求解释他们自己的解决方案时,却磕磕巴巴。
“我们现在不仅仅是关注错误的答案,”一位招聘经理说。“我们还在观察他们是否是人类的迹象。”
来自技术面试平台的内部数据显示,疑似AI辅助作弊的比例已从2023年初的2%跃升至今天的10%以上。
这些曾经旨在筛选掉不合格申请者的平台,现在被精通AI的求职者用来营造一种精通的假象。其后果是严重的:浪费工程时间,破坏信任,在某些情况下,整个招聘流程都被冻结。
通往硅谷明星之路的60美元捷径
Interview Coder的运行方式简单得令人不安。候选人拍摄编码问题的照片,然后AI工具——利用GPT——提供带注释的分解、逐步推理和完整的解决方案。
一个覆盖界面确保一切都对屏幕共享检测保持隐藏。鼠标似乎从未离开浏览器。候选人似乎从未切换标签。但每一次击键都是预先设定好的。
到5月中旬,该工具预计将超过100万美元的年度经常性收入。它的病毒式传播并非偶然。Lee在YouTube和LinkedIn上记录了他的整个旅程——从作弊进入亚马逊到构建实现这一目标的工具——获得了数千次观看。
他在LinkedIn上发布的关于被哥伦比亚大学开除的帖子引发了激烈的辩论——并帮助推动了订阅增长。
根据他发布的内部业务数据:
- 94%的收入来自每月60美元的计划
- 每月客户流失率约为35%
- 实际成本极低:Vercel托管费用为3,000美元,Reddit广告费用为500美元
他声称近10%的谷歌暑期实习生使用了该工具。至今没有人反驳他。
Interview Coder只是一个开始
如果Interview Coder是火花,那么Leetcode Wizard就是野火。
Leetcode Wizard每月收费49欧元,拥有超过16,000名用户,自诩为“排名第一的AI驱动的面试作弊应用”。该工具声称通过率高达93%,用户甚至展示了真实的FAANG公司的offer,它比竞争对手更进一步:它可以诊断时间复杂度,生成澄清问题,并模拟“类似人类”的打字输出以避免被检测到。
主要功能包括:
- 无法检测到的屏幕覆盖
- 对面试平台不可见的全局快捷键
- 策略性地放置在代码编辑器之上的界面
- 对所有主要的屏幕录制工具不可见
尽管该工具是公开的,广泛宣传的,并且可以从GitHub上下载,但到目前为止,它从未被任何主要的面试平台标记过。
它的创建者声称问题不在于软件,而在于系统。
“Leetcode ≠ 实际工作,”他们的主页上写道。“我们只是揭露了这场闹剧。”
一个认知失调的行业
招聘人员现在面临着一个生死攸关的困境:禁止AI工具,可能会疏远已经在工作中使用的AI人才——或者允许他们使用,并将面试过程简化为一场表演。
AI招聘公司Micro1的首席执行官Ali Ansari认为,现状已不再可行。
“即使没有作弊,编码测试也必须开始变得不同,”他说。“我们正在进入一个新时代。AI已经永久改变了工程师的角色。”
Experis Services的副总裁Don Jernigan也表达了同样的观点,他认为面试必须侧重于人类独有的能力:判断力、创造力和调试直觉。
一些公司已经开始尝试。软件公司Apryse现在给候选人布置离线家庭作业,允许使用AI——但最终评估取决于对工作流程的深入解释。
其他公司正在建立已知作弊者的黑名单,并设计强调实时讨论而非完美代码的面试形式。
但人们仍然担心:AI已经超越了旨在控制它的形式。
学术界的打击适得其反
哥伦比亚大学本以为在3月20日Lee被开除后,已经结束了这一事件,这是在行业投诉引发的纪律听证会之后做出的决定。
据报道,亚马逊,哥伦比亚大学的长期招聘合作伙伴,曾警告说:如果学校不采取行动,双方的关系将面临风险。
在听证会上,Lee被要求承认Interview Coder可能被用于帮助学生在课程作业中作弊——他嘲笑这一指控是不相关的。“哈哈,”他在决定后公开表示。“我没有遗憾。”
具有讽刺意味的是,强烈反对反而加速了他的成功。该工具的最大更新在几天后推出。他在X上声称,由于该工具,成千上万的用户通过了面试。
他高达99%的利润率——每月近25万美元的收入——将最初的纪律丑闻变成了近期历史上利润最高的AI微型创业公司之一。
AI并没有破坏面试——它只是揭示了它们早已崩溃
传统面试的捍卫者现在陷入了一个矛盾:AI在工作场所受到欢迎,但在面试中却被禁止。为什么?
“计时测试从来都不现实,”一家面试辅导公司的创始人说。“AI只是揭开了面纱。”
UNC和微软的一项联合研究发现,当候选人被允许解释他们的想法并且没有受到严格监控时,他们的表现会更好——这表明面试压力本身可能比AI更能扭曲表现。
甚至OpenAI的联合创始人Andrej Karpathy也创造了“氛围编码”这个术语——认为工程师可能很快就会更多地根据代码理解和AI协作而不是原始实现能力来判断。
由于AI能够立即生成代码,也许未来开发人员的真正技能是知道生成哪个代码——以及为什么。
接下来会发生什么?
面试的崩溃可能是煤矿里的金丝雀。
如果一个人,在两个月内,花费3,500美元的成本,就可以构建一个病毒式的、有利可图的工具,从而破坏价值数万亿美元的公司使用的招聘协议——还有什么是脆弱的?
目前,各公司正在争先恐后地采取行动。一些公司将加强控制。另一些公司将从头开始重新设计面试。但越来越多的人认为,解决方案不是更好的监控——而是更好的评估。
一位招聘负责人总结道:
“我们需要测试AI无法做到的事情的面试。否则,我们只是在面试工具。”
与此同时,Roy Lee正忙于扩大他的业务。
如果旧规则不再适用,那么——正如他所看到的那样——他不是这个故事中的恶棍。
他是原型。