
2024年春天,香港科技大学开了一门课叫作《计算机网络原理》,期末考试那天,教授没有阻止一个戴眼镜的学生进入考场,这副眼镜是乐奇Rokid AI眼镜,它连接着ChatGPT-5.2系统,能够自动读题答题,30分钟就完成考试并提交试卷,最终得分92.5分,在所有考生中排名前5%,人类学生中有95%的成绩比不过它,这次考试的题目并不简单,包括选择题、简答题,还有需要跨页推理的题目,AI作答过程非常稳定,只在几处计算步骤上出现小错误,但整个解题过程的书写清晰度超过大多数学生。

这件事是教授团队亲自做的实验,带头人是张军和孟子立,他们没有随便选一个眼镜来用,而是从十二款里面挑出最合适的,Meta Ray-Ban 功能开放但不能控制屏幕显示,Frame 画质不行,最后选了乐奇Rokid,因为它的 SDK 很灵活,可以准确控制显示内容,模型也试了好几个,最终确定用 GPT-5.2,它回答快知识全,配合图像转文字的流程很顺畅,整个系统是这样运行的:眼镜拍下题目传到手机,再传到云端计算答案,结果传回眼镜直接显示出来,整个过程没有人工参与,全部自动完成。

可别觉得这东西没有缺点,它有个明显问题就是耗电快,连续拍照传送图像还要保持联网,三十分钟就能让电量从满格掉到一半多,如果要用一整天考试,很可能中途就没电关机了。另外还有个更麻烦的情况,它是靠摄像头来看题目的,题目要是反光、模糊或者拍歪了,它就认不出来,答案自然不对。说白了,它的识别依赖的是摄像头这种物理设备,不是纯靠程序算法,环境条件一变,它就应付不了。这一点和人不一样,人可以歪头凑近猜意思,但人工智能做不到这样灵活调整。

这个实验暴露了考试制度的问题,我们反复考核记忆、步骤和标准答案,这些恰好是人工智能的强项,英国雷丁大学的研究显示94%的人工智能答卷被教师误认为人类作品,创业者Eddy Xu戴着Meta眼镜下国际象棋,实时查询最优解,几乎不动用大脑,只负责移动棋子,这不是作弊,而是工具过于强大,导致人类退化为执行机器,我们在用工厂流水线的标准衡量现在的孩子。

更深层的问题在于,教育评估并没有覆盖人的全部能力,加德纳提出人拥有八种智能,考试只能测量语言和逻辑数学这两种,比如提出好问题、处理模糊情况、整合不同学科、做出共情决策,这些能力根本没法打分,人工智能可以写出满分答案,但它不会问“为什么要有这个问题”,也不会在缺少标准答案的时候权衡利弊,现在的课堂奖励的是“答对题”,不是“想得深”,奖励的是“完成作业”,不是“原创内容”,这才是人和人工智能的最大区别。

这场实验想说明,教学不能偷懒,我们还在教学生像机器一样答题,而不是学会思考,分数高不等于会动脑筋,卷面干净也不代表有创意,未来的考试需要设计出人工智能做不了的题目,比如开放的设计题、伦理辩论、跨领域方案评审,这些题目没有固定答案,人工智能没法照搬,只能靠人自己来想,我认为,教育应该往这个方向走。
股票配资门户网站,配资证券配资网站,第一配资网提示:文章来自网络,不代表本站观点。