当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
你见过最沉着住气的人是什么样子?
什么样的人算是中了基因***?
你们觉得京东外卖能做起来么?
为什么这么久了还是没有主流软件开发鸿蒙版?
为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
为什么中国没有成为农业克苏鲁,美国没有成为工业克苏鲁?
前端想要学习后端,选择哪种语言好一点?
新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧?
Caddy 和 Nginx 比有哪些优点和缺点?
Flutter 为什么没有一款好用的UI框架?
为什么 electron 不做成独立的 runtime?
老板说我设计了一周的海报还是不行,我到底该怎么学啊?
golang和rust你选择哪个?
既然数据无价,为什么会存在单盘位NAS这种奇葩存在呢?
面试中被嘲笑Token放在redis里,该如何应对这种情况呢?
程序员明明是技术积累岗位,为什么年龄越大反而可替代性变高了?
能分享一下你写过的rust项目吗?
小朋友到底应不应该购买SWitch?
前端真的已经凉了么?
作为车主第一视角,你开车最不喜欢副驾驶的什么行为?为什么?
厦门房价2025年会报复性上涨吗?
为什么欧美影视喜欢露点?
你读过最冷门,但「含金量极高」的书是什么?
求推荐程序开发笔记本!?
是什么原因导致HDR无法推行?
储存很多文件,是要用云盘还是用硬盘?
电视机为什么有大流量上传?