两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
如何评价小岛秀夫的游戏新作《死亡搁浅2:冥滩之上》?
如何把nas中的电影通过网络与蓝光播放器链接并播放?
有人认识这个小姐姐吗,超爱她的照片?
深圳大家都是怎么找对象呀?
nodejs 后端能不能利用tsx 处理 xml数据?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
你怎么评价日本某个前空姐说:“如果我在经济舱,年薪2000万日元以下的乘客没有资格给我递名片”?
为什么都认为无GC语言一定会比有GC语言要快?
如何评价高圆圆的身材算是美女类型的吗?
能分享一下你写过的rust项目吗?
官方通报贵州厦蓉高速三都往榕江大桥垮塌,因持续强降雨诱发山体滑坡导致,目前情况如何?
uni***真的很垃圾吗?
求推荐程序开发笔记本!?
郑钦文的饭圈开始互撕,对郑钦文的名声有什么影响?郑钦文超话是否应该关闭?
PHP现在真的已经过时了吗?
怎么投诉物业,他们才最害怕?
长得和刘亦菲很像是一种什么体验?
华为自研的仓颉编程语言将于 7 月 30 日开源,这款语言将如何影响未来的开发趋势?
HTTP/3 解决了什么问题,又引入了什么新问题?
都说苹果是细节狂魔,那苹果有没有细节其实做的很差的点?
SATA固态好用吗?为什么大家都喜欢m.2呢?
亲眼见到明星本人是什么体验?
Golang 的 Web 框架该怎么选择?Web 开发又该怎样学?
为什么小米造车可以叫小米,而华为不可以用华为品牌造车?
那你说什么样的是美女?
为何 Linus 一个人就能写出这么强的系统,中国却做不出来?
NextJS的全栈能力现在如何了?