为什么Qwen模型总给我一种又土又low的感觉?

2025-06-26 18:30:16

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。

虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。

为什么Qwen模型总给我一种又土又low的感觉?
广告位810*200
相关阅读
异性同办公室久了会不会日久生情?

异性同办公室久了会不会日久生情?

我最近一年,因为有个项目,经常和一个女同事出差,我是产品,她...

2025-06-21
如何评价中国电科研发的JY-10防空指挥控制系统成为伊朗防空指挥系统核心?

如何评价中国电科研发的JY-10防空指挥控制系统成为伊朗防空指挥系统核心?

一个写程序超过二十年的老家伙说: 凡是国企写的软件都是垃圾,...

2025-06-21
闲鱼上为什么会有人问都不问直接下单?

闲鱼上为什么会有人问都不问直接下单?

装修时剩下一桶未开封的油漆,过期2年了,但是密封完好,网上新...

2025-06-21
有什么适合多人玩的我的世界模组或整合包?

有什么适合多人玩的我的世界模组或整合包?

我的世界【Better MC】(更好的我的世界)整合包开服联...

2025-06-21
不用CDN就没事,用阿里云CDN就被攻击刷流量,阿里云表示证明不了就要用户买单,如何看到这种行为?

不用CDN就没事,用阿里云CDN就被攻击刷流量,阿里云表示证明不了就要用户买单,如何看到这种行为?

楼上 @佚明 已经讲得很好了,起因是三大运营商对PCDN打击...

2025-06-21