今天用 antigravity 老是搞不明白要删哪些内容 总是删多
然后跟我说不好意思改错了,然后说不好意思,会更小心,一直循环一直循环。。。
这玩意工程质量有点差。
还是看模型
gemini3刚出的时候实测了两天,发现它的指令遵循性非常差,多轮对话之后的性能快速衰退,有点高分低能的意思,幻觉也比较严重
我让他参与我项目开发了一下午,发现他给的代码,也不是不好,但是感觉有点刻意工程化。。
问题点还是蛮多的,而且多轮对话这块和2.5差多了,但是这个比推理确实还可以,或者说有点过度拟合用户输入,我做了个尝试,前几天我用qwen搞了个chrome离线的那个恐龙小游戏,提示词我给的很细,同样的提示词给到gemini3给我生成的惨不忍睹,但是我换了种策略,只跟模型说我想要一个chrome离线恐龙跑酷游戏,生成的效果确好了非常多。。。
这不是搞笑吗,我给的细反而影响了它的发挥。。
看来是我的需求给的细,降低了它的的推理空间,反向说明了它推理还是可以的。。。。可能局部噪声也会有一些,毕竟提示词我随手写的,但确实gemini3在实际用下来并没有那么好
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。