我个人非常高兴能拥有一个真正的非思考型qwen3,具有绝对疯狂的基准测试,而没有那些 /no_think <think></think> 的事儿。
@TheAhmadOsman 我不需要它超越 opus 或 kimi。我只希望它像 V3-0324,但更小。
@TheAhmadOsman 它在运行中 我喜欢它。初步检查让我印象深刻。 在小失误后能自我调整,似乎知道自己知道什么/不知道什么,稀有的世界知识还不错,拒绝过于困难的问题,令人愉快的助手形象,不太马虎,工具调用得当。
@TheAhmadOsman 将会在稍后运行一些自定义基准测试,但我确实可以看到它取代 4.1/V3 作为默认 API 模型。 我希望他们能给 30B-A3B 同样的待遇…
16.72K