DeepSeek lanseeraa V3.1:n, joka yhdistää V3:n ja R1:n hybridipäättelymalliksi, jossa älykkyys kasvaa asteittain Inkrementaalinen älykkyyden lisäys: DeepSeek V3.1:n alustavat vertailutulokset osoittavat tekoälyn älykkyysindeksin olevan 60 päättelytilassa, kun R1:n pistemäärä oli 59. Ei-päättelytilassa V3.1 saavuttaa pistemäärän 49, mikä on suurempi lisäys aiempaan V3 0324 -pistemäärään 44. Tämä jättää V3.1:n (päättely) Alibaban uusimman Qwen3 235B 2507:n (perustelu) taakse - DeepSeek ei ole ottanut johtoasemaa takaisin. Hybridipäättely: @deepseek_ai on siirtynyt ensimmäistä kertaa hybridipäättelymalliin, joka tukee sekä päättelyä että ei-päättelyä. DeepSeekin siirtyminen yhtenäiseen hybridipäättelymalliin jäljittelee OpenAI:n, Anthropicin ja Googlen lähestymistapaa. On kuitenkin mielenkiintoista huomata, että Alibaba hylkäsi äskettäin Qwen3:lle suosimansa hybridilähestymistavan erillisillä Qwen3 2507 -päättely- ja ohjemalleillaan. Funktiokutsu / työkalun käyttö: Vaikka DeepSeek väittää mallin parannettua funktiokutsua, DeepSeek V3.1 ei tue funktiokutsuja päättelytilassa. Tämä todennäköisesti rajoittaa merkittävästi sen kykyä tukea agenttisia työnkulkuja älykkyysvaatimuksilla, myös koodausagenteissa. Tokenin käyttö: DeepSeek V3.1 saa asteittain korkeammat pisteet päättelytilassa kuin DeepSeek R1, ja käyttää hieman vähemmän tokeneita Artificial Analysis Intelligence Indexissä käyttämissämme valeissa. Ei-päättelytilassa se käyttää hieman enemmän tokeneita kuin V3 0324 - mutta silti useita kertoja vähemmän kuin omassa päättelytilassaan. API: DeepSeekin ensimmäisen osapuolen API palvelee nyt uutta DeepSeek V3.1 -mallia sekä chat- että päättelypäätepisteissään - yksinkertaisesti muuttamalla, annetaanko loppuajattelun </think> token mallille chat-mallissa, jotta voidaan hallita, järkeileekö malli. Arkkitehtuuri: DeepSeek V3.1 on arkkitehtonisesti identtinen aiempien V3- ja R1-mallien kanssa, ja siinä on 671 miljardia kokonaisparametria ja 37 miljardia aktiivista parametria. Seuraukset: Suosittelemme varovaisuuteen tehdessämme oletuksia siitä, mitä tämä julkaisu antaa ymmärtää DeepSeekin edistymisestä kohti tulevaa mallia, jota huhuissa kutsutaan nimellä V4 tai R2. Huomaamme, että DeepSeek julkaisi aiemmin lopullisen mallin, joka on rakennettu heidän V2-arkkitehtuuriinsa 10. joulukuuta 2024, vain kaksi viikkoa ennen V3:n julkaisua.
70,79K