Vreau modele LLM mai ieftine și milioane de contexte token. Vă rog cercetători AI, permiteți-ne să scalăm gazul/sec în timp ce scalați jetoanele/contextul { și faceți-o ieftin! } Vă rog.....
345