Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mam nadzieję, że prace nad modelami z obsługą głosu doprowadzą do tego rodzaju rozwiązania. Streaming jest bardzo trudny, ale wydaje się, że to końcowy stan w ewolucji zaawansowanych systemów.

11 sie, 23:38
Naturalna rozmowa obejmuje przerwy i mówienie jednocześnie, co jest trudne do modelowania dla LLM jako pojedynczej sekwencji autoregresywnej. Jestem pewien, że można osiągnąć sporo, tworząc sekwencję tekstową z przerwami w stylu scenariusza filmowego w trakcie zdania, ale wydaje się, że prawdziwe rozwiązanie wymagałoby równoległych strumieni słuchania i myślenia, z mówieniem w kolejce na przerwy lub w przypadku priorytetu przerwania. Mieszanie tokenów z różnych strumieni i robienie czegoś niestandardowego z uwagą wydaje się wykonalne.
1,65K
Najlepsze
Ranking
Ulubione