Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

aiko/acc
Produs și marketing. AI @myshell_ai. Partener @FoliusVentures. Părerile sunt ale mele. DM este deschis.
Recent, în timpul procesului Particle News, @particle_news regândește valoarea și limitele LLM-urilor în scenariul fluxului de informații despre tranzacții. Particle este un produs de știri AI foarte sofisticat, care face o treabă excelentă în ceea ce privește lățimea și neutralitatea informațiilor, lizibilitatea și audibilitatea conținutului lichid. Cu toate acestea, există o diferență structurală între această experiență șlefuită cu precizie și sistemul de informații tranzacționale și este scrisă mai întâi pentru a vedea dacă poate ajuta colegii care fac și ei produse similare.
1. Informațiile nu sunt capturate și integrate, ci înțelegerea grupată.
Sunt de acord cu conceptul de "poveste" subliniat în mod repetat de fondatoarea Sara Beykpour în interviuri, care este, de asemenea, unul dintre punctele lor de atracție, subliniind că informațiile nu sunt "capturate și integrate", ci "grupate și înțelese". Dacă informațiile sunt doar răzuire și concatenare fără creier, atunci toate ordonările din aval și evaluarea credibilității vor fi neclare. În special, în scenariile tranzacționale, unde densitatea informațiilor este extrem de mare, cerințele în timp real sunt puternice și intervalul de context este mare, este imposibil să lași modelul mare "să înțeleagă liber", dar trebuie mai întâi să efectuezi o rundă de clusterizare semantică structurată de către AI pentru a organiza informațiile fragmentate în mai multe "clustere de evenimente" compacte (povești) cu indicii cauzale interne.
2. Punctele forte și punctele oarbe ale LLM: neutralitate, cauzalitate vs. putere predictivă
- LLM-urile au avantaje semnificative în controlul stilului/neutralitatea emoțiilor de opinie cu moderație. Cu toate acestea, după polimerizare + multe post-evaluări, oportunitatea și tensiunea structurală sunt sacrificate.
- LLM-urile sunt bune la judecata cauzală a lanțului, analiza cauzei și efectului și unele puncte pentru a rafina dacă există o corelație între lucruri foarte nuanțate, în special "calea de influență" și "reacțiile din amonte și din aval", care vor deveni una dintre logicile importante ale tranzacțiilor.
- LLM-urile nu sunt bune la prezicere. Ca model de limbaj statistic, amplifică în mod natural "opiniile mainstream" sau "semnalele de înaltă frecvență". Propria noastră observație este că AI este întotdeauna "prea optimistă", iar judecata Sarei este: "Dacă mulți oameni spun că echipa A va câștiga, modelul va crede că echipa A a câștigat". "Predicția este un mare punct mort pentru LLM-uri și nu ar trebui să fie folosită ca motor de semnal. Pe de altă parte, rămâne de văzut dacă produsele de chatbot precum Flush sau predicția de întrebări și răspunsuri deschise de tip Bobby de la Rockflow pot depăși această limitare sau pot fi prinse.
3. Strategii pentru predicții alternative: lanț cauzal + cronologie structurală
Dacă predicțiile sunt un defect actual în LLM-uri, este util să păstrați secțiuni precum Calendarul TradingView și Cauză și efect atunci când prognoza nu este făcută și actualitatea este ridicată. A deduce dacă un lucru este legat de altul și ordinea relativă și declanșatorii dezvoltării evenimentelor. Această judecată este, de asemenea, suficientă pentru a stabili un model de părtinire informațională pentru sistemul de tranzacționare fără prognoze reale.
4. Activitatea de evaluare:
Evaluarea este cu siguranță o muncă foarte rafinată și direcțională. De exemplu, reținerea limitează exprimarea: fiecare propoziție poate avea un singur punct de vedere, evitați propozițiile; De exemplu, "indiciu" = "opinie" pentru a evita concluziile vagi; De exemplu, rezumatul nu poate depăși cuvântul X și, odată ce există o culoare subiectivă sau o "expresie intenționată", este considerat o eroare. Desigur, gradul "critic" al fiecărei unități de conținut este, de asemenea, cuantificat, pentru a face mai bine conducta să ruleze automat. Întreaga conductă este asincronă și repetabilă: atâta timp cât verificările de evaluare eșuează, sarcina este repornită automat. Prin urmare, modelul trebuie să finalizeze doar o sarcină mică la un moment dat, cum ar fi determinarea dacă a avut loc un eveniment sau generarea unui rezumat neimplicit, mai degrabă decât să completeze toate inferențele și expresiile într-o singură rundă. Logica de bază a acestei abordări este de a împărți generația în mai multe sarcini mici verificabile și reutilizabile, fiecare dintre ele putând fi verificată real pentru a evita halucinațiile și tendințele în cea mai mare măsură.
5. Linie de producție completă de la prototip la conținut AI de înaltă calitate
Sara împărtășește procesul complet de realizare a unui sistem de moderare: mai întâi scrieți un prompt într-un mediu de testare, setați cinci întrebări, apoi faceți jailbreak sau rupeți structura sau uitați contextul, până când modelul arată un comportament stabil și de bună calitate, promptul poate avea sute de rânduri.
Când promptul este inițial stabil, este predat echipei tehnice, șablonul de prompt este dezasamblat în componente și pus în conducta asincronă, iar toate celelalte întrebări sunt rulate pentru analiză offline. În cele din urmă, începeți testul de întrebări live pentru a rula sistemul în scenarii reale, apoi alăturați-vă oficial evaluării.
Pe scurt, dacă doriți să construiți un sistem de agregare și împingere a informațiilor asistat de inteligență artificială, nu fantezați că modelul mare oferă direct alfa; Toate predicțiile care folosesc AI pentru a vă spune ce țintă să cumpărați sunt escrocherii. Adevăratul know-how este structura, procesul și sistemul de verificare care fac LLM-urile fiabile în cadrul arhitecturii.
3,37K
aiko/acc a repostat
Standardul mai practic pentru măsurarea libertății ar trebui să fie
Înțelegi cum funcționează lucrurile mai aproape de esență?
Dacă este aproape de resurse de mare valoare
Dacă costul real al apelării resursei este relativ scăzut.
Acest lucru nu este exact echivalent cu suma de bani.
30,96K
Motivul pentru care discuția cu ChatGPT este admirabilă este că face o treabă excelentă în două puncte: în primul rând, condensează și reelaborează cu acuratețe opiniile, oferind spectatorilor o perspectivă clară și văzând clar logica de bază; Al doilea este să ai o gândire divergentă, enumerând o varietate de posibilități și soluții pentru a completa punctul mort inițial al gândirii.
În schimb, valoarea emoțională și compania sunt secundare. Ceea ce oamenii nu pot înlocui cu adevărat sunt aceste două abilități.
666
Agentul vertical este într-adevăr prea dificil de utilizat (reflexia laterală va fi foarte dificil de făcut), am folosit mem, citit, iar acum folosesc Get (cel făcut de Luo Yonghao, doar terminalul mobil și poate accesa doar intranetul, ceea ce este cu adevărat chinuitor), fiecare are un mic prag pentru a începe și nu există nicio modalitate de a importa rețelele sociale personale cu un singur clic și este dificil să îți formezi obiceiuri de utilizare.
Recent, am descoperit că timpul meu de utilizare a GPT este aproximativ același cu cel al slack și google meet și simt profund că mica echipă de produs este mică în fața inteligenței generale. Echipele mici de produse concurează în esență pentru o fereastră de timp: dacă agentul de domeniu vertical cu adevărat "prag zero și ușor de utilizat" iese primul, fie că utilizatorii în masă se obișnuiesc să colaboreze cu agenți generici și să personalizeze mai întâi fluxurile de lucru.
2,65K
Oamenii fac lucruri de mult timp, înțeleg logica de a face lucrurile și optimizează modul în care fac lucrurile, nu numai pentru a îmbunătăți eficiența, ci mai important, pentru a deveni mai fericiți și mai sustenabili pentru a-și atinge obiectivele.
De exemplu, ceea ce am realizat recent:
1. Fii suficient de ambițios și încrezător (ridică-te în fiecare zi cu un obiectiv clar, dă impuls și nu te lăsa distras). )
2. Motivația ar trebui să fie suficient de pură (să te ajute să faci față atunci când obiectivul nu este atins/nu poți obține feedback pozitiv imediat, cum ar fi atunci când ești anxios din cauza traficului, îți vei aminti că obiectivul de astăzi a fost îndeplinit, iar expresia este să te prezinți sincer, nu doar pentru date. )
3. A face 2-3 lucruri legate și importante în același timp este mai ușor să formezi un cerc virtuos decât un singur lucru
(Dacă un lucru se blochează, treceți la altul și lăsați energia și cunoașterea să continue să curgă.) De exemplu, cititul/ascultarea podcasturilor mă poate ajuta să lucrez și să produc, așa că atunci când întâlnesc un punct blocat, ar trebui să mă calmez și să citesc mai întâi cartea pentru a stabili un ciclu auto-consistent în ceea ce privește emoțiile și cogniția. )
1,84K
De ce nu cred în rețelele sociale sub stimulente economice: Pentru că atâta timp cât ați folosit Douyin și ați experimentat plăcerea de a crea dependență adusă de analiza big data + algoritmii de trafic, veți înțelege că ceea ce își doresc cu adevărat creatorii sunt doar like-uri, comentarii, atenție și redirecționare, iar orice altceva este afiliat.
Sentimentul meu a fost întărit când l-am văzut pe Luo Zhenyu vorbind despre logica datelor Alibaba - platforma dorește să păstreze comercianții și creatorii, bazându-se pe sentimentul de controlabilitate și creștere adus de feedback-ul datelor și este foarte important să obții îndrumări precise + plăcerea interioară de a te îmbunătăți cu muncă grea. Este un pic ocolit, iar cei care înțeleg pot înțelege în mod natural.
6,46K
Flowith este ca un stagiar care nu este suficient de capabil și nu suficient de inteligent, dar vrea întotdeauna să facă mai mult, poate își poate mulțumi șeful. O copie de sarcină poate obține doar 60 de puncte și, înainte de a putea fi modificată, începe să fie ocupată cu generarea de imagini și coloane sonore și ratează deloc ideea.
Genspark este ca un orășel ca problemalist, bazându-se pe conținut pre-completat pentru a perfecționa sentimentul existenței pentru a obține o impresie bună, iar întrebările simulate sunt în regulă, dar răspunsul la fața locului este aproape lipsit de sens. Optzeci de puncte nu au accidentări dure și nu există puncte de memorie.
Dar Manus, chiar te voi lăuda. Nu numai că puteți șlefui fiecare sarcină, dar vă puteți aminti și ce am spus (baza de cunoștințe este atât de puternică încât vă va întreba "dacă doriți să o setați ca preferință" de fiecare dată când aveți nevoi suplimentare). Puteți chiar să spuneți "Încercați-l data viitoare...", la fel cum ați face cu un stagiar, și să-l adăugați la baza de cunoștințe cu un singur clic. Înțelege cineva acest sentiment de estompare a granițelor dintre AI și oameni?
Un manager de produs care se simte bine trebuie să fie un angajat/coleg bun atunci când este tânăr. Deși semnificația "muncii cu jumătate de normă" este adesea devalorizată în zilele noastre, numai atunci când ne-am gândit serios la cum să lucrăm împreună într-un grup putem înțelege cât de valoroase sunt cele mai elementare virtuți ale cooperării umane, cum ar fi "alinierea în sus și în jos, stânga și dreapta" și "înțelegerea intenției sarcinii". (Chiar nu este Manus, este doar un utilizator anual căruia îi plac evaluările)
3,1K
Manus este ca un nou stagiar care tocmai s-a alăturat companiei, dar a performat foarte bine și este foarte inteligent, cu cât îl folosește mai mult, cu atât îi place mai mult, cu atât îi place mai mult și vrea să-l împărtășească cu colegii tăi de fiecare dată când generează un rezultat. Din adâncul inimii mele, a nu mă enerva pe un agent este singurul criteriu pentru a judeca dacă produsul este bun sau nu
1,24K
Simt că nu este rău să faci o transmisiune live a versiunii de înscriere instantanee și să o vinzi bloggerilor self-media, în special pentru consultanță și chat, iar transmisiunea live filtrează un număr mare de oameni pentru capacitatea de răspuns la fața locului a oamenilor

orange.ai16 iul. 2025
După recenta explozie a software-ului de înșelăciune a interviurilor A16Z Investment
Cineva nu a mai putut suporta și a dezvoltat o alternativă mai bună, open-source, care pune confidențialitatea pe primul loc, Clueless
Dacă marketingul este prea fierbinte, se va întoarce împotriva lui, dar nu contează, 15 milioane de dolari au sosit deja
1,44K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante