Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

aiko/acc
Produto e Marketing. AI @myshell_ai. Parceiro @FoliusVentures. As opiniões são minhas. DM está aberta.
Recentemente, ao experimentar o Particle News @particle_news, repensei o valor e os limites dos LLMs no cenário de fluxo de informações de negociação. O Particle é um produto de notícias AI muito refinado, que se destaca na amplitude e neutralidade da informação, bem como na legibilidade e auditabilidade do conteúdo fluido (liquid content). No entanto, essa experiência meticulosamente refinada apresenta uma divergência estrutural em relação aos sistemas de informação de negociação. Escrevo isso na esperança de que possa ajudar colegas que estão desenvolvendo produtos semelhantes.
1. A informação não é capturada e integrada, mas sim agrupada e compreendida.
O conceito de "story" que a fundadora Sara Beykpour enfatiza repetidamente em entrevistas é algo que eu concordo plenamente; é um dos seus principais destaques, enfatizando que a informação não é "capturada e integrada", mas sim "agrupada e compreendida". Se a informação for apenas capturada e encadeada sem reflexão, todas as classificações e avaliações de credibilidade a montante se tornam nebulosas. Especialmente em cenários de negociação, onde a densidade de informação é extremamente alta, a exigência de tempo real é forte e a amplitude do contexto é grande, não podemos permitir que um grande modelo "entenda livremente"; em vez disso, deve haver uma primeira rodada de agrupamento semântico estruturado pela IA, organizando informações fragmentadas em vários "clusters de eventos" (stories) compactos, com pistas causais internas.
2. Vantagens e pontos cegos dos LLMs: neutralidade, causalidade vs capacidade preditiva
- Os LLMs têm uma vantagem clara no controle de estilo/moderação e na neutralidade emocional/opiniões. No entanto, após agregação e muitas avaliações pós-evento, a atualidade e a tensão estrutural podem ser sacrificadas.
- Os LLMs são bons em fazer julgamentos de cadeias causais, análises de causa e efeito, extraindo nuances sobre se há correlações entre certos pontos, especialmente em relação a "caminhos de influência" e "reações a montante e a jusante", que se tornam uma lógica importante para a negociação.
- Os LLMs não são bons em prever. Como modelos de linguagem estatística, tendem a amplificar "opiniões predominantes" ou "sinais de alta frequência". Nossa própria observação é que a IA tende a ser "excessivamente otimista", enquanto o julgamento de Sara é: "Se muitas pessoas dizem que o time A vai ganhar, o modelo assume que o time A ganhou." A previsão é um grande ponto cego dos LLMs e não deve ser usada como um motor de sinal. Em contraste, produtos de chatbot de perguntas abertas e previsões, como o Tonghuashun Wencai ou o Bobby da Rockflow, ainda precisam ser observados para ver se conseguem superar essa limitação ou se permanecem presos.
3. Estratégias alternativas à previsão: cadeia causal + linha do tempo estrutural
Se a previsão é a fraqueza atual dos LLMs, em situações que não exigem previsão e têm alta exigência de atualidade, manter seções semelhantes ao calendário do tradingview e ao bloco de causa e efeito será muito útil. Inferir se um evento está relacionado a outro, bem como a ordem relativa de desenvolvimento dos eventos e os fatores desencadeadores. Esse tipo de julgamento é suficiente para construir um modelo de viés informacional para sistemas de negociação, sem a necessidade de previsão real.
4. Trabalho de avaliação:
a avaliação é absolutamente um trabalho muito refinado e direcionado. Por exemplo, restringir a forma de expressão: cada frase pode conter apenas um ponto de vista, evitando orações subordinadas; por exemplo, "sugerir" = "opinião", evitando conclusões ambíguas; por exemplo, o resumo não pode exceder X palavras, e uma vez que haja uma conotação subjetiva ou "expressão intencional", é considerado um erro. Claro, o grau de "criticidade" de cada unidade de conteúdo também é quantificado, para melhor permitir que o pipeline que será discutido a seguir funcione automaticamente. Todo o pipeline é assíncrono e executável de forma repetida: assim que a verificação de avaliação falhar, a tarefa é reiniciada automaticamente. Portanto, o modelo precisa completar apenas uma pequena tarefa a cada vez, como determinar se um evento ocorreu ou produzir um resumo sem conotações, em vez de completar toda a inferência e expressão em uma única rodada. A lógica subjacente a essa abordagem é dividir a geração em várias pequenas tarefas verificáveis e reutilizáveis, cada uma das quais pode ser verificada pela realidade, evitando ao máximo ilusões e tendências.
5. Da prototipagem à linha de produção de conteúdo AI de alta qualidade
Sara compartilhou o processo completo que eles utilizam para o sistema de moderação: primeiro, em um ambiente de teste, escrevem um prompt, definem cinco perguntas e, em seguida, quebram a estrutura ou esquecem o contexto, até que o modelo demonstre um comportamento estável e de boa qualidade, com prompts que podem ter várias centenas de linhas. Quando o prompt está inicialmente estável, ele é entregue à equipe técnica, que divide o modelo de prompt em componentes e os insere no pipeline assíncrono, executando todas as outras perguntas para análise offline. Finalmente, começam os testes de perguntas ao vivo, permitindo que o sistema funcione em cenários reais, momento em que a avaliação é formalmente incorporada.
Em resumo, se você deseja construir um sistema de agregação e envio de informações assistido por AI, não deve esperar que um grande modelo forneça diretamente um alpha; todas as tentativas de usar AI para prever qual ativo comprar são fraudes. O verdadeiro know-how está na estrutura, no processo e no sistema de verificação, tornando os LLMs confiáveis dentro dessa arquitetura.
3,02K
aiko/acc republicou
O padrão prático para medir a liberdade deve ser
se a sua compreensão do funcionamento das coisas está mais próxima da essência
se você está mais perto de recursos de alto valor
se o custo real de acessar recursos é relativamente baixo.
Isso não é completamente equivalente à quantidade de dinheiro.
24,42K
A razão pela qual conversar com o ChatGPT é tão irresistível é que ele se destaca em dois aspectos: primeiro, ele articula e reformula pontos de vista com precisão, oferecendo uma perspectiva clara de observador, permitindo ver a lógica subjacente; segundo, possui um pensamento divergente, listando várias possibilidades e soluções, preenchendo as lacunas do pensamento original.
Em comparação, o valor emocional e a sensação de companhia são secundários. O que os humanos realmente não conseguem substituir são essas duas habilidades.
660
Os agentes de nicho são realmente muito difíceis de usar (o que também reflete que é realmente difícil de fazer). Para agentes de conhecimento pessoal/anotações, usei o mem, readwise, e agora estou usando o Get (aquele feito pelo Luo Yonghao, que só está disponível em dispositivos móveis e só funciona na intranet, o que é realmente frustrante). Cada um tem um certo nível de dificuldade para começar, e não há como importar facilmente as redes sociais pessoais, tornando difícil formar um hábito de uso.
Recentemente, percebi que o tempo que uso o GPT é quase o mesmo que o do Slack e do Google Meet, e sinto profundamente a insignificância das pequenas equipes de produtos diante da inteligência geral. Não só você não consegue superar o GPT em termos de experiência geral, como também faz com que os usuários gastem mais tempo para desenvolver um hábito de uso. As pequenas equipes de produtos estão essencialmente competindo por uma janela de tempo: será que o seu verdadeiro "agente de nicho fácil de usar" será lançado primeiro, ou os usuários em geral se acostumarão a colaborar e personalizar fluxos de trabalho com agentes gerais?
2,64K
As pessoas que trabalham a longo prazo entendem a lógica do trabalho, otimizam os métodos de trabalho, não apenas para aumentar a eficiência, mas, mais importante, para se tornarem mais felizes e alcançarem seus objetivos de forma sustentável.
Por exemplo, o que percebi recentemente:
1. A ambição e a confiança devem ser grandes o suficiente (acordar todos os dias com um objetivo claro, ter motivação, não se distrair facilmente.)
2. A motivação deve ser pura o suficiente (ajuda a enfrentar a falta de realização dos objetivos ou a ausência de feedback positivo imediato, como a ansiedade em relação ao tráfego, lembrando-se de que o objetivo de hoje já foi cumprido, e que a expressão é para apresentar-se de forma autêntica, não apenas para os dados.)
3. Fazer 2-3 coisas relacionadas e importantes ao mesmo tempo é mais fácil de criar um ciclo positivo do que se concentrar em uma única tarefa (se uma tarefa estiver travada, mude para outra, permitindo que a energia e o conhecimento continuem fluindo. Por exemplo, ler um livro/ouvir um podcast pode ajudar no trabalho e na produção de conteúdo, então, ao encontrar um obstáculo, deve-se acalmar e primeiro ler um livro, estabelecendo um ciclo coerente em termos de emoção e cognição.)
1,83K
Por que não confio muito nas redes sociais impulsionadas por incentivos econômicos: porque assim que você usa o Douyin e experimenta pessoalmente a sensação viciante trazida pela análise de big data + algoritmos de tráfego, você entenderá que o que os criadores realmente desejam são apenas curtidas, comentários, seguidores e compartilhamentos; o resto é acessório.
Essa sensação foi reforçada quando assisti ao discurso de Luo Zhenyu sobre a lógica de dados da Alibaba - para reter comerciantes e criadores, a plataforma depende da sensação de controle e crescimento trazida pelo feedback dos dados; a capacidade de obter orientações precisas + o prazer interno de melhorar com esforço é realmente muito importante. Pode parecer um pouco confuso, mas quem entende, entende.
6,46K
Flowith é como um estagiário que não é muito inteligente, mas sempre quer fazer um pouco mais na esperança de agradar o chefe. Um texto de tarefa só consegue atingir 60 pontos, e antes mesmo de corrigir, já começa a se apressar em gerar imagens e músicas, sem conseguir focar no essencial.
Genspark é como um estudante de uma pequena cidade, que se destaca preenchendo conteúdos pré-definidos para ganhar atenção e simpatia. Faz bem as questões simuladas, mas tem um desempenho um pouco abaixo do esperado em situações reais. Oitenta pontos não têm falhas graves, mas também não deixam uma impressão marcante.
Mas Manus, eu realmente preciso te elogiar. Não só consegue aprimorar cada tarefa, como também se lembra do que eu disse (a funcionalidade da base de conhecimento é muito forte, sempre que há uma demanda extra, pergunta "você quer definir isso como preferência?"). Pode até agir como se estivesse orientando um estagiário, dizendo: "tente isso da próxima vez..." e então adiciona com um clique à base de conhecimento. Alguém mais entende essa sensação de uma IA e um humano com fronteiras borradas?
Parece que o gerente de produto da Good Agent deve ter sido um ótimo funcionário/colega quando era mais jovem. Embora esta era esteja sempre desvalorizando o significado de "trabalhar", só quem realmente pensou sobre como colaborar em um coletivo entende o quão valiosas são as virtudes humanas mais básicas, como "alinhar-se com os outros" e "compreender a intenção da tarefa". (Não é que Manus tenha um exército de fãs, é apenas um usuário anual que ama avaliações.)
3,09K
O Manus é como um estagiário que acabou de entrar na empresa, mas que se destaca e é muito inteligente; quanto mais o usas, mais gostas dele, e quanto mais o observas, mais aprecias. A cada resultado gerado, sentes vontade de compartilhar e elogiar com os teus colegas. É uma alegria genuína, e a única forma de avaliar se um produto é bom ou não é se um agente não fica irritado.
1,24K
Parece que vender uma versão de legendas em tempo real para streamers de mídia social também é uma boa ideia, especialmente para consultoria e bate-papo, já que as transmissões ao vivo exigem uma capacidade de reação rápida que elimina uma grande parte das pessoas.

orange.ai16/07, 05:37
Recentemente, após o sucesso do software de trapaça em entrevistas, cluely, que foi investido pela a16z,
algumas pessoas não conseguiram suportar e desenvolveram uma alternativa melhor, open-source e focada na privacidade, chamada clueless.
Um marketing excessivo pode ter consequências negativas, mas isso já não importa, pois 15 milhões de dólares já estão garantidos.
1,44K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável