Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Nu we bijna alle menselijke kennis hebben samengeperst in grote taalmodellen, is de volgende grens het aanroepen van tools. Het aan elkaar schakelen van verschillende AI-tools maakt automatisering mogelijk. De verschuiving van denken naar doen vertegenwoordigt de echte doorbraak in de bruikbaarheid van AI.
Ik heb meer dan 100 tools voor mezelf gebouwd, en ze werken meestal, maar niet altijd. Ik ben niet alleen. Het Economic Index-rapport van Anthropic onthult dat 77% van het zakelijke gebruik van Claude zich richt op volledige taakautomatisering, niet op co-pilotage.
Anthropic publiceerde vorige week documentatie over token efficiëntie en het herontwerpen van tools om hun gebruik te optimaliseren. De richtlijn was tegenintuïtief: in plaats van veel eenvoudige tools met duidelijke labels, creëer je minder, complexere tools.
Hier zijn de zeven e-mailtools die ik heb gebouwd - Ruby-scripts, elk met een duidelijk doel. Het "Safe Send Email"-script was ontworpen om te voorkomen dat de AI e-mails verstuurt zonder goedkeuring.
Mooi naïef, eenvoudig en duidelijk, zou een taalmodel deze niet moeten kunnen lezen en precies weten wat ik het vroeg te doen? Maar zo eenvoudig is het niet!
Anthropic raadt aan om complexe tools te creëren. Hun onderzoek toont aan dat "verzoeken gemiddeld 14% aan outputtokens besparen, tot 70%" wanneer gebruik wordt gemaakt van geavanceerde, parameter-rijke tools in plaats van eenvoudige. De reden? AI-systemen begrijpen de volledige context beter dan gefragmenteerde intentie.
Ik heb het weekend besteed aan het consolideren van al mijn tools in uniforme tools, zoals deze voor e-mail: (derde afbeelding)
De impact op de nauwkeurigheid was onmiddellijk. De succesratio van Claude benadert 100%. Het systeem is sneller. Als gevolg hiervan gebruik ik veel minder tokens met een efficiënter systeem.
Hier is mijn huidige mentale model: (vierde afbeelding)
Toen ik herontwierp voor AI-cognitie in plaats van menselijke intuïtie, verbeterde alles. Mijn CRM-operaties, kalenderbeheer en database-workflows werden allemaal betrouwbaarder toen ze werden geconsolideerd in uitgebreide, parameter-rijke tools. De nauwkeurigheid verbeterde, waardoor de totale kosten aanzienlijk werden verlaagd.
Maar vraag me niet om de tools te gebruiken. Ik ben nu een beetje verloren te midden van de complexiteit. Dit is een onvermijdelijk gevolg van werken op hogere abstractieniveaus, waarbij ik de machine niet langer diep begrijp.
We hebben tientallen jaren software eenvoudig gemaakt voor mensen. Nu leren we het complex te maken voor AI.



395
Net als ontbijt in een diner, is software goedkoop en snel te maken. Vraag om een nieuwe taakbeheertool en je hebt de eerste versie in minder tijd en voor minder geld dan een omelet.
AI-gebouwde tools overleven misschien niet lang. Sommige overleven slechts een paar minuten, lang genoeg om te antwoorden "Wat is onze doorlooptijd deze week?"
Andere blijven een paar dagen of weken nuttig, zoals een app die een lichte projecttracker kan opzetten voor de onboarding van Walmart. Soms blijven ze langer dan een maand bestaan.
Als permanentie de afgelopen twee decennia van software heeft gedefinieerd, kan impermanentie de volgende definiëren.
We zien nu drie lagen die zich vormen langs een continuüm:
Duurzame SaaS: langlevende registratiesystemen zoals een pipeline-dashboard.
Ephemerale Apps: kortlevende tools zoals de projecttracker voor de onboarding van Walmart.
Instant Vragen: eenmalige vragen zoals "Vertel me over het Apple-account."
In grote getale zullen ephemerale apps en instant vragen SaaS-toepassingen overtreffen, misschien miljoenen tegen één. De dopaminekick van directe probleemoplossing is verslavend en versnelt carrières.
Onder al deze toepassingen ligt een registratiesysteem, vaak een bestaand platform maar steeds vaker een nieuw.
Financiën- en operationele teams zijn afhankelijk van persistente dashboards voor governance en rapportage, alsof de definitie van een metric gestandaardiseerd kan worden binnen de organisatie. Marketeers zetten data-apps op die een paar maanden meegaan om hun betaalde uitgavenprestaties te analyseren, en supportteams stellen snelle vragen over de doorlooptijd voordat ze verder gaan.
De vertrouwde modellen, machtigingen en bedrijfslogica van een onderliggend BI-platform zoals @omni geven gebruikers vertrouwen om te experimenteren met ephemerale apps en instant vragen. Controle over de basis zorgt voor controle over de lagen erboven.
Dit ontwerppatroon strekt zich verder uit dan AI naar de meeste andere software.
Of je nu een koffie, een omelet of een vijf-gangenmaaltijd hebt, de volgende geweldige startup zal het allemaal serveren.

5,66K
Technologie begrijpen staat centraal in hoe we nieuwe theorieën onderzoeken. Als onderdeel van die inspanning begint Theory een team voor ontwikkelaarsrelaties.
Ontwikkelaarsrelaties voor durfkapitaal? Wat betekent dat?
Intern hebben we honderden agenten gebouwd, hebben we moeite gehad met het debuggen van toolaanroepen, grote actiemodellen getest en werken we elke dag met AI. We hebben evenementen georganiseerd over hoe je met AI kunt bouwen.
We willen graag terug bijdragen aan de gemeenschap met onze ervaringen en leren van andere bouwers.
Al onze workflows van het afgelopen decennium zijn plotseling veranderd. Onze bredere gemeenschap verkent welke nieuwe workflows mogelijk zijn en welke het beste zijn. Deze nieuwe inspanning is weer een stap in die richting.
Dus als je Mischa, onze nieuwe leider van de ontwikkelaarsrelaties, op een evenement ziet, zeg dan hallo! Hij heeft veel te delen!
698
Boven
Positie
Favorieten