Émergence et utilisation des données onchain de CEX Déballage de la discussion @ETHCC par @hildobby de @dragonfly_xyz, alias la principale source de jeux de données et de tableaux de bord disponibles sur @Dune 📊 Aperçus critiques *ET* un bonus 🎁 à la fin de ce fil 🧶
Pourquoi cette discussion ? Les données des CEX sont sous-exploitées sur la chaîne. Il est difficile de savoir ou de dire ce qui se passe dans un CEX d'un point de vue on-chain où tout est censé être accessible et ouvert. Hildobby va essayer de relier les points (adresses et tokens) et de maintenir l'ensemble de données.
En dehors de la sécurité, de la preuve de réserves, etc., les données onchain des CEX sont en réalité au cœur de nombreux autres ensembles de données. Notamment, les flux de staking et d'ETF sont très précieux, surtout lors des grandes fluctuations du marché.
Au lieu d'utiliser des adresses signalées, Hildobby suit les données on-chain directement en taguant et en détectant automatiquement les adresses. Quelques heuristiques comme " @BlackRock utilisera @CoinbaseInsto comme dépositaire" nous permettent de trianguler qui fait quoi.
L'approche de tagging est multiple. Elle commence par comprendre comment fonctionnent les CEX sur la chaîne. Le financement des frais de transaction ou les allers-retours entre adresses permettent de prédire des comportements sur les graphes d'adresses onchain.
Par exemple, concentrons-nous sur les tokens : ils nécessitent un financement en gaz vers l'adresse de dépôt lorsque le CEX n'utilise pas de comptes intelligents dédiés pour gérer la consolidation.
Les adresses CEX peuvent être classées en 4 catégories principales (assez explicites) - Portefeuille chaud, Portefeuille froid, Fournisseur de gaz, Récepteur de gaz excédentaire. Quelques autres catégories apparaissent pour des comportements plus sophistiqués. Ce n'est pas parfait bien sûr en raison d'interactions aléatoires ou de tentatives de tromperie volontaires/involontaires comme certains dépôts (trop petits ?) qui ne sont jamais consolidés.
La liste d'adresses émerge donc des détections de motifs, de multiples correspondances et d'une validation supplémentaire provenant de diverses sources comme @herd_eco, @nansen_ai et @arkham.
La maintenance est dirigée par la communauté même si la plupart des contributions (99% ?) proviennent de @hildobby_
D'accord, donc maintenant que nous avons les adresses CEX, que pouvons-nous en faire ? Extrapolons ces données dans plusieurs autres ensembles de données, re-flux, crosslayers, etc.
Bien sûr 🪡 les aiguilles dans les meules de foin de la blockchain sont des adresses de dépôt. L'approche pour les trouver implique 8 étapes :
Dans l'ensemble, en juin 2025, plus de 350 CEX et 92 millions d'adresses de dépôt ont été trouvés. Combien en manquent est bien sûr un "inconnu inconnu", mais au moins cela nous donne une limite inférieure.
Les mettre en perspective montre plusieurs histoires intéressantes, comme l'ère de @Poloniex, la chute de @FTX_Official, l'essor de @coinbase, @HTX_Global et bien sûr @binance qui engloutit une énorme part du marché.
L'activité des CEX représente une part considérable des activités onchain. Environ ~25 % de toutes les transactions sur #Ethereum L1 impliquent une adresse CEX.
Cela se traduit par des frais payés au réseau. Les CEX représentent environ 10 % des frais totaux payés sur Ethereum L1…
…tandis que leurs utilisateurs représentent environ 5 % des frais totaux sur Ethereum L1. L'activité CEX entrant et sortant représente donc environ 15 % des frais sur le mainnet. 💰
Adresses de financement : 85,5 % des adresses Ethereum sont financées par un transfert initial provenant d'un CEX. Pour le reste, le financement provient d'adresses déjà financées, éventuellement par le biais de ponts, de staking ou de mining avant le PoS. Cela est crucial à mon avis en ce qui concerne l'adoption, le point d'entrée du réseau est un CEX. Nous avons terminé avec les jours où quiconque possédant un GPU pouvait obtenir une portion d'ETH par le mining. Les CEX ont un rôle clé à jouer dans l'adoption.
En ce qui concerne l'adoption, il y a beaucoup de choses que le dApp peut tirer de ces ensembles de données. La catégorisation des utilisateurs, comme "la majorité de mes utilisateurs vient-elle de Kraken ?", peut aider à mieux cibler les campagnes d'acquisition et les partenariats avec les CEX.
L'autre côté du spectre des EXchanges - le DEX. @BNBCHAIN a écrasé la part de marché du volume DEX en faisant récemment acheminer le volume de Binance vers le DEX sur BNB. L'opération s'appelle DEX sur CEX et nous pouvons nous attendre à ce que d'autres acteurs fassent de même bientôt (salut @base ? @inkonchain ?).
Cette tendance a créé beaucoup d'activités d'arbitrage, ce qui à son tour augmente encore plus la part de marché (en volume) de BNBchain.
Vous voulez jouer ? Trouvez le jeu de données ci-dessous :
Pour consulter tous les graphiques CEX, rendez-vous sur : Vous pouvez notamment jeter un œil à l'activité récente sur CEX après le rallye post @ethcc dans le prix de $ETH.
Pour des retours et des suggestions, n'hésitez pas à contacter @hildobby_ par DM. L'accent est principalement mis sur les EVM, car c'est le standard de facto pour l'activité on-chain. Dans un avenir proche, l'expansion des ensembles de données est un excellent cas d'utilisation de l'IA. Un clin d'œil à @Dune, @arkham et @KaikoData pour avoir donné à hildobby un avant-goût des données CEX en 2019.
@EthCC @hildobby_ @Dune @arkham @KaikoData Quelle est la suite ? Les ponts et les données d'interopérabilité. c'est le prochain sujet brûlant pour @hildobby_ et il cherche de l'aide. Envoyez-lui un DM ! Il est en train de préparer quelque chose.
@EthCC @hildobby_ @Dune @arkham @KaikoData Passons maintenant au bonus 🎁 Ce serait génial d'avoir le flux net de $ETH sur les CEX et le suivi de l'AUM sur l'actif natif #Ethereum. C'est exactement ce que fait cette nouvelle requête @Dune (toujours en cours 🤖) :
@EthCC @hildobby_ @Dune @arkham @KaikoData Regardez l'intégralité de la présentation ici :
12,23K