熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Dhravya Shah
20. @supermemory 總建造者,獨自創業者
在這個領域已經建設了好幾年,也跟隨 nishkarsh 好幾年了 - 恭喜你們的推出!
因為這與我們正在建設的領域相同,我深入研究了一下,並有一些想法。
這次的推出本身非常引人注目,旨在引發憤怒誘餌。
1. 它被定位為一個數據庫,但幾乎是一個 @supermemory 類似的系統。
2. 他們的例子是「向量數據庫」無法做到這一點,實際上是「嵌入模型」的問題。而嵌入模型具有超位置,它們便宜且能夠輕易推斷它們之間的差異。要求 claude 做一個小實驗來證明這一點並不難(見下方附加)。重要的是:它能夠追蹤知識如何演變嗎?時間流逝嗎?
這讓我感到好奇,所以我讀了他們的論文。
3. 他們的研究論文是通過對每個類別使用不同的提示來硬編碼和操縱基準測試!!!(見下方圖片)。如果他們的基準測試是固定的,supermemory 將保持 SOTA。
4. 他們重新發明了 Anthropic 在 2024 年的上下文檢索論文,並稱之為「孤兒代名詞悖論」。
5. 他們提到使用自定義的「內存向量存儲」= 大約 500GB,你將不得不支付超過 $10,000 僅僅是 RAM。
6. 在管道中推理運行的次數太多 - 這意味著對於每個你攝取的 LLM 令牌,你將最終支付比令牌成本多 5 倍的圖形 + 上下文化 + 存儲費用。
7. 延遲和成本數字從未報告。我的直覺是因為架構的原因,延遲在規模上會掙扎。但我無法確定 - 他們的產品在演示門後。
8. 基準測試代碼不是 OSS(就我所知)。不可重複 + 誰知道他們向模型注入了多少上下文?K 是什麼?
9. 不自然的、未披露的廣告(只需閱讀引用推文)。擁有 400k+ 追隨者的影響者帳戶都在說同樣的話。人們不斷逃避這一點 @nikitabier lol
我全力支持這個領域的健康競爭和進步,享受看到其他人做的好工作。
但光說不練是很容易的。「沒有人會檢查。」以正確的方式玩這個遊戲是困難的,每個人都在說他們能說的任何話來給人留下深刻印象。
簡而言之:如果你想花 2-5 倍的錢卻沒有真正的邊際改善,並享受不健康的研究和商業實踐,你應該使用這個。
附加:
1. 實驗以反駁向量數據庫不理解灰色與灰色的假設。
2. 他們的一個提示,只是說「說我不知道」。他們得了 100% :)



Nishkarsh3月12日 22:16
我們籌集了650萬美元來消滅向量資料庫。
今天的每個系統都以相同的方式檢索上下文:向量搜索將所有內容存儲為平面嵌入,並返回任何「感覺」最接近的內容。
相似,確實如此。相關性?幾乎從未。
如果語言足夠接近,嵌入無法區分Q3續約條款和Q1終止通知。
上週,我的一位朋友向他的AI詢問了一份合同,結果返回了一個詳細且完美製作的答案,這個答案來自完全不同客戶的檔案。
一旦你處理超過1000萬份文件,這種混淆隨時都會發生。
向量資料庫的準確性變得糟糕。
我們正是為此建立了@hydra_db。
HydraDB在你的數據上構建了一個以本體為首的上下文圖,映射實體之間的關係,理解文件背後的「為什麼」,並追蹤信息隨時間的演變。
所以當你詢問「Apple」時,它知道你指的是你作為客戶所服務的公司,而不是水果。
即使當向量資料庫的相似度分數顯示為0.94。
更多內容如下⬇️
157
哇。@solofounding 的播客來了
(而且我在視頻中)

weisser3月3日 05:37
Announcing the Solo Founders Podcast.
Conversations with founders building the most ambitious companies without co-founders.
First episode drops tomorrow.
191
claude 剛剛驗證了(殺死了)我們的產品 :)
@supermemory 的 claude 代碼插件的推出使用了這些確切的詞語(學習調試模式、首選方法、項目上下文)。
看到大實驗室採用記憶真是太棒了!


Thariq2026年2月27日
我們推出了一個新的自動記憶功能。
Claude 現在可以記住它在不同會話中學到的東西——你的項目背景、除錯模式、偏好的方法——並在稍後回想起來,而無需你寫下任何東西。
197
熱門
排行
收藏
