في الآونة الأخيرة ، أثناء تجربة Particle News ، @particle_news إعادة التفكير في قيمة وحدود LLMs في سيناريو تدفق معلومات المعاملات. الجسيمات هو منتج أخبار الذكاء الاصطناعي المتطور للغاية يقوم بعمل ممتاز في اتساع نطاق المعلومات والحياد وقابلية قراءة المحتوى السائل والسمع. ومع ذلك ، هناك فرق هيكلي بين هذه التجربة المصقولة بدقة ونظام معلومات المعاملات ، ويتم تدوينها أولا لمعرفة ما إذا كان بإمكانها مساعدة الزملاء الذين يقومون أيضا بمنتجات مماثلة. 1. لا يتم التقاط المعلومات ودمجها ، ولكن يتم الفهم العنقودي. أتفق بشدة مع مفهوم "القصة" الذي أكدته مرارا وتكرارا المؤسس سارة بيكبور في المقابلات ، والتي تعد أيضا واحدة من النقاط البارزة الأساسية ، مع التأكيد على أن المعلومات ليست "مجمعة ودمجة" ولكنها "مجمعة ومفهومة". إذا كانت المعلومات مجرد كشط وتسلسل بلا عقل ، إلغاء جميع الطلبات النهائية وتقييم المصداقية. على وجه الخصوص ، في سيناريوهات المعاملات ، حيث تكون كثافة المعلومات عالية للغاية ، وتكون متطلبات الوقت الفعلي قوية ، ومدى السياق كبير ، من المستحيل السماح للنموذج الكبير "بالفهم بحرية" ، ولكن يجب أولا إجراء جولة من التجميع الدلالي المنظم بواسطة الذكاء الاصطناعي لتنظيم المعلومات المجزأة في عدة "مجموعات أحداث" مدمجة (قصص) مع أدلة سببية داخلية. 2. نقاط القوة والنقاط العمياء في LLM: الحياد والسببية مقابل القوة التنبؤية - تتمتع LLMs بمزايا كبيرة في التحكم في الأسلوب / الرأي ، وحيادية العاطفة في الاعتدال. ومع ذلك ، بعد البلمرة + العديد من ما بعد الإيفال ، يتم التضحية بالتوقيت والتوتر الهيكلي. - تعتبر LLMs جيدة في الحكم على السلسلة السببية ، وتحليل السبب والنتيجة ، وبعض النقاط لتحسين ما إذا كان هناك ارتباط بين الأشياء الدقيقة للغاية ، وخاصة "مسار التأثير" و "ردود الفعل الأولية والنهائية" ، والتي ستصبح واحدة من المنطق المهم للمعاملات. - LLMs ليست جيدة في التنبؤ. كنموذج لغوي إحصائي ، فإنه يضخم بشكل طبيعي "الآراء السائدة" أو "الإشارات عالية التردد". ملاحظتنا الخاصة هي أن الذكاء الاصطناعي دائما ما يكون "مفرطا في التفاؤل" ، وحكم سارة هو: "إذا قال الكثير من الناس إن الفريق أ سيفوز ، فسيعتقد النموذج أن الفريق أ فاز". "التنبؤ هو نقطة عمياء كبيرة لLLMs ولا ينبغي استخدامه كمحرك إشارة. من ناحية أخرى ، يبقى أن نرى ما إذا كانت منتجات chatbot مثل Flush أو تنبؤ Bobby's Bobby's Open End Q & A + يمكن أن يخترق هذا القيد أو أن تكون محاصرة. 3. استراتيجيات التنبؤات البديلة: السلسلة السببية + الجدول الزمني الهيكلي إذا كانت التنبؤات عيبا حاليا في LLMs ، فمن المفيد الاحتفاظ بأقسام مثل تقويم TradingView و Cause & Effect عندما لا يتم التنبؤ ويكون التوقيت مرتفعا. استنتاج ما إذا كان شيء ما مرتبطا بآخر والترتيب النسبي ومحفزات تطور الأحداث. هذا الحكم كاف أيضا لإنشاء نموذج تحيز المعلومات لنظام التداول دون تنبؤ حقيقي. 4. أعمال التقييم: التقييم هو بالتأكيد عمل مكرر وتوجيهي للغاية. على سبيل المثال ، يحد ضبط النفس من التعبير: يمكن أن يكون لكل جملة وجهة نظر واحدة فقط ، تجنب العبارات. على سبيل المثال ، "تلميح" = "رأي" لتجنب الاستنتاجات الغامضة. على سبيل المثال ، لا يمكن أن يتجاوز الملخص كلمة X ، وبمجرد وجود لون شخصي أو "تعبير مقصود" ، فإنه يعتبر خطأ. بالطبع ، يتم أيضا تحديد الدرجة "النقدية" لكل محتوى وحدة ، من أجل تشغيل خط الأنابيب تلقائيا بشكل أفضل. المسار بأكمله غير متزامن وقابل للتكرار: طالما فشلت عمليات التحقق من التقييم ، تتم إعادة تشغيل المهمة تلقائيا. لذلك ، يحتاج النموذج فقط إلى إكمال مهمة صغيرة في كل مرة ، مثل تحديد ما إذا كان الحدث قد وقع أو إخراج ملخص غير ضمني ، بدلا من إكمال كل الاستدلال والتعبير في جولة واحدة. المنطق الأساسي لهذا النهج هو تقسيم الجيل إلى مهام صغيرة متعددة يمكن التحقق منها وقابلة لإعادة الاستخدام ، يمكن فحص كل منها بشكل حقيقي لتجنب الهلوسة والميول إلى أقصى حد. 5. خط إنتاج كامل من النموذج الأولي إلى محتوى الذكاء الاصطناعي عالي الجودة تشارك سارة العملية الكاملة للقيام بنظام الإشراف: اكتب أولا مطالبة في بيئة اختبار ، وقم بتعيين خمسة أسئلة ، ثم كسر الحماية أو كسر الهيكل أو نسيان السياق ، حتى يظهر النموذج سلوكا مستقرا وعالي الجودة ، يمكن أن تكون المطالبة مئات الأسطر. عندما تكون المطالبة مستقرة في البداية ، يتم تسليمها إلى الفريق الفني ، ويتم تفكيك قالب المطالبة إلى مكونات ووضعها في خط الأنابيب غير المتزامن ، ويتم تشغيل جميع الأسئلة الأخرى للتحليل دون اتصال. أخيرا ، ابدأ اختبار الأسئلة المباشرة لتشغيل النظام في سيناريوهات حقيقية ، ثم انضم رسميا إلى التقييم. باختصار ، إذا كنت ترغب في بناء نظام تجميع ودفع معلومات بمساعدة الذكاء الاصطناعي ، فلا تتخيل النموذج الكبير الذي يعطي ألفا مباشرة. جميع التنبؤات التي تستخدم الذكاء الاصطناعي لإخبارك بالهدف الذي تريد شراؤه هي عمليات احتيال. الدراية الحقيقية هي الهيكل والعملية ونظام التحقق الذي يجعل LLMs موثوقا به في ظل الهندسة المعمارية.
‏‎3.38‏K