Little Octopus @OpenledgerHQ ha actualizado una importante explicación del mecanismo de prueba de atribución, que como siempre cubre algunos aspectos técnicos No sé de tecnología, así que solo puedo tratar de escribir mi comprensión y la importancia práctica de este mecanismo de prueba de atribución de una manera fácil de entender Los profesores que entiendan de tecnología son bienvenidos 🙋 El problema con la tradición: los modelos lingüísticos tradicionales utilizan n-gramas (secuencias de palabras de longitud fija) para predecir la siguiente palabra, lo cual es rápido pero carece de contexto para rastrear la fuente de la predicción o el contribuyente a los datos 📖Explicación del mecanismo Infini-gram: El mecanismo de prueba de atribución (PoA) de OpenLedger utiliza Infini-gram en lugar del n-grama tradicional, por lo que Infini-gram rompe las limitaciones del n-grama Es un motor de coincidencia de intervalos simbólicos basado en un marco de atribución de ∞ gramos (longitud infinita) basado en matrices de sufijos, que puede indexar secuencias de todas las longitudes en los datos de entrenamiento y admitir la trazabilidad en tiempo real de cada token en la salida del modelo para identificar su origen. Infini-gram es compatible con el sistema de prueba de atribución de OpenLedger, lo que permite un seguimiento preciso desde la respuesta del modelo hasta los datos de entrenamiento sin tener que acceder a las partes internas del modelo, manteniéndolo rápido, transparente y reproducible 👍 El significado práctico de este mecanismo: (interpretación personal, si hay un problema, bienvenido a corregir) 1. Trazabilidad precisa, transparente y fiable: Infini-gram admite el seguimiento de la salida del modelo de IA palabra por palabra, diciéndole de qué datos de entrenamiento proviene la respuesta Es como poner una "etiqueta de origen" en la IA para que todo el proceso quede claro. Los usuarios pueden saber lo que dijo la IA y por qué lo dijo de un vistazo, con total transparencia y un sistema de trazabilidad completo 2. Reconocimiento justo de los contribuyentes de datos: Para los contribuyentes que proporcionan datos, Infini-gram puede aclarar qué datos ayudan a la IA a generar la respuesta, y los contribuyentes de datos finalmente pueden ser vistos y reconocidos Este enfoque hace que el ecosistema de IA sea más justo e incentiva a más personas a compartir datos de alta calidad 3. Expandible + eficiente: el marco de Infini-gram basado en matrices de sufijos puede rastrear la fuente en tiempo real sin importar cuán grande sea la cantidad de datos, y la eficiencia es total Además, no requiere cálculos de gradiente complejos y se puede escalar a escenarios de conjuntos de datos masivos de manera simple y eficiente 4. Haga que la IA sea más confiable y cumpla con las normas: Infini-gram puede proporcionar una "tarjeta de identificación verificable" con un modelo de IA, lo que permite que el contenido de salida determine con precisión la fuente Esto no solo brinda a los usuarios más confianza en la IA, sino que también cumple con los requisitos regulatorios y hace que la IA sea más ética y conforme 🤔 Lo anterior es mi pensamiento e interpretación personal: en la actualidad, algunas personas tienen la intención de guiar a la IA para que cometa errores e inculque información y datos incorrectos, y esta función de Little Octopus tiene un gran escenario de aplicación práctica para ayudarlo a rastrear el origen de los datos de error y corregir los errores de la IA ¡Esperamos ver cómo funciona esta función en el futuro
Openledger
Openledger10 jul, 20:45
OpenChat está impulsado por ti y diseñado para darte crédito. Cada mensaje que envías, conjunto de datos que compartes o modelo que ajustas se registra en la cadena. Con la prueba de atribución, tus contribuciones no solo se recuerdan. Son recompensados 🐙
21.94K