Pequeño pulpo @OpenledgerHQ ha actualizado una importante explicación sobre el mecanismo de prueba de atribución, que como siempre cubre algunos aspectos técnicos. No entiendo de tecnología, así que intentaré expresar mi comprensión y el significado práctico de este mecanismo de prueba de atribución de manera sencilla. Bienvenidos a los profesores que entienden de tecnología para intercambiar ideas. 🙋 Problemas existentes en la tradición: los modelos de lenguaje tradicionales utilizan n-gram (secuencias de palabras de longitud fija) para predecir la siguiente palabra, son rápidos pero carecen de contexto y no pueden rastrear el origen de las predicciones o los contribuyentes de datos. 📖 Explicación del mecanismo Infini-gram: el mecanismo de prueba de atribución (Proof of Attribution, PoA) de OpenLedger utiliza Infini-gram en lugar del tradicional n-gram, por lo que Infini-gram rompe las limitaciones de n-gram. Es un motor de coincidencia de tramos simbólicos de un marco de atribución ∞-gram (longitud infinita) basado en arreglos de sufijos, capaz de indexar secuencias de todas las longitudes en los datos de entrenamiento y soportar el rastreo en tiempo real de cada token en la salida del modelo, localizando con precisión su origen. Infini-gram apoya el sistema de prueba de atribución de OpenLedger, logrando un rastreo preciso desde la respuesta del modelo hasta los datos de entrenamiento, sin necesidad de acceder al interior del modelo, manteniendo la rapidez, transparencia y reproducibilidad. 👍 Significado práctico de este mecanismo: (interpretación personal, si hay problemas, bienvenidos a corregir) 1. Rastreabilidad precisa, transparente y confiable: Infini-gram permite rastrear la salida del modelo de IA palabra por palabra, indicándote de dónde proviene realmente la respuesta. Es como ponerle a la IA una "etiqueta de origen", haciendo que todo el proceso sea claro. Los usuarios pueden ver fácilmente qué dijo la IA y por qué lo dijo, con una transparencia total y un sistema de rastreo completo. 2. Reconocimiento justo a los contribuyentes de datos: para aquellos que proporcionan datos, Infini-gram puede identificar claramente qué datos ayudaron a la IA a generar la respuesta, permitiendo que los contribuyentes de datos finalmente sean vistos y reconocidos. Este enfoque hace que el ecosistema de IA sea más justo y puede motivar a más personas a compartir datos de calidad. 3. Escalabilidad + eficiencia equilibradas: el marco basado en arreglos de sufijos de Infini-gram puede rastrear el origen en tiempo real, sin importar el tamaño de los datos, maximizando la eficiencia. Además, no requiere cálculos de gradiente complejos, siendo simple y eficiente para escalar a escenarios de conjuntos de datos masivos. 4. Hacer que la IA sea más confiable y conforme: Infini-gram puede proporcionar a los modelos de IA una "identificación verificable", permitiendo que el contenido generado tenga un origen preciso. Esto no solo aumenta la confianza de los usuarios en la IA, sino que también satisface los requisitos regulatorios, ayudando a que la IA sea más conforme y ética. 🤔 Lo anterior son mis pensamientos e interpretaciones personales: actualmente, algunas personas realmente tienen la intención de guiar a la IA a cometer errores, inyectándole información errónea. Esta función del pequeño pulpo tiene un gran potencial práctico para ayudar a rastrear datos erróneos y corregir errores de la IA. Espero ver los resultados de la implementación de esta función en el futuro.
Openledger
Openledger10 jul, 20:45
OpenChat está impulsado por ti y diseñado para darte crédito. Cada mensaje que envías, conjunto de datos que compartes o modelo que ajustas se registra en la cadena. Con la Prueba de Atribución, tus contribuciones no solo se recuerdan. Se recompensan 🐙
21,94K