Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Inversor en Crypto, TMT, AI, seguimiento de las tendencias tecnológicas más avanzadas, observación macropolítica y económica salvaje, investigación de liquidez de capital global, inversión de tendencia cíclica. Registre el aprendizaje y el pensamiento personal, a menudo comete errores y cae en el pozo y escala el pozo normalmente. Corredor🏃
¿Cómo mantener la continuidad económica en un mundo turbulento? El mundo está pasando de un orden dominado por reglas a uno dominado por la fuerza, y los conflictos geopolíticos solo aumentarán y se intensificarán en el futuro. A solo dos meses del inicio de 2026, deberíamos tener una profunda comprensión de esto. En este entorno, como individuos, especialmente para aquellos en países y personas profundamente atrapadas en el torbellino de conflictos: el cierre de bancos, la interrupción de canales de pago, el colapso de sistemas de identidad e incluso la destrucción de datos bancarios (como ocurrió el año pasado con el Banco Nacional de Irán) son cuestiones críticas. Cuando te das cuenta de que no puedes probar tu identidad, no puedes pagar, e incluso el sistema bancario presenta problemas, este es el problema de la continuidad económica. En este momento, la tendencia de los precios de los activos ya no es relevante; la clave es si la economía puede continuar.
Entonces, ¿cómo mantener la continuidad económica? Muchos países y equipos técnicos están explorando constantemente en este ámbito. Al buscar información sobre esto, vi que los Verifiable Credentials (Credenciales Verificables, abreviado VC) lanzados por sign son muy interesantes: no son otro juguete de blockchain llamativo, sino una solución real para la continuidad económica en tiempos de guerra.
Desglosémoslo un poco:
1) issuer (emisor): instituciones autorizadas como gobiernos, universidades, instituciones de salud, empresas, etc., que firman los certificados con una clave privada de una sola vez (por ejemplo, identidad de residente emitida por el estado, certificados de grado, registros médicos, pruebas de propiedad, licencias de conducir, acceso a CBDC, etc.).
2) Holder (titular): ciudadanos/usuarios que almacenan los certificados en su billetera móvil o billetera digital, controlando completamente su información.
3) Verifier (verificador): cualquier institución/servicio que necesite confirmar información (aeropuertos, bancos, empleadores, hospitales, etc.), que verifica localmente la firma + el estado de revocación, sin necesidad de contactar al emisor o subir datos a un servidor central. Esto también evita fallos de un solo punto.
La ventaja central de este diseño radica en la protección de la privacidad y la divulgación selectiva. Por ejemplo, un usuario puede probar que "tiene más de 18 años" sin revelar su fecha de nacimiento, o verificar que "tiene un título válido" sin revelar calificaciones específicas. Esto evita los riesgos de privacidad que conlleva la copia de datos y la difusión de registros en los sistemas tradicionales. Al mismo tiempo, los VC admiten la expansión a múltiples escenarios, incluyendo la propiedad inmobiliaria, licencias de conducir, pruebas de cumplimiento, e incluso la gestión de certificados de activos del mundo real (RWA). Esto también es una forma de "pasaporte en la cadena".
Equivale a que los Verifiable Credentials nos construyen una vía paralela que no depende de nadie: pueden asegurar que los pagos continúen, que la identidad se mantenga y que las actividades económicas no se detengan, en lugar de colapsar como en los sistemas físicos tradicionales.
En este sentido, los Verifiable Credentials buscan abordar un punto crítico: en tiempos de guerra, la soberanía "de repente se vuelve muy real", y es necesario asegurar que incluso si la infraestructura física se desmorona, la continuidad económica siga siendo inquebrantable.
Esta es también la razón por la que el Centro Blockchain de Abu Dabi, profundamente afectado por la situación en Irán, ha establecido una alianza estratégica con sign; Kirguistán, el país más cercano a Oriente Medio, está colaborando activamente con Digital Som para llevar a cabo un proyecto piloto de moneda digital del banco central; y el país africano de Sierra Leona está implementando la identidad de los residentes en la cadena a través de SignPass, para garantizar la soberanía del pueblo. Estos países han descubierto que depender de sistemas de datos centralizados durante crisis geopolíticas conlleva riesgos significativos. Todos están reflexionando y explorando cómo mantener la capacidad de continuidad económica en tiempos de agitación.
Por lo tanto, las elecciones de todos también serán cada vez más pragmáticas: no se trata de una lucha ideológica, ni de quién puede hacerlo mejor, sino de priorizar la capacidad de acceso seguro y evitar fallos de un solo punto.
Aunque es cruel, también debemos admitir que el caos es la forja de la era dorada de la soberanía distribuida. Quien logre hacerlo bien, obtendrá un mayor espacio. Desde este punto de vista, el futuro de los Verifiable Credentials es prometedor.
381
Recientemente descubrí que el campo de la evaluación de IA ha entrado en una fase de alta madurez y rápida iteración. Las pruebas de referencia tradicionales (como MMLU, HumanEval) tienden a estar saturadas, y la nueva generación de marcos y métodos se centra en la capacidad del mundo real (agente, uso de computadoras, razonamiento multimodal), rigor estadístico, cuantificación de la incertidumbre, seguridad/credibilidad y desafíos de contaminación/cola larga. Antes se probaban grandes modelos, ahora se prueba a los Agentes de IA. Estas plataformas ayudan a desarrolladores y empresas a realizar pruebas de fiabilidad, precisión, coste, seguridad y rendimiento de la IA a lo largo de toda la cadena, desde el desarrollo y la iteración hasta el despliegue en producción. Grok ha recopilado una lista de las plataformas de evaluación de IA más populares.


qinbafrank3 mar, 11:08
¿Cuáles son los aspectos clave para que las empresas implementen IA? A diferencia del uso de grandes modelos de IA o agentes de IA por parte de los consumidores, la implementación de IA en empresas requiere un entorno de producción de alta exigencia, con documentación densa y contexto, donde se necesita una alta precisión y una tasa de error lo más baja posible, incluso cero. Esto no se trata de hacer que la IA escriba poesía, chatee, genere imágenes o resuelva problemas matemáticos, sino de integrar realmente la IA en los procesos operativos y de producción de una empresa, permitiendo que la IA realice tareas complejas, tediosas y que requieren una precisión extremadamente alta que normalmente realiza una persona. Si no se puede determinar la precisión de la IA, será difícil para las empresas implementar la IA con confianza.
El Arena lanzado por SentientAGI es bastante interesante. Proporciona a estos agentes de IA tareas empresariales reales con un nivel de dificultad (o altamente realista), a través de estrictos criterios de evaluación (como precisión, integridad de la evidencia, tasa de alucinaciones, tasa de citas correctas, tiempo de finalización, entre otros), y luego registra sistemáticamente los patrones de fallo (como "fabricación de datos de la nada", "citas de fuentes incorrectas", "saltos en el razonamiento", "omisión de cláusulas clave"), para finalmente iterar continuamente y comparar públicamente para que los desarrolladores puedan ver las diferencias y mejorar.
En resumen, Arena no mide si "la IA es inteligente o no", sino si puede entender correctamente la intención y ejecutar tareas, en esencia, mide si esta IA puede realmente trabajar en grandes empresas, especialmente en aquellos procesos y etapas que son más difíciles de automatizar y donde es más fácil que ocurran problemas.
Desde esta perspectiva, Arena es una plataforma de competencia donde los desarrolladores envían agentes de IA a tareas estandarizadas y comparan resultados bajo condiciones de prueba consistentes. Es como un "torneo de agentes de IA", donde cada agente de IA compite de manera justa bajo las mismas reglas en el mismo escenario. Luego, la plataforma puede rastrear las categorías de fallos, como alucinaciones, falta de evidencia, citas incorrectas y brechas en el razonamiento, permitiendo a los desarrolladores diagnosticar problemas recurrentes.
Parece que Sentient espera que, a través de este enfoque, se impulse a la comunidad de código abierto a llevar la fiabilidad de los agentes de IA, el razonamiento en cadena largo y la auditabilidad a un entorno real donde las empresas se atrevan a implementarlo, y no solo se queden en la fase de demostración y puntuación en tablas de clasificación. Esto es lo que realmente puede ayudar a llevar la IA a un nuevo nivel SOTA (state-of-the-art, el más avanzado) en tareas de razonamiento empresarial en el mundo real.
Desde esta perspectiva, también se puede entender por qué grandes instituciones en el ámbito de la inversión financiera, como Franklin Templeton, Founders Fund, Pantera, OpenRouter, están dispuestas a colaborar, porque también están muy interesadas en este aspecto; lo que realmente les preocupa a las instituciones y empresas es si se atreverán a integrar la IA en sus procesos de toma de decisiones empresariales.
Sigo teniendo muchas expectativas sobre el progreso futuro de la plataforma Arena, que debería ser una parte muy clave de la hoja de ruta de "AGI abierta" que Sentient quiere promover.
116
Microsoft hoy está bastante firme

qinbafrank5 mar, 00:44
Microsoft también ha lanzado su propio agente de IA, Copilot Tasks, que debería considerarse un paso importante en la incursión de Microsoft en la "IA Agente". Finalmente, puede seguir el ritmo de empresas como OpenAI, Anthropic y Google. Sin embargo, en esta etapa, solo está disponible para un número limitado de usuarios, y se necesita unirse a la lista de espera para probarlo.
Según la demostración en el tweet de Nadella, Copilot Tasks debería estar profundamente integrado con Microsoft 365, pudiendo operar Outlook, Teams, Word, Excel, etc., y manejar tareas complejas de múltiples pasos (puede descomponer pasos → planificar → ejecutar → informar), enfatizando "de la respuesta a la acción".
Parece ser la versión de Microsoft de un "trabajador digital autónomo" dirigido a usuarios comunes y escenarios de oficina, elevando a Copilot de "asistente de chat" a "agente que puede ayudarnos a trabajar".
La semana pasada, al hablar sobre la dinámica de Microsoft, el PER ya había vuelto a su punto más bajo en diez años, entrando en un rango de relación calidad-precio. El lanzamiento de Copilot Tasks hace que esta relación calidad-precio parezca aún más atractiva. Este año, las grandes tecnológicas están acelerando la adopción de agentes de IA, y los escenarios de oficina y productividad son el enfoque principal de todas las empresas. En el ámbito de la productividad en la oficina, Microsoft tiene la mayor ventaja.

203
Parte superior
Clasificación
Favoritos