Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cientistas sociais que trabalham com materiais que requerem digitalização só podem estudar o que as máquinas conseguem ler. Na prática, isso significa documentos impressos em script latino de arquivos bem financiados. Em um novo artigo de trabalho, mostro que os Modelos de Linguagem Visual usados em zero-shot superam todos os sistemas de OCR existentes em todos os scripts avaliados, e proponho um pipeline para implementá-los em novas coleções. Aplico isso a seis coleções arquivísticas que abrangem 1,8 milhões de páginas em seis países por menos de $1.900.

Top
Classificação
Favoritos
