Comparativa completa de 4 soluciones para ahorrar tokens en el procesamiento de corpus Markdown de cientos de miles de palabras con un Modelo de Lenguaje Grande
Recientemente recibí una consulta muy típica: un usuario quiere "destilar" cientos de miles de palabras de un escritor experto para que un Modelo de Lenguaje Grande adopte su estilo, pero no sabe cuál es la forma más rentable de introducir el corpus en Markdown. Las tres estrategias comunes son: subir los archivos uno a uno…
