Google предлагает SPARQ-новый метод создания синтетического набора данных, который включает задачи с четко определенными шагами решения, чтобы модели могли учиться не только конечным ответам, но и процессу их получения.
Это помогает преодолеть ограничения, связанные с галлюцинациями, поверхностным запоминанием шаблонов, что часто встречается в LLM.
Метод также использует автоматизированные подходы для масштабируемого создания данных, минимизируя необходимость в дорогостоящей ручной разметке.

Google представил алгоритм создания синтетических данных для обучения рассуждениям LLM
Поделись с друзьями!