Параллельное скрытое рассуждение для улучшения последовательных рекомендаций

Представлена новая структура под названием Parallel Latent Reasoning (PLR), предназначенная для улучшения систем последовательных рекомендаций за счёт одновременного исследования нескольких траекторий рассуждений. Этот подход решает ограничения существующих методов глубоких последовательных рекомендаций, создавая параллельные потоки рассуждений с обучаемыми триггерными токенами и применяя глобальную регуляризацию рассуждений для обеспечения разнообразия. Структура PLR адаптивно объединяет результаты через агрегацию смеси потоков рассуждений. Обширные эксперименты показали, что структура PLR значительно превосходит современные передовые базовые модели при сохранении эффективного вывода. Теоретический анализ дополнительно подтверждает её улучшенную способность к обобщению, что знаменует собой значительный прогресс в области последовательных рекомендаций.