Представлена новая структура под названием Parallel Latent Reasoning (PLR), предназначенная для улучшения систем последовательных рекомендаций за счёт одновременного исследования нескольких траекторий рассуждений. Этот подход решает ограничения существующих методов глубоких последовательных рекомендаций, создавая параллельные потоки рассуждений с обучаемыми триггерными токенами и применяя глобальную регуляризацию рассуждений для обеспечения разнообразия. Структура PLR адаптивно объединяет результаты через агрегацию смеси потоков рассуждений.
Обширные эксперименты показали, что структура PLR значительно превосходит современные передовые базовые модели при сохранении эффективного вывода. Теоретический анализ дополнительно подтверждает её улучшенную способность к обобщению, что знаменует собой значительный прогресс в области последовательных рекомендаций.
Новая платформа улучшает системы последовательных рекомендаций
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
