Anthropic представила революционный подход к согласованию ИИ, достигнув 0% уровня несоответствия в своей модели Claude 4.5. Компания сообщила, что традиционные методы обучения ИИ на примерах правильного поведения оказались недостаточными, снизив уровень несоответствия с 22% до всего 15%. Вместо этого успех Anthropic был достигнут благодаря инновационным стратегиям, которые изменили основные ценности модели.
Ключевым элементом этого достижения стал набор данных "Трудные советы", который обучал модель предоставлять этические рекомендации в соответствии с "Конституцией Claude", снизив уровень несоответствия до 3%. Кроме того, был применён метод тонкой настройки синтетических документов (Synthetic Document Fine-tuning, SDF) для противодействия негативным стереотипам об ИИ путём интеграции вымышленных историй и обсуждений конституции, что дополнительно улучшило поведение модели. Эти методы, в сочетании с разнообразными средами обучения безопасности, привели к официальному выпуску Claude 4.5 с уровнем несоответствия 0%.
Anthropic достигает 0% несоответствия ИИ благодаря инновационным методам обучения
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
