Ученые Центра практического искусственного интеллекта Сбербанка в сотрудничестве с исследователями Института AIRI и «Сколтеха» создали «детектор качества». Этот инструмент определяет момент, когда сжатие информации для экономии памяти приводит к потере смысла и искажению данных нейросетью.
«Наш продукт работает как защитный механизм: мы научились автоматически выявлять порог, за которым экономия пространства становится причиной ошибок и снижает устойчивость модели. Для бизнеса это открывает новые горизонты надежности искусственного интеллекта, сокращая издержки и повышая точность решений», – рассказал директор Центра практического искусственного интеллекта Сбербанка Николай Тиден.
Современные большие языковые модели при работе с большими объемами данных, такими как длинные переписки и массивы документов, обычно используют весь доступный контекст. Однако этот подход эффективен только до определенного объема. При увеличении длины текста модель может сохранить начало и конец, но потерять важные фрагменты в середине, что приводит к искажению ответа. Один из популярных методов обработки больших объемов данных – сжатие информации с последующим переводом в векторные представления. Это снижает нагрузку на вычислительные ресурсы, но чрезмерное сжатие может вызвать необратимые искажения содержания.
«Детектор качества проверяет сжатые токены до их попадания в большую языковую модель. Если классификатор обнаруживает нарушение смысла, он не пропускает измененный контекст. В таких случаях система может использовать оригинальный несжатый текст или искать свежие документы», – уточнили разработчики.
Новый метод был применен при обновлении модели GigaChat Ultra.
Источник: ТАСС
