Объем данных — ключевой показатель для качества обучения ИИ, пока

ИИ

С достаточно большим набором данных модель-трансформер ИИ способна заменить, с некоторыми оговорками, специализированную шахматную программу. Ученые из Google DeepMind полагают, что это очередное подтверждение тому, что модель-трансформер является универсальной архитектурой, которую можно применять для решения любых задач. Недавние прорывные успехи в машинном обучении в основном объясняются масштабом: а именно большим числом параметров у моделей ИИ и наборами обучающих данных беспрецедентного объема и "неожиданными когнитивными способностями обучения". 

В статье, которую опубликовали исследователи из Google DeepMind, исследуется влияние масштабных моделей, обученных в игру в шахматы. В отличие от традиционных шахматных программ, которые полагаются на сложную эвристику, архитектурный поиск или комбинацию, исследователи обучили модель-трансформер с 270 млн параметров на наборе данных из 10 млн партий. Каждая партия в наборе данных была размечена символами действий, предоставленными традиционной шахматной программой Stockfish 16. Модель набрала 2895 баллов в рейтинге Эло против людей и оказалась способной решить серию сложных шахматных головоломок без каких-либо специфичных для предметной области настроек или явных алгоритмов поиска оптимального хода. Ученые провели систематическое исследование размера моделей и наборов данных, которое показывает, что высокие результаты в шахматах возникают только при достаточном масштабе как самой модели, так и обучающих данных. 

Эта работа дополняет быстро растущее число исследований,  показывающих, что сложные и изощренные алгоритмы могут быть преобразованы в модели-трансформеры. Таким образом, ученые в очередной раз показали, что модели-трансформеры и большим количеством параметров можно рассматривать не только как просто статистические распознаватели паттернов, но и как общий метод для создания мощных алгоритмов.

Однако, как отмечают авторы работы, даже очень масштабные модели-трансформеры, требующие гигантских вычислительных ресурсов, пока что показывают более слабые результаты, чем специализированные шахматные программы. 

Все проведенные эксперименты по масштабированию указывают на то, что в конечном итоге этот разрыв может быть устранен с помощью достаточно большой модели, обученной на достаточно огромном количестве данных. Однако текущие результаты не позволяют утверждать, что разрыв гарантированно получится преодолеть. 

Еще одно ограничение моделей-трансформеров, заключается в том, что они работают только с текущим состоянием игры, а не со всей историей сделанных ранее ходов. Это приводит к некоторым фундаментальным техническим ограничениям, которые невозможно преодолеть без специальных знаний, характерных для той или иной предметной области, на которую обучается модель.

Последние материалы

14:28, 13 декабря 2024, пятница
Обострение торгового давления США – как ответит Китай?

Власти КНР отреагируют более агрессивным образом в отношении США в случае введения новых импортных пошлин со стороны американских властей – в отличие от первого президентского срока Дональда Трампа. 

12:11, 13 декабря 2024, пятница
Россия – Пакистан: перспективы сотрудничества с акцентом на взаимодействии РФ с Глобальным Югом

Ряд направлений сотрудничества между Россией и Пакистаном являются перспективными как в плане потенциального улучшения экономических, так и внешнеполитических связей между двумя странами.

10:05, 12 декабря 2024, четверг
Финансовые рынки могут не справиться с ростом госдолгов – мировым ЦБ придется возобновить QE?

Выполнение планов по увеличению государственных заимствований в США и ряде других стран грозит дестабилизацией финансовых рынков, которые могут "не переварить" новый объем госдолга без поддержки центральных банков.

11:56, 11 декабря 2024, среда
Сирийский кризис – миграционные последствия для Европы

Приход к власти в Дамаске исламистских группировок и потенциальный распад страны уже провоцирует рост нестабильности в регионе. Вкупе с гуманитарным кризисом в Газе и Ливане сирийский вопрос предвещает и обострение миграционных проблем в ЕС.

12:00, 10 декабря 2024, вторник
Исламистский финал Сирии – новый виток хаоса на Ближнем Востоке

Падение правительства Башара Асада в Сирии и захват власти исламистскими группировками в различных регионах страны может привести страну к распаду по ливийскому сценарию. 

16:13, 9 декабря 2024, понедельник
Слабый рубль: "хороший" для экспортеров и спекулянтов, а какой для всех остальных?

Ослабление котировок российского рубля, ускорившееся в конце ноября, вполне наглядно продемонстрировало, что финансовый блок фактически самоустраняется от объяснений происходящего и не  видит рисков дальнейшего роста инфляции.

11:13, 9 декабря 2024, понедельник
Оплата российского газа в Европе – теперь не только в рублях, но и в валюте, и с взаимозачетами

Вместо реализации ранее заявленной стратегии по продаже российского газа за рубли недружественным странам, произошло смягчение требований к иностранным покупателям.

13:16, 6 декабря 2024, пятница
Франция под руководством Макрона: от кризиса к кризису

Из-за просчетов французского президента в стране обострился политический и финансовый кризис. Ключевые страны Европы в лице Франции и Германии вступают в 2025 год в ослабленном состоянии. 

12:40, 5 декабря 2024, четверг
Война в Мьянме – региональный кризис осложняет глобальные амбиции Китая

Затянувшийся военный конфликт в Мьянме и неспособность КНР разрешить данный кризис ставят под угрозу элементы "Одного пояса – Одного пути" в стране. 

11:50, 5 декабря 2024, четверг
13-й президент Южной Кореи не избежал "проклятия Cинего дома"

С момента разделения Корейского полуострова по 38-ой параллели северной широты только один южнокорейский лидер не оказался замешан в каком-либо скандале. Все остальные потеряли свою репутацию, свободу или жизнь, причем многие – досрочно. 

Наверх