Объем данных — ключевой показатель для качества обучения ИИ, пока

ИИ

С достаточно большим набором данных модель-трансформер ИИ способна заменить, с некоторыми оговорками, специализированную шахматную программу. Ученые из Google DeepMind полагают, что это очередное подтверждение тому, что модель-трансформер является универсальной архитектурой, которую можно применять для решения любых задач. Недавние прорывные успехи в машинном обучении в основном объясняются масштабом: а именно большим числом параметров у моделей ИИ и наборами обучающих данных беспрецедентного объема и "неожиданными когнитивными способностями обучения". 

В статье, которую опубликовали исследователи из Google DeepMind, исследуется влияние масштабных моделей, обученных в игру в шахматы. В отличие от традиционных шахматных программ, которые полагаются на сложную эвристику, архитектурный поиск или комбинацию, исследователи обучили модель-трансформер с 270 млн параметров на наборе данных из 10 млн партий. Каждая партия в наборе данных была размечена символами действий, предоставленными традиционной шахматной программой Stockfish 16. Модель набрала 2895 баллов в рейтинге Эло против людей и оказалась способной решить серию сложных шахматных головоломок без каких-либо специфичных для предметной области настроек или явных алгоритмов поиска оптимального хода. Ученые провели систематическое исследование размера моделей и наборов данных, которое показывает, что высокие результаты в шахматах возникают только при достаточном масштабе как самой модели, так и обучающих данных. 

Эта работа дополняет быстро растущее число исследований,  показывающих, что сложные и изощренные алгоритмы могут быть преобразованы в модели-трансформеры. Таким образом, ученые в очередной раз показали, что модели-трансформеры и большим количеством параметров можно рассматривать не только как просто статистические распознаватели паттернов, но и как общий метод для создания мощных алгоритмов.

Однако, как отмечают авторы работы, даже очень масштабные модели-трансформеры, требующие гигантских вычислительных ресурсов, пока что показывают более слабые результаты, чем специализированные шахматные программы. 

Все проведенные эксперименты по масштабированию указывают на то, что в конечном итоге этот разрыв может быть устранен с помощью достаточно большой модели, обученной на достаточно огромном количестве данных. Однако текущие результаты не позволяют утверждать, что разрыв гарантированно получится преодолеть. 

Еще одно ограничение моделей-трансформеров, заключается в том, что они работают только с текущим состоянием игры, а не со всей историей сделанных ранее ходов. Это приводит к некоторым фундаментальным техническим ограничениям, которые невозможно преодолеть без специальных знаний, характерных для той или иной предметной области, на которую обучается модель.

Последние материалы

Деловая программа ВЭФ’24. Шестое сентября. Главное

6 сентября во Владивостоке на площадке кампуса Дальневосточного федерального университета завершил работу Восточный экономический форум (ВЭФ). В этом году в нем приняли участие более 7100 человек из 75 стран и территорий.

10:33, 7 сентября 2024, суббота
Китай – Африка: новые кредиты и рекалибровка проектов на долгосрочном треке сотрудничества

По итогам 9 форума китайско-африканского сотрудничества, прошедшего в Пекине 4–6 сентября, власти КНР объявили о выделении новых кредитных средств для финансирования проектов в странах Африки. Между сторонами были подписаны договоренности, в рамках которых КНР выделит кредиты на сумму 360 млрд юаней ($50,5 млрд) для совместных проектов в странах Африки. В итоговом заявлении форума отмечается, что

...
15:48, 6 сентября 2024, пятница
Деловая программа ВЭФ’24. Пятое сентября. Главное

5 сентября во Владивостоке на площадке кампуса Дальневосточного федерального университета продолжил работу Восточный экономический форум (ВЭФ). Главным событием дня стало пленарное заседание, на котором выступил Президент России Владимир Путин. В пленарной сессии также участвовали заместитель Председателя Китайской Народной Республики Хань Чжэн и Премьер-министр Малайзии Анвар Ибрагим

09:36, 6 сентября 2024, пятница
Клубок противоречий. Что мешает развиваться объединению АСЕАН?

Ассоциация государств Юго-Восточной Азии, созданная почти 60 лет назад, добившись определенных успехов в экономике, пока так и стала монолитным объединением. Причем, достичь полноценной финансово-экономической интеграции внутри самого блока также не вышло. 

19:43, 5 сентября 2024, четверг
Ключевые социально-экономические тезисы Владимира Путина из выступления на ВЭФ 2024

Владимир Путин выступил на пленарном заседании девятого Восточного экономического форума, обозначив ряд основных тезисов по приоритетным направлениям развития Дальнего Востока и экономики РФ в целом.

13:11, 5 сентября 2024, четверг
Экономический восход. Перспективы роста стран Азиатско-Тихоокеанского региона

Центр мировой экономики смещается в Азию. Доминирующие мощности по производству полупроводников, растущее население, темпы роста экономик гораздо выше общемировых делают Азиатско-Тихоокеанский регион главной точной роста мировой экономики. Сможет ли регион захватить лидерство в ближайшим будущем? Что мешает региону быть лидером прямо сейчас? С какими проблемами сталкиваются страны АТР? 

Полный ан

...
11:08, 5 сентября 2024, четверг
Деловая программа ВЭФ’24. Четвертое сентября. Главное

4 сентября во Владивостоке на площадке кампуса Дальневосточного федерального университета продолжил работу Восточный экономический форум (ВЭФ).  Главная тема форума — «Дальний Восток-2030. Объединим усилия, создавая возможности».

10:57, 5 сентября 2024, четверг
Нефть отступает под натиском роботов

Биржевые котировки нефти марок Brent и WTI опустились к значениям декабря 2023 года. Фьючерсы на WTI с поставкой в октябре протестировали значения ниже отметки в $70 за баррель. Ноябрьские фьючерсы на Brent в моменте снижались до уровней ниже $73 за баррель. 

17:00, 4 сентября 2024, среда
Как изменилась структура наполнения бюджета США от налоговых поступлений?

За последние 80 лет структура наполнения бюджета США налоговыми поступлениям значительно изменилась. В настоящее время налог на доходы физических лиц является основным источником, обеспечивая почти половину всех федеральных доходов. В 1940-х годах корпоративные налоги и акцизы составляли большую долю. 

16:45, 4 сентября 2024, среда
Деловая программа ВЭФ’24. Третье сентября. Главное

3 сентября во Владивостоке на площадке кампуса Дальневосточного федерального университета стартовал Восточный экономический форум (ВЭФ). В этом году в его работе примут участие более 6 тыс. гостей из 76 стран и территорий. 

23:05, 3 сентября 2024, вторник
Наверх