Объем данных — ключевой показатель для качества обучения ИИ, пока

ИИ

С достаточно большим набором данных модель-трансформер ИИ способна заменить, с некоторыми оговорками, специализированную шахматную программу. Ученые из Google DeepMind полагают, что это очередное подтверждение тому, что модель-трансформер является универсальной архитектурой, которую можно применять для решения любых задач. Недавние прорывные успехи в машинном обучении в основном объясняются масштабом: а именно большим числом параметров у моделей ИИ и наборами обучающих данных беспрецедентного объема и "неожиданными когнитивными способностями обучения". 

В статье, которую опубликовали исследователи из Google DeepMind, исследуется влияние масштабных моделей, обученных в игру в шахматы. В отличие от традиционных шахматных программ, которые полагаются на сложную эвристику, архитектурный поиск или комбинацию, исследователи обучили модель-трансформер с 270 млн параметров на наборе данных из 10 млн партий. Каждая партия в наборе данных была размечена символами действий, предоставленными традиционной шахматной программой Stockfish 16. Модель набрала 2895 баллов в рейтинге Эло против людей и оказалась способной решить серию сложных шахматных головоломок без каких-либо специфичных для предметной области настроек или явных алгоритмов поиска оптимального хода. Ученые провели систематическое исследование размера моделей и наборов данных, которое показывает, что высокие результаты в шахматах возникают только при достаточном масштабе как самой модели, так и обучающих данных. 

Эта работа дополняет быстро растущее число исследований,  показывающих, что сложные и изощренные алгоритмы могут быть преобразованы в модели-трансформеры. Таким образом, ученые в очередной раз показали, что модели-трансформеры и большим количеством параметров можно рассматривать не только как просто статистические распознаватели паттернов, но и как общий метод для создания мощных алгоритмов.

Однако, как отмечают авторы работы, даже очень масштабные модели-трансформеры, требующие гигантских вычислительных ресурсов, пока что показывают более слабые результаты, чем специализированные шахматные программы. 

Все проведенные эксперименты по масштабированию указывают на то, что в конечном итоге этот разрыв может быть устранен с помощью достаточно большой модели, обученной на достаточно огромном количестве данных. Однако текущие результаты не позволяют утверждать, что разрыв гарантированно получится преодолеть. 

Еще одно ограничение моделей-трансформеров, заключается в том, что они работают только с текущим состоянием игры, а не со всей историей сделанных ранее ходов. Это приводит к некоторым фундаментальным техническим ограничениям, которые невозможно преодолеть без специальных знаний, характерных для той или иной предметной области, на которую обучается модель.

Последние материалы

Миллионы потерянных баррелей: рекордный разрыв в прогнозах ОПЕК+ и МЭА


Между ведущими организациями и агентствами на нефтяном рынке усиливаются разногласия относительно дальнейшей динамики мирового спроса на нефть.

19:35, 12 сентября 2024, четверг
Что происходит с ценами на нефть?

Несмотря на определенную стабилизацию в последние несколько дней, биржевые цены на нефть в целом остаются под серьезным давлением. В начале сентября котировки нефти марок Brent и WTI протестировали свои наиболее низкие значения с начала 2021 года – фьючерсы опускались ниже отметок в $70 и $66 (в рамках внутридневных торгов – прим. ред.) за баррель, соответственно. При этом еще в июле этого года би

...
17:02, 12 сентября 2024, четверг
Трамп или Харрис: влияние нового президента США на курс доллара

До президентских выборов в США в настоящее время остается несколько месяцев, при этом до начала цикла смягчения монетарного курса американским ЦБ остались считанные дни.

09:49, 12 сентября 2024, четверг
Китайские компании рентабельнее европейских?

В начале сентября эксперты ЕЦБ опубликовали доклад со сравнительным анализом изменения конкурентоспособности компаний стран еврозоны и Китая. В докладе отмечается, что за последние несколько лет произошло заметное ухудшение показателей рентабельности продукции, которая производится на территории зоны евро. Наиболее серьезная утрата конкурентоспособности была отмечена по сравнению с Китаем.  

19:10, 11 сентября 2024, среда
Новая IT-реальность Европы – штрафы и запреты вместо инноваций

Европейские страны всё более активно прибегают к ограничениям и карательным мерам в сегменте информационных технологий и промышленности в целом, теряя при этом способность к конкуренции с Китаем и США.

17:01, 11 сентября 2024, среда
Прогноз: ЦБ РФ сохранит процентную ставку на текущем уровне

Банк России возьмет паузу в ужесточении денежно-кредитной политики и не станет повышать ставку на заседании совета директоров 13 сентября. Данного мнения придерживается большинство экспертов Института изучения мировых рынков. Решение о сохранении прежнего уровня ставки, вполне вероятно, будет сопровождаться умеренно-жесткой риторикой о готовности к дальнейшему ужесточению монетарной политики в слу

...
17:48, 9 сентября 2024, понедельник
Закат Volkswagen – "народный автомобиль" потерял обороты

Немецкое автомобилестроение, как и промышленный сектор Европы в целом пребывают в кризисном положении, компании вынуждены закрывать производство в ЕС из-за нерентабельности.

11:19, 9 сентября 2024, понедельник
Рубли на рупии: на пути создания платежной системы для торговли с Индией

Тема быстрого и бесперебойного проведения платежных расчетов с дружественными странами после начала СВО не теряет своей актуальности.

Президент РФ Владимир Путин и премьер-министр Индии Нарендра Моди обсуждали вопрос применения национальных платежных систем на встрече в Москве в начале июля 2024 года. При этом в конце июня, незадолго до проведения встречи, власти Евросоюза ввели санкции против ро

...
08:52, 9 сентября 2024, понедельник
ЦБ РФ отметил ужесточение кредитных условий в августе

По оценкам Центрального банка России, денежно-кредитные условия в экономике страны в июле-августе продолжили ужесточаться.

Среди основных факторов  сохранения тенденции в ЦБ отметили рост номинальных ставок в большинстве сегментов финансового рынка после повышения ключевой ставки на заседании Совета директоров ЦБ РФ в июле этого года, а также ожиданий ее дальнейшего повышения.

15:30, 7 сентября 2024, суббота
Деловая программа ВЭФ’24. Шестое сентября. Главное

6 сентября во Владивостоке на площадке кампуса Дальневосточного федерального университета завершил работу Восточный экономический форум (ВЭФ). В этом году в нем приняли участие более 7100 человек из 75 стран и территорий.

10:33, 7 сентября 2024, суббота
Наверх