Объем данных — ключевой показатель для качества обучения ИИ, пока

14:16, 13 февраля 2024, вторник

С достаточно большим набором данных модель-трансформер ИИ способна заменить, с некоторыми оговорками, специализированную шахматную программу. Ученые из Google DeepMind полагают, что это очередное подтверждение тому, что модель-трансформер является универсальной архитектурой, которую можно применять для решения любых задач. Недавние прорывные успехи в машинном обучении в основном объясняются масштабом: а именно большим числом параметров у моделей ИИ и наборами обучающих данных беспрецедентного объема и "неожиданными когнитивными способностями обучения".

В статье, которую опубликовали исследователи из Google DeepMind, исследуется влияние масштабных моделей, обученных в игру в шахматы. В отличие от традиционных шахматных программ, которые полагаются на сложную эвристику, архитектурный поиск или комбинацию, исследователи обучили модель-трансформер с 270 млн параметров на наборе данных из 10 млн партий. Каждая партия в наборе данных была размечена символами действий, предоставленными традиционной шахматной программой Stockfish 16. Модель набрала 2895 баллов в рейтинге Эло против людей и оказалась способной решить серию сложных шахматных головоломок без каких-либо специфичных для предметной области настроек или явных алгоритмов поиска оптимального хода. Ученые провели систематическое исследование размера моделей и наборов данных, которое показывает, что высокие результаты в шахматах возникают только при достаточном масштабе как самой модели, так и обучающих данных.

Эта работа дополняет быстро растущее число исследований, показывающих, что сложные и изощренные алгоритмы могут быть преобразованы в модели-трансформеры. Таким образом, ученые в очередной раз показали, что модели-трансформеры и большим количеством параметров можно рассматривать не только как просто статистические распознаватели паттернов, но и как общий метод для создания мощных алгоритмов.

Однако, как отмечают авторы работы, даже очень масштабные модели-трансформеры, требующие гигантских вычислительных ресурсов, пока что показывают более слабые результаты, чем специализированные шахматные программы.

Все проведенные эксперименты по масштабированию указывают на то, что в конечном итоге этот разрыв может быть устранен с помощью достаточно большой модели, обученной на достаточно огромном количестве данных. Однако текущие результаты не позволяют утверждать, что разрыв гарантированно получится преодолеть.

Еще одно ограничение моделей-трансформеров, заключается в том, что они работают только с текущим состоянием игры, а не со всей историей сделанных ранее ходов. Это приводит к некоторым фундаментальным техническим ограничениям, которые невозможно преодолеть без специальных знаний, характерных для той или иной предметной области, на которую обучается модель.

Последние материалы

00:04, 11 июля 2025, пятница

Милитаризация Европы. Бюджеты и география новых производственных мощностей

Европейский союз активно наращивает производство вооружения. Строятся новые заводы по всей Европе. Особый упор на артиллерийские снаряды и производство взрывчатых веществ.

19:21, 10 июля 2025, четверг

Как центробанки общаются с внешним миром

В Международном валютном фонде (МВФ) в июне 2025 года, провели анализ коммуникаций центральных банков с рынками, обществом и властью. Для анализа использовали искусственный интеллект.

13:24, 9 июля 2025, среда

Способна ли ФРС управлять рынком облигаций в периоды кризисов?

Рынки фиксированного дохода (рынки облигаций) исторически играют ключевую роль в связке между финансовой системой и реальной экономикой, обеспечивая распределение капитала, финансирование правительства и корпоративных нужд. Эффективность и стабильность этих рынков напрямую влияют на стоимость заимствований, инвестиционные решения и общий экономический рост. Федеральная резервная система (ФРС) исто

...

14:15, 7 июля 2025, понедельник

Борьба за лидерство в сфере ИИ - марафон, а не спринт

США могут в дальнейшем утратить лидирующие позиции в сфере генеративного искусственного интеллекта Китаю из-за потенциальных проблем в энергетике и возможных разногласий между различными американскими администрациями.

10:57, 5 июля 2025, суббота

Налоговая реформа Трампа 2.0: корпоративный триумф за счет снижения социальных госрасходов

Одобренный и подписанный в США "большой прекрасный закон" усиливает внутриполитические позиции президента Трампа, добившегося принятия ранее обещанных им мер. Потенциальные негативные последствия реформы в виде ускорения прогнозируемого роста госдолга США при этом подтверждают мировую тенденцию: власти развитых стран не только не собираются сокращать объем накопленных госдолгов, но и продолжают ув

...

10:25, 4 июля 2025, пятница

Ограничения многовекторной политики Азербайджана

Диверсификация инвестиций подтверждает адаптивность экономики Азербайджана к геополитическим изменениям, однако в структуре экономики существенных изменений пока не произошло. Экспорт углеводородов остается ключевой статьей доходов страны, что делает бюджет уязвимым к ценовым колебаниям барреля. При этом транзитный потенциал страны остается высоким, при сохранении добрососедских отношений с рядом

...

11:24, 3 июля 2025, четверг

Крипторегулирование по западным стандартам: контроль FATF за финансовыми потоками и соблюдением санкций против национальных интересов РФ

Антикризисная система против отмывания денег, основанная странами "Большой семерки", продолжает работать в интересах западных государств, при этом РФ не только не имеет возможности влияния на принимаемые решения, но и прямо называется участником различных серых схем и уклонения от санкций.

10:47, 2 июля 2025, среда

Ставка Google, Microsoft и IT-компаний США на ядерные и термоядерные стартапы – новые перспективы или вынужденное решение?

Существенный объем выделенных венчурных инвестиций и соглашений о партнерстве, которые американские корпорации заключают с рядом новых компаний в экспериментальных областях энергетической сферы за последние годы, говорят о нехватке существующих энергетических мощностей для обеспечения дальнейших потребностей IT-сектора США.

10:38, 2 июля 2025, среда

Трамп – главе ФРС: Я к вам пишу, чего же вы такой ужасный, медленный и глупый, и ставки ваши все так же непомерно высоки?

Президент США предпринимает новые попытки давления на председателя Федеральной резервной системы, продолжая требовать от него быстрого смягчения монетарной политики. Кампания Трампа по дискредитации руководства ФРС может иметь определенные последствия для США и других стран мира.

14:40, 1 июля 2025, вторник

Импульсивный прагматизм. Какие экономические проблемы США решит торговая война

Тарифы Трампа спровоцировали распродажу на рынках государственных облигаций США и ослабление доллара. Фондовый рынок всего за несколько дней потерял триллионы долларов. Хотя это может показаться непредвиденными последствиями действий Белого дома, более вероятно, что американская администрация реализует продуманную стратегию, направленную на достижение своих целей, включая развитие собственной макр

...