Euromedia24.info | Ученые объяснили превосходство искусственного интеллекта в аркадных играх

Лента новостей

22:32 09/01/2025

ВР продовжила "пільгу" для тих, хто пішов в СЗЧ: скільки часу є на повернення на службу 21:31 09/01/2025

Оголошення номінантів на "Оскар" перенесли через пожежі у Лос-Анджелесі: названо нові дати 20:38 09/01/2025

США оголосили про новий пакет допомоги для України на $500 мільйонів: що в нього входить 19:36 09/01/2025

Ворог скинув на Херсон три КАБи: багато поранених та руйнувань 18:32 09/01/2025

Взяття на військовий облік призовників: що ухвалила Рада 17:31 09/01/2025

Джессіка Альба розлучається з чоловіком, – ЗМІ 16:34 09/01/2025

"Виживає найсильніший": у Франції спрогнозували, чи може Трамп вторгнутися в Гренландію 15:32 09/01/2025

День армійської авіації: Зеленський підписав указ про нове державне свято 14:34 09/01/2025

Скандал зі 155-ю бригадою: командувач Сухопутними військами зробив нову заяву 13:33 09/01/2025

День матері 2025: якого числа в Україні вітають мам 12:32 09/01/2025

"Мирний план" Путіна - заклик до повної капітуляції України: аналітик дав похмурий прогноз 11:30 09/01/2025

Ні на що не схожий: на новому знімку у Китаї побачили ще один "‎винищувач шостого покоління"‎ 10:35 09/01/2025

У Венесуелі заявили про затримання групи "терористів", серед них троє українців 09:35 09/01/2025

На українців чекають дощі, сніг та хуртовини: синоптик повідомив, де вируватиме негода 00:38 09/01/2025

Як схуднути після 50: тренер порадив 8 простих вправ 23:32 08/01/2025

Жінка 17 місяців мандрувала світом, витрачаючи 50 доларів на день: що пішло не так 22:33 08/01/2025

Українець Усик - найкращий боксер 2024 року за версією WBC 21:32 08/01/2025

10 дивацтв у поведінці дітей, які є ознакою геніальності 20:38 08/01/2025

Удар по російській нафтобазі в Енгельсі: у Генштабі ЗСУ підтвердили атаку 19:19 08/01/2025

Українець Усик - найкращий боксер 2024 року за версією WBC 18:33 08/01/2025

Конгрес США розгляне резолюцію про визнання геноцидом агресію РФ проти України, - Маркарова 17:30 08/01/2025

Аліна Гросу повернулася в Україну зі своїм чоловіком-росіянином 16:36 08/01/2025

До України йде похолодання: синоптикиня назвала точну дату, коли повернуться морози 15:35 08/01/2025

"Ситуація ганебна, але неоднозначна": в Раді відреагували на скандал у 155 бригаді 14:21 08/01/2025

Збірна України з санного спорту вперше в історії виборола медаль в естафеті Кубка світу

Стартап Google Deep Mind продемонстрировал новые возможности искусственного интеллекта. Его система Deep-Q-Network смогла превзойти человека в 49 классических аркадных играх 1980-х, не имея доступа к исходному коду игр и без изучения практики игроков-людей. Об алгоритме работы системы рассказывается в журнале Nature, а коротко о новой технологии сообщил Science News.

Лондонскую фирму DeepMind, специализирующуюся в области искусственного интеллекта, в 2014 году приобрел Google. По данным СМИ сумма сделки составила около 400 миллионов фунтов стерлингов. После вхождения в состав американской корпорации один из основателей стартапа Демис Хассабис (Demis Hassabis) заставил компьютер самостоятельно обучаться опыту игры — и даже открывать эффективные ходы и стратегии, о которых не знали даже люди.

Система компьютерного самообучения получила название Deep-Q-Network (DQN). В ней используются две различные стратегии обучения. Во-первых, это глубинная нейронная сеть — система восприятия, принцип работы которой напоминает зрение животных: она делает ходы и замечает, как меняются пиксели на экране. «Q» в названии означает Q-learning: математический аналог обучения с подкреплением (или поощрением), благодаря которому люди и животные осваивают новые навыки: каждое новое эффективное действие вознаграждается. В случае DQN наградой являются очки в игре: пробуя различные действия, система запоминает те комбинации, которые приносят максимум очков.

Исследователи дали DQN порезвиться с 49 классическими аркадными играми на платформе Atari 2600. Эти игры, по мнению Хассабиса, представляют собой золотую середину с точки зрения сложности игрового процесса. DQN были предоставлены крайне ограниченные ресурсы: две недели на каждую игру и вычислительные мощности одного-единственного персонального компьютера.

Эффективность системы была далеко не очевидна: искусственный интеллект раньше всегда проигрывал человеку в играх наподобие Breakout или Space Invaders, где для получения рекордного счета необходимо искать сложные стратегии. Однако в итоге DQN обыграла живых экспертов в 60 процентах игр: она набрала на 20-30 процентов больше очков в Space Invaders и Pong, а в Breakout и Video Pinball — в 200 раз больше. Следующим этапом, по словам Хассабиса, станет трансфер знаний: перенос навыков из одной игры в другую (например, во вторую игру с летающими шариками система сможет играть быстрее, чем в первую).

По мнению экспертов, система DQN имеет все шансы найти применение в рекламной стратегии Google. Пиксели аркадных игр являются аналогом многочисленных данных, которые поисковик собирает об отдельных пользователях, а очки — аналогом прибыли от рекламы. Обучение с подкреплением пригодится для улучшения качества объявлений: чем чаще на них кликают, тем больше очков получает система. Тот факт, что DQN обучается, наблюдая за происходящим на экране, а не обрабатывая исходный код, говорит о том, что Google она нужна для анализа изображений и видео.