AI achieves its best ever mark on a set of English exam questions
Ялинку у Польщі визнали найкрасивішою у світі: в чому її особливість У Криму дрон уразив російське судно "Федір Урюпін", - соцмережі "Він був та буде найкращим": на фронті загинув відомий український поет Режисер фільму "Сам удома" розкрив одну з найбільших загадок: ким працювали батьки Кевіна Авіакатастрофа в Актау: пасажирський літак могла збити російська зенітна установка, - WSJ Обстріл України на Різдво: Байден прокоментував атаку і дав доручення Пентагону Малайзія почне нові пошуки літака, який загадково зник понад 10 років тому Ви робили це неправильно: як загадати бажання на Новий рік, щоб збулося Подоляк про падіння літака у Казахстані: трагедія, яка є воєнним злочином РФ Окупанти намагаються перетнути річку Вовча, щоб оточити ЗСУ в Куп'янську, - військовий Після Різдва в Україну прийде невелике похолодання Зірка серіалу "Дитячий охоронець" відповів, чи готовий стати головним героєм "Холостяка" Найкращий тренер національної збірної з футболу 2024: названо володаря нагороди У Швейцарії під час сходження лавини загинула олімпійська сноубордистка "Це збиття": оглядач висловився про падіння пасажирського літака в Казахстані Між Естонією та Фінляндією вийшла з ладу важлива лінія електропередачі: що відомо Усик пояснив, чому підняв шаблю гетьмана Мазепи після перемоги над Ф'юрі Який алкоголь містить найменше калорій: дієтологи вказали на важливі нюанси "Він просто хоче грошей": в Усика прокоментували бажання Ф'юрі провести третій бій Камалія зізналася, як переживає розлуку з 11-річними доньками "Змішані почуття": Шуров відреагував на те, що Тіна Кароль стала продюсеркою Нацвідбору Судно для вивезення російських військ з Сирії зламалось у відкритому морі, - ГУР Промоутер Усика висловився про бій з Дюбуа "13 років разом": Лілія Ребрик зворушливо привітала чоловіка з річницею У путінській армії надумали створити новий рід військ: у Defence Express розповіли деталі

The results are in. An artificial intelligence has gone to the top of its class after passing an English exam. Though it can’t beat more able human students, it achieved the best mark yet for a machine.

Hai Zhao at Shanghai Jiao Tong University in China and his colleagues trained their AI on more than 25,000 English reading comprehension tests.

Each contained a 200 to 300-word story followed by a series of related multiple-choice questions. The tests were sourced from English proficiency exams aimed at Chinese students aged from 12 to 18 years.

While some answers could be directly found in the text, over half of them required a degree of reasoning. For example, one of the questions asked you to choose the best headline for a story from four options.

After the training, the AI sat a final exam consisting of 1400 tests it hadn’t seen before. It achieved an overall score of 74 per cent, better than all previous machine attempts.

Zhao’s AI uses a system that can identify parts of the story that are relevant to the question, then selects the answer that is most similar in meaning and logic.

The next best was a system made by Tencent, a leading Chinese technology firm, which scored 72 per cent on the same exam. Tencent’s AI learned to compare the information carried by each option and use their differences as cues to look for evidence in the text.

Despite topping the leader board, Zhao is determined to improve his system’s abilities. “What our AI got is very average, a C+ at most,” he says. “For students who want to get into good universities in China, they will aim for 90 per cent.”

To increase its score, the team will try to modify the AI so that it can understand information embedded in sentence structure and feed it with more data to expand its vocabulary.

Understanding human language is a major headache for AI, as it is often imprecise and involves hidden contextual and societal clues that machines struggle to pick up on.

It is unclear what rules AIs follow when they learn our languages, says Guokun Lai at Carnegie Mellon University in Pennsylvania, who originally collated the tests in 2017 for AI research. “They seem to be able to [understand our logic] after reading tonnes of sentences and stories.”