Система искусственного интеллекта превзошла результаты человека в одном из самых сложных в мире тестов на понимание прочитанного — Stanford Question Answering Dataset (SQuAD).
ИИ обошел человека в тесте Стэнфордского университета на понимание прочитанного - 1
Данный тест, разработанный в Стэнфордском университете (США), содержит 100 тысяч вопросов, основанных на более чем 500 статьях Википедии, и считается самым сложным в области когнитивной обработки текстов. Он привлекает разработчиков из университетов и компаний таких, как Google, Facebook, IBM, Microsoft в Университете Карнеги-Меллона, Стэндфордского Университета и Алленского научно-исследовательского института. Команды, конкурирующие между собой, должны создавать модели машинного обучения, которые могут дать наиболее точные ответы на все вопросы. Наиболее высокий балл, установленный человеком в этом тесте, составлял 82.304. Система глубокой нейронной сети Alibaba (разработка Alibaba Institute of Data Science of Technologies), набрала 82.44 балла, став первой системой искусственного интеллекта, которая превзошла результат человека в этом тесте. Также опередить человечество удалось искусственному интеллекту, разработанному Microsoft. Его результаты - 82.65 балла, однако об этом стало известно только на следующий день после оглашения результатов Alibaba. Точность системы Alibaba связана с её способностью находить потенциально точные ответы среди абзацев, предложений и слов в тексте. Также технология использует NLP —обработку естественного языка, в процессе которой машины имитируют человеческое понимание слов и предложений. В течение нескольких лет машины Alibaba отвечали на большое количество входящих запросов от клиентов с использованием системы искуственного интеллекта, параллельно обучаясь. Исследователи считают, что тесты SQuAD помогут привести к созданию более совершенных роботов и автоматизированных систем, способных решать сложные проблемы и отвечать на сложные вопросы, сформулированные людьми.