Подписаться на ленту новостей через RSS канал


07 February 2022

«Наносемантика» преодолела технологический барьер

«Наносемантика» преодолела технологический барьер

Команда «Наносемантики» стала одной из двух команд, преодолевших технологический барьер в конкурсе по английскому языку, и получает крупный денежный приз — 20 млн рублей. Для сочинений на русском языке технологический барьер пока не преодолен, но «Наносемантика» заняла первое место в специальной номинации «Структура» (12 миллионов рублей).

Конкурсы Up Great проводятся в рамках Национальной технологической инициативы. Их задача — стимулировать преодоление технологических барьеров в различных отраслях; для этого участники «должны найти прорывное решение сложнейших технологических задач глобального масштаба». Про//Чтение — уже пятый такой конкурс, но преодоление технологического барьера зарегистрировано впервые.

Главная задача конкурса заключалась в разработке автоматического решения для проверки сочинений по ЕГЭ на русском и английском языке. Программные решения участников должны были обработать 500 сочинений и загрузить на сервер конкурса разметку в формате JSON с описанием обнаруженных в сочинении структурных блоков (проблема, аргумент, позиция и т. п.) и ошибок. На каждое сочинение давалось не более минуты (у команды «Наносемантики» проверка сочинений на русском языке заняла в среднем менее 4 секунд, на английском — чуть более 7 секунд). Результаты проверки от алгоритма должны были быть «неотличимы» от результатов проверки сочинения специалистами по соответствующему предмету.

Сочинение — единственное задание в рамках единых государственных экзаменов по русскому языку, литературе, истории, обществознанию и английскому языку, которое проверяется не автоматически, а вручную, экспертами. При этом учитывается соответствие структуры сочинения заданию, наличие в нём грамматических, стилистических, логических, смысловых, терминологических, фактических и других ошибок.

Разработчики «Наносемантики» создали искусственный интеллект, который решил задачу технологического конкурса с эффективностью 105,49% по сравнению с результатами проверки от учителей-экспертов, и занял на конкурсе по английскому языку второе место. Первое место досталось команде DeepPavlov (107,12%).

q7g2bKnumnPYnoBuLFMJZ_PLAedwnwtV3QBkvyP9_gJAM00nnv15PDUrYbfUw6TcQLNf6mbyYSamOzk84EmPY1IK7hGzOLo6tDSSLD-Y5DLYF4UGgEq0iOSOSLyT8xfr_QbLmz3Y

Для сочинений на русском языке «Наносемантика» возглавила лидерборд с показателем 89,48% — и продолжит борьбу за взятие уже второго технологического барьера в следующих циклах конкурса, который должен завершиться до конца 2022 года. Осталось чуть больше 10% — но, как показывает опыт, они самые сложные: чем ближе к 100%, тем с большим трудом дается дальнейшее продвижение.

Своим успехом «Наносемантика» во многом обязана опыту, накопленному при разработке многофункциональной системы проверки правописания на русском, английском и других языках ОРФО. А решения, найденные в рамках конкурса, в свою очередь, послужат развитию технологий ОРФО.Полученный приз, 32 миллиона рублей, «Наносемантика» планирует потратить на развитие лингвистических технологий — прежде всего, интеллектуальных систем проверки грамматики и стилистики для русского и английского языков.

Станислав Ашманов, генеральный директор компании «Наносемантика»:

«Наш коллектив 30 лет двигается к пониманию естественного языка: мы учим машину говорить, находить ошибки в речи человека, генерировать тексты - все наши эксперименты в этой сфере делают нас сильнее и открывают новые возможности. Без наших наработок в сфере понимания естественного языка мы бы не смогли взять призы в двух номинациях. Теперь перед нами стоит серьезный вызов: взять технологический барьер и для русского языка, который, конечно, значительно сложнее.»