ОРЕАНДА-НОВОСТИ. С 4 по 8 июня в Подмосковье пройдёт 20-я Международная конференция "Диалог". Это крупнейшее в России мероприятие по компьютерной лингвистике проводится уже около 40 лет, и более десяти из них её главным организатором является ABBYY. На "Диалог" ежегодно приезжают ведущие российские и зарубежные лингвисты и разработчики компьютерных технологий анализа языка, чтобы обсудить самые актуальные и интересные вопросы и обменяться опытом.

Компьютерная лингвистика на сегодняшний день является одной из самых быстро развивающихся прикладных наук. Своим появлением ей обязаны электронные словари, машинные переводчики, решения, связанные с информационным поиском, извлечением знаний, распознаванием речи и другие. На "Диалоге" новейшие методы компьютерной лингвистики обсуждаются применительно именно к русскому языку, поэтому конференция позволяет оценить текущее состояние российской компьютерной лингвистики и определить векторы развития.

Основная тема "Диалога" этого года - "Вычислительные модели семантики". Семантика - это путь к компьютерному пониманию смысла текстов, поэтому не удивительно, что с каждым годом интерес разработчиков систем компьютерного анализа языка к использованию семантических моделей растёт. Но сами применяемые модели существенно различаются: наряду с традиционными лингвистическими и формально-логическими подходами бурно развиваются дистрибуционные, операциональные, онтологически ориентированные методы.

Все эти вопросы участники смогут обсудить с крупнейшими зарубежными специалистами. В качестве приглашённых докладчиков на конференции выступят:

Герних Шютце (Hinrich Schutze) из Мюнхенского университета (Германия), крупнейший специалист с области статистических методов анализа языка, автор своего рода "Библии" по этому предмету, по которой учились и учатся все современные компьютерные лингвисты.

Марко Барони (Marco Baroni) из университета Тренто (Италия), один из основателей т.н. дистрибуционной семантики, в которой значения слов определяются автоматически на основании анализа их употребления в огромных корпусах текстов.

Марджори MакШейн (Marjorie McShane) из Политехнический института Ренсселера (США), специалист в области онтологической семантики, основанной на идее включения в семантические описания знаний о мире.

В 2014 году организаторы "Диалога" планируют впервые провести практическую сессию под названием "День технологий". Компании и институты получат возможность продемонстрировать, как результаты их собственных научных исследований воплощаются в практические решения для бизнеса и управления. Планируется проведение Круглого стола на тему прикладного потенциала компьютерной лингвистики.

Ежегодно в рамках "Диалога" проходят мероприятия по сравнительной оценке различных систем лингвистического анализа текстов. Такие технологические соревнования дают возможность разработчикам объективно оценить свой уровень в сравнении с результатами коллег. В прошлые годы прошли тестирования систем автоматической оценки мнений (анализ тональности), синтаксического анализа, машинного перевода с русского языка. В этом году будут подведены итоги соревнования по автоматическому разрешению кореферентных связей. За этим названием скрывается важнейшая проблема связывания в тексте местоимений с теми объектами, на которые они ссылаются, что очень важно, например, для информационного поиска и машинного перевода.

Диалог традиционно использует очень строгие критерии отбора работ на конференцию. В отборе Редсовету каждый год помогают около 60 профессиональных российских и зарубежных экспертов. Благодаря строгой, но прозрачной системе рецензирования сборник "Диалога" с 2014 года входит в SCOPUS - крупнейшую в мире аналитическую базу данных, которая индексирует научные журналы, материалы конференций и серийные книжные издания. SCOPUS является наиболее авторитетным ресурсом в мире для поиска научной литературы.