Введение в компьютерную лингвистику
Программа спецкурса
Лекторы:
доцент, к.ф.-м.н. И. А. Волкова
доцент, к.ф.-м.н. Т. Ю. Грацианова
Введение
Автоматическая обработка текстов. Актуальность. Трудности. Классификация систем автоматической обработки текстов. Типы прикладных задач, решаемых с помощью АОТ-систем. Машинный перевод. Генерация текста.
Локализация и интернационализация. Работа на ограниченном языке. Создание текстовых документов. Поиск информации.
Информационно-поисковые системы. Основные определения. Тезаурус
ИПС: релевантность. Языковой компонент.
Системы, моделирующие общение с пользователем на естественном языке. Eliza и ей подобные; современные чат-боты.
Человеко-машинный интерфейс. Лингвистический и нелингвистический компоненты.
Лингвистическое обеспечение систем автоматической обработки текстов. Лингвистические банки данных.
Системы автоматической обработки текстов на естественном языке (АОТ-системы).
Область применения АОТ-систем, аспекты изучения языка, языковые уровни, лингвистические процессоры.
Морфологический компонент АОТ-систем.
морфологические модели,
морфологические базы данных,
морфологическая омонимия,
морфологическая парадигма, а) морфологические анализаторы и синтезаторы,
грамматический словарь русского языка А.А.Зализняка.
Синтаксический компонент АОТ-систем.
синтаксические модели,
способы представления синтаксических структур предложения,
понятие проективности предложения,
синтаксическая омонимия,
синтаксический анализ на основе сетевой грамматики,
понятие синтаксической модели управления,
основные алгоритмы синтаксического анализа предложений естественнного языка.
Семантический компонент АОТ-систем.
семантическая теория,
теория концептуальной зависимости Р. Шенка,
теория лингвистических моделей «СМЫСЛ<=>ТЕКСТ»,
падежные системы,
теория А. П. Журавлева о соотношении звука и смысла.
Прагматический компонент в АОТ-системах.
Анализ связного текста в АОТ-системах.
Исправление ошибок в русскоязычных текстах. Система комплексного контроля качества текста ЛИНАР: функции системы, сценарии работы.
База знаний системы ЛИНАР. Программы контроля.