Автоматическое выявление дефектов в документации

Материал из Электронная энциклопедия ТПУ
Перейти к навигации Перейти к поиску
Компания ТПУ
Учебный семестр Весна 2021


Что это за проект?

Цель - разработать инструмент для автоматизированного поиска неточностей, неполноты и других дефектов в PDF файлах технической документации.


Чему студент научится?

  • Методам и алгоритмам компьютерной обработки языка (Natural Language Processing, NLP)


Какие начальные требования?

  • Основы программирования
  • Интерес к лингвистике и анализу данных


Какие будут использоваться технологии?

  • Python
  • Библиотеки NLTK, PyMorphy


Критерии оценки

  • Что должно получиться на "удовлетворительно": скрипт для автоматизированной обработки PDF файлов
  • Что должно получиться на "отлично": удобный и полезный сервис для анализа технической документации


Подробное описание

Полезно разобрать вот эти статьи:


Контакты

Ростислав Яворский (ryavorsky@tpu.ru)