Автоматическое выявление дефектов в документации
Перейти к навигации
Перейти к поиску
Компания | ТПУ |
Учебный семестр | Весна 2021 |
Что это за проект?
Цель - разработать инструмент для автоматизированного поиска неточностей, неполноты и других дефектов в PDF файлах технической документации.
Чему студент научится?
- Методам и алгоритмам компьютерной обработки языка (Natural Language Processing, NLP)
Какие начальные требования?
- Основы программирования
- Интерес к лингвистике и анализу данных
Какие будут использоваться технологии?
- Python
- Библиотеки NLTK, PyMorphy
Критерии оценки
- Что должно получиться на "удовлетворительно": скрипт для автоматизированной обработки PDF файлов
- Что должно получиться на "отлично": удобный и полезный сервис для анализа технической документации
Подробное описание
Полезно разобрать вот эти статьи:
- Indicators of Text Complexity
- Identifying and Classifying Ambiguity for Regulatory Requirements
- Using NLP to Detect Requirements Defects: an Industrial Experience in the Railway Domain
Контакты
Ростислав Яворский (ryavorsky@tpu.ru)