Репозиторий содержит файлы, используемые для реализации курса по Анализу текстов в ИТМО.
Лекции и вспомогательные материалы приведены в директории lectures.
Ресурсы для выполнения лабораторных работ расположены в директории tasks, каждой лабораторной работе соответствует отдельный каталог. Общие указания к выполнению лабораторных работ приведены в файле README.md
, расположенном в директории tasks. Инструкции к выполнению отдельных лабораторных работ приведены в файлах README.md
, расположенных в директориях /tasks/task-<TASK_NUMBER>
, где <TASK_NUMBER>
- номер соответствующей лабораторной работы:
- Сегментация и аннотация текста
- N-grams
- Векторизация текста
- Классификация текстов или Тематическое моделирование
- Поиск по векторной БД
- Question Answering
Результаты выполнения лабораторных работ оформляются в виде проектов и размещаются в отдельных директориях внутри каталога projects (также см. указания по выполнению лабораторных работ). В качестве названия директории испоьзуется название соответствующего проекта, которое необходимо указывать в соответствии с конвенцией kebab-case
. Соответствие между названием проекта и ФИО студента задается в следующей таблице:
Project name | Student name |
---|---|
emoji-labeller | Иванов Иван Иванович |
danishevskiy-lab | Данишевский Никита Сергеевич |
ag-news-tasks | Епифанов Владислав Андреевич |
vas-news-labeller | Лисицина Василиса Васильевна |
yelp-labeller | Карпович Александр Евгеньевич |
movie-genre-predictor | Филиппенко Илья Павлович |
kobzar-news | Кобзарь Дарья Сергеевна |
ag_newsgroups_labeller | Горцуева Александра Сергеевна |