forked from sokirko74/aot
-
Notifications
You must be signed in to change notification settings - Fork 0
/
todo.txt
14 lines (14 loc) · 1.68 KB
/
todo.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1. Отказаться от Graphlet и tcl (они не поддерживаются), я не могу установить русский шрифт в graphlet
Написать windows решение
2. Сделать корпус с оценкой BLEU
3. Все строковые константы перевести в latin
4. Запускать все тесты параллельно
5. Оттестировать MorphWizard и исправить в нем шрифты.
6. Прикрутить синтаксис Стаса
7. Добавить триграмную модель. Пока ее нельзя испоьзовать, поскольку она совсем не работает на служебных частях речи (как-то можно пофиксить).
Не работает на примере "коммерческие банки принимал", поскольку не имеет (или что-то сломалось?) зависимость от лексического контекста.
8. Регулярные полуавтоматические обновление морфологии от Wiktionary.
9. Тесты в синтаксисе падают из-за того, что дубли в морфологии сортируются по-разному в multimap (потом в автомате берется только один варинант)
10., я вышел из дома №26 — две клаузы?
11. попробовать отсортировать слова по частоте в plm. (удалить костыль он/оно в seman).
12. Перейти на RapidJson (во много раз быстрее)