Skip to content

Latest commit

 

History

History
24 lines (24 loc) · 716 Bytes

eder_maciej.md

File metadata and controls

24 lines (24 loc) · 716 Bytes

Maciej Eder

Instytut Języka Polskiego PAN


Kim naprawdę był Gall Anonim? Zagadnienia statystycznej analizy tekstu


Wystąpienie będzie poświęcone analizie tekstu za pomocą kilku pakietów języka R, w tym atrybucji autorskiej opartej o statystyczne miary podobieństwa tesktów, a także szeroko rozumianej analizy stylu. Jako jeden z przykładów zostanie omówiony przykład autorstwa "Kroniki polskiej", przypisywanej tzw. Gallowi Anonimowi. W dalszej części wystąpienia zostanie przedstawiona metoda modelowania tematycznego (topic modeling) i jej zastosowania w analizie tekstu.