wordfreq/MANIFEST.in at 752c90c8a57044c2b4ad81dd00c5aeca2cbc9f6e - wordfreq - Hifadhi: Ibu's code storage

iskm/wordfreq

mirror of https://github.com/rspeer/wordfreq.git synced 2024-12-24 18:01:38 +00:00

Rob Speer a0893af82e Tokenization in Korean, plus abjad languages (#38 )

* Remove marks from more languages

* Add Korean tokenization, and include MeCab files in data

* add a Hebrew tokenization test

* fix terminology in docstrings about abjad scripts

* combine Japanese and Korean tokenization into the same function


Former-commit-id: fec6eddcc3

2016-07-15 15:10:25 -04:00

9 lines

285 B

Plaintext

Raw Blame History

 recursive-include wordfreq/data *.gz
 include README.md
 recursive-include wordfreq/data *.txt
 recursive-include wordfreq/data *.bin
 recursive-include wordfreq/data *.def
 recursive-include wordfreq/data *.dic
 recursive-include wordfreq/data dicrc
 recursive-include wordfreq/data COPYING