wordfreq/MANIFEST.in at d30183a7d736df8ddec38a8d7364d797c74e4d37 - wordfreq - Hifadhi: Ibu's code storage

iskm/wordfreq

mirror of https://github.com/rspeer/wordfreq.git synced 2024-12-23 09:21:37 +00:00

Robyn Speer 0a2bfb2710 Tokenization in Korean, plus abjad languages (#38 )

* Remove marks from more languages

* Add Korean tokenization, and include MeCab files in data

* add a Hebrew tokenization test

* fix terminology in docstrings about abjad scripts

* combine Japanese and Korean tokenization into the same function


Former-commit-id: fec6eddcc3

2016-07-15 15:10:25 -04:00

9 lines

285 B

Plaintext

Raw Blame History

 recursive-include wordfreq/data *.gz
 include README.md
 recursive-include wordfreq/data *.txt
 recursive-include wordfreq/data *.bin
 recursive-include wordfreq/data *.def
 recursive-include wordfreq/data *.dic
 recursive-include wordfreq/data dicrc
 recursive-include wordfreq/data COPYING