removed TOKENIZE_TWITTER option

2024-12-24 01:41:39 +00:00 · 2015-07-17 14:40:49 -04:00 · 2015-07-17 14:40:49 -04:00 · 00e18b7d4b
commit 00e18b7d4b
parent 772c0cddd1
1 changed files with 7 additions and 14 deletions
--- a/wordfreq_builder/wordfreq_builder/ninja.py
+++ b/wordfreq_builder/wordfreq_builder/ninja.py
@ -10,10 +10,6 @@ HEADER = """# This file is automatically generated. Do not edit it.
 TMPDIR = data_filename('tmp')


-# Set this to True to rebuild the Twitter tokenization (which takes days)
-TOKENIZE_TWITTER = True
-
-
 def add_dep(lines, rule, input, output, extra=None, params=None):
    if isinstance(output, list):
        output = ' '.join(output)
@ -48,8 +44,6 @@ def make_ninja_deps(rules_filename, out=sys.stdout):
    # The first dependency is to make sure the build file is up to date.
    add_dep(lines, 'build_deps', 'rules.ninja', 'build.ninja',
            extra='wordfreq_builder/ninja.py')
-
-    if TOKENIZE_TWITTER:
    lines.extend(
        twitter_deps(
            data_filename('raw-input/twitter/all-2014.txt'),
@ -58,7 +52,6 @@ def make_ninja_deps(rules_filename, out=sys.stdout):
            slices=40,
            languages=CONFIG['sources']['twitter']
        )
-        )
    lines.extend(
        wikipedia_deps(
            data_filename('raw-input/wikipedia'),