diff --git a/AugmentText/Readme.md b/AugmentText/Readme.md
new file mode 100644
index 0000000..b08a700
--- /dev/null
+++ b/AugmentText/Readme.md
@@ -0,0 +1,61 @@
+# AugmentText
+
+# ¸ÅÊö
+    - Ïà½ÏÓÚÍ¼ÏñÊý¾ÝÔöÇ¿£¬ÎÄ±¾Êý¾ÝÔöÇ¿£¬ÏÖÔÚ»¹ÊÇÓÐºÜ¶àÎÊÌâµÄ£»
+    - Íù¸üÑÏ¸ñµÄ½Ç¶È¿´£¬ÎÄ±¾Êý¾ÝÔöÇ¿¸üÏñÊÇÍ¬Òå¾äÉú³É£¬µ«ÓÖ²»ÍêÈ«ÊÇ£¬ËüÊÇÒ»¸ö¸ü´ó·¶Î§µÄ¸ÅÄî£»
+    - ºÜ¶àÊ±ºò£¬ÐèÒªÎÄ±¾Êý¾ÝÔöÇ¿£¬Ò»¸öÊÇ³£³£Óöµ½µÄÊý¾Ý²»×ã£¬ÁíÒ»¸ö¾ÍÊÇÊý¾Ý²»¾ùºâ¡£
+    - ÎÒµÄ¸Ð¾õÊÇ£¬ÎÄ±¾Êý¾ÝÔöÇ¿µÄÓÐÐ§·½·¨:
+    - Ò»¸öÊÇ»ØÒë£¨·­ÒëÁ½´Î£¬ÀýÈçÖÐÎÄµ½Ó¢ÎÄ£¬È»ºóÓ¢ÎÄÔÙµ½ÖÐÎÄ£©£¬
+    - ÁíÍâÒ»¸ö¾ÍÊÇEDA£¨Í¬Òå´ÊÌæ»»¡¢²åÈë¡¢½»»»ºÍÉ¾³ý£©£¬²åÈëºÍ½»»»µ±Ê±È·ÊµÃ»ÓÐÏëµ½ÓÃ
+
+
+###githubÏîÄ¿µØÖ·Îª###
+    https://github.com/yongzhuo/nlp_xiaojiang/tree/master/AugmentText
+
+
+# »ØÒë£¨Ïà¶Ô¿¿Æ×£©
+    - 1.ÔÚÏß·­Òë¹¤¾ß£¨ÖÐÎÄ->[Ó¢¡¢·¨¡¢µÂ¡¢¶í¡¢Î÷°àÑÀ¡¢ÆÏÌÑÑÀ¡¢ÈÕ¡¢º«¡¢ºÉÀ¼¡¢°¢À­²®]µÈÓïÑÔ£©
+       - ¹È¸è·­Òë(google)£¬¹È¸è·­Òë²»ÓÃËµ£¬Ó¦¸ÃÊÇÍ¦ºÃµÄ£¬ÓïÑÔÖ§³Ö×î¶à£¬²»¹ýÎÒÔÝÊ±»¹²»»á·­Ç½×¢²áÕË»§
+       - °Ù¶È·­Òë(baidu)£¬°Ù¶È·­Òë²»ÓÃËµ£¬¹úÄÚÖ§³Ö·­ÒëÓïÑÔ×î¶àµÄÁË(28ÖÖ»¥Òë)£¬¶øÇÒ×î´ó·½ÁË£¬×¢²áÕË»§ºóÃ¿ÔÂÓÐ200Íò×Ö·ûµÄÁ÷Á¿£¬´óÔ¼ÊÇ2M°É£¬³¬³öÔò49ÔªÈËÃñ±Ò/°ÙÍò×Ö·û
+       - ÓÐµÀ·­Òë(youdao)£¬³õÊ¼½Ó´¥ÍøÂçµÄÊ±ºòÎÒ×îÏ²»¶ÓÃÓÐµÀ·­ÒëÁË£¬µ«ËÀ¹ó£¬Ö»ÓÐ100ÔªÌåÑé½ð£¬²îÆÀ¡£²ÅÖ§³Ö11ÖÖÓïÑÔ£¬48Ôª/°ÙÍò×Ö·û
+       - ËÑ¹··­Òë(sougou)£¬¶ÔÓÚËÑ¹·Ó¡Ïó»¹ÐÐ°É£¬±Ï¾¹ÊÇÄÜ×öËÑË÷ÒýÇæµÄ¹«Ë¾Âï¡£78ÖÖÓïÑÔ£¬200ÔªÌåÑé½ð£¬³£¼ûÓïÑÔ40Ôª/°ÙÍò×Ö·û,·Ç³£¼ûÓïÑÔ60Ôª/°ÙÍò×Ö·û
+       - ÌÚÑ¶·­Òë(tencent)£¬×Ü¾õµÃÌÚÑ¶AIÊÇºóÖªºó¾õÁË£¬¹«Ë¾µ÷ÓÃÌÚÑ¶½Ó¿ÚÀÏÊÇ±äÀ´±äÈ¥µÄ£¬Õâ´ÎÒ²ÊÇ±»ËüµÄsign¼ÓÃÜ¸ø¶ñÐÄµ½ÁË£¬¿Õ¸ñ¸ÄÎª+¡£»òÐí¶ÔÆó¶ì¶øÑÔ£¬ÈË¹¤ÖÇÄÜ²»ÄÇÃ´ÖØÒª°É¡£
+                          -ÓÐÁ½¸ö£¬Ò»¸öÊÇ·­Òë¾ýÒ»¸öÊÇAIlabÊ²Ã´µÄ£¬Ö§³ÖµÄÓïÑÔÉÙÐ©¡£ËÆºõ»¹ÔÚ¿ª·¢ÖÐ£¬²»ÏÞ¶î²»±£Ö¤²¢·¢£¬php¿ª·¢Ã»ÓÐpythonµÄdemo
+       - ±ØÓ¦·­Òë(bing)£¬Î¢ÈíµÄ¶«Î÷£¬Äã¶®µÄ£¬Ã»ÓÐ³¢ÊÔ£¬Ö±½ÓÔÚÍøÒ³ÉÏÊÔÊÔ»¹¿ÉÒÔ°É
+       - ¿ÉÒÔ²ÉÓÃ¹¤¾ß¡¢Ä£Äâ·ÃÎÊÍøÒ³¡¢»òÕßÊÇ×¢²áÕËºÅµÈ
+    - 2.ÀëÏß·­Òë¹¤¾ß
+       - 1.×Ô¼ºÐ´£¬ÊÕ¼¯Ð©ÓïÁÏ£¬seq2seq,nmt,transformer
+       - 2.Ð¡Å£·­Òë£¬±È½Ï¹ÅÀÏµÄ°æ±¾ÁË£¬win10»òÕßlinux¶¼¿ÉÒÔ£¬²»¹ýÖ»ÓÐÑµÁ·ºÃµÄÖÐÓ¢»¥Òë
+             µØÖ·:http://www.niutrans.com/index.html
+
+# Í¬Òå´ÊÌæ»»£¨»¹ÐÐ£©
+    - 1.eda(ÆäÊµ¾ÍÊÇÍ¬Òå´ÊÌæ»»¡¢²åÈë¡¢½»»»ºÍÉ¾³ý)   ÂÛÎÄ¡¶Easy data augmentation techniques for boosting performance on text classification tasks¡·
+        - ÖÐÎÄÊµÏÖµÄdemo£¬githubÏîÄ¿zhanlaoban/eda_nlp_for_Chinese£¬µØÖ·:https://github.com/zhanlaoban/eda_nlp_for_Chinese
+    - 2.word2vec¡¢´ÊµäÍ¬Òå´ÊÌæ»»
+        - ²»Í¬ÓÚ1ÖÐÊ¹ÓÃsynonyms¹¤¾ß²éÕÒÍ¬Òå´Ê£¬¿ÉÒÔÊ¹ÓÃgensimµÄ´ÊÏòÁ¿£¬ÕÒ³öÄ³¸ö´Ê×îÏàËÆµÄ´Ê×÷ÎªÍ¬Òâ´Ê¡£
+        - »¹¿ÉÒÔÊ¹ÓÃÍ¬Òå´Êµä»úÐµ²éÕÒ£¬´Êµä¿ÉÓÃfighting41love/funNLP£¬githubµØÖ·:https://github.com/fighting41love/funNLP/tree/master/data/
+
+# ¾ä·¨¡¢¾ä×ÓÀ©³ä¡¢¾ä×ÓËõÐ´£¨±È½ÏÀ§ÄÑ¡¢£©
+    - 1.¾ä×ÓËõÐ´£¬²éÕÒ¾ä×ÓÖ÷Î½±öµÈ
+        - ÓÐ¸öjavaµÄÏîÄ¿£¬µ÷ÓÃË¹Ì¹¸£·Ö´Ê¹¤¾ß(²»°®ÓÃ)£¬²éÕÒÖ÷Î½±öµÄ
+        - µØÖ·Îª:£¨Ö÷Î½±öÌáÈ¡Æ÷£©https://github.com/hankcs/MainPartExtractor
+    - 2.¾ä×ÓÀ©Ð´  todo
+    - 3.¾ä·¨ todo
+
+# HMM-marko£¨ÖÊÁ¿½Ï²î£©
+    - HMMÉú³É¾ä×ÓÔ­Àí: ¸ù¾ÝÓïÁÏ¹¹½¨×´Ì¬×ªÒÆ¾ØÕó£¬jiebaµÈÌáÈ¡¹Ø¼ü´Ê¿ªÍ·£¬Éú³É¾ä×Ó
+        - ²Î¿¼ÏîÄ¿:https://github.com/takeToDreamLand/SentenceGenerate_byMarkov
+
+# Éî¶ÈÑ§Ï°·½·¨ todo
+    - seq2seq
+    - bert
+    - transformer
+    - GAN
+
+
+# ²Î¿¼/¸ÐÐ»
+    - eda_chinese£º  https://github.com/zhanlaoban/eda_nlp_for_Chinese
+    - Ö÷Î½±öÌáÈ¡Æ÷£º   https://github.com/hankcs/MainPartExtractor
+    - HMMÉú³É¾ä×Ó£º   https://github.com/takeToDreamLand/SentenceGenerate_byMarkov
+    - Í¬Òå´ÊµÈ£º      https://github.com/fighting41love/funNLP/tree/master/data/
+    - Ð¡Å£·­Òë£º      http://www.niutrans.com/index.html
diff --git a/AugmentText/__init__.py b/AugmentText/__init__.py
new file mode 100644
index 0000000..d7bc126
--- /dev/null
+++ b/AugmentText/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 19:44
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_eda/__init__.py b/AugmentText/augment_eda/__init__.py
new file mode 100644
index 0000000..6745f1f
--- /dev/null
+++ b/AugmentText/augment_eda/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 21:14
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_eda/enhance_eda.py b/AugmentText/augment_eda/enhance_eda.py
new file mode 100644
index 0000000..c484cae
--- /dev/null
+++ b/AugmentText/augment_eda/enhance_eda.py
@@ -0,0 +1,235 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/1 10:35
+# @author   :Mo
+# @function :enhance text by eda, eda is replace, insert, swap, delete
+
+
+from utils.text_tools import is_total_english
+from utils.text_tools import is_total_number
+from conf.path_config import stop_words_path
+from utils.text_tools import jieba_cut
+from random import shuffle
+import synonyms
+import random
+
+
+random.seed(2019)
+key_word_list = ["rsh", "mo", "å¤§æ¼ å¸å›½"]
+
+
+# åœç”¨è¯åˆ—è¡¨ï¼Œé»˜è®¤ä½¿ç”¨hanlpåœç”¨è¯è¡¨
+f_stop = open(stop_words_path, "r", encoding="utf-8")
+stop_words = []
+for stop_word in f_stop.readlines():
+    stop_words.append(stop_word.strip())
+
+
+def synonym_replacement(words, n, key_words):
+    """
+      åŒä¹‰è¯æ›¿æ¢,æ›¿æ¢ä¸€ä¸ªè¯­å¥ä¸­çš„nä¸ªå•è¯ä¸ºå…¶åŒä¹‰è¯
+    :param words: list, inupt sentence
+    :param n: int, replace words
+    :return: list, new_words
+    """
+    new_words = words.copy()
+    random_word_list = list(set([word for word in words if word not in stop_words]))
+    random.shuffle(random_word_list)
+    num_replaced = 0
+    for random_word in random_word_list:
+        sim_synonyms = get_syn_by_synonyms(random_word)
+        if len(sim_synonyms) >= 1 and random_word not in key_words and not is_total_english(random_word) and not is_total_number(random_word):
+            synonym = random.choice(sim_synonyms)
+            new_words = [synonym if word == random_word else word for word in new_words]
+            num_replaced += 1
+        if num_replaced >= n:
+            break
+    sentence = ' '.join(new_words)
+    new_words = sentence.split(' ')
+    return new_words
+
+
+def get_syn_by_synonyms(word):
+    if not is_total_english(word.strip()):
+        return synonyms.nearby(word)[0]
+    else:
+        return word
+
+
+def random_insertion(words, n, key_words):
+    """
+      éšæœºæ’å…¥, éšæœºåœ¨è¯­å¥ä¸­æ’å…¥nä¸ªè¯
+    :param words: list, inupt sentence
+    :param n: int, insert words
+    :return: list, new_words
+    """
+    new_words = words.copy()
+    for _ in range(n):
+        add_word(new_words, key_words)
+    return new_words
+
+
+def add_word(new_words, key_words):
+    """
+      åœ¨listä¸Šéšæœºæ’å…¥ä¸€ä¸ªåŒä¹‰è¯
+    :param words: list, inupt sentence
+    :return: list, new_words
+    """
+    synonyms = []
+    counter = 0
+    while len(synonyms) < 1:
+        random_word = new_words[random.randint(0, len(new_words) - 1)]
+        # è¿‡æ»¤
+        if random_word not in key_words and not is_total_english(random_word) and not is_total_number(random_word):
+            synonyms = get_syn_by_synonyms(random_word)
+            counter += 1
+        if counter >= 10:
+            return
+    random_synonym = random.choice(synonyms)
+    random_idx = random.randint(0, len(new_words) - 1)
+    new_words.insert(random_idx, random_synonym)
+
+
+def random_swap(words, n):
+    """
+      éšæœºäº¤æ¢ï¼Œéšæœºäº¤æ¢ä¸¤ä¸ªè¯è¯­næ¬¡æ•°
+    :param words: list, inupt sentence
+    :param n: int, swap words
+    :return: list, new_words 
+    """
+    new_words = words.copy()
+    for _ in range(n):
+        new_words = swap_word(new_words)
+    return new_words
+
+
+def swap_word(new_words):
+    """
+        éšæœºäº¤æ¢ï¼Œéšæœºäº¤æ¢ä¸¤ä¸ªè¯è¯­
+    :param new_words: list, inupt sentence
+    :return: list, new_words 
+    """
+    random_idx_1 = random.randint(0, len(new_words) - 1)
+    random_idx_2 = random_idx_1
+    counter = 0
+    while random_idx_2 == random_idx_1:
+        random_idx_2 = random.randint(0, len(new_words) - 1)
+        counter += 1
+        if counter > 3:
+            return new_words
+    new_words[random_idx_1], new_words[random_idx_2] = new_words[random_idx_2], new_words[random_idx_1]
+    return new_words
+
+
+def random_deletion(words, p, key_words):
+    """
+      éšæœºåˆ é™¤,ä»¥æ¦‚çŽ‡påˆ é™¤è¯­å¥ä¸­çš„è¯
+    :param words: list, inupt sentence
+    :param p: float,éšæœºåˆ é™¤çš„æ¦‚çŽ‡
+    :return: list, è¿”å›žç­‰
+    """
+    if len(words) == 1:
+        return words
+
+    new_words = []
+    for word in words:
+        r = random.uniform(0, 1)
+        if r > p or word in key_words:
+            new_words.append(word)
+
+    if len(new_words) == 0:
+        rand_int = random.randint(0, len(words) - 1)
+        return [words[rand_int]]
+
+    return new_words
+
+
+def sentence_replace_whitespace(sentences):
+    """
+      åŽ»é™¤ç©ºæ ¼
+    :param sentences: list,
+    :return: list
+    """
+    sentences_new = []
+    for sentence in sentences:
+        sentence_replace = sentence.replace(" ", "").strip()
+        sentences_new.append(sentence_replace + "\n")
+    return sentences_new
+
+
+def eda(sentence, alpha_sr=0.1, alpha_ri=0.1, alpha_rs=0.1, p_rd=0.1, num_aug=9, key_words=[]):
+    """
+      EDAå‡½æ•°ï¼ŒåŒä¹‰è¯æ›¿æ¢ã€æ’å…¥è¯æ±‡ã€äº¤æ¢è¯è¯­é¡ºåºã€åˆ é™¤è¯è¯­
+    :param sentence: str, input sentence
+    :param alpha_sr: float, synonym_replacement
+    :param alpha_ri: float, random_insertion
+    :param alpha_rs: float, random_swap
+    :param p_rd:     float, random_deletion
+    :param num_aug:  int, generate n new sentence
+    :return: list, contain orl sentence
+    """
+    seg_list = jieba_cut(sentence)
+    seg_list = " ".join(seg_list)
+    words = list(seg_list.split())
+    num_words = len(words)
+
+    augmented_sentences = []
+    num_new_per_technique = int(num_aug*2 / 4) + 1
+    n_sr = max(1, int(alpha_sr * num_words)) * 2
+    n_ri = max(1, int(alpha_ri * num_words)) * 2
+    n_rs = max(1, int(alpha_rs * num_words))
+
+    # åŒä¹‰è¯æ›¿æ¢sr
+    for _ in range(num_new_per_technique):
+        a_words = synonym_replacement(words, n_sr, key_words)
+        augmented_sentences.append(''.join(a_words))
+
+    # éšæœºæ’å…¥ri
+    for _ in range(num_new_per_technique):
+        a_words = random_insertion(words, n_ri, key_words)
+        augmented_sentences.append(''.join(a_words))
+
+    # éšæœºäº¤æ¢rs
+    for _ in range(num_new_per_technique):
+        a_words = random_swap(words, n_rs)
+        augmented_sentences.append(''.join(a_words))
+
+    # éšæœºåˆ é™¤rd
+    for _ in range(num_new_per_technique):
+        a_words = random_deletion(words, p_rd, key_words)
+        augmented_sentences.append(''.join(a_words))
+
+    augmented_sentences = list(set(augmented_sentences))
+    shuffle(augmented_sentences)
+    # å¤ªçŸ­çš„å¥å­ä¸è¦
+    augmented_sentences_new = []
+    for augmented_sentences_one in augmented_sentences:
+        if len(augmented_sentences_one) > 5:
+            augmented_sentences_new.append(augmented_sentences_one)
+
+    augmented_sentences = augmented_sentences_new
+    if num_aug >= 1:
+        augmented_sentences = augmented_sentences[:num_aug]
+    else:
+        keep_prob = num_aug / len(augmented_sentences)
+        augmented_sentences = [s for s in augmented_sentences if random.uniform(0, 1) < keep_prob]
+
+    if len(augmented_sentences) > num_aug:
+        augmented_sentences = augmented_sentences[0:num_aug]
+    # augmented_sentences.append(seg_list)
+    return augmented_sentences
+
+
+
+
+if __name__ == "__main__":
+    des = get_syn_by_synonyms("åŒä¹‰è¯")
+    print(des)
+    syn = eda(sentence="rshå–œæ¬¢å¤§æ¼ å¸å›½å—", alpha_sr=0.2, alpha_ri=0.2, alpha_rs=0.2, p_rd=0.2, num_aug=10, key_words=key_word_list)
+    syn_s = sentence_replace_whitespace(syn)
+    print(syn)
+    while True:
+        print('è¾“å…¥: ')
+        sen = input()
+        syn = eda(sentence=sen)
+        print(syn)
\ No newline at end of file
diff --git a/AugmentText/augment_marko/__init__.py b/AugmentText/augment_marko/__init__.py
new file mode 100644
index 0000000..6745f1f
--- /dev/null
+++ b/AugmentText/augment_marko/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 21:14
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_marko/enhance_marko.py b/AugmentText/augment_marko/enhance_marko.py
new file mode 100644
index 0000000..e1cb58e
--- /dev/null
+++ b/AugmentText/augment_marko/enhance_marko.py
@@ -0,0 +1,196 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @Time     :2019/3/25 14:11
+# @author   :Mo
+# @function :generate disorder sentence by marko
+
+from sklearn.feature_extraction.text import TfidfTransformer
+from sklearn.feature_extraction.text import CountVectorizer
+from conf.path_config import chicken_and_gossip_path
+from conf.path_config import projectdir
+from utils.text_tools import txtRead
+from utils.text_tools import txtWrite
+from jieba import analyse
+import random
+import jieba
+
+
+# å¼•å…¥TF-IDFå…³é”®è¯æŠ½å–æŽ¥å£
+tfidf = analyse.extract_tags
+# å¼•å…¥TextRankå…³é”®è¯æŠ½å–æŽ¥å£
+textrank = analyse.textrank
+
+
+def create_model(model_markov, datalist):
+    """
+      create model of sentence sequence
+    :param model_marko: dict
+    :param datalist: list of set
+    :return: set
+    """
+    for line in datalist:
+        line = list(jieba.cut(line.lower().strip(), cut_all=False))
+        for i, word in enumerate(line):
+            if i == len(line) - 1:
+                model_markov['FINISH'] = model_markov.get('FINISH', []) + [word]
+            else:
+                if i == 0:
+                    model_markov['BEGIN'] = model_markov.get('BEGIN', []) + [word]
+                model_markov[word] = model_markov.get(word, []) + [line[i + 1]]
+
+    for key in model_markov.keys():
+        model_markov[key] = list(set(model_markov[key]))
+
+    return model_markov
+
+
+def generate_random_1(model_markov, gen_words):
+    """
+       æ ¹æ®é©¬å°”ç§‘å¤«é“¾ç”ŸæˆåŒä¹‰å¥ï¼Œæœ¬è´¨å°±æ˜¯æ ¹æ®ä¸€ä¸ªè¯èµ°åˆ°å¦å¤–ä¸€ä¸ªè¯åŽ»
+    :param generated: list, empty
+    :param model_marko: dict, marko of dict
+    :return: str
+    """
+    while True:
+        if not gen_words:
+            words = model_markov['BEGIN']
+        elif gen_words[-1] in model_markov['FINISH']:
+            break
+        else:
+            try:
+                words = model_markov[gen_words[-1]]
+            except Exception as e:
+                return "".join(gen_words) + "\n"
+        # éšæœºé€‰æ‹©ä¸€ä¸ªè¯è¯­
+        gen_words.append(random.choice(words))
+
+    return "".join(gen_words) + "\n"
+
+
+def generate_random_select(generated, model_marko, twice=100000, len_min=5):
+    """
+      é»˜è®¤éåŽ†1000æ¬¡ç”Ÿæˆå¥å­
+    :param generated: list, one key word, rg.["å»ºè¡Œ"]
+    :param model_marko: dict, transition matrix
+    :param twice: int, twice
+    :param len_min: int, min length of gen sentence 
+    :return: list, syn_generates
+    """
+    syn_generates = set()
+    for num in range(twice):
+        syn_generate = generate_random_1(model_marko, generated)
+        generated = []
+        if len(syn_generate) > len_min:
+            syn_generates.add(syn_generate)
+    return list(syn_generates)
+
+
+def get_keyword_from_tf(sentences, p):
+    """
+      èŽ·å–æŸä¸ªç±»åž‹ä¸‹è¯­æ–™çš„çƒ­è¯
+    :param sentences: list, cuted sentences, filter by " "
+    :param p: float, rate, 0 < p < 1
+    :return: list, words
+    """
+    sentence_cut_list = [" ".join(list(jieba.cut(text.strip(), cut_all=False, HMM=True))) for text in sentences]
+    # token_patternæŒ‡å®šç»Ÿè®¡è¯é¢‘çš„æ¨¡å¼, ä¸æŒ‡å®š, é»˜è®¤å¦‚è‹±æ–‡, ä¸ç»Ÿè®¡å•å­—
+    vectorizer = CountVectorizer(token_pattern='\\b\\w+\\b')
+    # norm=Noneå¯¹è¯é¢‘ç»“æžœä¸å½’ä¸€åŒ–
+    # use_idf=False, å› ä¸ºä½¿ç”¨çš„æ˜¯è®¡ç®—tfidfçš„å‡½æ•°, æ‰€ä»¥è¦å¿½ç•¥idfçš„è®¡ç®—
+    transformer = TfidfTransformer(norm=None, use_idf=False)
+    vectorizer.fit_transform(sentence_cut_list)
+    # tf = transformer.fit_transform(vectorizer.fit_transform(sentence_cut_list))
+    word = vectorizer.get_feature_names()
+    # weight = tf.toarray()
+    return word[-int(len(word) * p):]
+
+
+def get_begin_word(sentences, p):
+    """
+      èŽ·å–jiebaåˆ‡è¯åŽ
+    :param sentences:list, sentences of input 
+    :param p: float, 
+    :return: list, key_words
+    """
+    sentence_cut_begin_list = [list(jieba.cut(text.strip(), cut_all=False, HMM=True))[0] for text in sentences]
+    len_begin_p = int(len(sentence_cut_begin_list) * p)
+    return sentence_cut_begin_list[-len_begin_p:]
+
+
+def get_keyword_from_jieba_tfidf(sentences, p):
+    """
+      åŸºäºŽTF-IDFç®—æ³•è¿›è¡Œå…³é”®è¯æŠ½å–
+    :param sentence: str, sentence of input
+    :return: list, return keyword
+    """
+    sentence_cut_list = [" ".join(list(jieba.cut(text.strip(), cut_all=False, HMM=True))) for text in sentences]
+    sentence_cut_list_str = str(sentence_cut_list)
+    key_word = tfidf(sentence_cut_list_str)
+    return key_word
+
+
+def get_keyword_from_jieba_textrank(sentences, p):
+    """
+      åŸºäºŽtextrankç®—æ³•è¿›è¡Œå…³é”®è¯æŠ½å–
+    :param sentence: str, sentence of input
+    :return: list, return keyword
+    """
+    key_words = []
+    for sentences_one in sentences:
+        key_word = textrank(sentences_one)
+        key_words = key_words + key_word
+    # token_patternæŒ‡å®šç»Ÿè®¡è¯é¢‘çš„æ¨¡å¼, ä¸æŒ‡å®š, é»˜è®¤å¦‚è‹±æ–‡, ä¸ç»Ÿè®¡å•å­—
+    vectorizer = CountVectorizer(token_pattern='\\b\\w+\\b')
+    vectorizer.fit_transform(key_words)
+    word = vectorizer.get_feature_names()
+    return word[-int(len(word) * p):]
+
+
+def generate_syns_from_list(sentence_list, begin_word="tfidf", p=0.1):
+    """
+      è¯»å–txtæ–‡ä»¶åŽŸè¯­å¥ï¼ŒèŽ·å–æ²¡æœ‰çš„ç”Ÿæˆå¥å­
+    :param txt_path: str, path of corpus
+    :param begin_word: str, "tf", "tfidf", "textrank"
+    :param p: float, rate, 0 < p < 1 
+    :return: list, generated sentence
+    """
+    # èŽ·å–çƒ­é—¨å…³é”®è¯
+    if begin_word == "tf":
+        generated_hot = get_keyword_from_tf(sentence_list, p)
+    elif begin_word == "textrank":
+        generated_hot = get_keyword_from_jieba_textrank(sentence_list, p)
+    elif begin_word == "begin_word":
+        generated_hot = get_begin_word(sentence_list, p)
+    else:
+        generated_hot = get_keyword_from_jieba_tfidf(sentence_list, p)
+
+    # åˆ›å»ºä¼ é€’æ¨¡åž‹
+    model_txt = {}
+    model_txt = create_model(model_txt, sentence_list)
+    # ä»¥å…³é”®è¯å¼€å¤´ï¼Œæž„å»ºåŒä¹‰å¥
+    gen_all_syn = []
+    for generated_hot_one in generated_hot:
+        generated_hot_one_1 = [generated_hot_one]
+        generated_str = generate_random_select(generated_hot_one_1, model_txt, twice=1000, len_min=5)
+        if generated_str:
+            gen_all_syn = gen_all_syn + generated_str
+    # æå–åŽŸå¥ä¸­æ²¡æœ‰çš„éƒ¨åˆ†
+    gen_all_syn = list(set(gen_all_syn))
+    # ç”Ÿæˆå¥å­ä¸ŽåŽŸå¥çš„äº¤é›†
+    syn_intersection = list(set(sentence_list).intersection(set(gen_all_syn)))
+    # ç”Ÿæˆå¥å­å‡åŽ»äº¤é›†
+    gen_syns = list(set(gen_all_syn).difference(set(syn_intersection)))
+    return gen_syns
+
+
+if __name__ == "__main__":
+    # è¯»å–ä¸€ä¸ªæ–‡ä»¶ï¼Œå†ç”Ÿæˆå¥å­
+    txt_path = chicken_and_gossip_path
+    sentence_list = txtRead(txt_path)
+    sentence_list = sentence_list[0:100]
+    enhance_texts = generate_syns_from_list(sentence_list, begin_word="tfidf", p=0.1)
+    for enhance_texts_one in enhance_texts:
+        try:
+            print(enhance_texts_one)
+        except Exception as e:
+            print(str(e))
\ No newline at end of file
diff --git a/AugmentText/augment_syntax/__init__.py b/AugmentText/augment_syntax/__init__.py
new file mode 100644
index 0000000..7dad124
--- /dev/null
+++ b/AugmentText/augment_syntax/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 21:16
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_translate/__init__.py b/AugmentText/augment_translate/__init__.py
new file mode 100644
index 0000000..1f0ae12
--- /dev/null
+++ b/AugmentText/augment_translate/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 21:15
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_translate/translate_account/__init__.py b/AugmentText/augment_translate/translate_account/__init__.py
new file mode 100644
index 0000000..6efb462
--- /dev/null
+++ b/AugmentText/augment_translate/translate_account/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 22:58
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_translate/translate_account/translate_tencent_secret.py b/AugmentText/augment_translate/translate_account/translate_tencent_secret.py
new file mode 100644
index 0000000..98d894e
--- /dev/null
+++ b/AugmentText/augment_translate/translate_account/translate_tencent_secret.py
@@ -0,0 +1,107 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 23:05
+# @author   :Mo
+# @function :ä½¿ç”¨è…¾è®¯è´¦æˆ·ï¼ˆç¿»è¯‘å›ï¼‰ï¼Œå›žè¯‘
+
+
+from conf.augment_constant import language_short_tencent
+from conf.augment_constant import app_secret_tentcnet
+from conf.augment_constant import app_key_tencent
+from urllib.parse import quote
+import logging as logger
+import requests
+import hashlib
+import random
+import string
+import time
+import json
+
+
+def md5_sign(text):
+    """
+       ç”Ÿæˆmd5
+    :param src: str, sentence
+    :return: str, upper of string
+    """
+    md5_model = hashlib.md5(text.encode("utf8"))
+    return md5_model.hexdigest().upper()
+
+
+def get_params(text, from_l="zh", to_l="en"):
+    """
+        ç”Ÿæˆsignå’Œparams
+    :param text:  str, input sentence
+    :param from_: source language
+    :param to_:   target language
+    :return:      dict, params
+    """
+    # è¯·æ±‚æ—¶é—´æˆ³ï¼ˆç§’çº§ï¼‰ï¼Œç”¨äºŽé˜²æ­¢è¯·æ±‚é‡æ”¾ï¼ˆä¿è¯ç­¾å5åˆ†é’Ÿæœ‰æ•ˆï¼‰Â Â 
+    time_stamp = str(int(time.time()))
+    # è¯·æ±‚éšæœºå­—ç¬¦ä¸²ï¼Œç”¨äºŽä¿è¯ç­¾åä¸å¯é¢„æµ‹Â Â 
+    nonce_str = ''.join(random.sample(string.ascii_letters + string.digits, 10))
+    params = {'app_id': app_key_tencent,
+              'source': from_l,
+              'target': to_l,
+              'text': text,
+              'time_stamp': time_stamp,
+              'nonce_str': nonce_str
+              }
+    signs = ''
+    # è¦å¯¹keyæŽ’åºå†æ‹¼æŽ¥Â Â 
+    for key in sorted(params):
+        # é”®å€¼æ‹¼æŽ¥è¿‡ç¨‹valueéƒ¨åˆ†éœ€è¦URLç¼–ç ï¼ŒURLç¼–ç ç®—æ³•ç”¨å¤§å†™å­—æ¯ï¼Œä¾‹å¦‚%E8ã€‚quoteé»˜è®¤å¤§å†™ã€‚Â Â 
+        signs += '{}={}&'.format(key, quote(params[key], safe='').replace("%20", "+"))
+    # å°†åº”ç”¨å¯†é’¥ä»¥app_keyä¸ºé”®åï¼Œæ‹¼æŽ¥åˆ°å­—ç¬¦ä¸²sign_beforeæœ«å°¾Â Â 
+    signs += 'app_key={}'.format(app_secret_tentcnet)
+    # å¯¹å­—ç¬¦ä¸²sign_beforeè¿›è¡ŒMD5è¿ç®—ï¼Œå¾—åˆ°æŽ¥å£è¯·æ±‚ç­¾åÂ Â 
+    sign = md5_sign(signs)
+    params['sign'] = sign
+    return params
+
+
+def any_to_any_translate_tencent(text, from_='zh', to_='en'):
+    """
+       è°ƒç”¨æœç‹—ç¿»è¯‘ï¼Œä»Žä»»æ„ä¸€ç§è¯­è¨€åˆ°å¦å¤–ä¸€ç§è¯­è¨€ï¼Œè¯¦æƒ…è§å¸¸é‡LANGUAGE_SHORT_BAIDU
+    :param text:  str, input sentence
+    :param from_: source language
+    :param to_:   target language
+    :return:      str, translate sentence
+    """
+    try:
+        url = "https://api.ai.qq.com/fcgi-bin/nlp/nlp_texttranslate"
+        params_text = get_params(text, from_l=from_, to_l=to_)
+        res_post = requests.request("POST", url, data=params_text)
+        res_content = res_post.content.decode("utf8")
+        res_json = json.loads(res_content)
+        target_text = res_json["data"]["target_text"]
+        return target_text
+    except Exception as e:
+        logger.error(str(e))
+        return None
+
+
+def translate_tencent_back(text, from_='zh', to_='en'):
+    """
+       å›žè¯‘ï¼Œè°ƒç”¨ä¸¤æ¬¡è…¾è®¯ç¿»è¯‘
+    :param text:  str, input sentence
+    :param from_: source language
+    :param to_:   target language
+    :return:      str, translate sentence
+    """
+    try:
+        text_from_to = any_to_any_translate_tencent(text, from_=from_, to_=to_)
+        text_to_from = any_to_any_translate_tencent(text_from_to, from_=to_, to_=from_)
+        return text_to_from
+    except Exception as e:
+        logger.error(str(e))
+        return None
+
+
+
+if __name__ == '__main__':
+    text_test = "ä½ è§‰å¾—JYä¼šå–œæ¬¢æš—å½±éšé£Žã€å¤§æ¼ å¸å›½å—".strip()
+    for to_test in language_short_tencent:
+        res_test = translate_tencent_back(text_test, from_='zh', to_=to_test)
+        print("æ²¡æœ‰è´¦æˆ·å°±ä¸ºç©ºï¼Œå›žè¯‘ç»“æžœ: ")
+        print(res_test)
diff --git a/AugmentText/augment_translate/translate_tools/__init__.py b/AugmentText/augment_translate/translate_tools/__init__.py
new file mode 100644
index 0000000..50ebcb6
--- /dev/null
+++ b/AugmentText/augment_translate/translate_tools/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 22:57
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_translate/translate_tools/translate_translate.py b/AugmentText/augment_translate/translate_tools/translate_translate.py
new file mode 100644
index 0000000..f68e10e
--- /dev/null
+++ b/AugmentText/augment_translate/translate_tools/translate_translate.py
@@ -0,0 +1,46 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 23:05
+# @author   :Mo
+# @function :ä½¿ç”¨ç¿»è¯‘å·¥å…·translate.Translatorï¼Œå›žè¯‘
+
+
+from conf.augment_constant import language_short_google
+from utils.text_tools import judge_translate_english
+from translate import Translator
+
+
+def translate_tools_translate(text, to_='en'):
+    """
+       è°ƒç”¨translateè¿›è¡Œå¥å­ç”Ÿæˆ
+    :param text: str, input
+    :param to_: language type
+    :return: str, result
+    """
+    # provider = 'mymemory','microsoft'
+    translator1 = Translator(to_lang=to_, from_lang='zh', provider=None, secret_access_key=None)
+    translator2 = Translator(to_lang="zh", from_lang=to_, provider=None, secret_access_key=None)
+
+    translation1 = translator1.translate(text)
+    translation2 = translator2.translate(translation1)
+    return translation2
+
+
+if __name__ == "__main__":
+    sen_org = "å¤§æ¼ å¸å›½å–œæ¬¢RSHã€JYå—"
+    for language_short_google_one in language_short_google:
+        text_translate = translate_tools_translate(sen_org, to_=language_short_google_one)
+        judge = judge_translate_english(sen_org, text_translate)
+        if judge:
+            print("True")
+            print(text_translate)
+        else:
+            print("False")
+            print(text_translate)
+# æµ‹è¯•ç»“æžœ:
+# False
+# æ²™æ¼ å¸å›½æ˜¯å¦åƒRSHï¼ŒJYï¼Ÿ
+# False
+# æ²™æ¼ å¸å›½çœ‹èµ·æ¥åƒRSHï¼ŒJYï¼Ÿ
+# False
+# å¸å›½æ²™æ¼ åƒrshï¼Œjyï¼Ÿ
\ No newline at end of file
diff --git a/AugmentText/augment_translate/translate_web/__init__.py b/AugmentText/augment_translate/translate_web/__init__.py
new file mode 100644
index 0000000..6efb462
--- /dev/null
+++ b/AugmentText/augment_translate/translate_web/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @time     :2019/4/9 22:58
+# @author   :Mo
+# @function :
\ No newline at end of file
diff --git a/AugmentText/augment_translate/translate_web/translate_google.py b/AugmentText/augment_translate/translate_web/translate_google.py
new file mode 100644
index 0000000..2ab2b02
--- /dev/null
+++ b/AugmentText/augment_translate/translate_web/translate_google.py
@@ -0,0 +1,154 @@
+# -*- coding: UTF-8 -*-
+# !/usr/bin/python
+# @Time     :2019/3/21 14:30
+# @author   :Mo
+# @function :å›žè¯‘è°ƒç”¨è°·æ­Œç¿»è¯‘ï¼Œæ¨¡æ‹Ÿgoogle tokenè®¿é—®
+
+from conf.augment_constant import language_short_google
+from utils.text_tools import judge_translate_english
+import logging as logger
+import urllib.parse as parse
+import requests
+import execjs
+
+
+class GoogleToken:
+    def __init__(self):
+        self.ctx = execjs.compile("""
+        function TL(a) {
+        var k = "";
+        var b = 406644;
+        var b1 = 3293161072;
+        var jd = ".";
+        var $b = "+-a^+6";
+        var Zb = "+-3^+b+-f";
+        for (var e = [], f = 0, g = 0; g < a.length; g++) {
+            var m = a.charCodeAt(g);
+            128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charCodeAt(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charCodeAt(++g) & 1023),
+            e[f++] = m >> 18 | 240,
+            e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224,
+            e[f++] = m >> 6 & 63 | 128),
+            e[f++] = m & 63 | 128)
+        }
+        a = b;
+        for (f = 0; f < e.length; f++) a += e[f],
+        a = RL(a, $b);
+        a = RL(a, Zb);
+        a ^= b1 || 0;
+        0 > a && (a = (a & 2147483647) + 2147483648);
+        a %= 1E6;
+        return a.toString() + jd + (a ^ b)
+    };
+    function RL(a, b) {
+        var t = "a";
+        var Yb = "+";
+        for (var c = 0; c < b.length - 2; c += 3) {
+            var d = b.charAt(c + 2),
+            d = d >= t ? d.charCodeAt(0) - 87 : Number(d),
+            d = b.charAt(c + 1) == Yb ? a >>> d: a << d;
+            a = b.charAt(c) == Yb ? a + d & 4294967295 : a ^ d
+        }
+        return a
+    }
+    """)
+
+    def get_google_token(self, text):
+        """
+           èŽ·å–è°·æ­Œè®¿é—®token
+        :param text: str, input sentence
+        :return: 
+        """
+        return self.ctx.call("TL", text)
+
+
+def open_url(url):
+    """
+      æ–°å¢žheaderï¼Œå¹¶requestè®¿é—®
+    :param url: str, urlåœ°å€
+    :return: str, ç›®æ ‡urlåœ°å€è¿”å›ž  
+    """
+    headers = {
+        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) '
+                      'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'}
+    req = requests.get(url=url, headers=headers)
+    return req.content.decode('utf-8')
+
+
+def max_length(content):
+    """
+      è¶…è¿‡æœ€å¤§é•¿åº¦å°±ä¸ç¿»è¯‘
+    :param content: str, need translate
+    :return: 
+    """
+    if len(content) > 4891:
+        logger.info("ç¿»è¯‘æ–‡æœ¬è¶…è¿‡é™åˆ¶ï¼")
+        return
+
+
+def translate_result(result):
+    """
+      åˆ åŽ»æ— å…³è¯
+    :param result: str
+    :return: str
+    """
+    str_end = result.find("\",")
+    if str_end > 4:
+        return result[4:str_end]
+    else:
+        return None
+
+
+def any_to_any_translate(content, from_='zh-CN', to_='en'):
+    """
+       è‡ªå®šä¹‰é€‰æ‹©
+    :param content: str, 4891ä¸ªå­—ï¼Œ ç”¨æˆ·è¾“å…¥ 
+    :param from_: str, original language
+    :param to_:   str, target language
+    :return: str, result of translate
+    """
+    max_length(content)
+    tk = google_tokn.get_google_token(content)
+    content = parse.quote(content)
+    url = "http://translate.google.cn/translate_a/single?client=t&sl={0}&tl={1}" \
+          "&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&" \
+          "ie=UTF-8&oe=UTF-8&source=btn&ssel=3&tsel=3&kc=0&tk={2}&q={3}".format(from_, to_, tk, content)
+    result = open_url(url)
+    res = translate_result(result)
+    return res
+
+
+def any_to_any_translate_back(content, from_='zh-CN', to_='en'):
+    """
+      ä¸­è‹±ï¼Œè‹±ä¸­å›žè¯‘
+    :param content:str, 4891ä¸ªå­—ï¼Œ ç”¨æˆ·è¾“å…¥ 
+    :param from_: str, original language
+    :param to_:   str, target language
+    :return: str, result of translate
+    """
+    translate_content = any_to_any_translate(content, from_=from_, to_=to_)
+    result = any_to_any_translate(translate_content, from_=to_, to_=from_)
+    return result
+
+
+if __name__ == '__main__':
+    google_tokn = GoogleToken()
+    while True:
+        sen_org = "è¿‡è·¯èœ»èœ“å–œæ¬¢å£è¢‹å·§å…‹åŠ›ï¼Œè¿™æ˜¯ä»€ä¹ˆæ„æ€"
+        for language_short_google_one in language_short_google:
+            text_translate = any_to_any_translate_back(sen_org, from_='zh', to_=language_short_google_one)
+            judge = judge_translate_english(sen_org, text_translate)
+            if judge:
+                print(language_short_google_one + " " + "True")
+                print(text_translate)
+            else:
+                print(language_short_google_one + " " + "False")
+                print(text_translate)
+#æµ‹è¯•ç»“æžœ
+# en False
+# æˆ‘å–œæ¬¢å£è¢‹å·§å…‹åŠ›ï¼Œè¿™æ˜¯ä»€ä¹ˆæ„æ€ï¼Ÿ
+# fr False
+# æˆ‘å–œæ¬¢å£è¢‹å·§å…‹åŠ›ï¼Œè¿™æ˜¯ä»€ä¹ˆæ„æ€ï¼Ÿ
+# ru False
+# æˆ‘å–œæ¬¢å£è¢‹ç³–æžœï¼Œè¿™æ˜¯ä»€ä¹ˆæ„æ€ï¼Ÿ
+# de False
+# æˆ‘å–œæ¬¢è¢‹å·§å…‹åŠ›ï¼Œè¿™æ˜¯ä»€ä¹ˆæ„æ€ï¼Ÿ
\ No newline at end of file