修改readme信息

This commit is contained in:
tuxiaohui001 2022-10-26 13:55:32 +08:00
parent 704a73db8b
commit 4326419cf6

View File

@ -56,11 +56,14 @@ python -m wikiextractor.WikiExtractor \
下载的语料包.bz2
```
-o 用来指定输出目录,--process 用来指定使用的进程数目(默认为 1-b 选项用来控制单个生成文件的大小(默认为 1M文件越大包含的词条也越多最后的参数为要处理的原始压缩语料文件名称。程序运行完成以后在输出目录下面会生成多个子目录每个目录下面有一些生成的文件。
-o用来指定输出目录--process 用来指定使用的进程数目(默认为 1-b 选项用来控制单个生成文件的大小(默认为 1M文件越大包含的词条也越多最后的参数为要处理的原始压缩语料文件名称。程序运行完成以后在输出目录下面会生成多个子目录每个目录下面有一些生成的文件。
| 参数 | 含义 |
| ------- | ---------------------- |
| o | 输出目录 |
| b | 控制单个生成文件的大小 |
| process | 进程数 |
| json | 生成json格式 |
| json | 生成json格式 |