有文本a.txt存储有如下格式的文件:我 是 中国 人 巴林 公主 将 于 今日 举行 婚礼有另一个文本b.txt存储有我我 是是 中国 人中国 人我 是 中国人巴林公主将于今日举行举行 婚礼要求生成一个新的文本c.txt,存储为如下格式:[我] [是 中国 人][我 是] [中国 人][我 是 中国] [人][巴林] [公主] [将] [于] [今日] [举行] [婚礼][巴林] [公主] [将] [于] [今日] [举行 婚礼]答对再加100,跪求大神就是通过b.txt文件对a.txt里面的句子进行处理。例如:a.txt里面的句子:巴林 公主 将 于 今日 举行 婚礼通过搜索b.txt文件,发现有:巴林 公主 将 于 今日 举行 婚礼这样7种可能的切分所以生成一个新的句子存放在c.txt中[巴林] [公主] [将] [于] [今日] [举行] [婚礼]
2 回答
holdtom
TA贡献1805条经验 获得超10个赞
你要做的是识别词汇吧?你应该输入更多的文章,按照两个字三个字到50个字这样的分解
你要 做的是识别词汇吧
要做 的是识别词汇吧
类似这样.然后记录所有的词汇.再统计出出现次数最多的词汇固定词汇.然后你才能做这个拆词
添加回答
举报
0/150
提交
取消