为了账号安全,请及时绑定邮箱和手机立即绑定

利用python从中文中提取关键词

利用python从中文中提取关键词

繁花不似锦 2019-02-20 11:31:33
我想从一组中文字符串中取得关键词,如“出版社”,然后将“朝华出版社”赋值给publisher。但是不知道应该怎么做,已经做了如下尝试。希望能够得到解答。 python>>>import sys >>>reload(sys) >>>sys.setdefaultencoding('utf8') >>> >>>import re >>>text = ''' 出版社: 朝华出版社 出版年: 2007-12 页数: 752 定价: 49.80元 装帧: 平装 ISBN: 9787505417670 ''' >>>re.findall(r'出版社:(.*?)'.encode('utf-8'), text.encode('utf-8')) ['']
查看完整描述

3 回答

?
一只甜甜圈

TA贡献1836条经验 获得超5个赞

print re.findall(r'出版社: ([\s\S]*?)\n', text)[0]

查看完整回答
反对 回复 2019-03-01
?
料青山看我应如是

TA贡献1772条经验 获得超8个赞

可以使用json库:

import json
data=json.load(text)
publisher=data["出版社"]
查看完整回答
反对 回复 2019-03-01
  • 3 回答
  • 0 关注
  • 557 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信