今天的需求是要根据线上问医平台的问诊单对问诊的病情描述进行关键字统计
分词的准确性还有待提高 没用到自定义词典,好多医疗的词汇分不出来
- python 2.7 (2.7获取数据库连接我用的是MySQLdb,3+换成了pymysql)
- MySql 5.7
- 结巴分词:https://github.com/fxsjy/jieba
| Name | Name | Last commit date | ||
|---|---|---|---|---|
今天的需求是要根据线上问医平台的问诊单对问诊的病情描述进行关键字统计
分词的准确性还有待提高 没用到自定义词典,好多医疗的词汇分不出来