TextSimilarScore

compute similar scores of two text


License
MIT
Install
pip install TextSimilarScore==0.0.6

Documentation

[![Version][version-badge]][version-link] ![MIT License][license-badge]

compute similar scores of two strings

TextSimilarScore这是个计算两个短文本相似度的算法

安装方法

安装以来 pip install TextSimilarScore

pip install -r resuirements.txt

使用方法

import TextSimilarScore.tools.TextSim as ts
test = ts.TextSimilarity()
# 计算连续最长公共子串的距离
print(test.lcs('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算连续最长公共子序列的距离
print(test.lcs_sequence('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算编辑距离
print(test.minimumEditDistance('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 基于tf-idf计算距离
print(test.splitWordSimlaryty('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算JaccardSim系数
print(test.JaccardSim('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))