为了账号安全,请及时绑定邮箱和手机立即绑定

sqlserver模糊匹配效率低怎么解决

sqlserver模糊匹配效率低怎么解决

慕娘9325324 2018-12-06 16:38:09
我们的数据库,数据表Company,有一万多条数据,我们要不断拿字段 CompanyName  出来匹配 用户输入,以数据库中的为准。如果用户输入 : 格力电器以前一直用 select  * from  Company   where   CompanyName  like '%格力电器%'但是这样匹配出来的太少了,很不准确,导致错误新增  比如要查询: 格力电器珠海有限公司  客户希望  输入: 格力电器珠海总公司  ,格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司等都能匹配出来。但是 第一种匹配方法无法做到。 我尝试分割用户的输入词: 生成这样的sql语句:select * from Company  where CompanyName like '%格力%电器%珠海%有限%责任%公司%'后来又用 select * from Company  where CompanyName like '%格力%电器%珠海有限责任%公司%'select * from Company  where CompanyName like '%格力%电器%珠海有限责任%公司%'or CompanyName like '%格力电%器珠海%有限责%任公司%'但是效率太低了,根本不能满足要求,查出来大概几分钟。他们主要是录入数据,希望厂家匹配出来,自动填充。他们操作习惯是,直接粘贴进去。为了省时间,但是这样稍微有差别,就匹配不出来,然后他们就增加一条,导致厂家很混乱。不知道各位有什么办法,救救我啊。弄了很久了,弄不成啊。
查看完整描述

11 回答

?
holdtom

TA贡献1805条经验 获得超10个赞

搞个笨方法吧,一般笨客户才有这种笨需求.所以就用笨方法.有什么不能过滤的新名词后面添加到函数里就好了

create function dbo.ft_get_short_company_name(@company_name varchar(50))
returns varchar(50)
as
begin
    declare @company    varchar(50)
    select @company = replace(@company_name,'有限责任公司','')
    select @company = replace(@company,'有限公司','')
    select @company = replace(@company,'总公司','')
    select @company = replace(@company,'公司','')
    --去除省名城市名
    --去除其它自定义内容
end


select  * from  Company   where   charindex(dbo.ft_get_short_company_name('格力电器有限责任公司'),CompanyName) > 0
查看完整回答
反对 回复 2019-01-07
?
aluckdog

TA贡献1847条经验 获得超7个赞

模糊匹配效率低的解决方案就是不用模糊匹配. 

mssqlserver的话用全文索引.很容易的

查看完整回答
反对 回复 2019-01-07
?
杨__羊羊

TA贡献1943条经验 获得超7个赞

1、从你的客户需求来看,他们出的价钱一定很高,基本上快赶上那个要求不能使用ASPX(低档货)的客户的。我初步估计项目达到10亿,而且还是美元,虽然汇率在走低,不过还是有5、6个人民币那么多。

2、Google和Baidu基本上技术上能达到你客户的要求,你可以找这两家采购再转卖给你的客户。

 

3、好了,不扯了,

比如要查询: 格力电器珠海有限公司  客户希望  输入: 格力电器珠海总公司  ,格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司等都能匹配出来。

类似这样的需求,本身如果满足的话,就是说,你的客户可能每次输入都会得到8000~9000个符合要求的信息,因为电脑根本不知道为什么格力就成了关键词了,如果不小心把公司当成关键词的话,是不是每个有包含公司的公司都会出现?

如果不是这样的话,要么你的客户愿意在信息条“ 格力电器珠海总公司、格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司”这些里面建立一个匹配数据,否则鬼才知道。

你的客户如果愿意输入“格力”出现后面那一堆,那叫合理需求,如果非要手贱输入“格力电器珠海有限公司”,还要匹配那后面的一系列名称,你们的业务还同意的话,真心对你们公司的技术实力表示佩服,期待中国Google的出现。

 

当你们解决了这个问题以后(先假设你们可以解决),客户会有一个这样的需求的,比如Walmart超市,可不可以当用户输入是WALMART超市的时候也可以找出来啊。

或者搜索小米科技,可以找到五谷杂粮科技公司。

查看完整回答
反对 回复 2019-01-07
?
侃侃无极

TA贡献2051条经验 获得超10个赞

灰常同意2楼观点,其实你们公司谈需求的不知道是谁?或者只是个熟悉业务并且对技术只有一点了解的人,其实这是很危险的,其实他要就只懂业务还好,但是如果还会那么一点点技术的话,那么他理解的这个需求他就会认为是完全可以实现的。

其实不然,因为你所要的效果是你输入一个字符串,只要其中有那么一两个字符或者中文与数据库中匹配,那么就可以将匹配的结果全部搜索出来,那么你的计算机怎么知道你想要匹配的是什么呢?你说你想查询: 格力电器珠海有限公司  客户希望  输入: 格力电器珠海总公司  ,格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司等都能匹配出来,那么这种情况是你自己认为你想要的是匹配你所输入的字符串中的“格力电器”or“格力”or“格力电”or“力电器”。。。等等,都要疯了,换而言之,你这样弄的话,假如你要搜索小米科技公司,还真的会带出五谷杂粮科技公司 -。-,客户的需求真的好高端,做之前真心需要好好分析,可行性实现的

查看完整回答
反对 回复 2019-01-07
?
德玛西亚99

TA贡献1770条经验 获得超3个赞

解决方案还是有的,你可以考虑lucene等引擎建立分词库,然后根据词库去最小词义匹配。但正如大叔所言,这不是小需求,从商业角度及你们实施能力考虑,这个功能你至少得再加价200万以上加6个月时间,问问你的客户是否愿意买单?

查看完整回答
反对 回复 2019-01-07
?
喵喵时光机

TA贡献1846条经验 获得超7个赞

用lucene吧。

查看完整回答
反对 回复 2019-01-07
?
海绵宝宝撒

TA贡献1809条经验 获得超8个赞

lucene

查看完整回答
反对 回复 2019-01-07
?
精慕HU

TA贡献1845条经验 获得超8个赞

请你有木有解决问题了,我也遇到同一类的问题

查看完整回答
反对 回复 2019-01-07
?
FFIVE

TA贡献1797条经验 获得超6个赞

要求用户必须严格输入,现在无法实现智能化。

后来我们做了数据分类,把某些关键词指定为一个标准名称。

查看完整回答
反对 回复 2019-01-07
  • 11 回答
  • 0 关注
  • 471 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信