我正在使用OCR和Tensorflow构建一个Android应用程序。它扫描超市中的价格标签,并且必须将扫描的数据放入不同的字段。我已经完成了OCR部分,因此图像->文本识别工作正常,仅需Tensorflow即可处理文本输入。总体而言,我是Tensorflow和机器学习的新手。是否可以使用Tensorflow进行以下工作,如果可以,您是否可以分享一些有关这样做的想法?平均输入如下所示:CARLSBERGEESTIHELE OLU 5%1.59 +0.10500 ml pudel3.18 /I4740019113419目标是按以下方式对这些数据进行排序:Brand: CARLSBERGProduct name: HELE OLU 5%Size: 500Units: ml确定如何对特定字符串进行分类的参数为:案件电话号码超市(默认情况下为已知)总行数字母/数字比率
3 回答
天涯尽头无女友
TA贡献1831条经验 获得超9个赞
我认为第一步将是动手实践或生成一些带有标签的培训数据。您应该研究特征提取。例如,如果您注意到某个项目的第二行通常是价格,则可以将其表示为参数。或者说,如果数字后面跟有毫升/升/盎司之类的单位,则很可能是体积。您想知道的是您对特定行/字符串说的价格有多大的信心。
但是,我认为TensorFlow将更适合该问题的OCR部分,您已经解决了。您要问的更多是文本解析,可以使用NLP方法更好地解决。
添加回答
举报
0/150
提交
取消