通过阅读掩码 rcnn 气球示例(https://engineering.matterport.com/splash-of-color-instance-segmentation-with-mask-r-cnn-and-tensorflow-7c761e238b46),现在:我的目标:将带有方向和根位置注释信息的气球数据集提供给修改后的 mask_rcnn,然后它最终可以学习如何检测 val 数据集中每个气球的方向(以度为单位)和根位置。状态:对于训练数据集,我使用 VIA 绘制一条线(从根/处理程序到每个气球的最底部),可以指示图像中每个气球实例的方向,因为在 VIA 中,一条线包含 2 个点,因此第一个json 文件中的点将是每个气球实例的根坐标。下图显示了我的想法: 示例图片我开发了一些可以:从 json 文件中获取图像中所有气球实例的根坐标(浮点值)通过所有气球的线的 2 个点计算方向(以度为单位的角度,带有 2 位数字的浮点值)我想将获取的角度和根位置信息发送到掩码rcnn,在balloon.py中,我需要将它们添加到```class BalloonDataset(utils.Dataset): def load_balloon(self, dataset_dir, subset): ....... self.add_image( "balloon", image_id=a['filename'], # use file name as a unique image id path=image_path, width=width, height=height, polygons=polygons, angles=angles, roots=roots )``` 对吗?我想我还需要在model.py中定义root和orientation的损失函数,但我认为我应该使用与掩码损失或盒子损失相同的类型,有人能给我一些提示吗?有人可以给我一些想法我应该在model.py或其他地方更改什么?
添加回答
举报
0/150
提交
取消