新闻中心
飞桨常规赛:遥感影像地块分割 - 10月第2名方案
该方案为飞桨遥感影像地块分割赛题10月第2名方案,借鉴榜首模型结构,采用HRNet_W48+OCRNet,loss结合LovaszSoftmax和CrossEntropy。数据集经处理剔除无效样本,用多种增强策略。训练用Momentum优化器等,预测选50轮模型,提分点含数据增强等。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

飞桨常规赛:遥感影像地块分割
10月第2名方案
赛题
本赛题旨在对遥感影像进行像素级内容解析,并对遥感影像中感兴趣的类别进行提取和分类,以衡量遥感影像地块分割模型在多个类别(如建筑、道路、林地等)上的效果。
数据共包括4种分类,像素值分别为0、1、2、3。此外,像素值255为未标注区域,表示对应区域的所属类别并不确定,在评测中也不会考虑这部分区域。
训练集包含66,653张遥感影像图片和对应的标注图片,测试集包括4,609张遥感影像图片。遥感分辨率均为2m/pixel,图片尺寸均为256*256。
示例图片:
解题思路
主要借鉴了当前榜首(戳这里查看方案)的模型结构,但由于实现细节的差异,分数还是低了不少。
和榜首方案不同的是,个人比较偏好API编程的模式。
模型
模型采用了HRNet_W48+OCRNet,loss采用LovaszSoftmax和CrossEntropy(详见my_model.py)。
backbone = paddleseg.models.backbones.HRNet_W48(pretrained='https://bj.bcebos.com/paddleseg/dygraph/hrnet_w48_ssld.tar.gz', has_se=False)model = paddleseg.models.OCRNet(num_classes=4,backbone=backbone,backbone_indices=[-1],ocr_mid_channels=512,ocr_key_channels=256, pretrained='https://bj.bcebos.com/paddleseg/dygraph/ccf/fcn_hrnetw48_rs_256x256_160k/model.pdparams')
ce_coef = 1.0lovasz_coef = 0.3main_loss = lovasz_coef*self.lovasz(yp[0], yt)+ce_coef*self.ce(yp[0], yt)soft_loss = lovasz_coef*self.lovasz(yp[1], yt)+ce_coef*self.ce(yp[1], yt)return 1.0*main_loss+0.4*soft_loss
数据集
数据集采用了paddle.io.Dataset包装,方便采用paddle.io.DataLoader实现组batch和并行预处理,能够提高训练效率。
在数据集中调用paddle.vision.transforms实现数据增强,采用的增强策略有颜色抖动、随机旋转、随机翻转、随机crop等。
另外,发现训练集中有大约5000余张样本对应的标签完全由255组成,他们对训练不会有任何收益,故构造数据集时将相应的样本剔除。
代码详见my_dataset.py
训练策略
优化器为Momentum,学习率策略为PolynomialDecay和LinearWarmup。其他训练参数为:
BATCH_SIZE = 32LR = 1e-3WARMUP_EPOCH = 10 # warmup轮数TRAIN_EPOCHS = 40 # 训练轮数EVAL_EPOCH = 2 # 每两轮验证一次
训练主函数见train.py
学习率变化曲线
loss曲线
miou曲线
预测
训练时有一个很奇怪的现象,验证集的miou曲线是一个先降后升的'U'型。采用验证集最优模型的话,提交结果不如最后一轮,所以预测时加载的模型是训练50轮的参数。
Motiff妙多
Motiff妙多是一款AI驱动的界面设计工具,定位为“AI时代设计工具”
334
查看详情
预测时使用with paddle.no_grad():或者@paddle.no_grad()装饰器可以在推理时不保存中间结果,节省巨量显存。当然AI Studio的V100显卡太强了,有没有都无所谓。
推理时把数据集用DataLoader包装一下可以更好的并行。
预测后在左侧直接右键result文件夹,选择'打包下载'即可直接下载zip压缩包,可以直接在比赛页面提交。奇怪,前两天用的时候好像还是英文'Download as zip archive',现在就变成中文了。
具体代码见predict.py。
代码说明
代码都放在work文件夹下,结果也都保存在work/result文件夹下,模型保存在models文件夹下。
| 文件 | 内容 |
|---|---|
| configs.py | 全局参数设置 |
| my_dataset.py | 构造数据集 |
| my_model.py | 构造模型 |
| predict.py | 预测并保存结果 |
| train.py | 训练模型 |
| utils.py | 一些工具函数 |
模块文件下都通过
if __name__=='__main__': ...
的形式编写了一些测试语句,方便调试。
总结
四月份的时候参加过一轮,当时手攒了个模型,没有利用好paddleseg这个好用的套件,分数很低,该做好的点没有做好。感觉提分点主要有以下这些吧:
- 数据增强。一般来说,常规的数据增强都会有些效果,也可以根据数据的特点进行一定的取舍;
- SOTA模型。自己攒模型一般还是不如用现成的,尤其是对于新手。学到一定程度以后可以看看源码对比一下论文,说不定以后自己也能提出一些改进呢;
- 预训练模型。不多说了,有没有预训练简直是两个模型;
- 结果后处理。按之前的经验,语义分割类的结果做个滤波会有一点点不大的提升;另外,TTA据说很强。这里我还没来得及试。
和榜首的差距可能主要还是在数据增强策略上,另外,自己用API手写的训练过程可能还是有些细节上没实现好,还需要多学习学习。
一键复现
In [ ]# 安装paddleseg和解压数据集。!pip install paddleseg==2.3.0!cd data/data77571/ && unzip -q train_and_label.zip!cd data/data77571/ && unzip -q img_test.zipIn [ ]
# 训练!cd work && python train.pyIn [ ]
# 预测!cd work && python predict.py
以上就是飞桨常规赛:遥感影像地块分割 - 10月第2名方案的详细内容,更多请关注其它相关文章!
# 工具
# python
# 均为
# 一言
# 中文网
# fig
# udio
# igs
# red
# ai
# 简单网站建设优化方案
# b站视频推广网站视频怎么上传
# 推广口碑营销价格行情
# 价值营销推广案例分析
# 优化seo疯狂易速达
# 沧州谷歌seo
# 白云外贸网站推广方案
# 建设手机网站多少费用
# 北京服务网站建设图
# seo实训外链分析
# 尤其是
# 放在
# 会有
# 是在
# 是一个
# 的是
# 官网
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
类似微信的聊天软件有哪些
51单片机怎么用flash
市盈率为负数是什么意思
如何去除计算器的命令
typescript卸载不掉怎么办
如何通过命令检测u盘启动
夸克还原排版是什么意思
焊机上power灯闪是什么意思
爱玛电动车power模式是什么意思
有什么基础可以学typescript
j*a怎么保存到数组
跑步机power键是什么意思
如何编写一个linux命令
如何测固态硬盘芯片
如何学习typescript
所有删除的聊天记录都可以恢复吗?
单片机计数程序怎么写
轩逸e-power挡位b是什么意思
j*a怎么处理json数组
typescript如何标记私有方法
新三板市盈率是什么意思
j*a数组元素怎么用
一尺是多少厘米
推特是什么软件国内可以使用吗
手机全功能type-c接口是什么意思
如何查找固态硬盘
电瓶车充电器power是什么意思
华为5g手机掉了怎么定位找回
typescript中范围如何设定
typescript怎么设置滚动条
苹果16适合哪些机升级
春运哪天抢票最好
苹果16如何预购
固态硬盘如何区分好坏
春运抢票可以抢几张
如何winpe cmd命令
.asm如何在命令行运行
苹果16会升级哪些
typescript接口怎么选
春运提前抢票攻略
vue组件typescript怎么用
typescript是什么时候出来的
跑分是什么意思
a03怎么根据编号找文链接入口
360f4怎么取消百变壁纸
如何固态硬盘4k对齐
一分钟等于多少秒
得物怎样不扣手续费 如何通过得物不支付手续费
如何在昇腾Ascend 910B上运行Qwen2.5教程
j*a数组怎么新增值


2025-07-28
浏览次数:次
返回列表