01 背景:风水塘巡查监管进入“高频更新”阶段
风水塘作为华南传统聚落中常见的水体形态,兼具生态调节与景观文化价值。在基层巡查监管与台账管理工作中,相关单位通常需要掌握风水塘的空间分布、面积规模、类型结构以及随时间变化的新增/消失/异常情况。
但在实际业务推进中,客户(信息已脱敏,以下简称“客户”)长期面临以下难题:
分布广、目标多:风水塘散布于村落周边与农田地带,靠人工逐景判读需要大量人力。
尺度差异大、边界复杂:小塘密集、边界受植被与阴影干扰,手工描边耗时且一致性差。
成果交付链条长:从影像判读到矢量成图、统计表汇总与台账更新,存在重复录入与二次加工。
缺少闭环机制:抽查、复核、修正与归档流程不统一,难以形成可追溯的历史库。
客户希望建立一套桌面端工具,在离线或内网环境下实现“识别—审核—导出—入库”的标准化流程,用更少的人力完成更高频的台账更新与监管核查。

02 方案:模型驱动识别 + 人工审核兜底,形成工程化闭环
客户采用 风水塘智能识别系统 V1.0 作为核心生产工具。系统基于 Python 与 PyQt6 开发,面向 PC 与 Mac 提供桌面端应用能力,集成了多种智能识别组件与 GIS 工程化输出能力:
交互式精细分割:基于 SAM 2.1,通过正/负提示点快速提取复杂边界;
自动批量检测:基于 GroundingDINO + SAHI + SAM 2.1 的流程,适配超大幅遥感影像;
大图处理机制:支持 20000×20000 像素以上影像浏览与切片推理,并提供异步状态反馈,减少界面卡顿;
结果审核与管理:结果列表联动定位,支持搜索、筛选、批量删除、类型修正与统计汇总;
多格式成果导出:支持 Shapefile、GeoJSON、PNG 叠加图、CSV 统计表,便于接入 ArcGIS/QGIS 与台账系统;
本地授权与数据可控:基于设备码的 HMAC-SHA256 授权验证,成果文件本地保存,适合内网/离线环境。
该方案的核心思路是:让模型承担“批量发现目标”的工作,让人工承担“关键样本复核与边界精修”的工作,从而在效率与准确性之间取得工程可用的平衡。

03 落地流程:从遥感影像到台账成果的“四步闭环”
第一步:影像加载与地理信息自动读取
客户将业务影像统一整理为 GeoTIFF 为主、普通图片为辅的输入规范。系统支持 GeoTIFF、PNG、JPG、BMP 等格式:
对于 GeoTIFF:系统自动读取坐标参考系(CRS)与仿射变换参数,后续面积统计与矢量导出可保留真实地理坐标;
对于 普通图片:可在比例尺设置区域输入像素分辨率(米/像素),以获得可用的面积换算结果。
影像打开后,系统会在后台计算 SAM 2.1 Embedding,并在界面状态区提示模型准备情况,便于用户把握处理节奏。
第二步:自动批量检测(快速完成“初筛”)
在普查与台账更新场景中,客户优先使用自动检测模式完成“初筛”,核心步骤为:
使用 GroundingDINO 进行开放词汇检测,定位疑似水塘候选区域;
对超大影像启用 SAHI 切片推理,按设定的切片大小与重叠率滑窗扫描,提高小目标召回;
将候选框送入 SAM 2.1 进行像素级分割,得到更精细的边界掩膜;
结果写入右侧面板并同步更新总数、总面积及分类统计。
客户在实践中形成了简化的调参经验:
分辨率高、目标尺度大:切片可设大一些,提升速度;
目标密集、边缘易漏检:适当提高切片重叠率与检测阈值策略,减少“边缘漏检”;
背景干扰强:结合阈值调整与后续人工审核,保证最终成果质量。

第三步:交互式分割与结果审核(让边界更“能用”)
对于自动检测中出现的漏检、误检以及复杂边界目标,客户用交互式分割进行补强:
左键正向提示点:表示需要保留的区域;
右键负向提示点:表示需要排除的区域;
系统实时返回候选掩膜,用户可切换候选方案后按 Enter 确认,按 Escape 取消。
识别完成后,所有目标会进入结果面板进行集中审核与管理。每条记录通常包含缩略图、序号、类型标签、面积、置信度等信息,并支持:
列表选中后联动在画布高亮定位,快速核查;
批量删除误检目标;
按类型筛选、搜索定位与统计汇总。
系统还支持将目标区分为“聚落水塘/植被水塘”等类型,客户可在台账中按类型维护更清晰的管理口径。
第四步:一键导出 GIS 成果与统计表(直接用于台账更新)
客户将“可交付”作为流程最后的硬标准。系统支持按类别/范围导出:
Shapefile / GeoJSON:保留 CRS 与空间位置,便于直接进入 ArcGIS/QGIS 或空间数据库;
CSV 统计表:输出面积、周长、紧凑度、置信度等字段,用于台账汇总与数据核对;
PNG 叠加结果图:原图叠加彩色掩膜与轮廓线,便于汇报与抽查取证。
通过这一导出链路,客户将过去“识别—描边—成图—统计—入库”的多环节工作,收敛为“系统内一次完成”,显著降低了重复劳动与交付不一致风险。

04 成效:效率、规范性与可追溯性同步提升(以区间口径表达)
由于不同区域影像分辨率、目标密度、季节干扰差异较大,客户在对外发布时采用区间与定性结合的口径描述成效,重点包括:
普查效率提升:对大幅影像可先自动检测完成初筛,再对重点区域进行交互式精修,整体作业节奏更可控;
台账更新更规范:统一输出矢量与统计字段,减少手工描边与人工录入导致的格式不统一;
复核成本下降:可视化叠加图 + 列表联动定位,使抽查复核从“找目标”变为“核目标”;
成果可追溯:识别结果、统计表与空间成果统一归档,便于历史对比与问题闭环。
若你希望文章更“案例中心化”,建议补充 2–3 个可公开数字(例如覆盖影像幅数、平均处理时长区间、台账更新频次提升等),我可以把这一段替换成更有冲击力的“前后对比”描述。
05 可复制经验:让系统在不同影像上稳定产出
客户在落地过程中总结了三点关键做法,帮助系统在多源影像与复杂背景下稳定产出可交付成果:
先自动、后精修:先用自动检测锁定候选范围,再用交互式分割处理疑难点,效率与边界质量兼顾;
调参只做“少量高频项”:主要围绕切片大小、重叠率、检测阈值与提示词进行策略调整,避免过度复杂化;
导出字段与入库口径前置统一:在项目早期就明确 Shapefile/GeoJSON 字段、分类规则与统计口径,减少后期返工。

06 总结:把遥感判读变成可持续的台账更新能力
风水塘巡查监管与台账更新,本质上是“高频、批量、可追溯”的空间信息生产工作。通过风水塘智能识别系统,客户将模型识别能力与人工审核机制结合起来,形成从影像到 GIS 成果再到台账入库的工程化闭环,为基层监管提供了更高效、更规范、更可持续的支撑能力。