标书查重

面向多份投标文件的相似性排查场景，帮助快速定位异常一致、图片相似和值得进一步核验的事实线索。

这项能力解决什么问题

标书查重不是为了直接给出风险定性，而是为了把多份投标文件之间那些“值得进一步怀疑的相似事实”先收束出来。

在文件数量多、篇幅长、版本复杂的项目里，真正困难的往往不是知道要比对，而是不知道该先比哪几份、哪几页、哪几类线索。

这个专题的价值，是把原本极度耗时的逐页对照，转成围绕重点文件对和重点线索做定向核验。

系统通常围绕以下几类事实线索进行对照：

关注段落内容、表述方式和局部文本是否存在异常接近、重复或高度同构。

关注页面图像、版式呈现和可视内容是否出现值得继续核验的相似点。

关注文档生成、编辑、修改过程中留下的元数据是否出现异常重合或值得继续复核的相似点。

关注人名、机构、联系方式等实体信息是否在不同文件中重复出现。

关注错误词、异常表达和共同错误模式是否在不同文件中重复出现。

标书查重更适合输出三类信息：

它的价值不在于替你直接判断风险成立，而在于帮助你更快缩小调查范围。

查重结果不等于串标结论，也不自动等于违规结论。

更稳妥的理解方式，是把它当成一种事实排查和证据收束工具。是否构成真实风险，仍需要结合业务背景、项目过程、主体关系和人工判断继续确认。

如果你已经通过标书查重定位到重点线索，下一步通常有三种路径：