返回精选项目

数字媒体数据集成与管理系统RAG 与数据产品 · 独立产品设计

把散落在文件夹中的视觉、音频、文本和 3D 素材,组织成具备来源、版权、用途与项目关系的数据资产,并让检索结果始终带着证据回来。

Role产品设计 / 独立著作权人
Scope数据本体 · RAG · 权利追踪
Registered2025.01
Copyright2025SR0148410

01 / Problem

真正丢失的不是文件,而是文件周围的语境。

素材分散时,用户通常还能按文件名找到某个文件,却无法快速回答:它来自哪里、是否能商用、在哪个项目用过、为什么值得复用。

因此产品目标不是再做一个网盘,而是建立一层可查询的数据关系,让媒体资源从“存储对象”变成“可审计资产”。

02 / 我做了什么

先统一资源语言,再谈智能检索。

媒体资源本体与检索链路 资源本体四维度(身份、语境、权利、关系)围绕中心资源实体,底部展示证据优先的检索链路 媒体资源 资源身份 类型 · 来源 · 主题 · 版本 使用语境 所属项目 · 位置 · 更新时间 权利信息 作者 · 许可 · 授权范围 · 到期 关系网络 跨项目引用 · 衍生 · 组合 检索链路 意图识别 多维检索 权利过滤 证据组织 交付 每一步输出均保留来源链接、授权说明与推荐依据
上半区回答资源语境怎么建,下半区回答请求如何带着权利和证据交付,而不是只返回一个文件名。

这套本体把“素材是什么”“素材怎么用”“素材能否用”拆开建模,避免用一组模糊标签承担所有检索与治理需求。

03 / Evidence-first retrieval

RAG 的价值不是生成摘要,而是缩短从意图到可信资源的距离。

  1. 检索根据主题、媒介类型、项目语境和权利要求召回候选资源。
  2. 过滤剔除许可冲突、版本过期和与当前用途不匹配的资源。
  3. 证据组织保留来源链接、授权说明、历史用途和推荐依据。
  4. 结果交付输出可直接复用的素材包,而不是只有一段模型回答。

04 / Request pipeline

复杂请求被拆成可检查的步骤,而不是一次黑箱问答。

对于“查找某主题的历史素材并推荐可商用组合”这类请求,系统依次完成意图识别、检索、过滤、证据整理、组合建议和结果交付。每一步都有结构化输入与输出,便于定位漏召回、错授权与错误推荐。

05 / Rights tracking

版权不是备注字段,而是贯穿导入、检索和复用的产品约束。

6核心模块:导入、标注、权利、检索、推荐、报告
1统一资源本体
100%推荐结果保留来源与权利证据

权利信息参与排序与过滤,复用报告记录素材去向,使系统不仅帮助“找到”,也帮助团队解释“为什么可以用”。

06 / 现在怎么看

企业 RAG 产品的护城河,通常在数据关系和证据治理。

模型可以更换,向量库可以迁移,但对业务对象、权限边界和证据要求的建模会持续积累。检索体验的上限,取决于数据进入系统时是否已经被正确组织。

Next case珍珠光泽评估与 3D 商品设计